PenséeTrésor - ThoughtTreasure

ThoughtTreasure est une base de connaissances et une architecture de bon sens pour le traitement du langage naturel . Il contient à la fois des connaissances déclaratives et procédurales.

Connaissance déclarative

La base de connaissances de ThoughtTreasure est constituée de concepts , qui sont liés les uns aux autres par des assertions . Une assertion est représentée sous la forme

@timestamp:timestamp|[concept ...]

Voici quelques exemples d'affirmations dans ThoughtTreasure :

[isa soda drink]
(A soda is a drink.)

[part-of phone-ringer phone]
(A phone ringer is part of a phone.)

[green green-pea]
(A green pea is green.)

[diameter-of green-pea .25in]
(The diameter of a green pea is .25 inches.)

[duration attend-play NUMBER:second:10800]
(The duration of a play is 10,800 seconds.)

[product-of Intel-8080 Intel]
(An Intel 8080 is a product of Intel.)

@19770120:19810120|[President-of country-USA Jimmy-Carter]
(Jimmy Carter was the President of the USA from January 20, 1977 to January 20, 1981.)

ThoughtTreasure contient un total de 27 000 concepts et 51 000 assertions. Il a une ontologie supérieure et plusieurs ontologies inférieures spécifiques à un domaine, telles que les vêtements, la nourriture et la musique.

Chaque concept est associé à zéro ou plusieurs entrées lexicales (mots et phrases). Deux langues sont prises en charge : l'anglais et le français. ThoughtTreasure a 35 000 entrées lexicales anglaises et 21 000 entrées lexicales françaises. En plus des entrées lexicales de classe ouverte telles que les noms, les verbes, les adjectifs et les adverbes, ThoughtTreasure contient également des entrées lexicales de classe fermée telles que les conjonctions, les déterminants, les interjections, les prépositions et les pronoms. Il contient également un dictionnaire de noms.

Zéro ou plusieurs caractéristiques sont attachées à chaque entrée lexicale. Il y a 118 fonctionnalités. Les exemples sont ZEROART (zéro article preneur), SING (singulier), FML (formel), CAN (canadien), ENG (anglais) et N (nom). La structure des arguments est fournie pour les verbes. Par exemple, la structure de l'argument pour le concept walk-in est

*> S ---- (from IO[2]) into IO

ThoughtTreasure contient 93 scripts , ou représentations d'activités typiques.

ThoughtTreasure contient 29 grilles , qui représentent la disposition des objets dans des lieux typiques tels que les chambres d'hôtel, les cuisines et les théâtres. Les grilles sont reliées entre elles par des trous de ver .

Connaissances procédurales

ThoughtTreasure comprend une agence de planification pour atteindre des objectifs dans un monde simulé et une agence de compréhension pour comprendre des histoires et poser et répondre à des questions.

ThoughtTreasure contient les procédures suivantes pour le traitement du langage naturel :

  • Mécanismes de morphologie algorithmique, analogique et dérivationnelle
  • Analyseur anaphorique
  • Chatterbot
  • Outils d'analyse de corpus
  • Générateur de dictionnaire
  • Marqueur lexical exhaustif
  • Résolveur d'intension (pour trouver des objets correspondant aux descriptions)
  • Reconnaissances d'entités nommées
  • Générateur de langage naturel
  • Analyseur sémantique
  • Analyseur syntaxique
  • Extracteur d'informations de table

ThoughtTreasure contient les procédures suivantes qui traitent de l'espace :

  • Planificateur de chemin en grille bidimensionnelle (matrice d'occupation)
  • Instanciateur de grille analogique
  • Planificateur de chemin inter-réseaux
  • Planificateur de voyage

Il contient des opérations traitant des parties et des ensembles d'objets, des grilles (distance, sous-espace), un grand espace (distance planétaire, confinement politique) et un espace imbriqué (pièce, étage, bâtiment, ville, planète).

D'autres procédures dans ThoughtTreasure incluent :

  • Apprenant d'assertion
  • Correspondance des couleurs des vêtements
  • Générateur d'associations libres
  • Fonctions de stockage et de récupération de la base de connaissances
  • Simulateur de frappe avec erreurs

Utiliser

ThoughtTreasure peut être utilisé pour ajouter du bon sens aux applications en utilisant sa base de connaissances ou en communiquant avec un serveur ThoughtTreasure.

ThoughtTreasure a été utilisé pour créer diverses applications telles qu'un assistant de DJ, un programme de réponse aux questions sur les critiques de films et un calendrier intelligent.

Histoire

ThoughtTreasure a été lancé par Erik Mueller en décembre 1993. La première version est sortie le 28 avril 1996. Mueller a créé la société Signiform en 1997 pour poursuivre les applications commerciales de ThoughtTreasure. Cependant, l'entreprise a échoué et Signiform a fermé ses portes en 2000. En 2000, Erik Mueller a rejoint IBM Research, où il a été membre de l'équipe qui a développé Watson (ordinateur) . Le 31 juillet 2015, ThoughtTreasure a été rendu disponible sur GitHub.

Voir également

Les références

  • Mueller, Erik T. (1998). Traitement du langage naturel avec ThoughtTreasure . New York : Signiforme. ISBN  978-1478171652 .
  • Mueller, Erik T. (1999). Une base de données et un lexique de scripts pour ThoughtTreasure .
  • Mueller, Erik T. (2000). "Un calendrier avec du bon sens." Actes de la Conférence internationale de 2000 sur les interfaces utilisateur intelligentes (pp. 198-201). New York : ACM.

Liens externes