Réponse aux questions - Question answering

La réponse aux questions ( QA ) est une discipline informatique dans les domaines de la recherche d'informations et du traitement du langage naturel (TAL), qui concerne la construction de systèmes qui répondent automatiquement aux questions posées par les humains dans un langage naturel .

Aperçu

Une implémentation de réponse à une question, généralement un programme informatique, peut construire ses réponses en interrogeant une base de données structurée de connaissances ou d'informations, généralement une base de connaissances . Plus communément, les systèmes de questions-réponses peuvent extraire des réponses d'une collection non structurée de documents en langage naturel.

Voici quelques exemples de collections de documents en langage naturel utilisées pour les systèmes de réponse aux questions :

  • une collection locale de textes de référence
  • documents d'organisation interne et pages web
  • rapports de presse compilés
  • un ensemble de pages Wikipédia
  • un sous-ensemble de pages du World Wide Web

La recherche par questions-réponses tente de traiter un large éventail de types de questions, notamment : des faits, une liste, une définition , comment , pourquoi , des questions hypothétiques, sémantiquement contraintes et multilingues.

  • La réponse aux questions à domaine fermé traite des questions relevant d'un domaine spécifique (par exemple, la médecine ou la maintenance automobile) et peut exploiter des connaissances spécifiques à un domaine fréquemment formalisées dans des ontologies . Alternativement, le domaine fermé peut faire référence à une situation où seul un type limité de questions est accepté, comme des questions demandant des informations descriptives plutôt que procédurales . Des systèmes de questions-réponses dans le cadre d'applications de lecture automatique ont également été construits dans le domaine médical, par exemple en rapport avec la maladie d'Alzheimer.
  • La réponse aux questions à domaine ouvert traite des questions sur presque tout et ne peut s'appuyer que sur des ontologies générales et la connaissance du monde. D'un autre côté, ces systèmes ont généralement beaucoup plus de données disponibles pour extraire la réponse.

Histoire

Deux premiers systèmes de réponse aux questions étaient le BASEBALL et le LUNAR. BASEBALL a répondu aux questions sur la Ligue majeure de baseball sur une période d'un an. LUNAR, à son tour, a répondu aux questions sur l'analyse géologique des roches renvoyées par les missions lunaires Apollo. Les deux systèmes de questions-réponses ont été très efficaces dans les domaines choisis. En fait, LUNAR a été présenté lors d'une convention scientifique lunaire en 1971 et il a pu répondre à 90% des questions dans son domaine posées par des personnes non formées sur le système. D'autres systèmes de réponse aux questions à domaine restreint ont été développés au cours des années suivantes. La caractéristique commune de tous ces systèmes est qu'ils disposaient d'une base de données centrale ou d'un système de connaissances écrit à la main par des experts du domaine choisi. Les capacités linguistiques de BASEBALL et LUNAR utilisaient des techniques similaires à ELIZA et DOCTOR , les premiers programmes de chatterbot .

SHRDLU était un programme de questions-réponses très réussi développé par Terry Winograd à la fin des années 1960 et au début des années 1970. Il simulait le fonctionnement d'un robot dans un monde de jouets (le "monde des blocs"), et il offrait la possibilité de poser des questions au robot sur l'état du monde. Encore une fois, la force de ce système était le choix d'un domaine très spécifique et d'un monde très simple avec des règles de physique faciles à encoder dans un programme informatique.

Dans les années 1970, des bases de connaissances ont été développées qui ciblaient des domaines de connaissances plus étroits. Les systèmes de réponse aux questions développés pour s'interfacer avec ces systèmes experts ont produit des réponses plus reproductibles et plus valides aux questions dans un domaine de connaissance. Ces systèmes experts ressemblaient étroitement aux systèmes modernes de questions-réponses, sauf dans leur architecture interne. Les systèmes experts s'appuient fortement sur des bases de connaissances construites et organisées par des experts , tandis que de nombreux systèmes modernes de réponse aux questions reposent sur le traitement statistique d'un vaste corpus de textes en langage naturel non structuré.

Les années 1970 et 1980 ont vu le développement de théories complètes en linguistique informatique , qui ont conduit au développement de projets ambitieux en compréhension de texte et en réponse aux questions. Un exemple d'un tel système était le consultant Unix (UC), développé par Robert Wilensky à l' UC Berkeley à la fin des années 1980. Le système a répondu aux questions relatives au système d' exploitation Unix . Il disposait d'une base de connaissances complète et artisanale de son domaine et visait à formuler la réponse pour s'adapter à différents types d'utilisateurs. Un autre projet était LILOG, un système de compréhension de texte qui opérait dans le domaine de l'information touristique dans une ville allemande. Les systèmes développés dans les projets UC et LILOG n'ont jamais dépassé le stade de simples démonstrations, mais ils ont aidé au développement de théories sur la linguistique informatique et le raisonnement.

Des systèmes spécialisés de réponse aux questions en langage naturel ont été développés, tels que EAGLi pour les scientifiques de la santé et de la vie.

Architecture

À partir de 2001, les systèmes de réponse aux questions comprenaient généralement un module de classification des questions qui détermine le type de question et le type de réponse.

Méthodes de réponse aux questions

La réponse aux questions est très dépendante d'un bon corpus de recherche - car sans documents contenant la réponse, il n'y a pas grand-chose qu'un système de réponse aux questions puisse faire. Il est donc logique que des tailles de collection plus grandes se prêtent généralement bien à de meilleures performances de réponse aux questions, à moins que le domaine de la question ne soit orthogonal à la collection. La notion de redondance des données dans les collections massives, telles que le Web, signifie que des pépites d'informations sont susceptibles d'être formulées de différentes manières dans des contextes et des documents différents, ce qui entraîne deux avantages :

  1. En faisant apparaître les bonnes informations sous de nombreuses formes, le fardeau du système de réponse aux questions d'effectuer des techniques complexes de PNL pour comprendre le texte est allégé.
  2. Les réponses correctes peuvent être filtrées des faux positifs en comptant sur la bonne réponse pour apparaître plus de fois dans les documents que les instances de réponses incorrectes.

Certains systèmes de questions-réponses reposent fortement sur le raisonnement automatisé .

Réponse à la question du domaine ouvert

Dans la recherche d'informations , un système de réponse aux questions à domaine ouvert vise à renvoyer une réponse en réponse à la question de l'utilisateur. La réponse renvoyée se présente sous la forme de textes courts plutôt que d'une liste de documents pertinents. Le système utilise une combinaison de techniques issues de la linguistique informatique , de la recherche d'informations et de la représentation des connaissances pour trouver des réponses.

Le système prend une question en langage naturel comme entrée plutôt qu'un ensemble de mots-clés, par exemple, « Quelle est la fête nationale de la Chine ? » La phrase est alors transformée en requête par sa forme logique . Avoir l'entrée sous la forme d'une question en langage naturel rend le système plus convivial, mais plus difficile à mettre en œuvre, car il existe différents types de questions et le système devra identifier le bon afin de donner une réponse sensée. L'attribution d'un type de question à la question est une tâche cruciale, l'ensemble du processus d'extraction de réponse repose sur la recherche du type de question correct et donc du type de réponse correct.

L' extraction de mots clés est la première étape pour identifier le type de question d'entrée. Dans certains cas, il existe des mots clairs qui indiquent directement le type de question, c'est-à-dire « Qui », « Où » ou « Combien », ces mots indiquent au système que les réponses doivent être de type « Personne », « Lieu », ou "Numéro", respectivement. Dans l'exemple ci-dessus, le mot "Quand" indique que la réponse doit être de type "Date". Les techniques de balisage POS (partie du discours) et d'analyse syntaxique peuvent également être utilisées pour déterminer le type de réponse. Dans ce cas, le sujet est "Fête nationale chinoise", le prédicat est "est" et le modificateur adverbial est "quand", donc le type de réponse est "Date". Malheureusement, certains mots interrogatifs comme « Qui », « Quoi » ou « Comment » ne donnent pas des types de réponses clairs. Chacun de ces mots peut représenter plusieurs types. Dans des situations comme celle-ci, d'autres mots dans la question doivent être pris en compte. La première chose à faire est de trouver les mots qui peuvent indiquer le sens de la question. Un dictionnaire lexical tel que WordNet peut alors être utilisé pour comprendre le contexte.

Une fois le type de question identifié, un système de recherche d'informations est utilisé pour trouver un ensemble de documents contenant les bons mots-clés. Un tagueur et un chunker NP/Verb Group peuvent être utilisés pour vérifier si les entités et relations correctes sont mentionnées dans les documents trouvés. Pour des questions telles que « Qui » ou « Où », un dispositif de reconnaissance d'entité nommée est utilisé pour trouver les noms de « personne » et de « lieu » pertinents dans les documents récupérés. Seuls les paragraphes pertinents sont sélectionnés pour le classement.

Un modèle spatial vectoriel peut être utilisé comme stratégie pour classer les réponses candidates. Vérifiez si la réponse est du type correct tel que déterminé dans l'étape d'analyse du type de question. Une technique d'inférence peut également être utilisée pour valider les réponses des candidats. Un score est ensuite attribué à chacun de ces candidats en fonction du nombre de mots interrogatifs qu'il contient et de la proximité de ces mots avec le candidat, plus il y en a et plus il est proche, mieux c'est. La réponse est ensuite traduite en une représentation compacte et significative par analyse. Dans l'exemple précédent, la réponse de sortie attendue est "1er octobre".

Réponse à une question mathématique

Un système de réponse aux questions open source basé sur Ask Platypus et Wikidata a été publié en 2018. Le système prend en entrée une question en anglais ou en hindi et renvoie une formule mathématique extraite de Wikidata comme réponse succincte. La formule résultante est traduite sous une forme calculable, permettant à l'utilisateur d'insérer des valeurs pour les variables. Les noms et les valeurs des variables et des constantes communes sont extraits de Wikidata si disponibles. On prétend que le système surpasse un moteur commercial de connaissances mathématiques informatiques sur un ensemble de test.

Les méthodes MathQA doivent combiner le langage naturel et le langage de formules. Une approche possible consiste à effectuer une annotation supervisée via Entity Linking. La « Tâche ARQMath » au CLEF 2020 a été lancée pour résoudre le problème de la liaison des questions nouvellement publiées de la plate-forme Math Stack Exchange (MSE) à celles existantes auxquelles la communauté a déjà répondu. Le laboratoire a été motivé par le fait que Mansouri et al. découvert que 20 % des requêtes mathématiques dans les moteurs de recherche à usage général sont exprimées sous forme de questions bien formées. Il contenait deux sous-tâches distinctes. Tâche 1 : « Récupération des réponses » correspondant aux anciennes réponses des messages aux questions nouvellement posées et tâche 2 : « Récupération des formules » correspondant aux anciennes formules des messages aux nouvelles questions. En commençant par le domaine des mathématiques, qui implique le langage des formules, l'objectif est d'étendre ultérieurement la tâche à d'autres domaines (par exemple, les disciplines STEM, telles que la chimie, la biologie, etc.), qui utilisent d'autres types de notation spéciale (par exemple, la chimie formules).

Le progrès

Les systèmes de réponse aux questions ont été étendus ces dernières années pour englober des domaines de connaissances supplémentaires. images et vidéo. Les sujets de recherche actuels répondent aux questions suivantes :

  • interactivité — clarification des questions ou des réponses
  • la réutilisation ou la mise en cache des réponses
  • analyse sémantique
  • présentation de la réponse
  • représentation des connaissances et raisonnement
  • analyse des médias sociaux avec des systèmes de réponse aux questions
  • analyse des sentiments
  • utilisation des rôles thématiques
  • résolution sémantique : pour combler le fossé entre des questions syntaxiquement différentes et des textes porteurs de réponses
  • l'utilisation de ressources linguistiques, telles que WordNet , FrameNet et similaires
  • Légende de l'image pour une réponse visuelle aux questions

En 2011, Watson , un système informatique de réponse aux questions développé par IBM , a participé à deux matchs d'exhibition de Jeopardy! contre Brad Rutter et Ken Jennings , gagnant par une marge significative. Facebook Research a rendu son système DrQA disponible sous une licence open source . Ce système a été utilisé pour répondre aux questions du domaine ouvert en utilisant Wikipedia comme source de connaissances.

Les références

Lectures complémentaires

Liens externes