FrameNet - FrameNet
FrameNet | |
---|---|
Énoncé de mission | Construire une base de données lexicale basée sur une théorie du sens appelée Frame Semantics . |
Commercial? | Non (disponible gratuitement en téléchargement) |
Type de projet | Base de données lexicale (contenant : cadres, éléments de cadre (FE), unités lexicales (LU), exemples de phrases et relations de cadre) |
Emplacement | Institut international d'informatique à Berkeley, Californie |
Propriétaire | Collin Baker (actuel chef de projet) |
Fondateur | Charles J. Fillmore |
Établi | 1997 |
Site Internet | framenet |
En linguistique informatique , FrameNet est un projet hébergé à l' International Computer Science Institute de Berkeley, en Californie, qui produit une ressource électronique basée sur une théorie du sens appelée sémantique des cadres . FrameNet révèle par exemple que la phrase « John a vendu une voiture à Marie » décrit essentiellement la même situation de base (cadre sémantique) que « Marie a acheté une voiture à John », juste d'un point de vue différent. Un cadre sémantique peut être considéré comme une structure conceptuelle décrivant un événement, une relation ou un objet et ses participants. La base de données lexicale FrameNet contient plus de 1 200 cadres sémantiques , 13 000 unités lexicales (un appariement d'un mot avec un sens ; les mots polysémiques sont représentés par plusieurs unités lexicales ) et 202 000 exemples de phrases. FrameNet est en grande partie la création de Charles J. Fillmore , qui a développé la théorie de la sémantique des cadres sur laquelle le projet est basé, et était initialement le chef de projet lorsque le projet a commencé en 1997. Collin Baker est devenu le chef de projet en 2000. Le projet FrameNet a eu une influence à la fois sur la linguistique et le traitement du langage naturel, où il a conduit à la tâche d' étiquetage automatique des rôles sémantiques .
notions
Cadres
Un cadre est une représentation schématique d'une situation impliquant divers participants, accessoires et autres rôles conceptuels. Des exemples de noms de trame sont Being_born
et Locative_relation
. Un cadre dans FrameNet contient une description textuelle de ce qu'il représente (une définition de cadre), des éléments de cadre associés, des unités lexicales, des exemples de phrases et des relations de cadre à cadre.
Éléments de cadre
Les éléments de trame (FE) fournissent des informations supplémentaires à la structure sémantique d'une phrase. Chaque trame a un certain nombre d'entités fonctionnelles centrales et non centrales qui peuvent être considérées comme des rôles sémantiques. Les entités fonctionnelles centrales sont essentielles à la signification de la trame, tandis que les entités fonctionnelles non centrales sont généralement descriptives (comme l'heure, le lieu, la manière, etc.).
Voici quelques exemples :
- Le seul noyau FE de la
Being_born
trame est appeléChild
; les entités fonctionnelles non centrales étantTime
,Place
,Relatives
, etc. - Les entités fonctionnelles principales du
Commerce_goods-transfer
comprennent lesSeller
,Buyer
,Goods
, entre autres, tandis que les entités fonctionnelles non centrales comprennent lesPlace
,Purpose
, etc.
FrameNet inclut des données superficielles sur les rôles syntaxiques que jouent les éléments de cadre dans les exemples de phrases. Par exemple, pour une phrase comme "Elle est née vers l'AD 460", FrameNet marquerait "Elle" comme un syntagme nominal faisant référence à l' Child
EF et "environ AD 460" comme un syntagme nominal correspondant à l' Time
élément frame. Les détails sur la façon dont les éléments de cadre peuvent être réalisés dans une phrase sont importants car cela révèle des informations importantes sur les cadres de sous - catégorisation ainsi que sur les alternances possibles de diathèse (par exemple, "John a cassé la fenêtre" vs.
Unités lexicales
Les unités lexicales (LU) sont des lemmes, avec leur partie du discours, qui évoquent un cadre spécifique. En d'autres termes, lorsqu'une LU est identifiée dans une phrase, cette LU spécifique peut être associée à sa ou ses trames spécifiques. Pour chaque trame, il peut y avoir de nombreuses LU associées à cette trame, et il peut également y avoir de nombreuses trames qui partagent une LU spécifique, c'est généralement le cas avec les LU qui ont plusieurs sens de mot. A côté du cadre, chaque unité lexicale est associée à des éléments de cadre spécifiques au moyen des exemples de phrases annotés.
Exemple:
Les unités lexicales qui évoquent le Complaining
cadre (ou des versions perspectivisées plus spécifiques de celui-ci, pour être précis), incluent les verbes « se plaindre », « grouse », « se plaindre » et autres.
Exemples de phrases
Les cadres sont associés à des exemples de phrases et les éléments de cadre sont marqués dans les phrases. Ainsi, la phrase
- Elle est née vers 460 après JC
est associé au cadre Being_born
, tandis que "Elle" est marqué comme élément de cadre Child
et "environ AD 460" est marqué comme Time
. (Voir le rapport d'annotation FrameNet pour born.v
.) Depuis le début, le projet FrameNet s'est engagé à examiner les preuves de l'utilisation réelle de la langue telle qu'elle se trouve dans des collections de textes comme le British National Corpus . Sur la base de tels exemples de phrases, des outils d' étiquetage de rôle sémantique automatique sont capables de déterminer des cadres et de marquer des éléments de cadre dans de nouvelles phrases.
Valences
FrameNet expose également les statistiques sur les valences des cadres , c'est-à-dire le nombre et la position des éléments du cadre dans les phrases d'exemple. La phrase
- Elle est née vers 460 après JC
tombe dans le modèle de valence
- NP Ext, INI --, NP Dep
qui apparaît deux fois dans les exemples de phrases dans FrameNet, à savoir dans :
- Elle est née vers 460 après JC , fille et petite-fille des empereurs romains et byzantins, dont la famille avait joué un rôle important dans la politique romaine pendant plus de 700 ans.
- Il fut bientôt affecté en Afrique du Nord, et ne rencontra jamais leur unique enfant, une fille née le 8 juin 1941 .
Relations de cadre
FrameNet capture en outre les relations entre différentes trames à l'aide de relations. Il s'agit notamment des éléments suivants :
- Héritage : lorsqu'un cadre est une version plus spécifique d'un autre cadre parent plus abstrait. Tout ce qui est vrai pour le cadre parent doit également l'être pour le cadre enfant, et un mappage est spécifié entre les éléments de cadre du parent et les éléments de cadre de l'enfant.
- Perspectivized_in : un cadre neutre (comme
Commerce_transfer-goods
) est connecté à un cadre avec une perspective spécifique du même scénario (par exemple leCommerce_sell
cadre, qui assume la perspective du vendeur ou leCommerce_buy
cadre, qui assume la perspective de l'acheteur) - Sous-
Criminal_process
trame : certaines trames comme la trame font référence à des scénarios complexes qui consistent en plusieurs états ou événements individuels qui peuvent être décrits par des trames distinctes telles queArrest
,Trial
, et ainsi de suite. - Precedes : la relation Precedes capture un ordre temporel qui s'applique entre les sous-trames d'un scénario complexe.
- Causative_of et Inchoative_of : il existe une relation assez systématique entre les descriptions statiques (comme le
Position_on_a_scale
cadre, par exemple "Elle avait un salaire élevé") et les descriptions causales (comme leCause_change_of_scalar_position
cadre, par exemple "Elle a augmenté son salaire") ou les descriptions inchoatives (comme leChange_position_on_a_scale
cadre, par exemple " Son salaire a augmenté"). - Utilisation : une relation qui existe entre une image qui, d'une manière ou d'une autre, implique une autre image. Par exemple, le
Judgment_communication
cadre utilise à la fois leJudgment
cadre et leStatement
cadre, mais n'hérite d'aucun d'eux car il n'y a pas de correspondance claire des éléments du cadre. - See_also : connecte des cadres qui ressemblent un peu mais qui doivent être distingués avec soin.
Applications
FrameNet s'est avéré utile dans un certain nombre d'applications informatiques, car les ordinateurs ont besoin de connaissances supplémentaires pour reconnaître que « John a vendu une voiture à Mary » et « Marie a acheté une voiture à John » décrivent essentiellement la même situation, malgré l'utilisation de deux des verbes différents, des prépositions différentes et un ordre des mots différent. FrameNet a été utilisé dans des applications telles que la réponse aux questions , la paraphrase , la reconnaissance de l'implication textuelle et l' extraction d'informations , soit directement, soit au moyen d' outils d' étiquetage de rôle sémantique . Le premier système automatique d' étiquetage de rôle sémantique (SRL, parfois aussi appelé « analyse sémantique superficielle ») a été développé par Daniel Gildea et Daniel Jurafsky sur la base de FrameNet en 2002. L'étiquetage de rôle sémantique est depuis devenu l'une des tâches standard en langage naturel. traitement, avec la dernière version (1.7) de FrameNet désormais entièrement prise en charge dans Natural Language Toolkit .
Étant donné que les cadres sont essentiellement des descriptions sémantiques, ils sont similaires d'une langue à l'autre, et plusieurs projets ont vu le jour au fil des ans qui se sont appuyés sur le FrameNet d'origine comme base pour d'autres FrameNets non anglais, pour l'espagnol, le japonais, l'allemand et le polonais, entre autres. .
Voir également
- BabelNet : un réseau sémantique multilingue intégrant FrameNet
- PropBank
- Instanciation nulle
- Langue du cadre
- UBY : une base de données de 10 ressources dont FrameNet
Les références
Lectures complémentaires
- Ruppenhofer, Josef; Ellsworth, Michael ; Petruck, Miriam RL ; Johnson, Christopher R.; Boulanger, Collin F.; Scheffczyk, janvier (1er novembre 2016). FrameNet II : Théorie et pratique étendues (éd. révisé). Berkeley, Californie : Institut international d'informatique.