BabelNet - BabelNet

BabelNet
Logo BabelNet
Version stable
BabelNet 5.0 / Février 2021
Système opérateur
Taper
Licence Attribution-NonCommercial-ShareAlike 3.0 Unported
Site Internet Babelnet .org

BabelNet est un réseau sémantique lexicalisé multilingue et une ontologie développé au sein du groupe PNL de l' Université Sapienza de Rome . BabelNet a été créé automatiquement en reliant Wikipédia au lexique informatique le plus populaire de la langue anglaise , WordNet . L'intégration se fait à l'aide d'une cartographie automatique et en comblant les lacunes lexicales dans les langues pauvres en ressources en utilisant la traduction automatique statistique . Le résultat est un dictionnaire encyclopédique qui fournit des concepts et des entités nommées lexicalisés dans de nombreuses langues et liés à de grandes quantités de relations sémantiques . Des lexicalisations et des définitions supplémentaires sont ajoutées par des liens vers des wordnets sous licence libre, OmegaWiki, le Wiktionnaire anglais , Wikidata , FrameNet , VerbNet et d'autres. De la même manière que WordNet, BabelNet regroupe les mots de différentes langues en ensembles de synonymes , appelés Babel synsets . Pour chaque synset de Babel, BabelNet fournit de courtes définitions (appelées gloses ) dans de nombreuses langues récoltées à la fois sur WordNet et Wikipedia.

BabelNet est un réseau sémantique multilingue obtenu en intégrant WordNet et Wikipedia.

Statistiques de BabelNet

Depuis avril 2021, BabelNet (version 5.0) couvre 500 langues . Il contient près de 20 millions de synsets et environ 1,4 milliard de sens de mots (quelle que soit leur langue). Chaque synset de Babel contient 2 synonymes par langue, c'est-à-dire le sens des mots, en moyenne. Le réseau sémantique comprend toutes les relations lexico-sémantiques de WordNet ( hypernymie et hyponymie , méronymie et holonymie , antonymie et synonymie , etc., totalisant environ 364 000 arêtes de relation) ainsi qu'une relation de parenté sous-spécifiée de Wikipedia (totalisant environ 1,3 milliard d'arêtes) . La version 5.0 associe également environ 51 millions d'images aux synsets Babel et fournit un encodage Lemon RDF de la ressource, disponible via un endpoint SPARQL . 2,67 millions de synsets se voient attribuer des étiquettes de domaine.

Applications

Il a été démontré que BabelNet permet des applications multilingues de traitement du langage naturel . Il a été démontré que les connaissances lexicalisées disponibles dans BabelNet permettent d'obtenir des résultats de pointe dans :

Prix ​​et remerciements

BabelNet a reçu le prix META 2015 pour « un travail révolutionnaire pour surmonter les barrières linguistiques grâce à un réseau sémantique lexicalisé multilingue et à une ontologie utilisant des sources de données hétérogènes ».

BabelNet figurait en bonne place dans un article du magazine Time sur la nouvelle ère des ressources de connaissances lexicales innovantes et à jour disponibles sur le Web.

Voir également

Les références

Liens externes