Analyse des sentiments - Sentiment analysis

L'analyse des sentiments (également connue sous le nom d'exploration d'opinion ou d' IA émotionnelle ) est l'utilisation du traitement du langage naturel , de l' analyse de texte , de la linguistique informatique et de la biométrie pour identifier, extraire, quantifier et étudier systématiquement les états affectifs et les informations subjectives. L'analyse des sentiments est largement appliquée à la voix des documents clients tels que les avis et les réponses aux sondages, les médias en ligne et sociaux et les documents de santé pour des applications allant du marketing au service client en passant par la médecine clinique.

Exemples

L'objectif et les défis de l'analyse des sentiments peuvent être illustrés à travers quelques exemples simples.

Cas simples

  • Coronet a les meilleures lignes de croiseurs all day.
  • Bertram a une coque en V profond et traverse facilement les mers.
  • Les croiseurs de jour aux couleurs pastel des années 1980 en provenance de Floride sont moches.
  • Je n'aime pas les vieux cruisers à cabine .

Des exemples plus difficiles

  • Je n'aime pas les croiseurs à cabine. ( Traitement des négations )
  • Ne pas aimer les motomarines, ce n'est pas vraiment mon truc. (Négation, ordre des mots inversé )
  • Parfois, je déteste vraiment les RIB . (L' adverbe modifie le sentiment)
  • J'aimerais vraiment vraiment sortir par ce temps ! (peut-être sarcastique )
  • Chris Craft est plus beau que Limestone. (Deux noms de marque , identifier la cible d'attitude est difficile).
  • Chris Craft est plus beau que Limestone, mais Limestone projette la navigabilité et la fiabilité. (Deux attitudes, deux marques).
  • Le film est surprenant avec de nombreux rebondissements troublants. (Terme négatif utilisé dans un sens positif dans certains domaines).
  • Vous devriez voir leur menu de desserts décadent. (Le terme d'attitude a changé de polarité récemment dans certains domaines)
  • J'adore mon mobile mais je ne le recommanderais à aucun de mes collègues. (Sentiment positif qualifié, difficile à catégoriser)
  • Le concert de la semaine prochaine aura raison de koide9 ! ("Quoi de neuf?", Français pour "quoi de neuf?". Les termes nouvellement créés peuvent être très attitudinaux mais instables dans la polarité et souvent hors du vocabulaire connu.)

Les types

Une tâche de base dans l'analyse des sentiments consiste à classer la polarité d'un texte donné au niveau du document, de la phrase ou de la caractéristique/aspect, que l'opinion exprimée dans un document, une phrase ou une caractéristique/aspect d'entité soit positive, négative ou neutre. La classification avancée des sentiments « au-delà de la polarité » examine, par exemple, les états émotionnels tels que le plaisir, la colère, le dégoût, la tristesse, la peur et la surprise.

Les précurseurs de l'analyse sentimentale incluent le General Inquirer, qui a fourni des indices pour quantifier les modèles dans le texte et, séparément, la recherche psychologique qui a examiné l' état psychologique d' une personne sur la base de l'analyse de son comportement verbal.

Par la suite, la méthode décrite dans un brevet par Volcani et Fogel, a examiné spécifiquement le sentiment et a identifié des mots et des phrases individuels dans le texte par rapport à différentes échelles émotionnelles. Un système actuel basé sur leur travail, appelé EffectCheck, présente des synonymes qui peuvent être utilisés pour augmenter ou diminuer le niveau d'émotion évoquée dans chaque échelle.

De nombreux autres efforts ultérieurs étaient moins sophistiqués, utilisant une simple vision polaire du sentiment, du positif au négatif, comme les travaux de Turney et Pang qui ont appliqué différentes méthodes pour détecter la polarité des critiques de produits et des critiques de films respectivement. Ce travail est au niveau du document. On peut également classer la polarité d'un document sur une échelle à plusieurs niveaux, ce qui a été tenté par Pang et Snyder entre autres : Pang et Lee ont élargi la tâche de base consistant à classer une critique de film comme positive ou négative pour prédire les notes sur une ou une échelle à 4 étoiles, tandis que Snyder a effectué une analyse approfondie des critiques de restaurants, prédisant les notes pour divers aspects du restaurant donné, tels que la nourriture et l'atmosphère (sur une échelle de cinq étoiles).

Les premières étapes à réunir différentes approches d'apprentissage en ligne, lexical, basée sur la connaissance, etc., ont été prises en 2004 AAAI Symposium de printemps où les linguistes, informaticiens et autres intérêts chercheurs ont d' abord alignés intéressés et ont proposé des tâches partagées et des ensembles de données de référence pour la recherche informatique systématique sur l'affect, l'attrait, la subjectivité et le sentiment dans le texte.

Même si dans la plupart des méthodes de classification statistique, la classe neutre est ignorée sous l'hypothèse que les textes neutres se trouvent près de la limite du classificateur binaire, plusieurs chercheurs suggèrent que, comme dans tout problème de polarité, trois catégories doivent être identifiées. De plus, il peut être prouvé que des classificateurs spécifiques tels que l' entropie maximale et les SVM peuvent bénéficier de l'introduction d'une classe neutre et améliorer la précision globale de la classification. Il existe en principe deux manières de fonctionner avec une classe neutre. Soit, l'algorithme procède en identifiant d'abord le langage neutre, en le filtrant puis en évaluant le reste en termes de sentiments positifs et négatifs, soit il construit une classification à trois voies en une seule étape. Cette seconde approche implique souvent l'estimation d'une distribution de probabilité sur toutes les catégories (par exemple les classificateurs naïfs de Bayes tels qu'implémentés par le NLTK ). Si et comment utiliser une classe neutre dépend de la nature des données : si les données sont clairement regroupées en langage neutre, négatif et positif, il est logique de filtrer le langage neutre et de se concentrer sur la polarité entre les sentiments positifs et négatifs. Si, en revanche, les données sont pour la plupart neutres avec de petits écarts vers les affects positifs et négatifs, cette stratégie rendrait plus difficile la distinction claire entre les deux pôles.

Une méthode différente pour déterminer le sentiment est l'utilisation d'un système d'échelle dans lequel les mots généralement associés à un sentiment négatif, neutre ou positif reçoivent un nombre associé sur une échelle de -10 à +10 (du plus négatif au plus positif). ou simplement de 0 à une limite supérieure positive telle que +4. Cela permet d'ajuster le sentiment d'un terme donné par rapport à son environnement (généralement au niveau de la phrase). Lorsqu'un morceau de texte non structuré est analysé à l'aide du traitement du langage naturel , chaque concept de l'environnement spécifié se voit attribuer un score basé sur la manière dont les mots de sentiment se rapportent au concept et à son score associé. Cela permet de passer à une compréhension plus sophistiquée du sentiment, car il est désormais possible d'ajuster la valeur de sentiment d'un concept par rapport aux modifications qui peuvent l'entourer. Les mots, par exemple, qui intensifient, détendent ou nient le sentiment exprimé par le concept peuvent affecter son score. Alternativement, les textes peuvent se voir attribuer un score de force de sentiment positif et négatif si l'objectif est de déterminer le sentiment dans un texte plutôt que la polarité et la force globales du texte.

Il existe divers autres types d'analyse des sentiments, tels que l'analyse des sentiments basée sur les aspects, l'analyse des sentiments par évaluation (positive, négative, neutre), l'analyse des sentiments multilingue et la détection des émotions.

Identification de la subjectivité/objectivité

Cette tâche est généralement définie comme la classification d'un texte donné (généralement une phrase) dans l'une des deux catégories suivantes : objective ou subjective. Ce problème peut parfois être plus difficile que la classification de polarité. La subjectivité des mots et des phrases peut dépendre de leur contexte et un document objectif peut contenir des phrases subjectives (par exemple, un article de presse citant les opinions des gens). De plus, comme mentionné par Su, les résultats dépendent largement de la définition de la subjectivité utilisée lors de l'annotation des textes. Cependant, Pang a montré que supprimer des phrases objectives d'un document avant de classer sa polarité aidait à améliorer les performances.

L'identification subjective et objective, les sous-tâches émergentes de l'analyse des sentiments pour utiliser des caractéristiques syntaxiques, sémantiques et les connaissances d'apprentissage automatique pour identifier une phrase ou un document sont des faits ou des opinions. La prise de conscience de la reconnaissance des faits et des opinions n'est pas récente, ayant peut-être été présentée pour la première fois par Carbonell à l'Université de Yale en 1979.

Le terme objectif fait référence à l'incident porteur d'informations factuelles.

  • Exemple de phrase objective : « Pour être élu président des États-Unis, un candidat doit être âgé d'au moins trente-cinq ans.

Le terme subjectif décrit que l'incident contient des informations non factuelles sous diverses formes, telles que des opinions personnelles, des jugements et des prédictions. Également appelés « États privés » mentionnés par Quirk et al. Dans l'exemple ci-dessous, il reflète un état privé « Nous, les Américains ». De plus, l'entité cible commentée par les avis peut prendre plusieurs formes, du produit tangible aux sujets intangibles énoncés dans Liu (2010). De plus, trois types d'attitudes ont été observés par Liu (2010), 1) des opinions positives, 2) des opinions neutres et 3) des opinions négatives.

  • Exemple de phrase subjective : « Nous, les Américains, devons élire un président mûr et capable de prendre de sages décisions.

Cette analyse est un problème de classification.

Les collections de mots ou d'indicateurs de phrases de chaque classe sont définies pour localiser les modèles souhaitables sur du texte non annoté. Pour l'expression subjective, une liste de mots différente a été créée. Des listes d'indicateurs subjectifs dans des mots ou des phrases ont été développées par plusieurs chercheurs dans les domaines du linguiste et du traitement du langage naturel dans Riloff et al. (2003). Un dictionnaire de règles d'extraction doit être créé pour mesurer des expressions données. Au fil des ans, dans la détection subjective, l'extraction des caractéristiques a progressé de la conservation manuelle des caractéristiques en 1999 à l'apprentissage automatisé des caractéristiques en 2005. À l'heure actuelle, les méthodes d'apprentissage automatisé peuvent se séparer en apprentissage automatique supervisé et non supervisé . L'extraction de modèles avec des processus d'apprentissage automatique annotés et non annotés a été largement explorée par des chercheurs universitaires.

Cependant, les chercheurs ont reconnu plusieurs défis dans le développement d'ensembles fixes de règles pour les expressions de manière respectable. Une grande partie des défis dans l'élaboration des règles découle de la nature de l'information textuelle. Six défis ont été reconnus par plusieurs chercheurs : 1) expressions métaphoriques, 2) divergences dans les écritures, 3) contextuelle, 4) mots représentés avec moins d'usages, 5) sensible au temps et 6) volume toujours croissant.

  1. Expressions métaphoriques. Le texte contient une expression métaphorique pouvant avoir un impact sur les performances de l'extraction. En outre, les métaphores prennent différentes formes, ce qui peut avoir contribué à l'augmentation de la détection.
  2. Discordances dans les écrits. Pour le texte obtenu à partir d'Internet, les divergences dans le style d'écriture des données textuelles ciblées impliquent des genres et des styles d'écriture distincts
  3. Sensible au contexte. La classification peut varier en fonction de la subjectivité ou de l'objectivité des phrases précédentes et suivantes.
  4. Attribut sensible au temps. La tâche est contestée par l'attribut sensible au temps de certaines données textuelles. Si un groupe de chercheurs veut confirmer un fait dans l'actualité, il lui faut plus de temps pour la validation croisée, car l'actualité devient obsolète.
  5. Mots de repère avec moins d'utilisations.
  6. Volume sans cesse croissant. La tâche est également contestée par le volume considérable de données textuelles. La nature toujours croissante des données textuelles rend la tâche extrêmement difficile pour les chercheurs de terminer la tâche à temps.

Auparavant, la recherche portait principalement sur la classification au niveau des documents. Cependant, la classification d'un niveau de document souffre moins de précision, car un article peut avoir divers types d'expressions impliquées. La recherche de preuves suggère un ensemble d'articles de presse qui devraient dominer par l'expression objective, alors que les résultats montrent qu'il s'agissait de plus de 40 % d'expression subjective.

Pour surmonter ces défis, les chercheurs concluent que l'efficacité du classificateur dépend de la précision de l'apprenant des modèles. Et les flux d'apprenants avec de gros volumes de données de formation annotées ont surpassé ceux formés sur des caractéristiques subjectives moins complètes. Cependant, l'un des principaux obstacles à l'exécution de ce type de travail est de générer manuellement un grand ensemble de données de phrases annotées. La méthode d'annotation manuelle a été moins favorisée que l'apprentissage automatique pour trois raisons :

  1. Variations dans les compréhensions. Dans la tâche d'annotation manuelle, un désaccord sur le fait qu'une instance soit subjective ou objective peut survenir parmi les annotateurs en raison de l'ambiguïté des langues.
  2. Erreurs humaines. La tâche d'annotation manuelle est une tâche méticuleuse, elle nécessite une concentration intense pour la terminer.
  3. Long. La tâche d'annotation manuelle est un travail assidu. Riloff (1996) montre que 160 textes coûtent 8 heures à un annotateur pour terminer.

Toutes ces raisons mentionnées peuvent avoir un impact sur l'efficience et l'efficacité de la classification subjective et objective. En conséquence, deux méthodes d'amorçage ont été conçues pour apprendre des modèles linguistiques à partir de données textuelles non annotées. Les deux méthodes commencent avec une poignée de mots de départ et des données textuelles non annotées.

  1. Meta-Bootstrapping par Riloff et Jones en 1999. Niveau un : Générer des modèles d'extraction basés sur les règles prédéfinies et les modèles extraits par le nombre de mots de départ que chaque modèle contient. Niveau deux : les 5 premiers mots seront notés et ajoutés au dictionnaire. Répéter.
  2. Basilic ( B ootstrapping A PPROCHE à S emantic L exicon I nduction utilisant S emantic K ONNAISSANCE) par Thelen et Riloff. Première étape : générer des modèles d'extraction Deuxième étape : déplacer les meilleurs modèles du pool de modèles vers le pool de mots candidats. Troisième étape : les 10 premiers mots seront notés et ajoutés au dictionnaire. Répéter.

Dans l'ensemble, ces algorithmes mettent en évidence la nécessité d'une reconnaissance et d'une extraction automatiques des formes dans les tâches subjectives et objectives.

Le classificateur subjectif et objet peut améliorer les applications de service du traitement du langage naturel. L'un des principaux avantages du classificateur est qu'il a popularisé la pratique des processus de prise de décision basés sur les données dans diverses industries. Selon Liu, les applications de l'identification subjective et objective ont été mises en œuvre dans les affaires, la publicité, le sport et les sciences sociales.

  • Classification des avis en ligne : dans le secteur des affaires, le classificateur aide l'entreprise à mieux comprendre les retours sur le produit et les raisonnements qui sous-tendent les avis.
  • Prévision du cours des actions : dans le secteur de la finance, le classeur aide le modèle de prédiction en traitant les informations auxiliaires des médias sociaux et d'autres informations textuelles provenant d'Internet. Des études antérieures sur le cours des actions japonaises menées par Dong et.al. indique que le modèle avec module subjectif et objectif peut fonctionner mieux que ceux sans cette partie.
  • Analyse des réseaux sociaux.
  • Classement des commentaires des étudiants.
  • Résumé du document : le classificateur peut extraire des commentaires ciblés et recueillir les opinions émises par une entité particulière.
  • Réponse à une question complexe. Le classificateur peut décortiquer les questions complexes en classant le sujet de langue ou la cible objective et ciblée. Dans la recherche Yu et al. (2003), le chercheur a développé un niveau de phrase et de document regroupé qui identifie les éléments d'opinion.
  • Applications spécifiques à un domaine.
  • Analyse des e-mails : le classificateur subjectif et objectif détecte le spam en traçant les modèles de langue avec les mots cibles.

Basé sur les caractéristiques/aspects

Il s'agit de déterminer les opinions ou les sentiments exprimés sur différentes caractéristiques ou aspects d'entités, par exemple un téléphone portable, un appareil photo numérique ou une banque. Une caractéristique ou un aspect est un attribut ou un composant d'une entité, par exemple l'écran d'un téléphone portable, le service d'un restaurant ou la qualité d'image d'un appareil photo. L'avantage de l'analyse des sentiments basée sur les fonctionnalités est la possibilité de capturer des nuances sur les objets d'intérêt. Différentes fonctionnalités peuvent générer différentes réactions de sentiment, par exemple un hôtel peut avoir un emplacement pratique, mais une nourriture médiocre. Ce problème implique plusieurs sous-problèmes, par exemple, identifier les entités pertinentes, extraire leurs caractéristiques/aspects et déterminer si une opinion exprimée sur chaque caractéristique/aspect est positive, négative ou neutre. L'identification automatique des caractéristiques peut être effectuée avec des méthodes syntaxiques, avec une modélisation thématique ou avec un apprentissage en profondeur . Des discussions plus détaillées sur ce niveau d'analyse des sentiments peuvent être trouvées dans le travail de Liu.

Méthodes et fonctionnalités

Les approches existantes de l'analyse des sentiments peuvent être regroupées en trois catégories principales : les techniques basées sur les connaissances, les méthodes statistiques et les approches hybrides. Les techniques basées sur la connaissance classent le texte par catégories d'affect en fonction de la présence de mots affectifs non ambigus tels que heureux, triste, effrayé et ennuyé. Certaines bases de connaissances répertorient non seulement des mots affectifs évidents, mais attribuent également à des mots arbitraires une "affinité" probable avec des émotions particulières. Les méthodes statistiques exploitent des éléments de l'apprentissage automatique tels que l'analyse sémantique latente , les machines à vecteurs de support , le « sac de mots », les « informations mutuelles ponctuelles » pour l'orientation sémantique et l'apprentissage en profondeur . Des méthodes plus sophistiquées tentent de détecter le détenteur d'un sentiment (c'est-à-dire la personne qui maintient cet état affectif) et la cible (c'est-à-dire l'entité à propos de laquelle l'affect est ressenti). Pour extraire l'opinion dans son contexte et obtenir la caractéristique sur laquelle l'orateur s'est prononcé, les relations grammaticales des mots sont utilisées. Les relations de dépendance grammaticale sont obtenues par une analyse approfondie du texte. Les approches hybrides exploitent à la fois l'apprentissage automatique et des éléments de représentation des connaissances tels que les ontologies et les réseaux sémantiques afin de détecter des sémantiques qui sont exprimées de manière subtile, par exemple, à travers l'analyse de concepts qui ne véhiculent pas explicitement des informations pertinentes, mais qui sont implicitement liés à d'autres concepts qui le font.

Des outils logiciels open source ainsi qu'une gamme d'outils d'analyse des sentiments gratuits et payants déploient des techniques d' apprentissage automatique , de statistiques et de traitement du langage naturel pour automatiser l'analyse des sentiments sur de grandes collections de textes, y compris des pages Web, des actualités en ligne, des groupes de discussion sur Internet, des critiques en ligne, blogs Web et médias sociaux. Les systèmes basés sur la connaissance, quant à eux, utilisent des ressources accessibles au public pour extraire les informations sémantiques et affectives associées aux concepts de langage naturel. Le système peut aider à effectuer un raisonnement affectif de bon sens . L'analyse des sentiments peut également être effectuée sur du contenu visuel, c'est-à-dire des images et des vidéos (voir Analyse des sentiments multimodale ). L'une des premières approches dans cette direction est SentiBank utilisant une représentation de paire de noms d'adjectifs du contenu visuel. De plus, la grande majorité des approches de classification des sentiments reposent sur le modèle du sac de mots, qui ne tient pas compte du contexte, de la grammaire et même de l' ordre des mots . Les approches qui analysent le sentiment en fonction de la façon dont les mots composent le sens de phrases plus longues ont donné de meilleurs résultats, mais elles entraînent une surcharge d'annotation supplémentaire.

Un composant d'analyse humaine est requis dans l'analyse des sentiments, car les systèmes automatisés ne sont pas en mesure d'analyser les tendances historiques du commentateur individuel ou de la plate-forme et sont souvent classés de manière incorrecte dans leur sentiment exprimé. L'automatisation impacte environ 23% des commentaires correctement classés par les humains. Cependant, les humains sont souvent en désaccord, et il est avancé que l'accord interhumain fournit une limite supérieure que les classificateurs de sentiments automatisés peuvent éventuellement atteindre.

Évaluation

La précision d'un système d'analyse des sentiments est, en principe, dans quelle mesure il s'accorde avec les jugements humains. Ceci est généralement mesuré par des mesures variables basées sur la précision et le rappel sur les deux catégories cibles de textes négatifs et positifs. Cependant, selon les recherches, les évaluateurs humains ne sont généralement d'accord qu'environ 80 % du temps (voir Fiabilité inter-évaluateurs ). Ainsi, un programme qui atteint une précision de 70 % dans la classification des sentiments fait presque aussi bien que les humains, même si une telle précision peut ne pas sembler impressionnante. Si un programme était « bon » 100 % du temps, les humains seraient toujours en désaccord avec lui environ 20 % du temps, puisqu'ils sont autant en désaccord sur n'importe quelle réponse.

D'un autre côté, les systèmes informatiques commettent des erreurs très différentes de celles des évaluateurs humains, et les chiffres ne sont donc pas entièrement comparables. Par exemple, un système informatique aura des problèmes avec les négations, les exagérations, les blagues ou les sarcasmes, qui sont généralement faciles à gérer pour un lecteur humain : certaines erreurs commises par un système informatique sembleront trop naïves pour un humain. En général, l'utilité pour les tâches commerciales pratiques de l'analyse des sentiments, telle qu'elle est définie dans la recherche universitaire, a été remise en question, principalement parce que le simple modèle unidimensionnel du sentiment, du négatif au positif, donne assez peu d'informations exploitables pour un client qui s'inquiète de la effet du discours public sur, par exemple, la réputation de la marque ou de l'entreprise.

Pour mieux répondre aux besoins du marché, l'évaluation de l'analyse des sentiments est passée à des mesures davantage axées sur les tâches, formulées en collaboration avec des représentants d'agences de relations publiques et des professionnels des études de marché. Par exemple , dans l' ensemble de données d' évaluation RepLab , l' accent est moins mis sur le contenu du texte considéré que sur l' effet du texte en question sur la réputation de la marque .

Étant donné que l'évaluation de l'analyse des sentiments est de plus en plus basée sur les tâches, chaque implémentation a besoin d'un modèle de formation distinct pour obtenir une représentation plus précise des sentiments pour un ensemble de données donné.

Web 2.0

L'essor des médias sociaux tels que les blogs et les réseaux sociaux a suscité l'intérêt pour l'analyse des sentiments. Avec la prolifération des avis, notes, recommandations et autres formes d'expression en ligne, l'opinion en ligne est devenue une sorte de monnaie virtuelle pour les entreprises cherchant à commercialiser leurs produits, identifier de nouvelles opportunités et gérer leur réputation. Alors que les entreprises cherchent à automatiser le processus de filtrage du bruit, de compréhension des conversations, d'identification du contenu pertinent et d'action appropriée, beaucoup se tournent désormais vers le domaine de l'analyse des sentiments. Pour compliquer encore les choses, la montée en puissance des plateformes de médias sociaux anonymes telles que 4chan et Reddit . Si le Web 2.0 consistait uniquement à démocratiser la publication, alors la prochaine étape du Web pourrait bien être basée sur la démocratisation de l'exploration de données de tout le contenu qui est publié.

Un pas vers cet objectif est accompli dans la recherche. Plusieurs équipes de recherche dans des universités du monde entier se concentrent actuellement sur la compréhension de la dynamique des sentiments dans les communautés électroniques grâce à l'analyse des sentiments. Le projet CyberEmotions , par exemple, a récemment identifié le rôle des émotions négatives dans la conduite des discussions sur les réseaux sociaux.

Le problème est que la plupart des algorithmes d'analyse des sentiments utilisent des termes simples pour exprimer des sentiments sur un produit ou un service. Cependant, les facteurs culturels, les nuances linguistiques et les contextes différents rendent extrêmement difficile la transformation d'une chaîne de texte écrit en un simple sentiment pour ou contre. Le fait que les humains soient souvent en désaccord sur le sentiment du texte illustre à quel point il est difficile pour les ordinateurs de bien faire les choses. Plus la chaîne de texte est courte, plus elle devient difficile.

Même si les chaînes de texte courtes peuvent être un problème, l'analyse des sentiments au sein du microblogging a montré que Twitter peut être considéré comme un indicateur en ligne valide du sentiment politique. Le sentiment politique des tweets démontre une correspondance étroite avec les positions politiques des partis et des politiciens, indiquant que le contenu des messages Twitter reflète de manière plausible le paysage politique hors ligne. En outre, il a également été démontré que l' analyse des sentiments sur Twitter capte l'humeur du public derrière les cycles de reproduction humaine dans le monde, ainsi que d'autres problèmes d'importance pour la santé publique tels que les effets indésirables des médicaments.

Alors que l'analyse des sentiments est populaire pour les domaines où les auteurs expriment leur opinion de manière assez explicite ("le film est génial"), tels que les médias sociaux et les critiques de produits, ce n'est que récemment que des méthodes robustes ont été conçues pour d'autres domaines où le sentiment est fortement implicite ou indirect. Par exemple, dans les articles de presse - principalement en raison de l'objectivité journalistique attendue - les journalistes décrivent souvent des actions ou des événements plutôt que d'énoncer directement la polarité d'une information. Les approches antérieures utilisant des dictionnaires ou des fonctionnalités d'apprentissage automatique peu profondes souffraient de ne pas pouvoir saisir le "sens entre les lignes", mais récemment, des chercheurs ont proposé une approche basée sur l'apprentissage en profondeur et un ensemble de données pour pouvoir analyser le sentiment dans les articles de presse.

Application dans les systèmes de recommandation

Pour un système de recommandation , l'analyse des sentiments s'est avérée être une technique précieuse. Un système de recommandation vise à prédire la préférence pour un élément d'un utilisateur cible. Les systèmes de recommandation traditionnels fonctionnent sur un ensemble de données explicite. Par exemple, le filtrage collaboratif fonctionne sur la matrice de notation et le filtrage basé sur le contenu fonctionne sur les métadonnées des éléments.

Dans de nombreux services de réseaux sociaux ou sites Web de commerce électronique, les utilisateurs peuvent fournir une révision de texte, des commentaires ou des commentaires sur les articles. Ces textes générés par les utilisateurs fournissent une riche source d'opinions des utilisateurs sur de nombreux produits et articles. Potentiellement, pour un élément, un tel texte peut révéler à la fois la fonctionnalité/les aspects liés à l'élément et les sentiments des utilisateurs sur chaque fonctionnalité. La fonctionnalité/les aspects de l'élément décrits dans le texte jouent le même rôle que les métadonnées dans le filtrage basé sur le contenu , mais les premiers sont plus utiles pour le système de recommandation. Étant donné que ces fonctionnalités sont largement mentionnées par les utilisateurs dans leurs avis, elles peuvent être considérées comme les fonctionnalités les plus cruciales pouvant influencer de manière significative l'expérience de l'utilisateur sur l'article, tandis que les métadonnées de l'article (généralement fournies par les producteurs au lieu des consommateurs) peut ignorer les fonctionnalités qui sont concernées par les utilisateurs. Pour différents éléments avec des caractéristiques communes, un utilisateur peut donner des sentiments différents. En outre, une caractéristique du même élément peut recevoir des sentiments différents de différents utilisateurs. Les sentiments des utilisateurs sur les fonctionnalités peuvent être considérés comme un score d'évaluation multidimensionnel, reflétant leur préférence sur les éléments.

Sur la base des caractéristiques/aspects et des sentiments extraits du texte généré par l'utilisateur, un système de recommandation hybride peut être construit. Il existe deux types de motivation pour recommander un élément candidat à un utilisateur. La première motivation est que l'élément candidat a de nombreuses caractéristiques communes avec les éléments préférés de l'utilisateur, tandis que la seconde motivation est que l'élément candidat reçoit un sentiment élevé sur ses caractéristiques. Pour un article préféré, il est raisonnable de croire que les articles ayant les mêmes caractéristiques auront une fonction ou une utilité similaire. Ainsi, ces articles seront également susceptibles d'être préférés par l'utilisateur. D'autre part, pour une caractéristique partagée de deux éléments candidats, d'autres utilisateurs peuvent donner un sentiment positif à l'un d'eux tout en donnant un sentiment négatif à un autre. De toute évidence, l'élément hautement évalué doit être recommandé à l'utilisateur. Sur la base de ces deux motivations, un score de classement combiné de similarité et d'évaluation du sentiment peut être construit pour chaque élément candidat.

À l'exception de la difficulté de l'analyse des sentiments elle-même, l'application de l'analyse des sentiments aux avis ou aux commentaires est également confrontée au défi du spam et des avis biaisés. Une direction de travail est axée sur l'évaluation de l'utilité de chaque examen. La critique ou les commentaires mal rédigés ne sont guère utiles pour le système de recommandation. En outre, un avis peut être conçu pour entraver les ventes d'un produit cible, et ainsi nuire au système de recommandation même s'il est bien rédigé.

Les chercheurs ont également constaté que les formes longues et courtes de texte généré par l'utilisateur devraient être traitées différemment. Un résultat intéressant montre que les avis abrégés sont parfois plus utiles que les avis longs, car il est plus facile de filtrer le bruit dans un texte abrégé. Pour le texte long, la longueur croissante du texte n'entraîne pas toujours une augmentation proportionnelle du nombre de caractéristiques ou de sentiments dans le texte.

Lamba & Madhusudhan introduisent une nouvelle façon de répondre aux besoins d'information des utilisateurs de bibliothèques d'aujourd'hui en reconditionnant les résultats de l'analyse des sentiments des plateformes de médias sociaux comme Twitter et en les fournissant sous forme de service temporel consolidé dans différents formats. En outre, ils proposent une nouvelle façon de faire du marketing dans les bibliothèques en utilisant l'exploration des médias sociaux et l'analyse des sentiments.

Voir également

Les références