L’analyse des
sentiments (opinion mining)
L'analyse des sentiments ou l'analyse d'opinion est un processus
permettant d'identifier la polarité de l'opinion en appliquant les techniques
de traitement de langage naturel PNL et l'analyse de texte. Cela se fait en
filtrant les phrases qui ne contribuent pas à la polarité, puis en extrayant
les informations subjectives contenues dans le texte restant. C’est un domaine
de la linguistique informatique qui a beaucoup retenu l’attention ces dernières
années, tant du côté de l’industrie que de l’universitaire, en raison
principalement de l’engagement croissant desutilisateurs dans les médias
sociaux (Chen & Zimbra, 2010)
Qu'est-ce qu'une
opinion ?
Dans la PNL (Natural language processing) l’information textuelle classée en deux classes principales :
les faits et les opinions.
Les faits représentent les expressions objectives sur une chose, mais les
opinions en générale représentent des expressions
subjectives tout en décrivant la polarité des sentiments des personnes à
l'égard d'un sujet (Négative, positive et neutre).
Portée de
l'analyse des sentiments
Selon (Collomb, Joyeux, Hasan, & and Brunie, 2007)l’analyse
des sentiments peut être divisée en trois (3) catégories :
1. Niveau de document
2. Niveau de la phrase
3. Niveau de l’aspect
Niveau de
document
Dans ce niveau, la tâche exprime une polarité générale de document
traité, sentiment tantôt positive tantôt négative (Pang, Lillian, & a
Shivakumar, 2002)
Par exemple dans un revu d’opinion sur un produit le système détecte l’avis
globale sur le produit. Cette dernière connue sous le nom classification de
sentiment au niveau du document. L’inconvénient majeur de cette méthode,
est celui des avis précis sur les différents composants des produits.
Niveau de la phrase
Permet d’extraire chaque phrase avec sa polarité (positive, négative,
neutre).Nous traitons l’identification d’une phrase comme subjective ou
objective, appelée classification de subjectivité (Wiebe, et al., 1999).Ces phrases subjectives sont considérées comme étant des petits
documents et sont ensuite classées en extrayant et en classifiant les opinions
comme positives ou négatives.
Niveau d'aspect
C’est le niveau le plus fine. L’objectif est de définir chaque
entité (caractéristique) avec sa polarité positive, négative, neutre. Nommé niveau
de fonctionnalité (exploration et synthèse d'opinion basées sur les
fonctionnalités) (Hu & Liu, 2004).
A ce niveau en peut produire un résumé structuré des opinions avec ces
aspects (transformant le texte non structuré en données structurées).
La tâche de l’analyse des sentiments basés sur l’aspect est divisée en trois
sous tâches:
Tache 1 : l’extraction d’aspect et d’opinion
Tache 2 : l’analyse du lexique des sentiments : consiste à déterminer la
polarité des mots d'aspects (extrayons lors de la tache 1).en utilisons des
lexiques, Senti-Word Net (Esuli & Sebastiani, SentiWordNet: A publicly
available resource for opinion mining, 2006) , Senti-Net (Esuli & Sebastiani), WordNet-Affect (Strapparava, Valitutti,
& al, 2004)
Tache 3 : la synthèse des opinions (Hu & Liu, 2004).
Types d'analyse
des sentiments
Il existe de nombreux types et d’outils de SA (sentiment
analysis), quelqu’un pour définir la polarité (positifs, négatifs, neutres) ou
permettant de détecter les sentiments et les émotions (en colère, heureux,
triste, etc.) ou d’identifier les intentions (par exemple, v. V. pas intéressé).
Dans la section suivante, nous couvrirons les plus importants.
Analyse fine des sentiments
Diviser en différents catégories tell que :
• Positif
• Négatif
• Neutre
• Très positif
• Très négatif
Pour mieux préciser aux niveaux d’opinion, au lieu d’écrire notre opinion nous
pouvons choisir l’un des classes.
Par exemple, si on mappe sur une note de 5 étoiles dans une critique
c’est-à-dire « Très positif » :
Très positif = 5 étoiles
Très négatif = 1 étoile
D’autres systèmes offrent une liaison entre la polarité (positif, négatif,
neutre) et les
sentiments particuliers, tel que :
• Bonheur, amour, colère : on comprend que tous ces derniers sont des
sentiments positifs.
Détection
d’émotion
La détection des émotions consiste à détecter : le bonheur, la
frustration, la colère, la
tristesse, etc. De nombreux systèmes de détection des émotions ont recours à
des lexiques (listes de mots et émotions qu’ils véhiculent) ou à des
algorithmes d’apprentissage automatique complexes.
L'un des inconvénients du recours aux lexiques, c’est que la façon dont les
gens expriment leurs émotions varie beaucoup, de même que les éléments lexicaux
qu'ils utilisent. Certains mots qui expriment généralement la colère comme merde
ou tuer (par exemple, dans votre produit est une merde ou votre
support client me tuer) peuvent également exprimer le bonheur (par exemple
dans des textes tels que This Is the shitou You kill the it).
Analyse des
sentiments basée sur l'aspect
Habituellement, lors de l’analyse du sentiment chez des sujets,
par exemple des produits, nous voudrons peut-être savoir non seulement si les
gens parlent avec une polarité positive, neutre ou négative du produit, mais
aussi quels aspects ou caractéristiques du produit dont ils parlent. C'est ce
sur quoi repose l'analyse des sentiments. Dans notre exemple précédent :
"La durée de vie de la batterie de cet appareil photo est trop
courte."
La phrase exprime un avis négatif sur l'appareil photo, mais plus précisément
sur la durée de vie
de la batterie, qui est une caractéristique particulière de l'appareil photo
Analyse
d'intention
L'analyse d'intention détecte essentiellement ce que les gens
veulent faire avec un texte plutôt qu’est- ce- qu'ils disent avec ce texte ?
Exemple :
« Votre support client est un désastre. Je suis en attente depuis 20 minutes
».
“J'aimerais savoir comment remplacer la cartouche”.
"Pouvez-vous m'aider à remplir ce formulaire ?"
Un être humain n'a aucun problème à détecter la plainte dans le premier
texte, la question dans le deuxième texte et la demande dans le troisième
texte. Cependant, les machines peuvent avoir des problèmes pour les identifier.
Parfois, l'action voulue peut-être déduite du texte, mais parfois, l'inférence
nécessite une certaine connaissance du contexte.
Analyse du
sentiment multilingue
L’analyse de sentiment multilingue peut être une tâche difficile,
un prétraitement important est nécessaire et ce prétraitement utilise un
certain nombre de ressources. La plupart de ces ressources sont disponibles en
ligne (par exemple, des lexiques de sentiments), mais de nombreuses autres
doivent être créées (par exemple, des corpus traduits ou des algorithmes de détection
de bruit). L'utilisation des ressources disponibles nécessite une grande
expérience de la programmation et sa mise en œuvre peut être longue.
Une autre solution serait de détecter automatiquement la langue dans les
textes, puis de former un modèle personnalisé pour la langue de notre choix et,
enfin, d'effectuer l'analyse.
L’importance de
l’analyse des sentiments
Les données non structurées posent un grand problème dans la
plupart des entreprises qui gèrent des grosses informations textuelles, telle
que les commentaires, les courriers électroniques, et les articles …etc.
Ces informations sont plus difficiles à gérer manuellement, c’est qu’on énonce
les
différentes recherches aux sciences de données.
L’analyse des sentiments revient comme une solution des entreprises permettant
de
comprendre ces difficultés de texte non structurée à partir des processus
d’optimisations en obtenant des informations exploitables et on doit éviter le
traitement manuelle (l’économisation de temps). (MonkeyLearn, s.d.)
Nous présentons certains avantages de SA (MonkeyLearn, s.d.):
• Evolutivité :
L’analyse des sentiments est de plus en plus efficace dans le cas de traitement
des textes (tweets, conversations …) manuellement, elle peut appliquer des
techniques à grand échelle
• Analyse en temps réel :
Nous pouvons utiliser l'analyse des sentiments pour identifier des
informations critiques qui permettent une connaissance de la situation lors de
scénarios spécifiques en temps réel.
Existe-t-il une crise de relations publiques dans les médias sociaux sur le
point d’éclater?
Un client en colère qui est sur le point de se désengager ?
Un système d'analyse des sentiments peut aider à identifier immédiatement ce
type de situation et à agir.
• Critères cohérents :
L’observation des personnes peut évaluer les sentiments qui se diffère
d’une personne à l’autre, On estime que différentes personnes ne s’entendent
que dans 60 à 65 % (MonkeyLearn,s.d.)des cas pour juger du sentiment d'un texte
en particulier.
Alors la tâche dans ce cas est subjective qui est fortement influencée par des
expériences personnelles, des pensées et des croyances.
Les systèmes de
SA peuvent appliquer le même critère à toutes les données, Cela aide à réduire
les erreurs et à améliorer la cohérence des données.


0 Commentaires