Avec l’augmentation de l’utilisation de l’internet au marketing. Les gens peuvent adresser leurs critiques ou leurs commentaires sur des produits, des services, dans un tel ou tel endroit.
Des milliards d’internautes émettent leurs avis concernant des produits ou des services. Cette grande quantité d’information peuvent être utiles afin d’améliorer la qualité des produits et d’être une source d’information pour les clients.
Pour rendre utile les remarques et les critiques, les entreprises et les fournisseurs de produits et services sont appelés à améliorer leurs performances à partir de l’analyse des critiques des clients.
Le problème qui se pose est la mise en place d’un système informatique capable d’analyser ses critiques et d’aider les fournisseurs pour satisfaire leurs clients. Il est donc nécessaire de mettre en place un système capable d’explorer ses informations, ce système utilise les techniques et les approches et méthodes proposées par l’analyse des sentiments

L’analyse des sentiments (opinion mining)
L'analyse des sentiments ou l'analyse d'opinion est un processus permettant d'identifier la polarité de l'opinion en appliquant les techniques de traitement de langage naturel PNL et l'analyse de texte. Cela se fait en filtrant les phrases qui ne contribuent pas à la polarité, puis en extrayant les informations subjectives contenues dans le texte restant. C’est un domaine de la linguistique informatique qui a beaucoup retenu l’attention ces dernières années, tant du côté de l’industrie que de l’universitaire, en raison principalement de l’engagement croissant desutilisateurs dans les médias sociaux (Chen & Zimbra, 2010)



Qu'est-ce qu'une opinion ?
Dans la PNL (Natural language processing) l’information textuelle classée en deux classes principales : les faits et les opinions.
Les faits représentent les expressions objectives sur une chose, mais les opinions en générale représentent
des expressions subjectives tout en décrivant la polarité des sentiments des personnes à l'égard d'un sujet (Négative, positive et neutre).

Portée de l'analyse des sentiments
Selon (Collomb, Joyeux, Hasan, & and Brunie, 2007)l’analyse des sentiments peut être divisée en trois (3) catégories :
1. Niveau de document
2. Niveau de la phrase
3. Niveau de l’aspect

Niveau de document
Dans ce niveau, la tâche exprime une polarité générale de document traité, sentiment tantôt positive tantôt négative (Pang, Lillian, & a Shivakumar, 2002)
Par exemple dans un revu d’opinion sur un produit le système détecte l’avis globale sur le produit. Cette dernière connue sous le nom classification de sentiment au niveau du document. L’inconvénient majeur de cette méthode, est celui des avis précis sur les différents composants des produits.
Niveau de la phrase
Permet d’extraire chaque phrase avec sa polarité (positive, négative, neutre).Nous traitons l’identification d’une phrase comme subjective ou objective, appelée classification de subjectivité (Wiebe, et al., 1999).
Ces phrases subjectives sont considérées comme étant des petits documents et sont ensuite classées en extrayant et en classifiant les opinions comme positives ou négatives.
Niveau d'aspect
C’est le niveau le plus fine. L’objectif est de définir chaque entité (caractéristique) avec sa polarité positive, négative, neutre. Nommé niveau de fonctionnalité (exploration et synthèse d'opinion basées sur les fonctionnalités) (Hu & Liu, 2004).
A ce niveau en peut produire un résumé structuré des opinions avec ces aspects (transformant le texte non structuré en données structurées).
La tâche de l’analyse des sentiments basés sur l’aspect est divisée en trois sous tâches:
Tache 1 : l’extraction d’aspect et d’opinion
Tache 2 : l’analyse du lexique des sentiments : consiste à déterminer la polarité des mots d'aspects (extrayons lors de la tache 1).en utilisons des lexiques, Senti-Word Net (Esuli & Sebastiani, SentiWordNet: A publicly available resource for opinion mining, 2006)
, Senti-Net (Esuli & Sebastiani), WordNet-Affect (Strapparava, Valitutti, & al, 2004)
Tache 3 : la synthèse des opinions (Hu & Liu, 2004).

Types d'analyse des sentiments
Il existe de nombreux types et d’outils de SA (sentiment analysis), quelqu’un pour définir la polarité (positifs, négatifs, neutres) ou permettant de détecter les sentiments et les émotions (en colère, heureux, triste, etc.) ou d’identifier les intentions (par exemple, v. V. pas intéressé). Dans la section suivante, nous couvrirons les plus importants.
Analyse fine des sentiments
Diviser en différents catégories tell que :
• Positif
• Négatif
• Neutre
• Très positif
• Très négatif
Pour mieux préciser aux niveaux d’opinion, au lieu d’écrire notre opinion nous pouvons choisir l’un des classes.
Par exemple, si on mappe sur une note de 5 étoiles dans une critique c’est-à-dire « Très positif » :
Très positif = 5 étoiles
Très négatif = 1 étoile
D’autres systèmes offrent une liaison entre la polarité (positif, négatif, neutre) et les
sentiments particuliers, tel que :
• Bonheur, amour, colère : on comprend que tous ces derniers sont des sentiments positifs.

Détection d’émotion
La détection des émotions consiste à détecter : le bonheur, la frustration, la colère, la
tristesse, etc. De nombreux systèmes de détection des émotions ont recours à des lexiques (listes de mots et émotions qu’ils véhiculent) ou à des algorithmes d’apprentissage automatique complexes.
L'un des inconvénients du recours aux lexiques, c’est que la façon dont les gens expriment leurs émotions varie beaucoup, de même que les éléments lexicaux qu'ils utilisent. Certains mots qui expriment généralement la colère comme merde ou tuer (par exemple, dans votre produit est une merde ou votre support client me tuer) peuvent également exprimer le bonheur (par exemple dans des textes tels que This Is the shitou You kill the it).

Analyse des sentiments basée sur l'aspect
Habituellement, lors de l’analyse du sentiment chez des sujets, par exemple des produits, nous voudrons peut-être savoir non seulement si les gens parlent avec une polarité positive, neutre ou négative du produit, mais aussi quels aspects ou caractéristiques du produit dont ils parlent. C'est ce sur quoi repose l'analyse des sentiments. Dans notre exemple précédent :
"La durée de vie de la batterie de cet appareil photo est trop courte."
La phrase exprime un avis négatif sur l'appareil photo, mais plus précisément sur la durée de vie
de la batterie, qui est une caractéristique particulière de l'appareil photo

Analyse d'intention
L'analyse d'intention détecte essentiellement ce que les gens veulent faire avec un texte plutôt qu’est- ce- qu'ils disent avec ce texte ?
Exemple :
« Votre support client est un désastre. Je suis en attente depuis 20 minutes ».
“J'aimerais savoir comment remplacer la cartouche”.
"Pouvez-vous m'aider à remplir ce formulaire ?"
Un être humain n'a aucun problème à détecter la plainte dans le premier texte, la question dans le deuxième texte et la demande dans le troisième texte. Cependant, les machines peuvent avoir des problèmes pour les identifier. Parfois, l'action voulue peut-être déduite du texte, mais parfois, l'inférence nécessite une certaine connaissance du contexte.

Analyse du sentiment multilingue
L’analyse de sentiment multilingue peut être une tâche difficile, un prétraitement important est nécessaire et ce prétraitement utilise un certain nombre de ressources. La plupart de ces ressources sont disponibles en ligne (par exemple, des lexiques de sentiments), mais de nombreuses autres doivent être créées (par exemple, des corpus traduits ou des algorithmes de détection de bruit). L'utilisation des ressources disponibles nécessite une grande expérience de la programmation et sa mise en œuvre peut être longue.
Une autre solution serait de détecter automatiquement la langue dans les textes, puis de former un modèle personnalisé pour la langue de notre choix et, enfin, d'effectuer l'analyse.

L’importance de l’analyse des sentiments
Les données non structurées posent un grand problème dans la plupart des entreprises qui gèrent des grosses informations textuelles, telle que les commentaires, les courriers électroniques, et les articles …etc.
Ces informations sont plus difficiles à gérer manuellement, c’est qu’on énonce les
différentes recherches aux sciences de données.
L’analyse des sentiments revient comme une solution des entreprises permettant de
comprendre ces difficultés de texte non structurée à partir des processus d’optimisations en obtenant des informations exploitables et on doit éviter le traitement manuelle (l’économisation de temps). (MonkeyLearn, s.d.)
Nous présentons certains avantages de SA (MonkeyLearn, s.d.):
Evolutivité :
L’analyse des sentiments est de plus en plus efficace dans le cas de traitement des textes (tweets, conversations …) manuellement, elle peut appliquer des techniques à grand échelle
Analyse en temps réel :
Nous pouvons utiliser l'analyse des sentiments pour identifier des informations critiques qui permettent une connaissance de la situation lors de scénarios spécifiques en temps réel.
Existe-t-il une crise de relations publiques dans les médias sociaux sur le point d’éclater?
Un client en colère qui est sur le point de se désengager ?
Un système d'analyse des sentiments peut aider à identifier immédiatement ce type de situation et à agir.
Critères cohérents :
L’observation des personnes peut évaluer les sentiments qui se diffère d’une personne à l’autre, On estime que différentes personnes ne s’entendent que dans 60 à 65 % (MonkeyLearn,s.d.)des cas pour juger du sentiment d'un texte en particulier.
Alors la tâche dans ce cas est subjective qui est fortement influencée par des expériences personnelles, des pensées et des croyances.

Les systèmes de SA peuvent appliquer le même critère à toutes les données, Cela aide à réduire les erreurs et à améliorer la cohérence des données.