Réseaux :
IBM propose la solution « Social Media Analytics », qui décrypte les
messages sur les médias sociaux et permet aux marques de mieux
comprendre les attentes des consommateurs.
IBM a développé « Social Media Analytics
» : un outil mis principalement à disposition des entreprises de grande
consommation, qui tentent de mieux comprendre leurs consommateurs, mais
qui peut également élargir son usage à des questions de sécurité. Des
applications classiques sont la lutte contre la pédophilie, ou encore le
terrorisme. L’intérêt de ce logiciel réside dans la transformation de
données brutes et isolées en une stratégie opérationnelle efficace.
Nous
avons rencontré Eric Martin, responsable de l’offre « Social Media
Analytics » Europe. Celui-ci nous a éclairé sur ce logiciel qui analyse
le volume conséquent de messages qui transitent sur Facebook, Twitter
mais également les plateformes de vidéos, les forums de consommateurs ou
encore les flux RSS.
ZDNet : Quelle est votre base de données initiale ?Eric Martin : Nous sommes dans le domaine du « Big Data » donc nous analysons des informations à la volumétrie conséquente et qui évoluent sans cesse. Notre infrastructure est construite pour supporter le traitement de millions et de millions de posts, que ce soit des tweets, des messages sur Facebook, des commentaires de vidéos ou des revues de produits sur Amazon… Il est important de préciser que toutes les informations que nous exploitons sont publiques.
ZDNet : Quelle est votre base de données initiale ?Eric Martin : Nous sommes dans le domaine du « Big Data » donc nous analysons des informations à la volumétrie conséquente et qui évoluent sans cesse. Notre infrastructure est construite pour supporter le traitement de millions et de millions de posts, que ce soit des tweets, des messages sur Facebook, des commentaires de vidéos ou des revues de produits sur Amazon… Il est important de préciser que toutes les informations que nous exploitons sont publiques.
Nous n’avons
absolument pas accès aux données privées telles que les conversations
e-mail et nous sommes très sensibles au respect légal des données
privées. Une entreprise de l’ampleur d’IBM ne peut pas se permettre de
se situer dans les zones grises de la loi.
Comment le logiciel procède-t-il à l’analyse ?Tout d’abord, le logiciel demande au client utilisateur de spécifier une langue, des mots ou expressions clés et le type de sources qu’il souhaite scanner. Alors, le logiciel identifie le nombre de documents à disposition satisfaisant les critères de recherche.
Comment le logiciel procède-t-il à l’analyse ?Tout d’abord, le logiciel demande au client utilisateur de spécifier une langue, des mots ou expressions clés et le type de sources qu’il souhaite scanner. Alors, le logiciel identifie le nombre de documents à disposition satisfaisant les critères de recherche.
Dans
une deuxième phase, celui-ci ne se contente pas de repérer certains
mots clés polarisés positivement ou négativement mais observe également
l’architecture des phrases, leur grammaire.
Nous
sommes même capables de comprendre des sentiments. Une phrase qui semble
simple telle que « Le produit est super mais la hotline n’est pas
terrible. » est en réalité très complexe sur le plan sémantique. Elle
implique de savoir identifier que le produit est associé à un sentiment
positif et la hotline à un sentiment négatif.
Nous
prenons également en compte toute la terminologie spécifique des médias
sociaux : smileys, abréviations etc. Notre seule limite est notre
incapacité à détecter les mensonges, mais sur de tels volumes il s’agit
d’un épiphénomène.
Enfin, l’utilisateur peut définir
des seuils d’alerte, par exemple mentionner qu’il veut être alerté si le
nombre d’opinions négatives autour d’un produit augmentent d’au moins
10% en une semaine.
Ci-dessous le dashboard de Social Media Analytics (cliquer sur l'image pour le voir en gros plan)
Quelle est votre degré de compréhension ? Nous comprenons 85% des posts aussi bien que si nous effectuions un travail manuel. En effectuant un travail d’affinage des dictionnaires, c’est-à-dire en réglant le logiciel pour qu’il comprenne la polysémie, le fait qu’un même mot puisse prendre un sens différent dans des contextes variés, nous pouvons atteindre 90% de taux de précision.
Ci-dessous le dashboard de Social Media Analytics (cliquer sur l'image pour le voir en gros plan)
Quelle est votre degré de compréhension ? Nous comprenons 85% des posts aussi bien que si nous effectuions un travail manuel. En effectuant un travail d’affinage des dictionnaires, c’est-à-dire en réglant le logiciel pour qu’il comprenne la polysémie, le fait qu’un même mot puisse prendre un sens différent dans des contextes variés, nous pouvons atteindre 90% de taux de précision.
Une fois l’analyse effectuée, quels types de résultats publiez-vous ?
C’est
très vaste. Dans un premier temps le Dashboard détaille la structure du
buzz. Nous pouvons compter le nombre de fois où les internautes
évoquent certaines caractéristiques du produit : le prix, la couleur ou
encore la qualité. Combien d’opinions sont-elles positives ? Combien
sont-elles négatives ? Quelles sont les sources les plus prolifiques ?
Twitter ou les forums ? En fonction des sources, les tendances
varient-t-elles ? Les utilisateurs de Twitter peuvent par exemple être
satisfaits et pas ceux de Facebook…
Ensuite, nous
caractérisons qui parle en différenciant les opinions en fonction de
multiples critères : les sociotypes, le sexe, la région géographique
etc. Nous portons un regard bien particulier aux « influenceurs » qui
sont définis en utilisant les données de notoriété publiées par Klout ou
Kred. L’opinion de ces influenceurs est plus importante que les autres
pour les marques.
A quelle vitesse traitez-vous toutes ces données ?Nous
sommes dans le Big Data, les volumes sont considérables. Nous ne
faisons pas dans la haute fréquence car il faudrait réduire le volume à
analyser à une unique source pour accélérer le logiciel, Twitter par
exemple. De toute manière cela n’intéresse pas nos clients. Nous
travaillons plus avec des marques de la distribution qui veulent mettre
en place des stratégies à moyen terme qu’avec des institutions
financières.
Par conséquent, plus il y a de buzz et plus il y a de données, plus les informations tirées sont précises. En moyenne, le logiciel a besoin de deux heures pour rafraichir toute l’analyse.
Par conséquent, plus il y a de buzz et plus il y a de données, plus les informations tirées sont précises. En moyenne, le logiciel a besoin de deux heures pour rafraichir toute l’analyse.
Aucun commentaire:
Enregistrer un commentaire
Remarque : Seul un membre de ce blog est autorisé à enregistrer un commentaire.