LINGWAY - Opinion mining: exemples d'applications
-
Upload
documation-gestion-de-linformation-et-du-document-numerique-en-entreprise -
Category
Business
-
view
572 -
download
0
description
Transcript of LINGWAY - Opinion mining: exemples d'applications
www.lingway.com
LINGWAY e-Reputation
Donnez du sens à votre réputationDOCUMATION, 23-24 Mars 2011
LINGWAY e-reputation
Une nouvelle offre commerciale� Lancée au Semo en novembre 2010
Avantage compétitif : Analyse linguistique et sémantique� Se base sur une technologie qui compte déjà 200 clients
S’appuyant sur un projet de R&D Cap Digital� iPinion, budget 1,5 M€, avec Science Po-Medialab et Pikko
>
Clients et Partenaires
Direct ou indirect� Direct : Grands comptes, Administrations, etc.
� Agences Marketing / Communication / Etudes• Qui ajoutent leurs prestations spécifiques
Plusieurs clients et partenaires déjà opérationnels� Toyota, Ministère de la Culture, Expancion, LA
Worldwide, Logdirect, Image & Dialogue, Valtech
� + nombreux prototypes / évaluations en cours
>
Applications
Etudes marketing / communication� Web-mining : Production mensuelle d’un rapport d’analyse de notoriété
(quanti) et de réputation (quali)
� Analyse de blogs de panelistes (analyse quali ciblée)
Veille� Surveillance « temps réél »
� Bouquet de sources sous surveillance
« Community management »� Suivi de la « conversation Internet »
� Identification des thématiques abordées, des tonalités
� Intervention dans ce dialogue entre les internautes et la marque
>
Ne pas confondre …
e-Notoriétée-Réputatione-Opinion
>
e-Notoriété
De qui parle-ton ?� Des personnes, des entreprises, des marques, des partis, etc.
Qui parle ?� Un site de presse, twitter, un blog, un forum, etc.
A quel propos ?� D’autres personnes, d’autres marques, d’autres partis
� De sujets déjà connus ou émergents
Quand ?� L’évolution dans le temps est importante
Où?� Depuis quel pays, région, parle t-on ?
>
Qui parle ? Volumes de citations « cantonales »
De qui, de quoi ?
20 Juin 2010
L’indexation sémantique
20 Juin 2010
Quels acteurs politiques ?
20 Juin 2010
Comment ça évolue dans le temps ?
Quelles marques associées à «Japon» ?
20 Juin 2010
Ne pas confondre …
e-Notoriétée-Réputatione-Opinion
>
De quoi parlent t-ils ?
Ce qu’il ne faut pas faire …� Des tags clouds de chaines de caractères
� Tout ce qui entre 2 blancs est vu comme un mot !
Passer de la chaine de caractère au mot
Un nom, un adjectif, un verbe n’ont pas la même impo rtanceExemple : Les adjectifs négatifs … (sur une entreprise X)
Sur quoi porte ce qualificatif ?…
Autour de trompeur…
Enseigner l’anglais aux enfants de 3 ans ?
Enseigner l’anglais aux enfants de 3 ans ?
Tag clouds colorisés selon la nature du tag
Ne pas confondre …
e-Notoriétée-Réputatione-Opinion
>
« Bag of words » insuffisant
Opinion = Evaluation + thème� Les frais d’ouverture de compte sont trop élevés
� J’ai remarqué un effort d’amabilitéde la hot-line
� Le servicen’est pourtant pas totalement déshumanisé
Importance des « petits mots »� Depuis que je suis chez X, je rencontre plein de soucis
� Depuis que je suis chez X, je ne connais plus les soucis d’une agence classique
Analyse des tonalités (exemple social)
Un verbatim = un objet (ici caché), un thème que l’o n veut suivre (en jaune), des marquages de tonalités
« sentiment analysis »
20 Juin 2010
Mise en Oeuvre
25
Processus d’analyse de l’e-Réputation
Gestion des bouquets de sources
20 Juin 2010
Methodologie pour définir le bouquet
1- Faire une photo de la situation (stock)� Construire le stock de départ de pages existantes sur le sujet
� Visibles par Google, Yahoo, Facebook, Twitter, etc.
� Mesurer le volume
� Repérer les sources intéressantes à suivre
� Tâche initiale réalisée par Lingway
2- Parallèlement, faire un film sur l’évolution (flux)� Identifier en temps réél les nouvelles pages publiées sur Internet
� Pour mesurer le flux, et ses variations
� Tâche initialisée par Lingway puis suivie par le client
3- Constituer le bouquet pour l’application� En choisissant les sources dans les ressources existantes
� En ajoutant progressivement des sources à partir des flux observés
LINGUISTIQUE ?
DICTIONNAIRES+
MORPHOLOGIE +
SYNTAXE +
SEMANTIQUE
>
Petit déjeuner, 20 Mai 2010
Notre secret de fabrication: le dictionnaire
30
Dictionnaire standard� 150 000 concepts� Allemand, anglais, espagnol, français, néerlandais, portugais� En cours : italien et russe� Mise à jour et extensions régulières par une équipe de linguistes
Dictionnaires « métiers »� Complètent le dictionnaire standard� Banques Assurances, Automobile, Luxe, etc…
Ces dictionnaires permettent d’aborder la plupart des applications sans adaptation préalable� D’autres solutions commencent par dire « il n’y a plus qu’à faire le
dictionnaire» au moment de la mise en service…
Les dictionnaires Lingway
31
LINGWAY e-Reputation
Indexation temps réélRecherche avec expansion sémantique multilingueExtraction de métadonnées, entités nommées, thèmesAnalyse linguistique des tonalités et avisOutils de classement automatique ou assistéAide à la lectureAlertes, Annotations, taggingCartographieExports multi-formats, listes de diffusionGestion des dictionnaires
20 Juin 2010 32
100 clients directs et 200 via nos partenaires
www.lingway.com
Merci