Post on 18-Dec-2014
description
Aquinum hacke la Cantine!13 Janvier 2011
1
Infobésité L’internaute = producteur d’information Développement du web social et collaboratif
▪ Statuts et contenus multimédia
Mobilité Smartphones et tablettes Applications
▪ Géolocalisation, Microblogging, Q/R
2
Outil de veille stratégique Détection d’informations en temps réel Analyse et vérification des messages des internautes Diffusion d’une information vérifiée et qualifiée
Cibles Médias Entreprises
Thématiques de recherche les catastrophes naturelles dans le monde les mouvements sociaux en France
3
Source : @carelpedre
« Information précoce, incertaine, non vérifiable, non recoupée »
Igor Ansoff (1975) Périmètre défini
Fiabilité Pertinence Priorité
Aide à la décision Individuelle et/ou collective Médias, entreprises, ONG
4
Source : The Gleaner
Traitement automatique du langage (TAL) Corpus de textes
▪ Sources▪ expert et témoin
▪ Langues▪ anglais et français
5
Processus de fouille de textes
• Acquisition• Nettoyeur• Etiqueteur • Extraction des termes• Détection et classification de concepts • Extraction d’informations
Fréquence + Similarité
Processus de fouille de textes
• Acquisition• Nettoyeur• Etiqueteur • Extraction des termes• Détection et classification de concepts • Extraction d’informations
Fréquence + Similarité
6
Information
PUBLICATION
SOURCES
FLUX
POUBELLE
CRAWLERFILTRE
VERIFICATION
Exemples « storm » « heavy rain » « flood »
« innondations »
7
Prototype 7 beta testeurs 1400 messages par minute 70% - 90% de messages sémantiquement valides
Notation des sources, ergonomie et pluridisciplinarité
8
9
Blog de l’outil : http://www.langma.infoPrésentation Béatrice LajousContact :Benjamin Rosoor Twitter : @webreport