Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

18
SEO & FOUILLE DE TEXTES L’extraction d’information

description

Les applications des technologies de web mining pour le SEO

Transcript of Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Page 1: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

SEO & FOUILLE DE TEXTESL’extraction d’information

Page 2: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Extraction d’information

• « Information extraction  »– Reconnaissance d’entités nommées– Identification des coréférences

(ONU=Organisation des Nations Unies)– Extraction de relations– Extraction d’évènements– Extraction de terminologies…

Page 3: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Reconnaissance des entités nommées

• La reconnaissance d'entités nommées est une sous-tâche de l'activité d'extraction d'information dans des documents

• Elle consiste à rechercher des objets textuels (c'est-à-dire un mot, ou un groupe de mots) catégorisables dans des classes telles que noms de personnes, noms d'organisations ou d'entreprises, noms de lieux, quantités, distances, valeurs, dates, etc.

Page 4: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Exemple : OpenCalais (Reuters)

Page 5: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Autre exemple

• Dbpedia Spotlight

Page 6: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Annotation automatique

Page 7: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Extraction d’évènements

Page 8: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Extraction de faits et de relations

Page 9: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Structuration de données non structurées

Page 10: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Revminer

Page 11: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Catégorisation automatique

Page 12: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

« Normalisation » des coréférences

• The Beatles• Beatles• Beatle• Beatles (The)• The Beatles (Group)

Page 13: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Génération de textes automatique

Page 14: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Génération de pages hubs

Page 15: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Maillage automatique

Page 16: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Analyse du sentiment

Page 17: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Conclusion

Page 18: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Merci !