Découvrir le web sémantique en 15 minutes (Decideo 2014)

37
Découvrir le Web Sémantique en 15 minutes François Belleau http://ca.linkedin.com/in/fbelleau http://slideshare.net/fbelleau

description

Présentation sur le Web Sémantique au forum Decideo 2014 à Québec

Transcript of Découvrir le web sémantique en 15 minutes (Decideo 2014)

Page 1: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Découvrir le Web Sémantique

en 15 minutesFrançois Belleau

http://ca.linkedin.com/in/fbelleau

http://slideshare.net/fbelleau

Page 2: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Quel pays a produit le plus grand nombre de compositeurs ?

Page 3: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Demandons à GOOGLE...

Page 4: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Demandons à Wikipedia...

Page 5: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Demandons à DBpedia, la version sémantique de Wikipedia…

http://dbpedia.org/fct/

Page 6: Découvrir le web sémantique en 15 minutes (Decideo 2014)

1...

Page 7: Découvrir le web sémantique en 15 minutes (Decideo 2014)

2...

Page 8: Découvrir le web sémantique en 15 minutes (Decideo 2014)

3...

Page 9: Découvrir le web sémantique en 15 minutes (Decideo 2014)

4...

Page 10: Découvrir le web sémantique en 15 minutes (Decideo 2014)

5...

Page 11: Découvrir le web sémantique en 15 minutes (Decideo 2014)

6...

Page 12: Découvrir le web sémantique en 15 minutes (Decideo 2014)

7...

Page 13: Découvrir le web sémantique en 15 minutes (Decideo 2014)

8...

Page 14: Découvrir le web sémantique en 15 minutes (Decideo 2014)

9...

Page 15: Découvrir le web sémantique en 15 minutes (Decideo 2014)

10, et voilà !

Page 16: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Le secret : le langage de requête SPARQL au coeur du Web Sémantique

Page 17: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Qu’est-ce que le Web Sémantique ?

Page 18: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Selon Google

Page 20: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Web sémantique selon Wikipedia

Le Web sémantique, ou toile sémantique1, est un mouvement collaboratif mené par le World Wide Web Consortium (W3C)2 qui favorise des méthodes communes pour échanger des données.Le Web sémantique vise à aider l'émergence de nouvelles connaissances en s'appuyant sur les connaissances déjà présentes sur Internet. Pour y parvenir, le Web sémantique met en œuvre le Web des données qui consiste à lier et structurer l'information sur Internet pour accéder simplement à la connaissance qu'elle contient déjà3.Selon le W3C, « le Web sémantique fournit un Modèle qui permet aux données d'être partagées et réutilisées entre plusieurs applications, entreprises et groupes d'utilisateurs »3.

Page 21: Découvrir le web sémantique en 15 minutes (Decideo 2014)

RDF

Resource Description Framework (RDF) est un modèle de graphe destiné à décrire de façon formelle les ressources Web et leurs métadonnées, de façon à permettre le traitement automatique de telles descriptions.

Page 22: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Un document RDF est composé de triplets

<SUJET> <PRÉDICAT> <OBJET> .ou

<SUJET> <PRÉDICAT> “LITÉRAL” .

Page 23: Découvrir le web sémantique en 15 minutes (Decideo 2014)

La version HTML dans Wikipedia

Page 24: Découvrir le web sémantique en 15 minutes (Decideo 2014)

La version RDF de DBpedia

Page 25: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Les triplets en format NTRIPLE

Page 26: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Triplestore

Un triplestore est une base de données spécialement conçue pour le stockage et la récupération de données RDF (Resource Description Framework).

Virtuoso d’OpenLink est un triplestore disponible en logiciel libre.http://virtuoso.openlinksw.com/dataspace/doc/dav/wiki/Main/VOSDownload

Page 27: Découvrir le web sémantique en 15 minutes (Decideo 2014)

OWL

Web Ontology Language (OWL) est un langage de représentation des connaissances construit sur le modèle de données de RDF. Il fournit les moyens pour définir des ontologies web structurées. Sa deuxième version est devenue une recommandation du W3C fin 2012.

Protégé est un excellent éditeur d’ontologie.http://protege.stanford.edu/

Page 28: Découvrir le web sémantique en 15 minutes (Decideo 2014)

SPARQL

SPARQL (prononcé sparkle en anglais : « étincelle ») est un langage de requête et un protocole qui permet de rechercher, d'ajouter, de modifier ou de supprimer des données RDF disponibles à travers Internet. Son nom est un acronyme récursif qui signifie SPARQL Protocol and RDF Query Language.

http://www.w3.org/TR/sparql11-overview/

Page 29: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Linked Datahttp://linkeddata.org/

Page 30: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Comment le Web Sémantique peut-il nous aider dans l’analyse des données et la prise de décision ?

L’expérience du projet Bio2RDF :Pour répondre à une question difficile, il faut d’abord construire la base de données spécifique pour y répondre, il faut amalgamer les données (mashup).

Page 31: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Méthodologie du mashup sémantique

● Concevoir son ontologie;● Identifier les sources de données

disponibles dans le nuage du Linked Data;● Convertir ses propres données en triplets,

au format RDF;● Populer un triplestore avec les triplets

nécessaires (Virtuoso, Jena, 4store, etc)● Explorer le mashup et soumettre sa question

en SPARQL

Page 32: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Les outils utilisées dans le cadre du projet Bio2RDF

● Le site DataHub.io recence plus de 700 SPARQL endpoints○ http://datahub.io/fr

● Le triplestore Virtuoso d’OpenLink, le MySQL du web sémantique

● L’éditeur d’ontologie Protégé● Le logiciel d’ETL Talend

○ http://www.talend.com/● Les composants sémantiques pour Talend

○ https://github.com/fbelleau/talend4sw

Page 33: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Processus Talend pour copier localement le RDF de DBpedia

Page 34: Découvrir le web sémantique en 15 minutes (Decideo 2014)

http://localhost:8890/fct/facet.vsp

Page 35: Découvrir le web sémantique en 15 minutes (Decideo 2014)

Talend4SW : des composants ETL pour le web sémantiquehttps://github.com/fbelleau/talend4sw

Page 36: Découvrir le web sémantique en 15 minutes (Decideo 2014)

En résumé

● Le Web Sémantique est une famille de technologies du W3C qui facilitent l’intégration des connaissances.

● Les meilleurs outils du WS sont des logiciels libres.

● La technologie d’ETL permet de transformer des données en RDF et de construire des mashup.

● Il est maintenant possible de poser des questions au Web!