Le Web sémantique. Un Web de métadonnées

35
Le Web sémantique. Un Web de métadonnées Tutoriel JABES 2010 – Yann Nicolas

description

Le Web sémantique. Un Web de métadonnées. Le Web est une collection de documents (HTML, PDF…) Le Web devient une collection de bases de données (RDF, RDFa). Web de documents vs Web de données. hier aujourd’hui demain. Données. Page HTML. - PowerPoint PPT Presentation

Transcript of Le Web sémantique. Un Web de métadonnées

Page 1: Le Web sémantique. Un Web de métadonnées

Le Web sémantique.Un Web de métadonnées

Tutoriel JABES 2010 – Yann Nicolas

Page 2: Le Web sémantique. Un Web de métadonnées

WEB DE DOCUMENTSVS

WEB DE DONNÉES

Le Web est une collection de documents (HTML, PDF…)

Le Web devient une collection de bases de données (RDF, RDFa)

Page 3: Le Web sémantique. Un Web de métadonnées

hier aujourd’hui demain

Page 4: Le Web sémantique. Un Web de métadonnées

LE CONTENU DES DONNÉES EST UTILISÉ DANS UN

DOCUMENT HTML Le Document HTML est fait pour être lu par des humains ;pas pour être exploité par des programmes

Données

Page HTML

Page 5: Le Web sémantique. Un Web de métadonnées

hier aujourd’hui demain

Page 6: Le Web sémantique. Un Web de métadonnées

LES DONNÉES SONT PRÉSENTES DANS LE

DOCUMENT HTMLLe Document HTML + RDFa peut être lu par des humains et exploité par des programmesLa base de données est dans le Web, pas sous le Web (deep Web)

Données

Page HTML

HTML + RDFa

Données

Page 7: Le Web sémantique. Un Web de métadonnées

LA VICTOIRE DES MÉTADONNÉES

• Rich snippets

• SearchMonkey

• Open Graph Protocol

Page 8: Le Web sémantique. Un Web de métadonnées

MÉTADONNÉES DE…

• Documents• Produits commerciaux• Entreprises et autres organismes• Evénements• Jeux• Recettes de cuisine

Page 9: Le Web sémantique. Un Web de métadonnées

MÉTADONNÉES DE RECETTE GOOGLE

Property Descriptionname (fn) Required. The name of the dish.recipeType (tag) The type of dish: for example, appetizer, entree, dessert ... photo Image of the dish being prepared.published The date the recipe was published, in ISO date format.summary A short summary describing the dish.review A review of the dish. Can include nested review information.

prepTime The length of time it takes to prepare the recipe for dish, in ISO 8601 duration format. Can use min, max as child elements to specify a range of time.

cookTime The time it takes to actually cook the dish, in ISO 8601 duration format. Can use min, max as child elements to specify a range of time.

totalTime (duration) The total time it takes to prepare the cook the dish, in ISO 8601 duration format. Can use min, max as child elements to specify a range of time.

nutritionNutrition information about the recipe. Can contain the following child elements: servingSize, calories, fat, saturatedFat, unsaturatedFat, carbohydrates, sugar, fiber, protein, cholesterol. These elements are not explicitly part of the hRecipe microformat, but Google will recognize them.

instructions The steps to make the dish. Can contain the child element instruction, which can be used to annotate each step.

yield The quantity produced by the recipe (for example, number of people served, number of servings, etc).

ingredient An ingredient used in the recipe. Can contain child items name (name of the ingredient) and amount. Use this to identify individual ingredients.

author Creator of the recipe. Can include nested person information.

Page 10: Le Web sémantique. Un Web de métadonnées

MÉTADONNÉES DE DOCUMENTSselon Yahoo

Page 11: Le Web sémantique. Un Web de métadonnées

MÉTADONNÉES DE DOCUMENTS

SELON YAHOO

Page 12: Le Web sémantique. Un Web de métadonnées

L’ENJEU Que le Web de données

ne parle pas seulement de vidéos, de produits commerciaux, de congrès et de recettes de

cuisinemais également

des fonds de nos bibliothèques, de nos thèses, de nos manuscrits, de nos articles, de nos revues…

et de nos auteurs, directeurs de thèse, organismes, vocabulaires …

Page 13: Le Web sémantique. Un Web de métadonnées

COMMENT METTRE NOS MÉTADONNÉES SUR LE WEB DE

DONNÉES ?

Sudoc.zip

Page 14: Le Web sémantique. Un Web de métadonnées

COMMENT METTRE NOS MÉTADONNÉES SUR LE WEB DE

DONNÉESsans y mettre nos notices ?Notices = paquets ficelés Ouvrir ces paquets !

Dissection d’une notice MARC Vers des métadonnées en RDF

Page 15: Le Web sémantique. Un Web de métadonnées

Partons d’une notice Sudoc en UNIMARC décrivant l’édition commerciale d’une thèse

Page 16: Le Web sémantique. Un Web de métadonnées

cam0 22 450 001 134144422005 20100315113520.000010 $a978-2-275-03443-0$bbr.$d38 EUR073 1$a9782275034430100 $a20090610d2009 k y0frey0103 ba101 0 $afre102 $aFR105 $ay va 001yy106 $ar200 1 $aAnthropologie juridique de la personne morale$bTexte imprimé$fJean-François Quievy,...$gpréface de Didier R. Martin,...210 $aParis$cLGDJ-Lextenso éd.$dDL 2009215 $a1 vol. (XI-416 p.)$d24 cm225 2 $aBibliothèque de droit privé$x0520-0261$vtome 510306 $aLGDJ = Librairie générale de droit et de jurisprudence320 $aBibliogr. p. [369]-396. Notes bibliogr. Index328 0$zTexte remanié de$bThèse de doctorat$cDroit privé$eParis 11$d2008410 |$tBibliothèque de droit privé$x0520-0261$v510451 |$tAnthropologie juridique de la personne morale$bTexte imprimé$fJean-François Quievy$c[S.l.]$n[s.n.]$d2008$p1 vol. (343 p.)606 $aAnthropologie juridique$2rameau606 $aSociétés$xDroit$2rameau606 $aPersonnes morales$2rameau686 $aKA.111$2local_cujas700 1$aQuievy$bJean-François$f1980-....$4070702 1$aMartin$bDidier$f1944-....$4080801 3$aFR$bAbes$c20100315$gAFNOR

Page 17: Le Web sémantique. Un Web de métadonnées

Notice = paquet

Mais j’ai triché

Page 18: Le Web sémantique. Un Web de métadonnées

cam0 22 450 001 134144422005 20100315113520.000010 $a978-2-275-03443-0$bbr.$d38 EUR073 1$a9782275034430100 $a20090610d2009 k y0frey0103 ba101 0 $afre102 $aFR105 $ay va 001yy106 $ar200 1 $aAnthropologie juridique de la personne morale$bTexte imprimé$fJean-François Quievy,...$gpréface de Didier R. Martin,...210 $aParis$cLGDJ-Lextenso éd.$dDL 2009215 $a1 vol. (XI-416 p.)$d24 cm225 2 $aBibliothèque de droit privé$x0520-0261$vtome 510306 $aLGDJ = Librairie générale de droit et de jurisprudence320 $aBibliogr. p. [369]-396. Notes bibliogr. Index328 0$zTexte remanié de$bThèse de doctorat$cDroit privé$eParis 11$d2008410 |$0001025449$tBibliothèque de droit privé$x0520-0261$v510451 |$0127264191$tAnthropologie juridique de la personne morale$bTexte imprimé$fJean-François Quievy$c[S.l.]$n[s.n.]$d2008$p1 vol. (343 p.)606 $3028070364$aAnthropologie juridique$2rameau606 $3027480968$aSociétés$xDroit$2rameau606 $3027883248$aPersonnes morales$2rameau686 $aKA.111$2local_cujas700 1$3127281851$aQuievy$bJean-François$f1980-....$4070702 1$3086099582$aMartin$bDidier$f1944-....$4080801 3$aFR$bAbes$c20100315$gAFNOR

Liens aux autorités

Page 19: Le Web sémantique. Un Web de métadonnées

Notice bibliographique avec liens aux autorités =

plusieurs paquets liés entre eux

Page 20: Le Web sémantique. Un Web de métadonnées

Edition de la Thèse. Titre = « Anthropologie… ». Langue = « fre »

Id=134144422 a pou

r dire

cteur

a pour sujet

a pour auteur

appartient à

Page 21: Le Web sémantique. Un Web de métadonnées

Id=134144422 a pou

r dire

cteur

a pour sujet

a pour auteur

appartient à

a pour langue

Page 22: Le Web sémantique. Un Web de métadonnées

Id=134144422

a pour directeur

a po

ur s

ujet

a pour auteur

appartient à

a po

ur la

ngue

La thèse comme Œuvre

. Titre = « Anthropologie… »

Id=123456789

a pour édition

Page 23: Le Web sémantique. Un Web de métadonnées

DÉMARCHE

• Vider la notice bibliographique• Déporter le maximum d’information dans

des notices d’autorité • L’information contenue dans une autorité est

» séparée» plus facile à réutiliser

Web de données : une façon de pousser cette logique jusqu’au bout

Page 24: Le Web sémantique. Un Web de métadonnées

DÉFAIRE LE PAQUET DE MÉTADONNÉES

• Décomposer la notice en affirmations élémentaires et indépendantes (triplets)

123456789 est de type Thèse123456789 a pour auteur127281851127281851 a pour nom « Jean-François Quiévy »123456789 a pour édition 134144422134144422 est de type Edition134144422 appartient à 001025449001025449 est de type Collection001025449 a pour titre « Bib. De droit privé »

Page 25: Le Web sémantique. Un Web de métadonnées

ON EST PASSÉ DE MARC À RDF (Resource Description

Framework – W3C)

123456789 a pour auteur 127281851

127281851 a pour nom« J.F. Quiévy »

• 2 informations indépendantes l’une de l’autre• 2 informations dans la même base ou non !

Information distribuée sur le Web

Page 26: Le Web sémantique. Un Web de métadonnées

Comment faire des liens si les informations qui composaient le paquet-notice sont éclatées ??sur le Web ?

Page 27: Le Web sémantique. Un Web de métadonnées

DES INFORMATIONS DÉCENTRALISÉES ET DES IDENTIFIANTS GLOBAUX

Information gérée par la base catalogue :

http://www.catalogue.org/123456789 a pour auteur http://www.referentiel.org/127281851

Information gérée par la base référentiel :

http://www.référentiel.org/127281851a pour nom « J.F. Quiévy »

Page 28: Le Web sémantique. Un Web de métadonnées

Qu’est-ce que ça change ????? #1

Page 29: Le Web sémantique. Un Web de métadonnées

N’IMPORTE QUI PEUT COMPLÉTER LA « NOTICE » !

• Car n’importe qui peut affirmer quelque chose sur ma thèse

Exemple :

http://www.ma-bib-perso.org/yann possède-un-exemplaire-de http://www.catalogue.org/134144422

Je m’exemplarise dans le Sudoc… ps : je prête aussi

Page 30: Le Web sémantique. Un Web de métadonnées

N’IMPORTE QUI PEUT RÉUTILISER MES DONNÉES!

• Car tout le monde comprend les triplets RDF (bientôt).

Exemple :

De nouvelles interfaces, de nouveaux outils

Où sont les limites du catalogue ? Une AOC ?

Page 31: Le Web sémantique. Un Web de métadonnées

RAISONNER

• N’importe qui peut tirer de mes données des choses que j’ignorais

• Exemple :• Le catalogue dit que ce livre appartient à la

collection http://www.issn.org/collection/001025449• La base ISSN dit que cette collection est une

collection d’ouvrages de droit privé (règle).« on » peut en déduire que ce livre est un livre de

droit privé (ce qui n’était pas dans la notice)

Page 32: Le Web sémantique. Un Web de métadonnées

LEVER LE DILEMME DE L’INTEROPÉRABILITÉ

• Dilemme :

• Populaire mais pauvre (Dublin Core simple)

• Rester riche et mourir seul (MARC, TEF)

• Solution : tef:auteursous-propriété dedc:creator

Page 33: Le Web sémantique. Un Web de métadonnées

NOS DONNÉES DANS LE WEB DE DONNÉES

• Calames RDFa en 2008

• Autorités Fin 2010

• STAR Fin 2010

• Portail des thèses 2011

Page 34: Le Web sémantique. Un Web de métadonnées

Aller plus loin• RDF Primer

http://www.w3.org/TR/rdf-primer/

• RDFa (RDF dans une page HTML) http://www.w3.org/TR/xhtml-rdfa-primer/

Page 35: Le Web sémantique. Un Web de métadonnées