Schema org-richsnippet-microdata-fr

22
jean-delahousse.net Schema.org Jean Delahousse http://jean-delahousse.net Introduction à Schema.org ou le SEO par la sémantique

description

La présentation positionne schema.org dans l'historique des langages et modeles utilises pour le balisage de page web. On s'interesse ensuite a la mise en oeuvre de fonctionnalites de plus en plus "semantique" de la part des moteurs de recherche, et a l'echange entre les moteurs qui offrent une meilleure visibilite aux contenus les mieux balisés. On détaille ensuite le modele Schema.org et a quoi ressemble le balisage en microdata. On montre que le travail fait pour avoir un meilleur referencement web, peut egalement etre utilisé pour avoir des fonctionnalités de recherche plus avancées dans l'intranet.

Transcript of Schema org-richsnippet-microdata-fr

Page 1: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Schema.org

Jean Delahoussehttp://jean-delahousse.net

Introduction à Schema.org ou le SEO par la sémantique

Page 2: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Balisage des pages web : historiqueLangages et Modèles

• 1989 : HTML (W3C) – Métadonnées html

• 2005 : Microformats (CommerceNet)– hCalendar, hCard, hNews, hAtom…

• 2008 : RDFa (W3C)– Ontologies du sémantic web : foaf, DublinCore…

• 2010 : Open Graph (Facebook)

• 2010 : HTML5/Microdata (W3C)

Page 3: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Des moteurs de plus en plus sémantiques

Page 4: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Des moteurs de plus en plus sémantiques

Page 5: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Juin 2011: création d’une modélisation commune pour le contenu des pages web

Un modèle adapté aux langages de balisage Microdata et RDFa

“Schema.org est une collaboration entre Bing, Google, Yahoo! Et Yandex pour faciliter la tâche des webmaster quand ils nous procure des données qui nous permettent de mieux diriger les utilisateurs vers leurs sites.” http://schema.org/docs/faq.html

Schema.org

Page 6: Schema org-richsnippet-microdata-fr

jean-delahousse.net

RichSnippets for banana bread

Page 7: Schema org-richsnippet-microdata-fr

jean-delahousse.net

RichSnippets for banana bread

Page 8: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Rich Snippets Testing Tool

Page 9: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Acheter un vélo et comparer les prix

Page 10: Schema org-richsnippet-microdata-fr

jean-delahousse.net

http://schema.org/docs/full.htmlThe type hierarchy schema : extrait

Page 11: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Les attributs et relations pour Person

Page 12: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Exemple de balisage microdata

Page 13: Schema org-richsnippet-microdata-fr

jean-delahousse.net

L’échange

• Les moteurs demandent aux entreprises plus de données structurées, plus de connaissances réutilisables par des systèmes automatisés

• En échange ils offrent aux entreprises – une meilleure visibilité de leurs contenus par le

RichSnippets– une prise en compte des contenus dans les

filtrages à facettes

Page 14: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Mise en place : méthode

Modèles de balisage adaptés aux contenus

de l’entreprise

Choix de vocabulaires contrôlés adaptés

lieux, sociétés, personnalités…

Traitement de balisage des pages webBases de données

Contenus

Alignement des modèles

Text MiningExtraction Personnes, lieux, produits..

pour enrichir le balisage

Page 15: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Mise en placeretraiter le stock de contenus

Réutilisation du balisage existant

métadonnées, codes xiti, fil d’ariane, microformats

Bases de données

ContenusText Mining

Enrichissement balisage

Personnes, lieux, produits..

Archives

Page 16: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Schema.org pour l’intranet• Construire des fonctions de recherche avancées dans les sites

web ou l’intranet : recherche à facette, index des sujets… en s’appuyant sur le balisage microdata / schema.org

Bases de données

Contenus

Page dans l’intranet Moteur de recherche intranet

Balisage de la page

Page 17: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Etendre le modèle en fonction de ses besoins

• Un mécanisme d’extension permet d’enrichir les classes et propriétés présentes dans Schema.org pour construire un schéma tenant compte des spécificités de l’organisation

• Etendre une classe : Person– Person/Engineer

• Etendre la propriété : musicGroupMember– musicGroupMember/leadVocalist – musicGroupMember/leadGuitar

Page 18: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Bases de données

Schema.org et Open Dataun exemple : data.bnf.fr

Traitements de publicationMulti-canalBases de

données

Contenus

Données structurées

RDF

HTML + microdata

Contenus

Page 19: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Vie de Schema.org

• Un groupe de travail dirigé par Dan Brickley pour l’évolution de Schema.org

• Des propositions d’évolutions provenant de différentes communautés– http://

www.w3.org/wiki/WebSchemas/SchemaDotOrgProposals

• Une mailing list de discussion– http://lists.w3.org/Archives/Public/public-vocabs/

• Des outils de test du balisage – http://www.google.com/webmasters/tools/richsnippets

Page 20: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Une ligne directrice pour les évolutions

• Objectif : Structurer les pages web pour améliorer la recherche

• La question n’est pas : comment décrire une voiture ? Mais comment je peux améliorer le balisage de pages qui parlent de voitures

• Simplifier le travail des webmasters et éditeurs

• Avoir un consensus entre les moteurs de recherche

Un seul objectif final : des services de recherche plus efficaces

Page 21: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Exercice

Faire une page web décrivant en microdata et en s’appuyant sur la modélisation Schema.org un événement :

« Le débat télévisé, sur Antenne2, entre F. Hollande, membre du PS et N. Sarkosi, membre de l’UMP, le 2/5/2012 »

Page 22: Schema org-richsnippet-microdata-fr

jean-delahousse.net

Sur l’auteur

KnowledgeConsult vous accompagne dans la définition et la mise en place de votre stratégie de

gestion des connaissances, travail collaboratif, gestion et diffusion de

contenus et données.KnowledgeConsult.com

Jean Delahousse, Directeur Associé chez KnowledgeConsult, est un expert des architectures de gestion et publication des contenus et des données, du web sémantique et de l’open-data.Il conseille les entreprises, média, éditeurs, administrations et centres de recherche pour construire et mettre en œuvre leur stratégie de valorisation des contenus et données. Mail : jean.delahousse dot knowledgeconsult.comBlog : jean-delahousse.net

Tweeter : @jdelahousse