Ouverture des données

38
OUVERTURE DES DONNÉES

description

Ouverture des données. Le projet d'établissement de l'ABES 2008-2011 , p. 4. Ouverture. « open » à toutes les sauces… Comment mesurer une vraie politique d’ouverture ? En exposant les données et en offrant des services , donner les moyens de se passer des applications ABES. - PowerPoint PPT Presentation

Transcript of Ouverture des données

Page 1: Ouverture des données

OUVERTURE DES DONNÉES

Page 2: Ouverture des données

Le projet d'établissement de l'ABES 2008-2011, p. 4

Page 3: Ouverture des données

Ouverture

• « open » à toutes les sauces…• Comment mesurer une vraie politique d’ouverture ?

 En exposant les données et en offrant des services, donner les moyens de se passer des applications ABES

Page 4: Ouverture des données

STAR comme Boîte aux lettres

Page 5: Ouverture des données

Questions préalables

• Questions juridiques– Quelles données ? Quelles licences ?– Dossier complexe en cours d’instruction– Volonté d’être aussi libéral que possible

• Questions techniques– Données brutes / services– Rapidité– Simplicité– Standards

Page 6: Ouverture des données

Ouvrir les données du Sudoc

• Fil RSS 2010

• Z39.50 2010

• Chargement dans Worldcat 2010-

• Référencement par les moteurs 2011

• Exposition des données bibliographiques et d’autorité en RDF 2011

• Micro Web Service Where 2011

Page 7: Ouverture des données

Fil RSS du Sudoc

Merci à Etienne Cavalié

Page 8: Ouverture des données

Z39.50

• Une version riche réservée aux membres du réseau sudoc

• Une version partielle et publique– Notices moins riches– Notices ISSN retirées depuis peu

Page 9: Ouverture des données

Sudoc dans Worldcat

• Chantier épique– Dernier chargement : été 2010– Travail sur la synchronisation en cours• Difficulté majeure : la synchronisation des notices dépend de la synchronisation des informations sur les bibliothèques

• Conséquence : les identifiants OCLC (OCN) sont dans les notices Sudoc– Ce qui facilite l’utilisation de certains services (OCLC, Google Books, Open Library et autres)

Page 10: Ouverture des données

Exposition des données bibliographiques

• URL pérennes• Pages HTML dédiées aux moteurs de recherche– sauf notices ISSN

• Pages RDF pour le Web de données– sauf notices ISSN

Page 11: Ouverture des données

Des URL pour le Sudoc

PPN 012367206

URL pérenne de la notice http://www.sudoc.fr/012367206 

URL pérenne de la notice en RDF http://www.sudoc.fr/012367206.rdf 

http://www.sudoc.fr/012367206 renverra• soit de l’HTML• soit du RDF

en fonction du contexte (négociation de contenu)

Page 12: Ouverture des données

Des pages Sudoc en HTML pour les moteurs ou les humains

• Si un humain passe par http://www.sudoc.fr/012367206, il sera renvoyé vers http://www.sudoc.abes.fr/DB=2.1/SRCH?IKT=12&TRM=012367206 (la page actuelle)

• Si c’est un moteur, on lui servira une page dédiée, pour un meilleur référencement Web

Page 13: Ouverture des données

Sudoc et le Web de données

Page 14: Ouverture des données
Page 15: Ouverture des données

Micro Web Service Where

• Web service mono-tâche : lister les bibliothèques possédant un document

• Fonctionnement :– Requête = 1 URL avec 1 identifiant de document (PPN)– Réponse = 1 liste de bibliothèques avec libellé court et code (RCR)

• Deux formats :– XML– JSON

Page 16: Ouverture des données

http://www.sudoc.fr/ppn/where/144089661 

Page 17: Ouverture des données

http://www.sudoc.fr/ppn/where/144089661

Page 18: Ouverture des données

Ouvrir les données de IdRef

• URL pérennes www.idref.fr/* 2010

• Exposition des données en RDF 2010

• Micro Web Service Biblio 2011

• Enrichissement des pages HTML et RDF par le service Biblio 2011

• Web service de recherche 2011

• Brancher IdRef dans un autre site 2011

Page 19: Ouverture des données

Des URL pour IdRef

PPN 026789450

URL pérenne http://www.idref.fr/026789450 

URL pérenne de la notice en RDF http://www.idref.fr/026789450.rdf 

URL pérenne de la notice en UNIMARC/XML

http://www.idref.fr/026789450.xml 

http://www.idref.fr/026789450 renvoie• soit de l’HTML• soit du RDF

en fonction du contexte (négociation de contenu)

Page 20: Ouverture des données

Micro Web Service Biblio

• Web service mono-tâche : lister les documents liés à l’autorité d’une personne, rôle par rôle.

• Fonctionnement :– Requête = 1 URL avec 1 identifiant de personne (PPN)– Réponse = 1 liste de documents, ventilée par rôle (auteur, préfacier…)

• Deux formats :– XML– JSON

Page 21: Ouverture des données

http://www.idref.fr/person/docs/026789450 

Page 22: Ouverture des données

HTML d’IdRef enrichi par le service Biblio

REL TT en HTMLpour les intimes

Page 23: Ouverture des données

RDF d’IdRef enrichi par le service Biblio

REL TT en RDFpour les intimes

Page 24: Ouverture des données

Web service de recherche d’IdRef

• Objectif = intégrer la recherche sur les autorités Sudoc dans une autre application– Exemple : aide à la saisie (auto-complétion)

• Solution–Web service natif de Solr : riche et puissant–Mêmes possibilités que via l’interface Web

Page 25: Ouverture des données

Exemple

• Nom = Jean Rau*

• http://www.idref.fr/Sru/Solr?wt=xml&version=2.2&start=&rows=30&indent=on&fl=id,ppn_z,affcourt_z&q=persname_t:(jean AND rau*)

• http://www.idref.fr/Sru/Solr?wt=xml&version=2.2&start=&rows=30&indent=on&fl=id,ppn_z,affcourt_z&q=persname_t:(jean AND rau*)

Page 26: Ouverture des données

Brancher IdRef sur un autre site

• Objectif : enrichir son site (ou application Web) des fonctionnalités d’IdRef– Recherche– Lien aux autorités– Création et modification de notices

• Méthode : IdRef comme popup• Solution : Javascript

– Code fourni par l’ABES– À modifier pour intégrer dans son site

Page 27: Ouverture des données

Ouvrir les données de Calames

• Serveur OAI-PMH 2010

• RDF enrichi 2011

Page 28: Ouverture des données

Moissonner Calames en OAI-PMH

• Format : Dublin Core, pas EAD– On perd la hiérarchie et certains niveaux

• 1er utilisateur : CERL Portal (portail du Consortium 

européen  des bibliothèques de recherche)

Page 29: Ouverture des données
Page 30: Ouverture des données

Calames et le Web de données

• Métadonnées RDFa dans les pages Calames depuis 2008

• Enrichissement 2010 : liens entre les métadonnées RDF de Calames et les autorités en RDF d’IdRef

• Moissonné en RDFa par :– Sindice (moteur de recherche RDF généraliste)– Isidore (moteur de recherche SHS du CNRS)

Page 31: Ouverture des données
Page 32: Ouverture des données

Ouvrir les donnéesde STAR et de theses.fr

• Serveur OAI-PMH de STAR 2010

• URL pérennes www.theses.fr/* 2010

• Exposition des données en RDF 2010 + 2011

• Web service pour interroger www.theses.fr 2011

Page 33: Ouverture des données

Moissonner STAR en OAI-PMH

• Formats : Dublin Core, TEF• Sets :– Etablissements de soutenance– Domaines (classes Dewey)– Diffusable en texte intégral ou non

Page 34: Ouverture des données
Page 35: Ouverture des données

URL pérennes des thèses

Numéro national de thèse 2008INPL070N

URL de la page décrivant la thèse http://www.theses.fr/2008INPL070N 

URL  du document où qu’il soit (s’il est diffusé)

http://www.theses.fr/2008INPL070N/document

Page 36: Ouverture des données

Exposition des métadonnées de thèses en RDF

• Aujourd’hui– Seulement les thèses de STAR– RDFa dans les pages HTML comme http://www.theses.fr/2008INPL070N 

• Bientôt– Toutes les thèses– RDF/XML en plus à http://www.theses.fr/2008INPL070N.rdf et http://www.theses.fr/2008INPL070N.xml

Page 37: Ouverture des données

Web service de recherche de www.theses.fr

• Objectifs :– Recherche fédérée par d’autres portails– Alertes– Intégration dans d’autres sites

• Solution– OpenSearch– Requête = une URL– Réponse = un flux ATOM– D’autres formats de réponse viendront

Page 38: Ouverture des données

Vous êtes ici