Ouverture des données

Post on 10-Jan-2016

51 views 1 download

description

Ouverture des données. Le projet d'établissement de l'ABES 2008-2011 , p. 4. Ouverture. « open » à toutes les sauces… Comment mesurer une vraie politique d’ouverture ? En exposant les données et en offrant des services , donner les moyens de se passer des applications ABES. - PowerPoint PPT Presentation

Transcript of Ouverture des données

OUVERTURE DES DONNÉES

Le projet d'établissement de l'ABES 2008-2011, p. 4

Ouverture

• « open » à toutes les sauces…• Comment mesurer une vraie politique d’ouverture ?

 En exposant les données et en offrant des services, donner les moyens de se passer des applications ABES

STAR comme Boîte aux lettres

Questions préalables

• Questions juridiques– Quelles données ? Quelles licences ?– Dossier complexe en cours d’instruction– Volonté d’être aussi libéral que possible

• Questions techniques– Données brutes / services– Rapidité– Simplicité– Standards

Ouvrir les données du Sudoc

• Fil RSS 2010

• Z39.50 2010

• Chargement dans Worldcat 2010-

• Référencement par les moteurs 2011

• Exposition des données bibliographiques et d’autorité en RDF 2011

• Micro Web Service Where 2011

Fil RSS du Sudoc

Merci à Etienne Cavalié

Z39.50

• Une version riche réservée aux membres du réseau sudoc

• Une version partielle et publique– Notices moins riches– Notices ISSN retirées depuis peu

Sudoc dans Worldcat

• Chantier épique– Dernier chargement : été 2010– Travail sur la synchronisation en cours• Difficulté majeure : la synchronisation des notices dépend de la synchronisation des informations sur les bibliothèques

• Conséquence : les identifiants OCLC (OCN) sont dans les notices Sudoc– Ce qui facilite l’utilisation de certains services (OCLC, Google Books, Open Library et autres)

Exposition des données bibliographiques

• URL pérennes• Pages HTML dédiées aux moteurs de recherche– sauf notices ISSN

• Pages RDF pour le Web de données– sauf notices ISSN

Des URL pour le Sudoc

PPN 012367206

URL pérenne de la notice http://www.sudoc.fr/012367206 

URL pérenne de la notice en RDF http://www.sudoc.fr/012367206.rdf 

http://www.sudoc.fr/012367206 renverra• soit de l’HTML• soit du RDF

en fonction du contexte (négociation de contenu)

Des pages Sudoc en HTML pour les moteurs ou les humains

• Si un humain passe par http://www.sudoc.fr/012367206, il sera renvoyé vers http://www.sudoc.abes.fr/DB=2.1/SRCH?IKT=12&TRM=012367206 (la page actuelle)

• Si c’est un moteur, on lui servira une page dédiée, pour un meilleur référencement Web

Sudoc et le Web de données

Micro Web Service Where

• Web service mono-tâche : lister les bibliothèques possédant un document

• Fonctionnement :– Requête = 1 URL avec 1 identifiant de document (PPN)– Réponse = 1 liste de bibliothèques avec libellé court et code (RCR)

• Deux formats :– XML– JSON

http://www.sudoc.fr/ppn/where/144089661 

http://www.sudoc.fr/ppn/where/144089661

Ouvrir les données de IdRef

• URL pérennes www.idref.fr/* 2010

• Exposition des données en RDF 2010

• Micro Web Service Biblio 2011

• Enrichissement des pages HTML et RDF par le service Biblio 2011

• Web service de recherche 2011

• Brancher IdRef dans un autre site 2011

Des URL pour IdRef

PPN 026789450

URL pérenne http://www.idref.fr/026789450 

URL pérenne de la notice en RDF http://www.idref.fr/026789450.rdf 

URL pérenne de la notice en UNIMARC/XML

http://www.idref.fr/026789450.xml 

http://www.idref.fr/026789450 renvoie• soit de l’HTML• soit du RDF

en fonction du contexte (négociation de contenu)

Micro Web Service Biblio

• Web service mono-tâche : lister les documents liés à l’autorité d’une personne, rôle par rôle.

• Fonctionnement :– Requête = 1 URL avec 1 identifiant de personne (PPN)– Réponse = 1 liste de documents, ventilée par rôle (auteur, préfacier…)

• Deux formats :– XML– JSON

http://www.idref.fr/person/docs/026789450 

HTML d’IdRef enrichi par le service Biblio

REL TT en HTMLpour les intimes

RDF d’IdRef enrichi par le service Biblio

REL TT en RDFpour les intimes

Web service de recherche d’IdRef

• Objectif = intégrer la recherche sur les autorités Sudoc dans une autre application– Exemple : aide à la saisie (auto-complétion)

• Solution–Web service natif de Solr : riche et puissant–Mêmes possibilités que via l’interface Web

Exemple

• Nom = Jean Rau*

• http://www.idref.fr/Sru/Solr?wt=xml&version=2.2&start=&rows=30&indent=on&fl=id,ppn_z,affcourt_z&q=persname_t:(jean AND rau*)

• http://www.idref.fr/Sru/Solr?wt=xml&version=2.2&start=&rows=30&indent=on&fl=id,ppn_z,affcourt_z&q=persname_t:(jean AND rau*)

Brancher IdRef sur un autre site

• Objectif : enrichir son site (ou application Web) des fonctionnalités d’IdRef– Recherche– Lien aux autorités– Création et modification de notices

• Méthode : IdRef comme popup• Solution : Javascript

– Code fourni par l’ABES– À modifier pour intégrer dans son site

Ouvrir les données de Calames

• Serveur OAI-PMH 2010

• RDF enrichi 2011

Moissonner Calames en OAI-PMH

• Format : Dublin Core, pas EAD– On perd la hiérarchie et certains niveaux

• 1er utilisateur : CERL Portal (portail du Consortium 

européen  des bibliothèques de recherche)

Calames et le Web de données

• Métadonnées RDFa dans les pages Calames depuis 2008

• Enrichissement 2010 : liens entre les métadonnées RDF de Calames et les autorités en RDF d’IdRef

• Moissonné en RDFa par :– Sindice (moteur de recherche RDF généraliste)– Isidore (moteur de recherche SHS du CNRS)

Ouvrir les donnéesde STAR et de theses.fr

• Serveur OAI-PMH de STAR 2010

• URL pérennes www.theses.fr/* 2010

• Exposition des données en RDF 2010 + 2011

• Web service pour interroger www.theses.fr 2011

Moissonner STAR en OAI-PMH

• Formats : Dublin Core, TEF• Sets :– Etablissements de soutenance– Domaines (classes Dewey)– Diffusable en texte intégral ou non

URL pérennes des thèses

Numéro national de thèse 2008INPL070N

URL de la page décrivant la thèse http://www.theses.fr/2008INPL070N 

URL  du document où qu’il soit (s’il est diffusé)

http://www.theses.fr/2008INPL070N/document

Exposition des métadonnées de thèses en RDF

• Aujourd’hui– Seulement les thèses de STAR– RDFa dans les pages HTML comme http://www.theses.fr/2008INPL070N 

• Bientôt– Toutes les thèses– RDF/XML en plus à http://www.theses.fr/2008INPL070N.rdf et http://www.theses.fr/2008INPL070N.xml

Web service de recherche de www.theses.fr

• Objectifs :– Recherche fédérée par d’autres portails– Alertes– Intégration dans d’autres sites

• Solution– OpenSearch– Requête = une URL– Réponse = un flux ATOM– D’autres formats de réponse viendront

Vous êtes ici