Post on 13-Jan-2015
description
CC
BY-N
C-S
A V
icky
&C
hu
ck R
og
ers
, Fl
ickr
INTEROPERABILITÉ ET ÉCHANGES DE DONNÉES
Pauline Moirez – BnF – 26 juin 2012
AAF - Archives et Internet : les nouveaux enjeux
CC
BY-N
C-N
D J M
ark
Dod
ds,
Flic
kr
Mais qu’est-ce que c’est que ces gros mots…?!?
CC
BY-N
D H
elg
a W
eb
er,
Flic
kr
L’interopérabilité, pour vous… ?
INTEROPERABILITE = Permettre l'échange de données entre
systèmes d'information
Pouvoir se parler (transport des
données)
Se comprendre (sens des données
échangées)
CC
BY-N
C-N
D Josh
Fass
bin
d, Fl
ickr
La recette de l’interopérabilité de Grand-Maman
CC
BY-N
C-S
A Joan
a H
ard
, Fl
ickr
Des ingrédients de qualité
CC
BY-N
C-S
A Joan
a H
ard
, Fl
ickr
Des données hétérogènes… mais propres
Du matériel de pro
CC
BY-N
C C
ap
tain
Bla
ub
eere
, Fl
ickr
Des protocoles d’échange normalisés
De bonnes proportions
CC
BY-N
C-S
A p
alo
eti
c, F
lickr
Un langage commun
CC
BY R
ob
ert
Cou
se-B
ake
r, F
lickr
ECHANGER, POURQUOI ?
CC
BY-N
D Jere
my S
alm
on
, Fl
ickr
Améliorer la visibilité et la dissémination
des collections
Organiser l’accès à l’information pour
les usagers
CC
BY-N
C-N
D A
lain
Bach
elli
er,
Flic
kr
CC
BY-S
A e
30
00
, Fl
ickr
Dupliquer ?
Le contexte administratif et technique : le référentiel général d’interopérabilité
(RGI)
« détermine notamment les répertoires de données, les normes et les standards qui doivent être utilisés
par les autorités administratives »
Publié par la DGME en 2009
Les niveaux d’interopérabilité du RGI
Ex. modélisation, ontologies, mais aussi SEDA
Ex. formats d’images, de documents multimédia, formats bureautiques, langage XML
Ex. protocoles et langages Web et messagerie, téléphonie, annuaires LDAP
Pour parler la même langue : normaliser !
Normes et standards
archivistiquesRéférentiels
Formats de métadonnées
Schémas d’encodage
EAD
EAC
Thesaurus W
Rameau
DublinCore
METS
LanguesISO 639
PaysISO 3166
Où es-tu ?
UniquesPérennesCitables
Des identifiants pour les
ressources numériques
CC
BY-N
C-N
D x
cod
e, Fl
ickr
ARK : un format d’identification pérenne
CC
BY-N
C-N
D F
rid
ay F
lets
, Fl
ickr
ARK aux AD de la Somme
http://archives.somme.fr/ark:/58483/a011260969022JKSv1y/1/1
Le système ARK : structure et
organisationhttp://gallica.bnf.fr/ark:/12148/
bpt6k5809503p/f2.image
protocoletype
d’identifiant
numéro d’autoriténommante
(NAAN)
autorité d’adressage
(NMAH)
nom ARK
qualifieurs(facultatif)
Et dans la vraie vie…
CC
BY-N
C d
r co
op
, Fl
ickr
OAI-PMH
Un protocole d’échange
incontournable dans le domaine culturel
CC
BY
-NC
-ND
Mary
lise
Doct
rin
al,
F
lick
r
OAI-PMH =
Open Archives Initiative - Protocol for Metadata
Harvesting
Principes de fonctionnement du protocole OAI-PMH
© M
inis
tère
de la C
ult
ure
, 2
00
5
CC
BY-N
C-N
D G
err
y B
ald
ing
, Fl
ickr
Les acteurs de l’OAI-PMH
Le fournisseur de données (entrepôt)
Le fournisseur de services
(moissonneur)
The place to be ?
L’OAI-PMH en 2012, c’est :
1740 entrepôts enregistrésPlus de 25 millions d’enregistrements moissonnables C
C B
Y-N
C-N
D v
ally
gir
l_tk
a, Fl
ickr
Les concepts documentaires de
l’OAI-PMHRESSOURCE
Objet physique ou numérique
ITEMNotice
informatique (URL +
métadonnées)LOT / SET
Ensemble d’enregistrem
ents
ENREGISTREMENT
Unité documentaire
dans un entrepôt OAI
Exemple de notice
OAI
Qu’y a-t-il dans un enregistrement OAI-PMH ?
•Un en-tête : header
- identifier (obligatoire, non répétable)- datestamp (obligatoire, non répétable)- setSpec (facultatif, répétable)- attribut de statut pour les items supprimés
•Des métadonnées : metadata
- métadonnées encodées en XML avec leur élément racine et leur espace de nom - les entrepôts doivent fournir leurs métadonnées en Dublin Core simple ; ils peuvent proposer en plus d’autres formats
Qu’y a-t-il dans un enregistrement OAI-PMH ?
OAI-PMH a le vocabulaire d’un bébé de 18 mois !
CC
BY-N
C-N
D W
on
derm
on
key2
k, F
lickr
Parlez-vous OAI-PMH ?
La syntaxe de moissonnage : les 6
verbesIdentify : identifier l’entrepôt
ListMetadataFormats : lister les formats utilisés (Dubin Core, EAD, etc.)
ListSets : lister les ensembles d’enregistrements
ListRecords : lister les ressources décrites
ListIdentifiers : lister les références des ressources
GetRecord : récupérer une ressource particulière
CC BY-NC-SA Musebrarian, Flickr
OAI-PMHLes atouts
Il s'appuie sur les standards du Web, le moissonnage est simple à mettre en œuvre.Les contenus ne sont pas dupliqués.Les métadonnées collectées sont mises à jour simplement et automatiquement (moissonnage différentiel/incrémental).Il s’adapte à des besoins transdisciplinaires sans interdire des besoins plus spécialisés.
OAI-PMHLes limites
Problèmes de granularité et de hiérarchisationPas d’interrogation finePas de liens simples avec les ressources extérieuresLimité à la communauté des chercheurs et bibliothécaires
A VOUS DE JOUER…!
(n° 1-5)
CC
BY-N
C-N
D s
.red
, Fl
ickr
Dublin Core
À protocole d’échange générique… format de
métadonnées générique !
CC
BY
-NC
-SA
Davi
d S
herr
et,
Fli
ckr
15 éléments de description, facultatifs et répétables
CC
BY
-NC
-SA
Davi
d S
ky,
sou
rce
Améliorer la recherche de ressources sur le web, en définissant un
ensemble de métadonnées communes
Les 15 éléments du Dublin Core simple
Contenu Propriété intellectuelle
Instanciation
Title Creator Date
Subject Contributor Type
Description Publisher Format
Source Rights Identifier
Language
Relation
Coverage
Tous facultatifs
Tous répétables
Mais comment je fais du Dublin Core avec mes données à moi ?
CC
BY-S
A t
an
gi_
bert
in, Fl
ickr
La problématique des conversions
CC
BY-N
D t
om
aB
, Fl
ickr
http://www.cartolis.org/detail_notice.php?num=AA00000001&x=11&y=13
Une notice dans Cartolis
http://www.cartolis.org/oai/oai2.php?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:cartolis.org:AA00000001
La même en Dublin Core…
Et avec l’EAD ?
GRANULARITÉHIERARCHIE
CC
BY-N
C-N
D R
icky
david
, Fl
ickr
COMPLEXITÉ
Un fonds d’archives en EAD : les papiers Pierre et Marie Curie
Du fichier XML-EAD très structuré et hiérarchisé…
… à l’enregistrement en Dublin Core
… et c’est pas fini…
A partir d’informations contenues dans <archdesc>
Tableau de conversion EAD > Dublin Core
Dublin CoreLes atouts
Généricité : permet de décrire des ressources numériques ou physiques, utilisable par de nombreuses communautés
SimplicitéGrande souplesseUtilisation internationale
Les limites
Simplification des métadonnéesLibertés d’interprétation qui limitent l’interopérabilité sémantiqueValeurs des éléments non normalisées
Faiblesse des informations techniques
Dublin Core
OAI-PMH est simpleDublin Core est simple
Ce n’est pas une raison pour faire n’importe quoi !
CC
BY-N
D c
urs
eth
ing
, Fl
ickr
A VOUS DE JOUER…!
(n°6)
… et donc, finalement, à quoi ça sert…?
CC
BY-N
C p
cgn
7, Fl
ickr
… à participer à des portails collectifs !
Europeana, mère de tous les portails…
La nébuleuse des projets liés à Europeana
Le Portail archivistique européen
Des portails par type d’institution
Le « guichet unique » français : le moteur Collections
Des portails nationaux
Une dynamique est lancée... Les portails culturels locaux se multiplient
Banque numérique des savoirs aquitains
(BnsA)
GeoCulture en Limousin
Manioc, bibliothèque numérique des
Caraïbes
Mais aussi...
Isidore, plateforme de recherche pour les
sciences humaines et sociales (SHS)
Gallica et ses 41 bibliothèques partenaires
A VOUS DE JOUER…!
(n°7)
Pour aller plus loin…InteropérabilitéInteropérabilité : faire des choix, échanger, gérer le temps (S. Pouyllau, 2010)Voir EAD et interopérabilité :comment permettre le moissonnage demétadonnées normalisées par des portails (L. Grand, F. Rolland, 2010)
Identifiants pérennesIdentifiants pérennes (E. Bermès, 2009)Des identifiants pérennes pour les ressources numériques - L’expérience de la BnF (E. Bermès, 2006)ARK, qu’est-ce que c’est ? (2012).
OAI-PMHSite officiel de l’Open archive initiativeLe protocole OAI et ses usages en bibliothèque (MCC, 2005)Guide d'interopérabilité OAI-PMH pour un référencement des documents numériques dans Gallica (2010)Le Guide des Bonnes Pratiques Numériques - Entrepôt OAI-PMH (TGE Adonis, 2010)
Dublin CoreSite officiel de la Dublin Core Metadata initiativeGuide d’utilisation du Dublin Core à la BnF (2008).
Merci de votre attention
CC
BY-N
C G
o E
sew
here
, flic
kr
pauline.moirez@bnf.fr