Les métadonnées sont déjà là !
• Dixit Maurits : « La grande majorité des éditeurs produisent des métadonnées et livrent ces métadonnées aux bibliothèques.
En conséquence, les systèmes de catalogage partagé s’orientent vers la possibilité de manipulation des flux de métadonnées provenant des éditeurs. »
20/05/2014 à 14h37
• Que faire ? Attendre que tout soit en MARC ?
marc marc marc
rdf A B C
X Y Z
Métadonnées éditeur natives
MARC de l’éditeur
MARC importé dans
le Sudoc
MARC enrichi par le réseau
MARC exporté vers
les SIGB locaux
RDF exposé (2011-)
Sudoc
Open
data
Open
data
Métadonnées éditeur natives
MARC enrichi par le réseau
MARC exporté vers
les SIGB locaux
RDF exposé
Sudoc
KBART Métadonnées éditeur modélisées en RDF et
enrichies
Métadonnées RDF enrichies par le réseau
et le hub
Hub
Open
data
Open
data
Open
data
Outils / Données / Collaboration
• Le hub est un ensemble de méthodes et d’outils internes pour récupérer et partager des données fiables
• But : – Contribuer à un espace public de métadonnées
ouvertes, à l’échelle du web – Que chacun intègre ces données ouvertes dans ses
propres outils (dont le Sudoc)
• Aujourd’hui : – Pas d’outil « hub » proposé à l’extérieur – Esquisse de collaboration avec le réseau Sudoc
PÉRIODIQUES
La liste éditeur, à la lumière du registre ISSN
titre année min.
année max.
p-issn e-issn titre année min.
année max
p-issn e-issn ppn
1950-2000 1940-1949
1950-1979
1980-2000
1980- =
? ?
Identifiant de notice dans le Sudoc
Initiatives de normalisation qui vont dans le même sens
PIE-J NISO 2013
KBART 2 2014
“will provide much-needed guidance on the presentation of e-journals to publishers and
platform providers as well as to solve some long-standing
concerns of serials librarians.” ❤
Enrichir les listes de périodiques avec les métadonnées d’articles
titre année
min année max
p-issn e-issn ppn 1er volume
1er numéro
dernier vol.
dernier n°
1 1 77 4
<métadonnées d’articles en XML/>
+
Métadonnées de bouquet = fichier KBART
BACON
publication_tit
le
date_first_issue_online
date_last_issue_online
print _identif
ier
online_identifi
er
num_first_vol_o
nline
num_first_issue_online
num_last_vol_online
num_last_issue_online
title_url
Notre tableau sert aussi à signaler dans le Sudoc
ajouter un exemplaire Licence Nationale et modifier la notice biblio du périodique :
207 $a Vol.1, n°1 (1914)-Vol.50, n°4 (1964)
titre année min
année max
p-issn e-issn ppn 1er volume
1er numéro
dernier vol.
dernier n°
URL
1914 1964 1 1 50 4
Zone 100
Zone 207
Signaler l’électronique pour gérer le papier
Aide au désherbage
titre année min
année max
p-issn e-issn ppn élec.
ppn papier
1er volume
1er numéro
dernier vol.
dernier n°
1941 1964 1 1 50 4
L’argus des périodiques papier achetés dans ISTEX
PPN 2013* 2014* % désexemplarisé
03930986X 490 431 -12,04081633
039401588 582 540 -7,216494845
038846373 1057 985 -6,811731315
039309878 328 307 -6,402439024
069424985 207 194 -6,280193237
039322688 249 234 -6,024096386
039395596 1208 1136 -5,960264901
040093417 351 331 -5,698005698
036747645 316 300 -5,063291139
013359258 854 811 -5,035128806
038263882 60 57 -5
* en années-périodiques
Liste de périodiques commerciale
Liste de périodiques
conformes à ISSN
Liste des notices Sudoc : e-journals
Liste des notices Sudoc : revues
imprimées
Métadonnées des articles
Métadonnées des fascicules
Négociation
Sudoc PS : circuit de numérotation ISSN
Conservation
Conservation / états de collection au niveau fascicule ?
Bases de connaissance
Outils de découverte
Exemplarisation automatique Sudoc
Passerelles
Web de données
Etablissements
Carto Doc elec. + ERE ?
EBOOKS
Métadonnées éditeur natives XML
MARC enrichi par le réseau
MARC exporté vers
les SIGB locaux
RDF exposé
Sudoc
KBART Métadonnées éditeur modélisées en RDF et
enrichies
Métadonnées RDF enrichies par le réseau
Hub
• Enrichissements
– Auteurs IdRef
– Indexation matière RAMEAU
– Langue des résumés
– ISBNs
– …
• Première interaction avec le réseau : zone 309 et todo list dynamique
Recueils des cours de l’Académie de La Haye
309 ##
$aLE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. SUPPRIMER LA PRESENTE NOTE 309
UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)
$bBRILL-RADI-LN
$cche ppn 060964588 OU 084013885
$d2014-04-09 11:15:01.894
Le hub fait ce qu’il peut puis laisse une todo list au réseau
PPN TEXTE CORPUS COMMANDE DATEIN ETAT
.. Nombre de ppn total : 1177 .. .. .. ..
.. Nombre de ppn réalisés : 111 .. .. .. ..
.. Pourcentage de ppn realisés : 0.09 .. .. .. ..
176448683
LE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. A TITRE INDICATIF, LE SYSTEME DE DETECTION AUTOMATIQUE SUGGERE PLUSIEURS PPN A DEPARTAGER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)
BRILL-RADI-LN
che ppn 060964588 OU 084013885
2014-04-09 12:37:02.980 todo
176448691
LE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)
BRILL-RADI-LN null
2014-04-18 09:02:33.475 todo
176448705
LE(S) LIEN(S) VEDETTE MATIERE RESTE(NT) A CREER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)
BRILL-RADI-LN null
2014-04-18 08:48:18.551 todo
176448837
LE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. A TITRE INDICATIF, LE SYSTEME DE DETECTION AUTOMATIQUE SUGGERE PLUSIEURS PPN A DEPARTAGER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)
BRILL-RADI-LN che ppn 078858119
2014-04-09 12:37:37.500 todo
http://www.sudoc.fr/services/chantier/BRILL-RADI-LN
Conclusions (1/2)
• Essayer de tenir ensemble: Automatique | Humain ABES | Réseau Adaptation à des outils précis | ouverture générique
• court terme : listes (KBART, ppn élec, ppn papier), notices • moyen terme : web de données
Différents niveaux de granularité • articles | chapitres | revues | livres
Gestion de la documentation électronique | Rigueur bibliographique
National | International • on travaille pour l’international • et l’international pour nous
Conclusions (2/2)
Enjeu Séparer fonction SGB
et fonction agrégation de métadonnées Demain, les données seront toutes : • sur le web de données (RDF moyen et fin)
• Agrégation facilitée • Nous devons y contribuer !
• et/ou chez des sociétés spécialisées (data markets) • Ajouter de la valeur et du service au-dessus de données ouvertes
Open
data
Questions pour la table ronde ?
• Quelle intensité et quelles formes de collaborations avec le réseau ? Quelles forces en central ? Des rôles différenciés reconnus pour certains établissements ? CollEx ?
• Sur quels corpus se concentrer ? – Archives (ISTEX)/courant
– Revues/articles
• Quelles collaborations avec partenaires, fr et au-delà ?
Corpus Analyser l’offre
KBART SUDOC Désherber Modéliser Convertir Enrichir
Brill RADI & New Pauly
Brill revues*
Elsevier
Nature
RSC
OUP
IOP
http://www.licencesnationales.fr/istex-negociations-en-cours/
Etat des traitements en mai 2014
* Numérisation non achevée au moment du signalement
Signature Décembre 2013
Signature Avril/Mai 2014
Top Related