Post on 26-Jul-2015
1
Les dessous de la frbrisation du Sudoc
Olivier Rousseaux - ABES
Journées ABES 2015
O. Rousseaux - ABES 2
Les dessous de la frbrisation du Sudoc
• Frbrisation du Sudoc : de quoi parle-t-on ?• Contexte– Démarche initiale– Vers une voie nouvelle– Modalités (très) schématiques de mise en œuvre
• Calendrier• A quelles fins ?• Premières conclusions
Journées ABES 2015
O. Rousseaux - ABES 3
Frbrisation du Sudoc : de quoi parle-t-on ?Un néologisme à géométrie variable
Assumer que si il y a nécessité de "frbriser" c'est que la base de données n'est pas totalement compatible avec le modèle cible
Le faire sans dramatiser...
Journées ABES 2015
O. Rousseaux - ABES 4
Frbrisation du Sudoc : de quoi parle-t on?
Il s'agit de mettre modestement un peu de "relief" FRBR dans les notices du catalogue Regrouper les Manifestations contenant une même
Œuvre Dégager des éléments qui caractérisent l'Œuvre (+
Expressions ?) contenue Créer une notice d’Œuvre Lier Manifestations et Œuvre
Journées ABES 2015
O. Rousseaux - ABES 5
Contexte
Novembre 2012 – Rapport d’orientation pour le Comité stratégique bibliographique– L’ABES s’engage sur la voie d'un rapprochement de
la production courante de données bibliographiques dans le Sudoc avec le modèle FRBR• « jeu de consignes de catalogage précises, avec pour
objectif l’identification systématique des œuvres [...] »• « [adaptations limitées] du paramétrage de la base
CBS »• « [...] étude des procédures de traitement automatique
rétrospectif [...] »Journées ABES 2015
O. Rousseaux - ABES 6
- rappels et ajustements de règles de catalogage en 2013• titre original pour une traduction ; • code fonction des différents contributeurs ; • identifiants ; • dates ; • abandon des notes textuelles de contenu au profit de point d'accès titre ; • etc.
- spécifications CBS de mécanismes d'appariement entre zones d'accès titre et d'accès auteur (non aboutis)
Journées ABES 2015
Démarche initialesans développements informatiques majeurs
O. Rousseaux - ABES 7
– Bilan fin 2013 : Démarche jugée insuffisante pour envisager un effet bénéfique significatif à l'échelle du Sudoc sans un support technique conséquent
– Dissociation des projets SGBM et Sudoc 2 = augmentation de la durée de vie du Sudoc dans le CBS
Décision au printemps 2014 de mener une expérimentation à partir des algorithmes de regroupements développés par OCLC pour le CBS
Vers une voie nouvelle
Journées ABES 2015
O. Rousseaux - ABES 8
Des limites techniques imposées– Un seul niveau FRBR généré en lien aux Manifestations (notices
bibliographiques) = Nouveau type de notice d’autorité avec contenu à la fois de niveau Œuvre et Expression (baptisée « notice de Regroupement » par l’ABES)
– Pas de notices de Regroupement pour les notices bibliographiques isolées
– Au maximum 1 lien à une notice de Regroupement par Manifestation
– Paramètres initiaux = ceux établis pour le projet néerlandais (spécifications détaillées inconnues de l'ABES)
Des spécifications complémentaires pour adaptations au contexte Sudoc
Vers une voie nouvelle
Journées ABES 2015
O. Rousseaux - ABES 9
Notices bibliographiques
Algorithmes de regroupement
1/3 – Calculs et regroupements
Journées ABES 2015
Modalités (très) schématiques de mise en œuvre
O. Rousseaux - ABES 10
1/3 – Calculs et regroupements
Journées ABES 2015
O. Rousseaux - ABES 11
Notices d’autorité de Regroupement générées par programmes
2/3 – Notice bibliographique préférée support de la notice de Regroupement
Notices bibliographiques
1 notice « préférée » calculée par regroupement
Pas de notice de Regroupement pour les notices isolées
Journées ABES 2015
O. Rousseaux - ABES 12
Notices bibliographiques
Notices d’autorité de regroupement générées par programmes
3/3 – Liage entre notices bibliographiques et notice de Regroupement
Journées ABES 2015
O. Rousseaux - ABES 13
Calendrier Novembre 2014 - juin 2015
• Novembre 2014Création d'un environnement CBS de test reprenant
l’intégralité de la base de production
• Novembre 2014 - 15 février 2015 Spécifications (ABES)
• 15 février 2015 - 25 Mars 2015Paramétrage du CBS de test selon les spécifications ABES
(OCLC)Etablissement de jeux de notices tests (ABES)
Journées ABES 2015
26 mars 2015Titre
(Auteur)Notice de regroupement
1,5M notices de regroupement généréespour 4.7M notices bibliographiques
O. Rousseaux - ABES 15
• 26 mars 2015 - 30 juin 2015Vérification des notices de test + rapports de tests (ABES)Ajustement / amélioration des algorithmes (OCLC)Au 27 mai 2015 nous en sommes là
Jusqu'à 5 ajustements de paramétrages pour optimiser les résultats ... et conclure
Journées ABES 2015
O. Rousseaux - ABES 16
Premiers constats (partiels)
• Le fonctionnement des algorithmes de regroupement est relativement opaque– Des développements ou paramétrages demandés restent à faire
(ou sont impossibles ?)– Marge de manœuvre incertaine sur des améliorations envisagées
après les premiers tests
Discussions en cours avec OCLC- Optimisation des temps de traitement | Perte de qualité- Réduire les cas de notices indûment présentes dans un regroupement (= bruit) sans augmenter les cas de notices non regroupées / ou les regroupements doublons(= silence)
Journées ABES 2015
O. Rousseaux - ABES 17
Premiers constats (partiels)Ça peut marcher...
Premiers regroupements...
Journées ABES 2015
Notice de Regroupement
Une notice bibliographique de la grappe
008 $aTr200A $0000U utf800V $02015-03-26 23:24:11.696103 ##$a2000104 ##$ak106 ##$a0$b#$c#231 ##$a@Etude de l'extension urbaine autour d'Avignon et de Montpellier de 1936 à 1999 par la simulation de dynamiques spatiales à l'aide de modèles cellulaires d'interaction locale300 ##$aLes phénomènes d'extension urbaine des régions d'Avignon et de Montpellier entre 1936 et 1999 constituent l'objet de cette thèse. Ces régions ont été choisies en raison de l'ampleur de l'extension urbaine qui les caractérise [...]. Les simulations n'ont pas eu pour but de reproduire le réel, mais d'aider à identifier des mécanismes spatiaux fondamentaux. En cela cette thèse s'inscrit dans une géographie expérimentale328 #0$bThèse de doctorat$cGéographie$eAvignon$d2000500 #1$3068881118{{Ellerkamp, Philippe (1967-...)}}606 ##$3027255034{{Urbanisation}}$3027226794{{France}}$3034681159{{Avignon (Vaucluse ; agglomération)}}$3086305646{{20e siècle}}$3027253139{{Thèses et écrits académiques}}$2rameau606 ##$3027255034{{Urbanisation}}$3027226794{{France}}$3027252051{{Montpellier (Hérault)}}$3086305646{{20e siècle}}$3027253139{{Thèses et écrits académiques}}$2rameau606 ##$3031194095{{Périurbanisation}}$3027226794{{France}}$3034681159{{Avignon (Vaucluse ; agglomération)}}$3086305646{{20e siècle}}$3027253139{{Thèses et écrits académiques}}$2rameau606 ##$3031194095{{Périurbanisation}}$3027226794{{France}}$3027252051{{Montpellier (Hérault)}}$3086305646{{20e siècle}}$3027253139{{Thèses et écrits académiques}}$2rameau606 ##$3027255247{{Croissance urbaine}}$3027551385{{Modèles mathématiques}}$3027253139{{Thèses et écrits académiques}}$2rameau686 ##$a910$2TEF
Notice de Regroupement (cas optimal)
Titre
Auteur (créateur)
Résumé
Accès matière
Note de thèse
Données codées
O. Rousseaux - ABES 20
A quelles fins ? • Pour le catalogueur– Tendre vers un allègement de la saisie en tirant
bénéfice du lien à l’autorité Œuvre (accès auteur/accès matière/résumé/...)
• Pour l’usager final– Mise en avant des regroupements de notices avec
restrictions par facettes (par langues notamment) – Donner par contraste plus de visibilité aux Œuvres
peu éditées
Journées ABES 2015
O. Rousseaux - ABES 21
Là
Journées ABES 2015
O. Rousseaux - ABES 22
Requête sur le titre français
Journées ABES 2015
O. Rousseaux - ABES 23
Sans regroupements, la même requête ne ramène que les 3 romans traduits en français
Journées ABES 2015
O. Rousseaux - ABES 24
Quelques limites• Les ressources continues– Intérêt des regroupements peu probant
• Les œuvres anonymes (ou sans points d’accès auteurs)– Risques de regroupements confus (sur titres
homonymes)• Les données hétérogènes– Les algorithmes ne peuvent guère pallier aux
manques, aux approximations, aux incohérences...
Journées ABES 2015
« - Et les agrégats... ? »
Plus d’une Œuvre contenue au sein d’une même Manifestation : œuvres littéraires complètes ou choisies, CD musicaux, etc.
Wind concertos / Mozart, comp. ; Berliner Philharmoniker, orch. ; Herbert von Karajan, dir.
Contient :- Flute concerto n °1 in G major K 313- Concerto for flute and harp in C major K 299- Oboe concerto in C major K 314- Clarinet concerto in A major K 622- Bassoon concerto in B flat major K 191- Sinfonia concertante K 297b
« - Ben... »
Flute and harp concerto K. 299 ; Sinfonia concertante K. 297B / Wolfgang Amadeus Mozart, comp. ; Kenneth Smith, fl. ; Bryn Lewis, hrp ; John Anderson, htb... [et al.] ; Philharmonia Orchestra ; Giuseppe Sinopoli, dir.
Contient :- Concerto for flute and harp in C major K 299 - Sinfonia concertante K 297b
Au mieux...Regroupement effectué de manière pertinente sur une œuvre (mais sur une seule) Notice de regroupement par exemple pour Concerto for flute and harp in C major K 299 et Sinfonia concertante K 297b non pris en compte
Au pire (?)La notice de Regroupement amalgame tous les titres communs à toutes les notices de la grappe Notice de regroupement pour Concerto for flute and harp in C major K 299avec comme « variante de titre » : Sinfonia concertante K 297b
O. Rousseaux - ABES 26
Déjà conclure ?• Sur l'expérimentation en cours
– Un grand... « peut-être »• l’Après?
– Des incertitudes sur l’articulation technique entre traitements automatiques et traitement manuel
– Une maintenance supplémentaire sur le CBS• Mais encore?
– Nouvelle version de CBS impérative (début 2016) – Cohabitation / convergence à mener entre les autorités Titres (Titre
uniformes / Auteur-Titre) et les notices de Regroupement– Règles de catalogage à établir pour passer des notices de Regroupement à
des notices d‘Œuvre (quid des expressions?)– Rapprochements envisagés avec la BnF : vers une base commune de notices
d'Œuvres?– ...
Journées ABES 2015
O. Rousseaux - ABES 27
Rendez-vous l’année prochaine, même heure, même endroit ?
Merci.
La suite reste donc encore grandement à écrire...
Journées ABES 2015