Diffuser et valoriser les données de la recherche : exemples issus de l’expérience de la...
-
Upload
mmsh-maison-mediterraneenne-des-sciences-de-lhomme-cnrs-universite-de-provence -
Category
Education
-
view
7.721 -
download
0
Transcript of Diffuser et valoriser les données de la recherche : exemples issus de l’expérience de la...
Diffuser et valoriser les données de la recherche :
exemples issus de l’expérience de la phonothèque de la Maison méditerranéenne des sciences de l’homme
Véronique Ginouvès https://phonotheque.hypotheses.org
La phonothèque de la MMSH
8 500 heures de son6 500 notices cataloguées7 000 heures numérisées
2000 heures en ligne
Accessibles sur la base de données Ganoub, http://phonotheque.mmsh.huma-num.fr
Ganoub : une base de données diffusée sur 4 plateformes
3GAN
OU
B Dublin core : Isidore, portail du patrimoine oral
EAD- Encoded Archival Description : Calames
EDM – Europeana Data Model : Europeana
Une histoire de l’interopérabilié, une histoire des financements
une histoire du métier2007 Portail du patrimoine oral2011 Moissonnage par Isidore2013 Catalogage sur la plateforme Calames2014 Europeana
Une histoire de collaborations
Mercredi 30 octobre 2015 : Du dépôt au partage des archives sonores de la recherche, les évolutions du métier de phonothécaire, Françoise Acquier (CRESSON, Ecole d'architecture Grenoble), Ariane Néroulidis et Marine Soubrié (Phonothèque, Maison méditerranéenne des sciences de l’homme, MMSH, Aix en Provence)
2009La synthèse des FREDOC : 6 bonnes raisons pour adopter l’OAI-PMH
- simplicité- adaptation aux
données de recherche
- nouvelle cartographie de la connaissance
- qualité des métadonnées
- valeur ajoutée aux données
- développement de nouveaux services
Extraits de la conclusion “Retour sur les FREDOC 2009”http://phonotheque.hypotheses.org/3037
Nouvelle cartographie de la connaissance et possibilité d’augmenter la masse critique de la recherche sur son domaine, cela même si la ressource numérique n’est pas au bout de la recherche.
Une base de donnée constituée par moisson OAI-PMH permet au fournisseur de service de rendre accessibles des données descriptives de documents sans faire peser une lourde charge sur le serveur de chaque fournisseur de données. Par contre, les données exploitées par le fournisseur de service sont le reflet d’un état figé des données collectées.
L’OAI-PMH est un bon modèle pour les grands réservoirs de données comme les bibliothèques universitaires.
Pour réaliser la phase finale de ce protocole il faut une bonne qualité de métadonnées. Ce protocole est un outil simple et facile à mettre en place mais les fonctions annexes de normalisation et de retraitement des données peuvent être lourdes.
Le partage des données va permettre de donner une valeur ajoutée par un contrôle de qualité.
Avec ce protocole, les professionnels de l’information ont la possibilité de développer de multiples services en n’investissant en une seule fois dans la création de ressources.
2010Un réseau documentaire associatif sur la source orale, lié aux musiques et danses traditionnelle (FAMDT), lance un portail collectif.
2000-2013Plan national de numérisation
Le réseau FAMDT documente des enquêtes de terrain enregistrées sur une large partie de l’hexagone, numérisées en partie dans le cadre du PNN.
199420012014
Les centres de ressources liés à la FAMDT ont uniformisé leurs pratiques de catalogage dès 1994 en publiant des guides de bonnes pratiques.
https://halshs.archives-ouvertes.fr/halshs-01065125/document
2008
Rédaction d’un cahier des charges pour créer un catalogue collectif.
2007-2010fabrication
du PPO
Plus de 130 000 notices décrivant des archives sonores et audiovisuelles réunies par 9 centres de ressources
Depuis 2011 des archives sonores en relation avec les données de la recherche
Exemple de recherche :homme politique marseille
2 126 sources de données numériques regroupées en 92 collections pour donner accès à 3 762 121 ressources dont 72 230 archives sonores ou audiovisuelles
consultation le 19 septembre 2015
Depuis 2011, création du consortium “archives des ethnologues”
• LAS : Laboratoire d’Anthropologie Sociale• LESC : Laboratoire d’ethnologie et de
sociologie comparative• MMSH - la Phonothèque • CREDO : centre de recherche et de
documentation sur l’Océanie• IMAf : Institut des mondes africains• CRBC : Centre de Recherche Bretonne et
Celtique• Centre d'études himalayennes• IrAsia : institut de recherches asiatiques
2012, première participation de la phonothèque à une ANR
L’accès aux données de la recherche est une demande institutionnelle
• ANR Colostrum (programme blanc 2012-2015) : « L’alimentation pré-lactée (don et consommation néonatale du colostrum) : pratiques, représentations et enjeux de santé publique ». Chef de projet Joël Candau, Laboratoire d'Anthropologie et de Psychologie Cognitives et Sociales (LAPCOS, ex-LASMIC, Nice).
• ANR Histinéraires (programme blanc 2013-2016), « La fabrique de l’histoire telle qu’elle se raconte. Etude des mémoires de synthèse des activités scientifiques, 1990-2010 ». Chef de projet Patrick Garcia, Institut d’histoire du temps présent (IHTP, Paris).
2013 : entrée de la phonothèque dans Calames
Catalogue en ligne des archives et des manuscrits de l'enseignement supérieur conçu et développé par les équipes de l'ABES (Agence bibliographique de l’enseignement supérieur).
Evolution du Répertoire national des manuscrits littéraires français du vingtième siècle (Palme) et du Catalogue général des manuscrits des bibliothèques publiques de France, catalogue imprimé commencé sous la monarchie de Juillet.
17
http://www.calames.abes.fr
Exemple de recherche :Henri Lhote
Poster sur HAL SHS : https://halshs.archives-ouvertes.fr/halshs-01075767
Les balises essentielles pour le catalogage des archives sonores en EAD
Calames
Une plateforme de catalogage originale en coursd’évolution
Un avis sur les plus– accès authentifié en ligne indépendant du poste – verrouillage des fragments en édition – consultation possible de tous les fichiers encodés par les autres participants– facilitation de la saisie en EAD – possibilité de publications intégrale ou partielles – lien des points d’accès aux autorités IdRef - Soutien d’une équipe de professionnels, plateforme d’aide en ligne et téléphonique- Communauté en soutien
Un avis sur les moins– Repose sur des technologies Microsoft et l’usage exclusif du navigateur Internet Explorer – Une maintenance, performance et évolutivité de l’outil qui semblent difficiles– Pas d’imports– Pas d’accès au code XML créé– Problèmes variables d’accès réseau ou organisationnels (proxys, affichages, droits d’administration sur les postes…)
2014
Participationà Europeana
Sounds
Durée : 36 mois (février 2014-Janvier 2017)Objectif : 1M enregistrements sonores sur le portail Europeana en 201724 organisations participantes, dans 12 pays, sous la direction de The British Library (BL)7 Work Packages : WP1 : Aggregation,
WP2 : Enrichment & participation,WP3 : Licensing guidelines,WP4 : Channels development,WP5 : Technical infrastructure,WP6 : Dissemination & networking,WP7 : Project management & sustainability
2014 - 2017
Europeana Sounds :
participants
Allemagne : Deutsche Nationalbibliothek, Rundfunk Berlin-Brandenburg ; Autriche : Oesterreichische Nationalbibliothek, Austrian Institute of Technology, Technisches Museum Wien mit Osterreichischer ; France : BnF ; CNRS – MAE & MMSH - ; Grèce : National Technical University of Athens, Music Library of Greece ; Italie : Istituto Centrale per il Catalogo Unico delle Biblioteche, Net7 Srl ; Danemark : Statsbiblioteket ; Irlande : Irish Traditional Music Archive ; Comhaltas Ceoltoiri Eireann ; Lettonie : National Library of Latvia ; Lituanie : UAB DIZI ; Pays-Bas : Nederlands Instituut Voor Beeld en Geluid ; Max Planck Gesellschaft Zur Foerderung der Wissenschaften, Nederland Kennisland, Europeana ; Portugal : Faculdade de Ciencias Sociais e Humanas da Universidade Nova de Lisboa ; Royaume Uni : The British Library ; We Are What We Do ; Community Interest Company ; Sabhal Mor Ostaig.
2014 - 2017
Europeana Sounds :
les objectifs
-Augmenter la quantité de contenus sonores sur le portail Europeana, en particulier en direction du grand public : 1M en 2017 ;-Améliorer leur accès en enrichissant leur description et en développement des outils participatifs ;-Développer des canaux sonores spécifiques vers différents publics, pour améliorer le moteur de recherche, la navigation et l'expérience utilisateur ;-Promouvoir la réutilisation des enregistrements sonores ;-Améliorer les bonnes pratiques dans le domaine de la diffusion des données sonores, en publiant des recommandations et des préconisations ;
2014 - 2017
Europeana Soundsun travail
collectif pour améliorer l’accès aux documents sonores et leur nombre avec un outil commun
MINT
-Structuration des données en EDM (Europeana data model), un modèle théorique de données pour présenter tous les types de documents, selon des pratiques différentes.-Définition d’une politique de sélection de contenu :
•Nombre de documents•Qualité des documents mis en ligne•Intérêt du public•Questions éthiques et juridiques
-Partage de référentiels :•Thématique et typologies•Langues•Répartition géographique
2014 - 2017
MINT
Metadata INTeroperability services
MINT est une plate-forme web, au code source ouvert, pour l'interopérabilité des métadonnées
http://mint.image.ece.ntua.gr Utilisée dans plus de 15 projets d’Europeana par plus de 300 organisations culturelles soit quelques 500 utilisateurs.MINT a permis de produire et de publier plus de 6 000 000 enregistrements de métadonnées sur Europeana.Créé en 2008 pour le projet Athena : 4 200 000 enregistrements de métadonnées, provenant de 23 musées et autres types d’institutions, ont été versées à Europeana
Zone du schéma DC (input)
Zone du mapping Zone de navigation
2014 - 2017
MINT
Metadata INTeroperability services
- La qualité des métadonnées doit être améliorée mais la question du traitement documentaire du son n’a pas toujours été abordée
- Beaucoup de fournisseurs ont des données sur les aspects techniques de l’enregistrement et sur les transferts numériques, peu sur les contenus
- MINT est d’abord conçu pour l’image et n’a pas prévu l’organisation en collection
- Les référentiels communs permettent de travailler sur le multilinguisme
- L’essentiel est de pouvoir diffuser, le juridique domine l’éthique (cf limite de 30 secondes pour les enregistrements commerciaux vs les entretiens de terrain)
L'utilisateur peut - sélectionner un terme (par le thésaurus) qui sera appliqué à tous les articles- aligner ses valeurs internes à des termes choisis par le thésaurus.
Europeana embarque uniquement les métadonnées, les fichiers numériques sont diffusés par les fournisseurs de données.
MINT – Workflow actuel
Harvesting Mapping
MINTOAI Europeana
TransformationAnnotation Publication
Statistics Import Mapping XSL Output Europeana
A ➔ B ➔…
NoSQL
Th. Portal
RDBMS
Triplestore
SPARQL
LOD
Diapositive de NTUA
2014 - 2017
L’expérienced’Eureopeana : pour mettre en avant les données sonoresl’interopérabilitén’est pas suffisante…
mais elle est essentielle !
Les métadonnées des fournisseurs sont hétérogènes, dans des langues et des alphabets multiples, le lien avec entre les vocabulaires spécifiques et les référentiels du web est une nécessité mais elle est difficile à réaliser d’autant plus que les objectifs des centres de ressources ne sont pas les mêmes.
La production de métadonnées de haute qualité dépend toujours de l'utilisateur. Un outil ne peut que fournir des services malgré toute sa flexibilité.
Les compétences à acquérir du côté des fournisseurs ne sont pas minimes.
http://www.archives-lutherie-mirecourt.fr/atom/index.php/enqu-te-ethnologique-sur-les-luthiers-de-mirecourt-vosges-lorraine
Participer à des portails est essentiel mais le moissonnage n’est pas toujours possible, la collaboration doit être ouverte à tous.
Et facilitent l’écriture collective
Être interopérable impliquel’usage de bonnes pratiques qui facilitent la valorisation par d’autres modes :
L’écriture collective
Être interopérable implique l’usage de bonnes pratiques qui facilitent la valorisation par d’autres modes :
L’éditorialisation des données
Participer à des portails est essentiel parce que cela impliquel’usage de bonnes pratiques qui facilitent la valorisation par d’autres modes :
La publication des instruments de recherche
Organisation d’une journée participative ou “Edit-a-thon” à la MMSH le vendredi 23 octobre 2015
Être interopérable impliquel’usage de bonnes pratiques qui facilitent la valorisation par d’autres modes :
Organisation de journées participatives
2015Et pour conclure, selon vous quelle sont les bonnes raisons de devenir interropérable ?
Réajustement des raisons d’être interopérables évoquées en conclusion des FREDOC 2009 :- simplicité la veille n’a de cesse comme l’adaption aux
évolution des modèles de données et du web ou la veille qualité
- adaptation aux données de recherche : oui mais les projets culturels dominent
- nouvelle cartographie de la connaissance : un des enjeux les plus importants qui n’a pas encore été développé
- qualité des métadonnées : certes, mais les archivistes doivent aussi s’intéresser à tous les types de données
- valeur ajoutée aux données : oui- développement de nouveaux services :
l’éditiorialisation des données est au coeur des enjeux de valorisation.
2007-2015
L’expérience de la phonothèque à propos del’interopérabilité :
un apprentissage du partage des valeurs archivistiques et professionnelles
➢Veiller à conserver l’intégrité des collections et la contextualisation des archives ;
➢Envisager systématiquement les questions des droits des informateurs d’hier et d’aujourd’hui mais aussi ceux des utilisateurs de demain ;
➢Ne jamais travailler hors des standards et des normes ;
➢Aucun projet ne s’effectue seul-e, le travail productif est toujours le fruit d’une collaboration.
Merci de votre écoute, belles expériences
interopérables...
N’oubliez pas…Vous êtes bienvenu-e-s le
23 octobre prochain à Aix-en-Provence pour une nouvelle expérience de partage de données
http://phonotheque.hypotheses.org/15843
CréditsDiapo 1 : Bill Smith de KOAC avec un magnétophone portable, 1955, Archives de l’Etat de l’Orégon (pas de restrictions de droit connues). Dépôt des archives de Marceau Gast, Laure Principaud, 2012. Numérisation à NTRZ, Dar-es-Salam, Tanzanie, Véronique Ginouvès, 2014.Diapo 2 : MMSH, Pierre Monteil, 2000.Diapo 46 : photographie d’un Edit-a-Thon à Amsderdam, Diapo 49 : retour de pêche, île de Providencia, Colombie, Véronique Ginouvès, 2009.
Plusieurs commentaires, idées ou images de ce diaporama sont issus de lectures ou de discussions avec les collègues des réseaux de la FAMDT, CALAMES, ABES, Consortium des ethnologues, Europeana Sounds, TGIR Huma-Num, Nederlands Instituut voor Beeld en Geluid, NTUA et de la médiathèque de la MMSH, merci à eux pour les échanges !