Mcc hadoc-medihadoc-inha 20141013-1-4

32
MCC – DGP – DSIP - HADOC A la recherche d’un schéma de métadonnées pour le multimédia compatible avec le modèle de données HADOC Katell Briatte, Marie-Claude Démoulin Des métadonnées pour les images numériques du patrimoine culturel INHA, 13 octobre 2014

Transcript of Mcc hadoc-medihadoc-inha 20141013-1-4

Page 1: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP - HADOC

A la recherche d’un schéma de métadonnées pour le multimédia compatible avec le modèle de

données HADOC

Katell Briatte, Marie-Claude Démoulin

Des métadonnées pour les images numériquesdu patrimoine culturelINHA, 13 octobre 2014

Page 2: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Typologie des données iconographiques

• Nature des données

– Fonds analogiques numérisés

• Fonds anciens– Originaux, tirages papier

• Couvertures photo contemporaines

– Données nativement numériques

• Images de travail

• Éléments de volumétrie

– Fonds analogiques numérisés

• 3 700 000

– Données nativement numériques

• 800 000

Page 3: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Fonction des données iconographiques

• Images « illustratives » : cas 1

– Gestion de stock

– Pas de gestion de MD

• L'image n'est accessible que par la notice d’œuvre

Pointeur vers un système de fichiers

voir image /0418/m110800_25961-5_p.jpg

Mention des crédits photodans la notice d’œuvre

Page 4: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Fonction des données iconographiques

• Images « illustratives » : cas 2

ivr91_94340193x_p.jpg

ivr91_94340193x_v.jpg

est illustrée par

est illustrée par

est illustrée par

ivr91_94340193x

décrit

est représentée par

est représentée par

donne accès à

Page 5: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Fonction des données iconographiques

• Réutilisabilité ?

une légende uniquepour des usages multiples

est illustré parRôle= « Vue de face »

est illustré parRôle= ?

Page 6: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Fonction des données iconographiques

• L'image objet patrimonial

– « collections »

– « archives »

Métadonnées de l'image ?Métadonnées du bien culturel ?

Page 7: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Fonction des données iconographiques

• Un Bien culturel illustre un autre Bien culturel

sap01_mh00088866

décrit

illustre

Page 8: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Fonction des données iconographiques

• La question du sujet représenté

– Le Bien culturel comme « vecteur » d'une représentation

• Exemple : figures allégoriques et symboles de « La République »

Page 9: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

sap01_na23800020n_t.jpg

m009804_0000494_v.jpgm506006_89-008140-01_v.jpg

m506006_96-014943_v.jpg

Fonction des données iconographiques

APNADAR000240

82.91.316 VAbbéma, Louise (1858-1927)

Nadar (atelier)

000SC01000

009800018

est illustrée par

est illustrée par

est illustrée par

Bernhardt, Sarah

IM91000362est illustrée par

M5060000285

est illustrée par

a pour auteur

a pour auteura pour auteur

a pour auteur

a pour sujeta pour sujet

a pour sujet

a pour sujet ?

a pour sujet

Page 10: Mcc hadoc-medihadoc-inha 20141013-1-4

10MCC – DGP – DSIP – HADOC

Fonction des données iconographiques

• Images de travail

décrit

illustreillustre

Page 11: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Éléments de volumétrie

• Images illustratives

– Mémoire : 3 000 000

– Joconde : 400 000

– Archim  : 30 000

– Médiathek : 200 000

• Images de travail

– Osiris : 250 000

– Pléade : 250 000

– Stockages : 500 000

Page 12: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Diversité et complexité des flux

Page 13: Mcc hadoc-medihadoc-inha 20141013-1-4

13MCC – DGP – DSIP – HADOC

HADOC

• objectif : harmoniser la production des données culturelles

– fournir aux producteurs un cadre normatif de production

• des modèles de données

• des référentiels

• la préconisation de normes, standards et bonnes pratiques favorisant l'interopérabilité

– « rationaliser » la production

• Éliminer la redondance informationnelle, les saisies multiples

• Faciliter les opérations de CST, de gestion et de diffusion

– « urbaniser » le Système d'Information (SI)

• Un besoin fonctionnel = un module applicatif– plusieurs applications « métier » peuvent partager un même module

• Des référentiels partagés– plusieurs applications « métier » peuvent partager les mêmes données

Page 14: Mcc hadoc-medihadoc-inha 20141013-1-4

14MCC – DGP – DSIP – HADOC

HADOC

• un « programme » = ensemble de projets visant le même objectif

• réalisations

– Modèle de données harmonisé pour la production des données culturelles

• modélisations centrées sur les Biens culturels et les Acteurs

– Plate-forme de gestion et de diffusion des vocabulaires scientifiques et techniques (GINCO)

• production : norme ISO 25964 (2011, 2013)

• diffusion : SKOS/RDF

• à venir

– MediHadoc, environnement de gestion des ressources multimédia

– Référentiel Acteurs (lancement fin 2014)

Page 15: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

HADOC

• chaque projet du programme constitue l'occasion de :

– faire l'état des lieux des normes, standards et bonnes pratiques

– élargir, enrichir et consolider le modèle de données HADOC

– choisir/construire les référentiels nécessaires

• listes d'autorité

• vocabulaires normalisés

• MediHadoc : un projet inscrit dans le programme HADOC

– rationaliser la production

– s'appuyer sur les normes, standards et bonnes pratiques pour

• enrichir le volet « ressources » du modèle de données HADOC

• choisir/construire les référentiels de description des ressources multimédia

Page 16: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Quel modèle de métadonnées pour MédiHadoc ?

• Deux « univers »

– métadonnées pour décrire les objets culturels ?

• traitement des collections

– métadonnées pour décrire les images et le multimédia ?

• Périmètre du projet

– outil de gestion de « collections » ou de « ressources multimédias » ?

• principes de l'urbanisation deux outils distincts :→

– gestion des Biens culturels

– gestion des ressources multimédias» Type DAM

• applicabilité de cette solution ?

Page 17: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Principe de rationalisation de la production

DOM architectureEDIF fontaine de la Ville de MontpellierTICO fontaine de la Ville de MontpellierSUJET fontaineAUTO Journet Jean-Louis (sculpteur)

LOCA France ; Languedoc-Roussillon ; Hérault ; MontpellierPAYS FranceREG Languedoc-RoussillonDPT 34ADRSINSEE 34172COM MontpellierAIRE Montpellier centre

Chabaneau (place)

COPY © Inventaire général, ADAGPAUTPDIFF reproduction soumise à autorisation du titulaire des droits d'exploitation

Périn, Jean-Michel - © Inventaire général, ADAGP

REF IVR91_94340193XNUM 0193NUMCD IVR91_000029_I_1NUMI 94340193XREFIM IVR91_94340193X_P. JPG, DS1, , VUECDEMET IVR91IDPROD Région Languedoc-Roussillon

IVR91_94340193X_P. jpg

COULEUR NONDATIMM 1994DATPV 1994FORMAT XTYPDOC phototype argentiqueTYPEIMG JPG ; ouiTYPSUPP DS1

LEG Sculpture, partie postérieure.

MD « héritées » de la notice d’œuvre- sujet- couverture géographique

IMGLBASE IA34000347; PA00103541LBASE2DMAJ 2009/03/16DMIS 2004/10/22

@{img1;//www.culture.gouv.fr/Wave/image/memoire/0769/ivr91_94340193x_p.jpg;ico1}@Lien statique non défini

<A HREF="javascript: MisNot ('merimee', 'IA34000347%20ou%20PA00103541') " TITLE="Mérimée : IA34000347, PA00103541"><IMG SRC="/documentation/icones/pcmer. gif" BORDER="0"></A>

MD propres à la ressource iconographique- droits- identification du support- description du support- MD de gestion

Page 18: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Le support iconographique comme objet patrimonial

Page 19: Mcc hadoc-medihadoc-inha 20141013-1-4

19MCC – DGP – DSIP – HADOC

HADOC : un modèle conceptuel pour la production

Page 20: Mcc hadoc-medihadoc-inha 20141013-1-4

20MCC – DGP – DSIP – HADOC

... aligné sur des ontologies (CRM, FRBRoo

...)

Page 21: Mcc hadoc-medihadoc-inha 20141013-1-4

21MCC – DGP – DSIP – HADOC

L'image illustrative dans HADOC

RGI-MDC::FR_AdresseNom VoieType Voie place

Chabaneau

RGI-MDC::FR_PaysIdentifiant FRNom France

RGI-MDC::FR_Division TerritorialeIdentifiant 91Nom Languedoc-RoussillonType région

RGI-MDC::FR_Division TerritorialeIdentifiant 34Nom HéraultType département

RGI-MDC::FR_Division TerritorialeIdentifiant 34172Nom MontpellierType commune

nom fontainetype dénomination fonctionnelle

Categorie

Localisation Physiqueen villemilieuImplantation

Appellation BCtype titre forgélibelle fontaine de la Ville de

Montpellier

S

Bien CulturelphotoIdentite http://.../IVR91_94340193X_v.jpg

IVR91_94340193X_v.jpg

Image ← Ressourceidentifiant IVR91_94340193Xauteur…

Périn, Jean-Michel

a pour sujet

est représentée par

Relation Ressourcetype est illustré parrôle Sculpture, partie posté-

rieure.

Pointeur

Page 22: Mcc hadoc-medihadoc-inha 20141013-1-4

22MCC – DGP – DSIP – HADOC

L'image objet patrimonial dans HADOC

Bien CulturelphotoIdentite http://.../sap01_na23800020n_t.jpg

IVR91_94340193X_v.jpgPointeur

Appellation BCtype légendelibelle Cloche brisée gisant dans une tranchée

type prise de vueEvenement BC

Personne ← ActeurformeAutorisée Lestrange, Comte Henri de

fonction photographeRoleActeur

Lieu

RGI-MDC::FR_Division TerritorialeIdentifiant 22Nom PicardieType région

RGI-MDC::FR_Division TerritorialeIdentifiant 80Nom SommeType département

RGI-MDC::FR_Division TerritorialeIdentifiant 80080NomType commune

Belloy-en-Santerre

RGI-MDC::FR_PaysIdentifiant FRNom France

Datationorigine dommages de guerre

Appellation Temps1917expressionLitterale

Laps de Temps type techniquevaleur positif noir et blanc pour projection

Caracteristique

type procédévaleur gélatino-bromure

Caracteristique

type supportvaleur support verre

Caracteristique

type finitionvaleur recadrage

Caracteristique

type dégradationvaleur métallisation (miroir d'argent)

Caracteristique

Identifiant BCtype n° photographielibelle 19L01650

Image ← Ressourceidentifiant IVR91_IVR91_94340193X…

a pour sujetest représentée par

Page 23: Mcc hadoc-medihadoc-inha 20141013-1-4

23MCC – DGP – DSIP – HADOC

Bien CulturelIdentifiant

technique sculpture

http://...m5060000285photoIdentite http://.../m506006_96-014943_v.jpg

Le sujet représenté dans HADOC

m506006_96-014943_v.jpg

nom bustetype dénomination

Categorie

type créationEvenement BC

Personne ← ActeurformeAutorisée Bernhardt, Sarah (1844-1923)

fonction sculpteurRoleActeur

Lieu

RGI-MDC::FR_PaysIdentifiant FRNom France

Laps de Temps

Appellation Temps1878expressionLitterale

Identifiant BCtype n° d'inventairelibelle RF 3756

Visuel ← Objet Informationnelsujettype représentation

Abbéma, Louise (1858-1927)

est support de

Page 24: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Quel modèle de métadonnées pour MédiHadoc ?

• Un modèle permettant de décrire la ressource, son contenu, ses sources, son auteur, les droits afférents, les conditions d'exploitation...

• Un modèle permettant de gérer les métadonnées décrivant l'original

• Un modèle exploitant les métadonnées embarquées dans la ressource

• Un modèle basé sur des normes et des standards

• Un modèle respectant les préconisations HADOC

Page 25: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Des flux hétérogènes

– Des images sans métadonnées

– Des images avec des métadonnées embarquées

– Des images accompagnées de métadonnées

EXIFJPG / RAW

EXIF/IPTC

Image + fichiers notices de biens culturels

Page 26: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

MédiHadoc outil de gestion de ressources

Page 27: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

Préconisation des normes et des standards

• Dublin Core et Qualified Dublin Core

– http://dublincore.org/documents/dces/

• METS (Metadata Encoding and Transmission Standard)

– http://www.loc.gov/standards/mets/METSOverview.v2_fr.html

• VRA Core (Visual Resources Association Data Standards)

– http://www.loc.gov/standards/vracore/schemas.html

• MIX ANSI/NISO Z39.87-2006

• EXIF (EXchangeable Image File)

– http://www.cipa.jp/std/documents/e/DC-008-2012_E.pdf

• IPTC (International Press Telecommunications Council) IIM, Core et Extension

– http://www.iptc.org/site/Home/

• XMP (Extensible Metadata Platform) standard ISO 16684-1 2012

– http://www.adobe.com/products/xmp.html

Page 28: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

EXIF, IPTC et XMP

• EXIF ensemble de métadonnées techniques fournies automatiquement par l'appareil de prise de vue numérique (embarquées dans l'image)

Fabricant, nom et modèle de l'appareil de prise de vueDimensions, définition et résolution de l'imageDate et heure de création, modification de la prise de vueDonnées sur les conditions de prise de vue (exposition, ouverture, flash…)Nom de l'auteur de la prise de vueCopyrightDescriptionIdentifiant du fichier...

IPTC Photo Metadata Standard ensemble de métadonnées de description des images qui peuvent être embarquées dans l'image

Contact

Créateur/auteurFonctionAdresseCommuneCode postalRégion/départementPaysN° de téléphoneMélSite internet

Image

Date de créationGenreCode scène

Sujets représentésLocalisation de prise de vueLocalisation du lieu représentéévénement

Source numériqueHauteur maxiLargeur maxiIdentifiant de la ressource

Contenu

RésuméDescriptionMots-clésAuteur de la descriptionOrganisation représenté sur la ressource

Statut

TitreIdentifiantInstructionsCréditSourceMention de copyrightDroits d'utilisationTitulaire des droitsTitulaire des licencesConditions d'utilisation

Fournisseur

NomIdentifiantstructure

Bien culturel ouObjet représenté

AuteurDate de créationCréditN° d'iventaireTitreLocalisation

Page 29: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

• Des métadonnées descriptives du bien culturel– Matériaux, techniques, période de création...

• Des métadonnées descriptives de l'original– Format, type d'image, type de document, échelle...

• Des liens vers les données d'autorités• Des dates en format texte pour les circa dates

Ce qu'il manque dans le schéma IPTC

Page 30: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

La solution XMP

• XMP format de métadonnées

– Basé sur XML

– reprenant le Dublin Core, une partie des métadonnées EXIF et les métadonnées IPTC Photo Metadata Standard

– Extensible

• Puisque qu'il est extensible

– XMP va permettre de compléter le schéma IPTC Photo Metadata Standard par la création de métadonnées spécifiques HADOC

– Ces métadonnées spécifiques pourront être embarquées dans la ressource

Page 31: Mcc hadoc-medihadoc-inha 20141013-1-4

MCC – DGP – DSIP – HADOC

En chantier

• Le modèle de métadonnées

– Corrélation des métadonnées existantes entre EXIF, IPTC, XMP et HADOC

– Complétion du schéma

– Définition des métadonnées embarquées

– Gérer les métadonnées communes aux différents formats

• Les métadonnées auteur, date de création, copyright et description peuvent exister à la fois dans les métadonnées EXIF, IPTC et XMP

Quelle priorité doit être appliquée ?

Quel traitement pour les métadonnées non sélectionnées ?