Metadonnees et SID
-
Upload
dalb -
Category
Technology
-
view
2.883 -
download
0
description
Transcript of Metadonnees et SID
Groupe Sectoriel ATC Aménagement – Transport - Construction
Réunion du 24 mars 2009
Sylvie Dalbin - [email protected]
Métadonnées
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 2
Plan du support
1. Objectif et contexte
2. Ressources
3. Métadonnées
4. XML
5. Modélisation
6. Axes d’évolution
1. OBJECTIF ET CONTEXTE
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 4
Objectif : Métadonnées et SID
Métadonnées Pour la représentation et l’accès à l’information Impacts sur les Systèmes d’information documentaire (SID)
Sur les outils documentaires et informatiques, de production, gestion et recherche
Perpectives Accès à l’information
à l’ère de la Société de l’Information et du Web Prendre acte des besoins et des pratiques des Utilisateurs des SID
Mise en perspective professionnelle Synthèse du questionnaire transmis le 17/03/2009
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 5
Synthèse - Fonctions (1)22 répondants du Groupe ATC en 3 jours, dont 15 présents à la réunion
1. Fonctions assurées
0,00%
13,60%
31,80%
31,80%
63,60%
68,20%
72,70%
95,50%
72,70%
Autres
Gestion prod. documents
Archives
Gestion d'information metier
Produits, services
Gestion documents internes
Bibliothèque
Veille
Recherche
ADéLIe (1) - un exemple
ADministration de Données locaLIsées
Système de stockage, de catalogage et de mise à disposition du patrimoine géographique du Ministère (Equip)
… sous forme de lots de données géographiques Aérodromes de Bourgogne - FICHE_2760
http://adelie.application.equipement.gouv.fr/syntheseFiche.do?fiche=2760&visu=ok&page=1
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 7
Zones de la fiche
Export de la fiche en XML
ADéLIe (2) - site Internet
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 8
ADéLIe (3) Patrimoine géographique
sous forme de lots de données (tableaux, cartes, statistiques, écrits, etc), stables et datés
accompagnés de métadonnées à la norme ISO 19115 - échangeables au format XML conforme à la norme ISO19139.
hébergés sur serveurs - central, local ou externe -alimentés par une application web centralisée
alimentés par des administrateurs de données localisées (ADL)
consultables à travers un moteur de recherche, accessible sur i-carré, ADER, Internet en fonction des droits d'accès
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 9
(?)ContrôleXML
(SGBD)
Rdf - uri
Schémas de métadonnées
Ressource numérique structurée
De gros manuels
Saisie
Import/export
SGBD
MCDNotice
(bibliographique)Document
Documentation du système
ProcessSystème
informatiqueSystème
documentaireDocument
granularité modèle métier norme interopérabilitéSystème
documenté
Thèmes abordés
Utilisateur producteur / Utilisateur final
Outils documentaires et informatiques
Hie
rAujourd
’hui
2. RESSOURCES
Ressources numériques structurées
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 11
ADéLIe (4) – Données, Documents, Informations
Information géographique Une collection constituée par les besoins et
pratiques du métier (Equipement) Quelle que soit la nature et le support de
l’information tableaux, cartes, statistiques, écrits, etc
Granularité adaptée aux besoins Ici des lots regroupés par rapport à la localisation
Informations et documents numériques
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 12
Synthèse – Informations (2)22 répondants du Groupe ATC en 3 jours, dont 15 présents à la réunion
2. Type d'informations gérées
0,00%
13,60%
13,60%
18,20%
45,50%
45,50%
63,60%
100,00%
Autres
Objets : maquettes,...
Plans
Films/video
Donnees stat.,factuelles
Photographies
Dossiers techniques
Articles/monographies
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 13
Synthèse - Médias (3)22 répondants du Groupe ATC en 3 jours, dont 15 présents à la réunion
6. Médias gérés
Image animee; 9,50%
Artefacts/Objets; 9,50%
Collection donnees; 9,50%
Autres ?; 9,50%
Image fixe; 47,60%
Logiciels; 9,50%
Texte; 90,50%
Catégories du Dublin Core
3. METADONNEES
Représentation documentaire métier
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 15
ADéLIe (5) Eléments de la fiche descriptive…
Ce que l’on voit à l’écran
titre version dates (création, révision, édition), producteur des données Aperçu droits d'accès aux données résumé type de données couverture administrative système de coordonnées résolution/échelle de
référence service gestionnaire des
données, contact pour les données
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 16
Adélie (6) … structurée
éléments de données = métadonnées
regroupés et hiérarchisés= schéma de métadonnées
=> une représentation des ressources, ici un lot de données géographiques.
Ce que l’on voit derrière l’écran
Logiciel XMLEditor ou Amaya
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 17
Catégories de métadonnées
Catégories fréquemment citées ns4:MD_Metadata ns4:fileIdentifier ns4:language ns4:characterSet ns4:hierarchyLevel ns4:hierarchyLevelName ns4:contact ns4:dataStamp ns4:metadataStandardName ns4:metadataStandardVersion ns4:referenceSystemInfo ns4:identificationInfo ns4:distributionInfo ns4:dataQualityInfo ns4:metadataConstraints
Représentation de la ressourcecaractéristiques intrinsèques, contexte de production
ns4:referenceSystemInfo
Administration de la ressource
ns4:contact
Métadonnées structurellesns4:hierarchyLevel (contexte)
Méta-métadonnéesns4:contact
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 18
Standardisation - Normalisation
Suivant les objets représentés La description d’une ressource
Norme bibliothéconomique telle RDA ou Onyx
La ressource elle-même DocBook d’OASIS pour les documents techniques, TEI…
Par élément de données Langue (rfc4646), contact (vCard), identifiants …
Par Métier - producteurs Secteur de l’information géographique, Secteur de la
formation : LOM, CDR, … Par Fonctions
Transports de données : METS, XMP…
Nouveaux « langages documentaires »
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 19
Schémas imbriqués
Une ressource « OAI »…Schéma OAI-PMH
transportant des ressources LOM
Schéma LOM
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 20
Métadonnées et Logiciels
Plusieurs jeux de métadonnées Diversité des modèles Relations entre modèles Mobilité des modèles
Complexité d’articulation entre ces schémas
Distinguer production et recherche Production en locale ? sur plusieurs systèmes ? Recherche fédérée sur d’autres ressources
Ressources à traiter et celles à intégrer au portail : quel recouvrement ?
Un point d’architecture aussi pour professionnels de l’infodoc, essentiel pour les questions d’interopérabilité et d’économie
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 21
Synthèse - Logiciels (4)22 répondants du Groupe ATC en 3 jours, dont 15 présents à la réunion
4. XML
Représentation informatique et applications de gestion et de
recherche
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 23
XML - Langage de description Format ouvert : texte
Non propriétaire
Ajoute des informations aux métadonnées
Chaîne de caractère Localise le référentiel avec
une URI
Structuration formelle Encadre les métadonnées
Balises: < > et </ > Arbre XML
Nouveaux langages informatiques
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 24
XML et SGBD
XML: format de transfert ou de stockage ? Débats dans la communauté informatique
SGBD : données encapsulées dans des tables, documentation externe aux fichiers véhiculés, peu souple
XML : données « ouvertes », auto-documentées grâce à RDF
Usage pour le stockage des index en recherche
Exploitation directe par les moteurs de recherche
Un point technique pour informaticiens, essentielles pour les questions d’interopérabilité et d’économie
5. MODELISATION
Processus et outils
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 26
Processus de conception
La Vie
Les Choses de la Vie
A - Représentation MétierA1 - Modéliser et formaliser le modèle métierA2 - Développer des Référentiels métier
B - Représentation InformatiqueB1 - Concevoir un modèle informatique sur la base du
modèle conceptuel métierB2 - Développer un schéma de données
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 27
liaison entre attribut et entité ou association et entité
Classe d’entité Attribut
matériauPont A conçu
Classe d’association
Cardinalité (1-n). Ici, on suppose qu’un pont peut être conçu par 1 ou n architectes. Classe d’entités / associations : regroupement d’entités ou d’associations de même natureIdendifiant : chaque occurrence est repérée de manière unique et sans ambiguïté pour être distinguée de toutes les autresCe vocabulaire est variable en fonction de l’origine du locuteur comme objet (entité), propriété (attribut) ou valeur et relation (association)
Architecte PontA conçu
nom prénom date nom-pont lieu
fonction durée matériau
1, n 1, n
Modèle entités-associations
Identifiant Identifiant
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 28
relation est_unterme_préféré
EntitésThésaurusConcepts
Termes
Attributsdu terme: langue, source…
Draft Schema np25964
relation terme: a_comme_définition
Diagramme UML
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 29
Administration des métadonnées
Documenter les applications Auto-référencement ?
RDF – grâce à une syntaxe formelle permet de documenter rigoureusement les métadonnées
Documenter « écrite » ISO 11179 (MDR) ISO 9735-2:2002 données composites
Enregistrer schémas et profils d’application Agences d’enregistrement: ISO 11179, par métiers Profils d’application
schéma + règle + système d’encodage + tableau de concordance
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 30
Vocabulaire RDFDocumenter les métadonnées
<?xml version="1.0"?>
<!DOCTYPE rdf:RDF PUBLIC "-//DUBLIN CORE//DCMES DTD 2002/07/31//EN"
"http://dublincore.org/documents/2002/07/31/dcmes-xml/dcmes-xml-dtd.dtd">
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://www.ilrt.bristol.ac.uk/people/cmdjb/">
<dc:title>Dave Beckett's Home Page</dc:title>
<dc:creator>Dave Beckett</dc:creator>
<dc:publisher>ILRT, University of Bristol</dc:publisher>
<dc:date>2002-07-31</dc:date>
</rdf:Description>
</rdf:RDF>
Doc. XML
Doc. RDF
Doc Elements du Dublin Core
Doc schema XML du Dublin Core / RDF (espace de nom)
Elements du Dublin Core
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 31
En résuméLangages à tous les étages
Langage : un moyen d'expression et de représentation Langage de représentation des SI
Représention graphique UML, entité-attribut-classe, Schémas XML
Langage de représentation des ressources De la notice aux schémas de métadonnées interopérables
Langages de représentation des notions Sert à alimenter les schémas de métadonnées Des listes d’autorité aux référentiels sémantiques
Langage de représentation des métadonnées RDF
Pour chacun : vocabulaire - syntaxe - sémantique
6. AXES D’EVOLUTION
#1 - Des listes d’autorité aux répertoires sémantiques
#2 – Pour une convergence des modèles documentaires
#3 – Continuum et réexploitation
#4 – Plonger dans les ressources numériques
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 33
#1 - Des lexiques contrôlés ….
PersonneGéographieGenres…
Réservoirs de vocabulairesdésambiguïsés
NomDateNaissance/Mort
IDTitreAuteurEditeurDateSupport…Descripteurs-Géographiques-Personnes-Thèmes
RépertoireDocuments
Personnes
Géographie
Lexiques contrôlés Ressource
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 34
. … aux répertoires sémantiques
IDNomDateNaissance/MortPseudoPaysNaissance
TypePublicationGenrePublicationAireLinguistiqueEditeur …
IDTitreAuteurEditeurDateSupportGenreLieuPersonnage…
RépertoireDocuments
RépertoirePersonnes
RépertoireGéographie
RessourceRessource
PersonneGéographieGenres…
Réservoirs de vocabulairesdésambiguïsés
pouvant servir de Base de connaissance qualifiée
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 35
#2 – Pour une convergence des modèles documentaires
biblio-doc
RM
Archives
KM
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 36
#3 Continuum et réexploitation
Continuum - de la création à l’exploitation des ressources Métadonnées à la source : « recyclage infini » des métadonnées produites, et
non (re)création Ne pas rester à la lisière du document
biblio-doc
RM
Archives
KM
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 37
#4 Plonger dans les ressources numériques
Etablir des schémas de représentation des contenus
Exemple : les thèses Etat de l’art Méthode proposée Expérimentation Perspective Terminologie Ressources liées (bibliographie)
Articuler les métadonnées description de la ressource description de son contenu avec des éléments de son
contexte
Contenu de la thèse (pdf)
C. Roussey - Une méthode d’indexation sémantique adaptée aux corpus multilingues, 2001
Etat de l’art
Méthode proposée
Expérimentation
Perspective
Terminologie
Ressource liée(ici un article)
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 38
Complexité de mise en œuvre
Malgré les qualités des technologies du Web Ouverture, interopérabilité technique, normalisation,…
Difficultés de conception et de mise en œuvre
Grande mobilité : normalisation, méthodes et outils Compétences multiples à associer Contenu et systèmes ouverts S’ouvrir aux pratiques des Utilisateurs Economie des dispositifs et coût des transformations Accompagner le changement : formation
Adopter un esprit ouvert et critique sur nos pratiques
Merci !
Sylvie [email protected]
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 40
Annexe 1 - Description des métadonnées
Selon la norme ISO 11179
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 41
Annexe 2 - Représentation fine et métadonnées composites
Représentation des langues RFC 4646 (Tags for Identifying Languages) Finalités
Accès direct aux ressources Répondre précisément aux besoins Prendre en compte les particularismes régionaux à travers
le monde Intégré à Dubin Core / ISO 15836
zh - Latn - CN [ISO 639-1] [ISO 15924] [ISO 3166]
de - CH - 1996Allemand utilisé en Suisse, écrit après la réforme de l'orthographe entamée en 1996.
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 42
Annexe 3 – Arbre XML et schéma de métadonnées
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 43
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 44
Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 45