Dublin Core - Paris Nanterre...

74
Dublin Core Théorie et applications Formation “Métadonnées” MEDIATIX Saint-Cloud, 16-17 sept. 2009 Catherine Morel-Pair, INIST-CNRS [email protected] partageable sous Licence Creative Commons

Transcript of Dublin Core - Paris Nanterre...

  • Dublin Core

    Théorie et applications Formation “Métadonnées” MEDIATIX

    Saint-Cloud, 16-17 sept. 2009

    Catherine Morel-Pair, INIST-CNRS

    [email protected] partageable sous Licence Creative Commons

    mailto:[email protected]://creativecommons.org/licenses/by-nc-sa/2.0/fr/http://creativecommons.org/licenses/by-nc-sa/2.0/fr/http://creativecommons.org/licenses/by-nc-sa/2.0/fr/

  • 20/10/10 C. Morel-Pair

    Introduction Les éléments Dublin Core et leur implémentation

    Modules Dublin Core Formats d’écriture

    Outils et applications Outils de formation … Archives ouvertes et protocole OAI-PMH ; TEF … Web sémantique et Web 2.0

  • 20/10/10 C. Morel-Pair

    Dublin Core Metadata InitiativeObjectif

    “Pallier les insuffisances des métadonnées HTML” pour donner une sémantique au Web Métadonnées HTML insuffisamment définies et

    utilisées … Par un standard généraliste pour le Web,

    une “description bibliographique simplifiée” pour décrire tout type de ressource … et améliorer la “resource discovery”

  • 20/10/10 C. Morel-Pair

    Métadonnées (X)HTML ? Embarquées, dans l’en-tête de la page

    Dans le navigateur : “Affichage”, “Source” Ou : clic droit, informations sur la page Ex : http://www.loc.gov/index.html

    Métadonnées descriptives du contenu

  • 20/10/10 C. Morel-Pair

    Métadonnées HTML, limites Peu de documentation d’accompagnement :

    DTD seule HTML est un format d’affichage pour le Web

    Peu de structuration logique du document, et de description Décrit des pages HTML … seulement “Détournement” de métadonnées …

    Utilisation insuffisante par les producteurs de sites … et par les moteurs

    “Alternatives” Développement du Dublin Core Autres métadonnées HTML spécifiques Structuration accrue des pages “référencement naturel”

  • 20/10/10 C. Morel-Pair

    Dublin Core Metadata Initiative

    Atelier à Dublin (Ohio) en 1995 (“OCLC/NCSA Metadata Workshop”) DCMI, Dublin Core Metadata Initiative Devenu une “fondation”

    Normalisation internationale ISO 15836-2003, http://www.niso.org/standards/resources/Z39-85.pdf

    Groupes de travail thématiques évolutifs, workshop annuel

    http://www.dublincore.org acteurs et activités documentation et recommandations logiciels et outils …

    http://www.niso.org/standards/resources/Z39-85.pdfhttp://www.dublincore.org/

  • 20/10/10 C. Morel-Pair

    I - Dublin Core, modules DC simple

    15 éléments caractérisés par 10 propriétés Norme ISO 15836-2003, RFC 5013, ANSI-NISO 39.85

    DC qualifié + “qualificatifs” (DCTERMS, “refinements, qualifiers, extensions”)

    caractérisés DC étendu :

    + éléments issus d’autres standards (Learning Object Metadata, IEEE-LOM)

    + éléments récents : gestion de collections …

    “Encoding schemes”, standardisation des valeurs des éléments : ressources reconnues

  • 20/10/10 C. Morel-Pair

    Dublin Core, des éléments bien définis

    Chacun des 15/16 éléments est défini par 10 propriétés (norme ISO/IEC 11179 - registres de métadonnées) Name (identifiant invariable) et Label(traductions

    possibles) Définition et Commentaire Version (1.1 actuelle) Autorité de gestion (DCMI) Langue de l’identifiant (anglais) Obligation et Occurrence de l’élément

    tous sont facultatifs et répétables Type de son contenu (tous = texte)Voir en Français :http://www-rocq.inria.fr/~vercoust/METADATA/DC-fr.1.1.html

    5 propriétés pour chaque qualificatif

    http://www-rocq.inria.fr/~vercoust/METADATA/DC-fr.1.1.html

  • 20/10/10 C. Morel-Pair

    Dublin Core simple, les 15 éléments

    Descriptifs du contenu Title, Description, Subject, Coverage Type, Language Relation

    Description des droits Creator, Contributor, Publisher Rights Source

    Techniques - structure Date, Format, Identifier Relation

    un exemple en HTML www.inist.fr

    http://www.inist.fr/

  • 20/10/10 C. Morel-Pair

    DC simple, éléments1 - description du contenu

    Title : nom donné à la ressource Exemple : titre d’un article, nom d’une œuvre d’art …

    Description : description du contenu de la ressource Exemple : résumé, table des matières, texte libre

    Subject : sujet du contenu de la ressource Mots-clés, classification Recommandation : issus d’une “source reconnue”

    Coverage : portée ou couverture spatio-temporelle de la ressource Période de temps ; entité ou position géographique ; juridiction

    administrative Recommandation

    Vocabulaire contrôlé (ex : TGN) Modèles de valeurs si numériques (DCMI Box, Point, Period) …)

    Exemple : couverture d’une base de données

  • 20/10/10 C. Morel-Pair

    DC simple, éléments1 - description du contenu

    Relation : référence à une autre ressource qui a un rapport avec la ressource décrite (rapport logique, ici ) R. : système formel d’identification (ex. URL, DOI …)

    Type : nature ou genre du contenu Décrit des catégories, fonctions ou genres généraux du contenu R. : vocabulaire contrôlé, exemple : vocabulaire DCMItype

    12 valeurs : Text, Event, Dataset, Service, Moving image … NB : autres vocabulaires, ex. CRGI (Canada)

    Language : langue du contenu intellectuel de la ressource Valeurs conformes à RFC 3066

    code langue à 2 ou 3 caractères (normes ISO 639) éventuellement suivi d'un code à deux lettres pour le pays (norme ISO

    3166)

    http://dublincore.org/documents/dcmi-type-vocabulary/http://dublincore.org/documents/dcmi-type-vocabulary/http://www.tbs-sct.gc.ca/im-gi/mwg-gtm/typ-typ/docs/2003/schem/schem-fra.asp

  • 20/10/10 C. Morel-Pair

    DC simple, éléments2 - description des droits

    Creator : entité principale responsable de la création du contenu de la ressource … auteur, compositeur … Personne, collectivité ou service

    Contributor : entité qui a contribué à la création du contenu de la ressource ; personne, collectivité ou service

    Publisher : entité responsable de la diffusion de la ressource dans sa forme actuelle, Personne, collectivité ou service : département universitaire,

    entreprise … Source : référence à une ressource dont la ressource actuelle

    dérive en totalité ou en partie ex : BD statistiques rapport Recom. : système formel d’identification

    Rights : droits sur la ressource Propriété intellectuelle, droits à gérer cette ressource, droits d’usage

  • 20/10/10 C. Morel-Pair

    DC simple, éléments3 – description technique

    Date : une date associée avec un événement dans le cycle de vie de la ressource Exemple : date de création, modification, publication R. : norme ISO 8601 (W3CDTF), AAAA-MM-JJ

    Identifier : référence non ambiguë à la ressource dans un contexte donné R : système formel d’identifiants uniques (URI)

    dont URL, DOI, ISSN …

    Format : décrit la matérialisation physique ou digitale de la ressource Support, média, dimensions (taille, durée …)

    Éventuellement, logiciel ou matériel indispensable R : vocabulaire contrôlé de type MIME

    Relation … dans ses aspects techniques - structure

  • 20/10/10 C. Morel-Pair

    Dublin Core étendu : des éléments complémentaires

    audience

    instructional method

    Groupe de personnes à qui le document est destiné.

    Méthode d’apprentissage

    provenanceChangements signifiants pour authenticité, intégrité, interprétation depuis création : propriétaire, dépôt …

    accrualMediumaccrualPeriodicityaccrualPolicy

    (évolution collections)Méthode d’ajouts de nouveaux itemsFréquence des ajoutsPolitique d’accroissement

  • 20/10/10 C. Morel-Pair

    DC qualifié : plus de précision

    Exemples

    TitleNom donné à la ressource, titre du document

    alternative : autre titre (traduit, abrégé …)

    Subject

    Mots-clés, codes de classement, sujet.Utilisation de vocabulaires ou classifications contrôlés recommandée (LCC, UDC,DDC LCSH, Mesh)

    DescriptionDescription du document, résumé, table des matières, texte libre

    abstracttableOfContents

  • 20/10/10 C. Morel-Pair

    DC qualifié, exemples élément “relation”

    Relation

    Lien vers une ressource liée.Il est recommandé d'utiliser une dénomination formelle des ressources (URI)

    Qualificatifs

    isFormatOf / hasFormatisVersionOf / hasVersionisReplacedBy / replacesisPartOf / hasPartisReferencedBy / referencesisRequiredBy / requiresconformsTo

  • 20/10/10 C. Morel-Pair

    DC qualifié, exempleélément “date”

    Date Date d'un évènement dans le cycle de vie du document. Recommandation : format W3CDTF (AAAA-MM-JJ), norme ISO et Period (DCMI).

    Qualificatifs created : date de créationvalid : date ou période de validitéavailable : date/période de mise à dispositionissued : date de publicationmodified : date de modificationdateAccepted : date d'acceptation (thèse, article…)dateCopyrighted : date du copyright dateSubmitted : date de soumission (article...)

  • 20/10/10 C. Morel-Pair

    Les schémas d’encodage “sémantiques” et “syntaxiques”

    Pour l’homogénéisation et la non-ambiguïté du contenu des éléments Valeurs basée sur des ressources reconnues

    Thésaurus, classements et ontologies… DC : LCSH, MESH, LCC, DDC, TGN, DCMItype

    Listes d’autorité personnes ou organismes Codes ISO, RFC …

    DC : codes langues et pays Modèles de valeurs attendues

    Ex : structure d’un ISSN, d’une date + DC : zone géographique, périodes de temps …

    Identifiants uniques des ressources : URI

  • 20/10/10 C. Morel-Pair

    Dublin Core, intérêt et limites

    Consensus international et interprofessionnel Sémantique “commune” interdisciplinaire ; “multilinguisme” Simplicité – 2 niveaux d’usage Extensibilité et flexibilité Normalisation ET évolutivité

    largement adopté aujourd’hui

    Description généraliste pour la recherche d’informations Ressource plutôt électronique et isolée Métadonnées techniques et administratives limitées Architecture peu contraignante

    … en association avec d’autres éléments

  • 20/10/10 C. Morel-Pair

    Dublin Core, plus d’info … Métadonnées et Dublin Core, OpenWeb group

    http://www.openweb.eu.org/articles/dublin_core/… tous les éléments, qualificatifs, schémas d’encodage

    Liste de discussion francophone Dublin Core http://listserv.inist.fr/wwsympa.fcgi/info/dcmi-fr

    Site officiel DCMI, http://dublincore.org Guide d’usage “Using Dublin Core” ,

    http://dublincore.org/documents/usageguide/ Généralités - Syntaxes – liens vers documents spécifiques

    Bonnes traductions de documents du DCMI http://www.yoyodesign.org/doc/dcmi/

    http://www.openweb.eu.org/articles/dublin_core/http://listserv.inist.fr/wwsympa.fcgi/info/dcmi-frhttp://dublincore.org/http://dublincore.org/documents/usageguide/http://dublincore.org/documents/usageguide/http://www.yoyodesign.org/doc/dcmi/

  • 20/10/10 C. Morel-Pair

    TP: éléments Dublin Core Objectif : découvrir les éléments Dublin Core

    en décrivant une ressource Ouvrir crozat_notice.htm avec un navigateur

    = notice de thèse en HTML contenant les informations à récupérer

    Ouvrir crozat_DC.xls et renseigner la “notice” Dublin Core simple ou qualifié Tous les éléments sont facultatifs et répétables Préciser la valeur avec un “attribut” ???

    Disponibles : langue … type (DC qualifié slt) Conclusions

  • 20/10/10 C. Morel-Pair

    II - Dublin Core, syntaxes d’écriture

    Pages HTML, XHTML : métadonnées dans la ressource

    Un exemple : site INIST

    Fichier XML : métadonnées dans un autre fichier En RDF : les 2 possibilités

    Flexibilité : éléments et qualificatifs facultatifs et répétables, formats divers

    Extensivité : association possible avec des métadonnées d’autres origines

    NB : “modèle abstrait” 2008 évolutions en cours

    http://www.inist.fr/

  • 20/10/10 C. Morel-Pair

    1 - Dublin Core, HTML et Internet Non pris en compte

    par les “grands” moteurs !

    Espoirs … Moteurs spécialisés Sites professionnels +++ Logiciels Web2 (Zotero …) Intérêt des webmasters

    « la question que doivent se poser les webmestres à cet instant est : les « grands » moteurs de recherche comprennent-ils le Dublin Core ? Non. La question qui suit, logiquement est : et donc, par rapport aux meta-tags classiques, que m'apporte leDublin Core ? Rien. »

    « Mais l’ensemble des dysfonctionnements d’Internet réside surtout dans l’absence de structuration et de classement des données présentes sur le réseau, ce qui empêche le repérage de l’information et l’accès au document. Pourtant, l'utilisation de données sur les données - les Métadonnées - a été prévu par les concepteurs du Web »

    « cependant, il est deux choses à rendre en compte : - le Dublin Core est un standard et plus ce standard

    sera accepté, plus il sera employé, et par les webmestres et par les moteurs de recherche,

    - dans le cas de sites intranet, il existe des outils qui prennent en compte les balises Dublin Core. Si les balises sont bien renseignées, ces outils sont d'une redoutable efficacité ! »« C’est ainsi que deux mondes distincts – celui de l’Internet et celui de la bibliothéconomie – se sont rencontrés et ont travaillé ensemble à l’amélioration de la technique des métadonnées. L’initiative du Dublin Core est une bonne illustration de cette collaboration »

    http://dublincore.org/tools/

  • 20/10/10 C. Morel-Pair

    2 – DC en XMLXML et métadonnées …

    XML est le format d’implémentation de

    beaucoup de jeux de métadonnées

    RDF et RSS sont des schémas XML

    particuliers

    Méta-formatsMETS …

    ImagesXMPMIX

    Domaines FGDC, LOM,

    Métiers MARC-XML, MODS

    EAD-EACONIX

    Applis DC

    PREMIS

  • 20/10/10 C. Morel-Pair

    Fichier Dublin Core en XML Déclaration des “espaces de nom”

    ( fait par l‘éditeur XML)

    Dublin Core simple

    fr Recherche d’information

    Dublin Core qualifié2002-06Numeric… … Plus “pro” : plus d’attributs et de valeurs contrôlées

    http://purl.org/dc/terms/http://purl.org/dc/terms/

  • 20/10/10 C. Morel-Pair

    Dublin Core simple en XML

    Recherche d’information dans … Chartron, Ghislaine Dans une … fr nformation retrieval Electronic publishing 2002-03-25 http://archivesic.ccsd.cnrs.fr/sic_00000025.en.html

    Text

  • 20/10/10 C. Morel-Pair

    Dublin Core qualifié en XML[espaces de nom …]UKOLNUK Office for Library and Information

    Networkingnational centre, network information

    support, library,community, […] 062061(410)

    http://www.bath.ac.uk http://www.ukoln.ac.uk/2001-07-18

  • 20/10/10 C. Morel-Pair

    III - Quelques outils d’implémentation

    Voir http://dublincore.org, Tools and Software (sous Firefox) … et ailleurs … !

    1 - des outils d’aide à la découverte/création Aide-mémoire DC-assist add-on Firefox d’affichage des métadonnées DC

    “Firefox Dublin Core Viewer Extension”

    http://dublincore.org/

  • 20/10/10 C. Morel-Pair

    Dublin Core, affichage Mozilla

  • 20/10/10 C. Morel-Pair

    DC, outils 2 - Convertisseurs

    Exemple : DC-Dot, Dublin Core Metadata Editor Des métadonnées (X)HTML

    … vers des métadonnées DC en (X)HTML, XML, RDF Et vers d’autres jeux d’éléments : MARC, TEI …

    Convertisseur + formulaire de saisie + « extracteur » TP

    Entrer une URL, ex. http://www.loc.gov/index.html Regarder le résultat généré ; compléter les métadonnées

    dans le formulaire, soumettre à nouveau Utilisation des métadonnées DC générées

    En HTML : coller dans la page HTML Autres : “notice”pour catalogue, portail …

    http://www.loc.gov/index.html

  • 20/10/10 C. Morel-Pair

    Dublin Core, outils (3)Autres

    3 - Des “templates”, formulaires de saisie DC-Dot Interface des systèmes de gestion de bases de données

    4 - Des “extracteurs” Besoin de structure … cf Lodel

    5 - Des outils intégrés à des applications Content Management System comme MKdoc Outils OAI-PMH et archives ouvertes Plateformes éditoriales : Lodel, Dspace … … … Logiciels documentaires – fonction portail …

  • 20/10/10 C. Morel-Pair

    Lodel et Dublin Core Lodel : plate-forme éditoriale développée par

    Revues.org Revues SHS

    Présentation paramétrable Voir www.revues.org et http://lodel.demo.inist.fr

    Organisation arborescente revue, année, numéro … par exemple

    D’un document Word ou Open Office à la mise en ligne en format XHTML Publication document et extraction des métadonnées Contrainte : documents stylés selon le modèle Lodel

    Préparation : stylage/marquage des éléments du .doc Soumission, publication

    http://www.revues.org/http://lodel.demo.inist.fr/

  • 20/10/10 C. Morel-Pair

    D’un article publié ailleurs à la publication avec Lodel …

  • 20/10/10 C. Morel-Pair

    Article stylé selon le modèle Lodel

  • 20/10/10 C. Morel-Pair

    Lodel, soumission

  • 20/10/10 C. Morel-Pair

    Lodel, soumission (2)

  • 20/10/10 C. Morel-Pair

    Résultat

  • 20/10/10 C. Morel-Pair

    L’article dans Lodel, la source du document

    [en-tête : métadonnées de type HTML puis DC : ]

    [ autres DC.* …]

    [Puis corps du texte]… Voir les sources d’articles de Revues.org

  • 20/10/10 C. Morel-Pair

    IV - Applications …Archives ouvertes

    et protocole OAI-PMH

    Bibliothèques numériques(profil libraries)

    eBooks : standard ePUB

    Corpus Recherche (OLAC …)

    Thèses Electroniques Fr

    Répertoires et portails des informations

    publiques

    Annuaires et portails

    XMP et images / pdfWeb sémantique

    Applications Web 2.0

    Profils d’applications

    Z39.50OpenURL

  • 20/10/10 C. Morel-Pair

    1 - Accès libre, archives ouvertesprotocole OAI-PMH

    Un principe : le libre accès à l’information scientifique et technique Intérêt :

    Accessibilité, visibilité, impact Modèle économique et social alternatif

    Des pionniers, 1990-93 : ArXiv, WoPEc, ADS astrophysique, CogPrints

    Conférences/conventions de Budapest, Bethesda, Berlin, Genève…: Le libre accès aux résultats de la recherche devient un postulat Différents pays et institutions adhèrent formellement à ce principe Distinctions formelles

    revue libre accès / archive ouverte archive thématique / institutionnelle

    Voir http://openaccess.inist.fr/

    http://openaccess.inist.fr/

  • 20/10/10 C. Morel-Pair

    Archives ouvertes, protocole OAI-PMH

    Extension rapide du mouvement BioMedCentral, PLoS…, serveurs du CCSD (HAL …), Plus de 2200 archives répertoriées, contenant plus de 20

    millions de ressources http://gita.grainger.uiuc.edu/registry/ (1850 en 2008) http://www.opendoar.org/index.html (1200)

    http://roar.eprints.org/ (940, 2008) Protocole OAI-PMH, 2001 : protocole de structuration et

    d’interrogation des entrepôts de métadonnées pour l’interopérabilité HTTP, XML, Dublin Core Acteurs : data providers et service provider “verbes” de requête

    http://gita.grainger.uiuc.edu/registry/http://www.opendoar.org/index.htmlhttp://roar.eprints.org/

  • 20/10/10 C. Morel-Pair

    OAI-PMH du côté utilisateurs Recherche dans un ensemble d’archives avec des

    moteurs spécialisés, “moissonneurs” http://oaister.umdl.umich.edu/o/oaister/

    nov. 2005 : 477 archives, 5 277 000 enregistrementsjanvier 2008 : 14 673 000 enregistrements

    http://citebase.eprints.org/cgi-bin/search (facteur d’impact”) Ordre : descending, citations

    http://www.scientificcommons.org (2007: 898 archives, 16M enr.)

    Auto-archivage exemple dans HAL, Hyper Articles on Line, CCSD-CNRS

    http://hal.archives-ouvertes.fr

    http://oaister.umdl.umich.edu/o/oaister/http://citebase.eprints.org/cgi-bin/searchhttp://www.scientificcommons.org/http://hal.archives-ouvertes.fr/

  • 20/10/10 C. Morel-Pair

    Résultat requête OAIster

  • 20/10/10 C. Morel-Pair

    HAL, soumettre

  • 20/10/10 C. Morel-Pair

    OAI-PMH

    ?

    Fournisseur de données

    Fournisseur

    de services

  • 20/10/10 C. Morel-Pair

    OAI-PMH, les entrepôts Contenu minimal d’un entrepôt de

    métadonnées Enregistrements compatible OAI-PMH

    Dublin Core – XML Dans une base de données (*SQL, ODBC …)

    Autres formats moissonnables MARC-XML et MODS METS, EAD … Tout format XML de métadonnées

  • 20/10/10 C. Morel-Pair

    OAI-PMH, enregistrement minimal

    identifiant, date, setSpec

    Recherche d’information dans … Chartron, Ghislaine

    Dans une … fr Information retrieval Electronic publishing 2002-03-25 http://archivesic.ccsd.cnrs.fr/sic_00000025.en.html Text

  • 20/10/10 C. Morel-Pair

    De la base de donnée interne d’une application à l’entrepôt OAI-PMH

    La base de données interne à l’application gère ses propres éléments Ex. application INIST I-Revues, http://irevues.inist.fr

    DSpace, MIT cf revue Hermès, 2005, 42, une notice détaillée

    Profil d’application Dublin Core qualifié

    … et les expose dans l’entrepôt OAI-PMH Ex : l’entrepôt de I-revues, requête sur Hermès,num 42

    Idem pour toutes les archives ouvertes et beaucoup de logiciels doc-bib-archivistique

    http://irevues.inist.fr/http://documents.irevues.inist.fr/dspace-oai/http://documents.irevues.inist.fr/dspace-oai/request?verb=ListRecords&set=hdl_2042_8929&metadataPrefix=oai_dchttp://documents.irevues.inist.fr/dspace-oai/request?verb=ListRecords&set=hdl_2042_8929&metadataPrefix=oai_dc

  • 20/10/10 C. Morel-Pair

    2 -TEF, thèses électroniques françaises

    Projet ministériel de valorisation et pérennisation Circulaire, directives Visant une diffusion accrue et des échanges

    Accès en ligne Signalement mutualisable dépassant le cadre des bibliothèques

    AFNOR CG 46 / CN 357, métadonnées des thèses Vers une chaîne de production unique et automatisée

    document électronique – métadonnées … … … Métadonnées : compatibilité OAI-PMH + richesse description

    SUDOC Descriptives, version 1 2005 : DC Autres, version 2, 2006

    Plateforme de saisie STAR ABES-CINES http://www.abes.fr/abes/page,428,star.html

    http://www.abes.fr/abes/page,428,star.html

  • 20/10/10 C. Morel-Pair

    Métadonnées TEF Espace de nom TEF

    Un “profil d’application” Dublin Core et/puis METS Version 1 : Dublin Core qualifié + MODS et ETD-MS Version 2, mai 2006 : encapsulation METS + droits METS

    Valeurs contrôlées : vocabulaires, autorités MADS…

    “Les métadonnées des thèses électronique françaises, TEF”, groupe AFNOR CG46/CN357/GE5, V1 http://www.abes.fr/abes/documents/tef/recommandation/tef_01.pdf V2 http://www.abes.fr/abes/page,403,tef.html

    Journée d’étude sur les thèses électroniques, 26 mars 2009, Médial, Nancy, http://www.univ-nancy2.fr/medial/docligne.html?depuis_id=1093 Diapos suivantes : Isabelle Mauger Perez - ABES

    http://www.abes.fr/abes/documents/tef/recommandation/tef_01.pdfhttp://www.abes.fr/abes/page,403,tef.htmlhttp://www.univ-nancy2.fr/medial/docligne.html?depuis_id=1093

  • 20/10/10

    STAR

    imports de données et/ou du document thèse

    Ce qui rentre dans STAR

    EPrints,Cyberthèses,ORI-OAI, Apogée…

    2. Star : comment on s’en sert ?

    formulaires web de STAR

    5. Star : comment on s’en sert ?

    Éviter la double saisie !

  • 20/10/10

    STAR

    Archivage pérenne *

    Signalement *

    URL pérenne *

    Diffusion

    Entrepôts national, international…

    Ce qui sort de STAR chaque établissement de soutenance *

    serveur OAI

    3. Star : à quoi ça sert ? * obligatoire

  • 20/10/10 C. Morel-Pair

    TEF V1 … V2Un coup d’œil ?

    TEF V1 Le registre

    http://www.abes.fr/abes/documents/tef/recommandation/tef_01.pdf

    Dans Demos/TEF, au choix Description minimale, tef_01_exemple_minimal.xml Description complète, tef_01_exemple_riche.xml Le schéma, tef_schema_01.xsl

    TEF V2 http://www.abes.fr/abes/DesktopDefault.aspx?tabindex=4&tabid=403

    , ‘Exemples’ (en bas)

    http://www.abes.fr/abes/documents/tef/recommandation/tef_01.pdfhttp://www.abes.fr/abes/DesktopDefault.aspx?tabindex=4&tabid=403

  • 20/10/10 C. Morel-Pair

    4- eBooks : ePub, OPF et métadonnées sur la publication

    Alice in Wonderlanden

    123456789X Lewis Carroll…

    … …

    http://www.openebook.org/2007/opf/OPF_2.0_final_spec.html

    http://www.openebook.org/2007/opf/OPF_2.0_final_spec.html

  • 20/10/10 C. Morel-Pair

    5 – Logiciels documentaires et DC Dans beaucoup de logiciels aujourd’hui

    Exports XML variés des éléments Exposition et moissonnage OAI-PMH via la fonction portail

    Plus … Koha, SIM couches internes XML, avec Dublin Core + autres

    standards … Logiciels de gestion de références bibliographiques

    Endnote exporte du XML maison Zotero, Web 2

    Reconnaît et importe les métadonnées DC des pages HTML (entre autres …)

    Exporte du DC (entre autres …) Couche interne RDF + DC + FOAF …

  • 20/10/10 C. Morel-Pair

    V - RDF Ressource Description Framework

    Modèle et cadre syntaxique Pour formaliser des connaissances sur/dans des ”ressources”

    très hétérogènes Objets physiques et numériques … Personnes, réseaux, lieux, événements … … Concepts

    Intégrant des ensembles d’éléments divers Toute connaissance = triplet “ressource - propriété – valeur” Ecriture : graphes, n3 … – XML

    Lisible par machines indépendamment du contexte

  • 20/10/10 C. Morel-Pair

    le “Web sémantique”

    Un Web de données interconnectées et interprétablles par les machines Echange de données et

    création de connaissances “inférence”

    Structuration et granularité du contenu

    Des standards d’écriture et de requête universels : RDF, OWL, SPARQL

    … le “Web 2.0” (accessoirement)

    Relie des personnes : “tous acteurs”

    Via l’utilisation d’outils simples et collaboratifs

    Blogs, wikis … Bibliothèques,

    photothèques partagées Réseaux sociaux Plate-formes de “widgets”

    Certains : RDF, métadonnées std

    RDF pour

  • 20/10/10 C. Morel-Pair

    RDF, syntaxe

    BNF Jean Gagnon

    Aujourd’hui : plus de 10 milliards de triplés RDF sur le Web !

  • 20/10/10 C. Morel-Pair

    RDF et Dublin Core Quelques exemples …

    Dublin Core a “sa place” pour décrire/structurer des ressources

    … parmi d’autres standards et de nouveaux éléments …

  • 20/10/10 C. Morel-Pair

    1 – métadonnées “XMP” dans un

    PDF ou une image

    “Fichier,

    Propriétés”

  • 20/10/10 C. Morel-Pair

    Document pdf et XMP

    “métadonnées supplémentaires, description

  • 20/10/10 C. Morel-Pair

    Document pdf et XMP De nombreux espaces de nom

    “propriétés, avancé”

  • 20/10/10 C. Morel-Pair

    XMP : du RDF extrait : partie Dublin Core

    […]

  • 20/10/10 C. Morel-Pair

    2 - Zotero, TP Add-on Firefox de gestion de références

    bibliographiques https://addons.mozilla.org/fr/firefox/

    Ouvrir Firefox puis Zotero Regarder cadres et boutons …

    Aller sur un site interopérable avec Zotero Revues.org un article Catalogue du Sudoc une page de résultats ou un article Article de Peccatte sur métadonnées … Flick’R …

    Si oui : icône dans la barre d’URL

    https://addons.mozilla.org/fr/firefox/http://www.revues.org/http://www.sudoc.abes.fr/http://www.sudoc.abes.fr/http://www.sudoc.abes.fr/http://peccatte.karefil.com/software/metadata.htmhttp://peccatte.karefil.com/software/metadata.htmhttp://peccatte.karefil.com/software/metadata.htmhttp://www.flickr.com/

  • 20/10/10 C. Morel-Pair

    Zotero, TP (suite) Importer les métadonnées correspondantes

    dans Zotero : Clic sur l’icône de Zotero dans la barre d’adresse

    Intégration dans une collection Zotero Enrichissement possible

    Onglets à droite Exporter des métadonnées :

    Clic droit sur une collection ou une description “Créer une bibliographie” ( texte stylé) OU

    exporter ( XML-RDF) Choix du format des éléments et de la localisation du

    fichier : DC, Zotero …

  • 20/10/10 C. Morel-Pair

    3 - Logiciel dédié recherche : myExperiment

  • 20/10/10 C. Morel-Pair

    myExperiment, architecture Gestion et annotation de contenu et work-flow + réseau social

    via une ontologie RDF / SPARQL, avec Dublin Core, FOAF et SIOC, OAI-ORE, Creative

    Commons, URI

  • 20/10/10 C. Morel-Pair

    4 - LIBRIS, catalogue collectif suédoisRDF, DC et autres …

    Source : http://blog.libris.kb.se/semweb/?p=7

    http://blog.libris.kb.se/semweb/?p=7

  • 20/10/10 C. Morel-Pair

    5 - RDFa et la “valorisation sémantique des publications”

    Travail de recherche : structurer un texte pour lui donner une sémantique machine

    Voir et naviguer http://imageweb.zoo.ox.ac.uk/pub/2008/plospaper/latest/

    Afficher la source Cet article contient des éléments sémantiques balisés, et

    utilise de nombreux espaces de nom, dont DC …

    L’article expliquant l’expérience : ... semantic enhancement of a research article ... Une tendance actuelle // XML

    http://imageweb.zoo.ox.ac.uk/pub/2008/plospaper/latest/http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1000361http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1000361http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1000361http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1000361http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1000361

  • 20/10/10 C. Morel-Pair

    6 - DC dans un moteur RDF, Sindice

  • 20/10/10 C. Morel-Pair

    VI - Un dernier effort …DCMI Abstract Model

    Modèlisation abstraite des entités Dublin Core et de leurs relations DCAM, 2007-2008

    DC devient une ontologie, vocabulaire de termes Propriétés (= éléments et raffinements) Schémas d’encodage syntaxiques et sémantiques Classes

    Avec des relations entre termes sur le modèle RDF

    Et un seul espace de noms : http://purl.org/dc/terms

  • 20/10/10 C. Morel-Pair

    DCAM, quelques précisions Ressources

    Traductions fr : http://www.yoyodesign.org/doc/dcmi/abstract-model/index.html http://www.yoyodesign.org/doc/dcmi/dcmi-terms/index.html

    Registre-outil, http://dcmi.kc.tsukuba.ac.jp/dcregistry/

    Syntaxe XML :

  • 20/10/10 C. Morel-Pair

    Dublin Core, conclusion Un jeu d’éléments généraliste

    Pour décrire tous types/formats de ressources De façon simple ou plus complète Orienté description du contenu intellectuel

    Contexte Web Norme et standard - Flexibilité et évolutivité Documentation abondante

    De plus en plus d’applications Intégré dans des protocoles d’échange de (méta)données Profils d’application spécifiques adaptés Une place dans le Web sémantique, dans le Web 2

    Des outils d’implémentation “Basiques” Développés dans le cadre d’applications

  • 20/10/10 C. Morel-Pair

    Merci de votre attention !

    Pour toute question ultérieure :

    [email protected]

    mailto:[email protected]

    Diapo 1Diapo 2Diapo 3Diapo 4Diapo 5Diapo 6Diapo 7Diapo 8Diapo 9Diapo 10Diapo 11Diapo 12Diapo 13Diapo 14Diapo 15Diapo 16Diapo 17Diapo 18Diapo 19Diapo 20Diapo 21Diapo 22Diapo 23Diapo 24Diapo 25Diapo 26Diapo 27Diapo 28Diapo 29Diapo 30Diapo 31Diapo 32Diapo 33Diapo 34Diapo 35Diapo 36Diapo 37Diapo 38Diapo 39Diapo 40Diapo 41Diapo 42Diapo 43Diapo 44Diapo 45Diapo 46Diapo 47Diapo 48Diapo 49Diapo 50Diapo 51Diapo 52Diapo 53Diapo 54Diapo 55Diapo 56Diapo 57Diapo 58Diapo 59Diapo 60Diapo 61Diapo 62Diapo 63Diapo 64Diapo 65Diapo 66Diapo 67Diapo 68Diapo 69Diapo 70Diapo 71Diapo 72Diapo 73Diapo 74