Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

121
Le document numérique Produire et décrire le document numérique : les identifiants

description

 

Transcript of Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

Page 1: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

Le document numérique

Produire et décrire le document numérique : les identifiants

Page 2: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

2 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

Page 3: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

3 Luc Bellier 2013

Le document numérique

» Les métadonnées : Les métadonnées pour la recherche : Catalogues, Moteurs Approche sémantique

Page 4: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

4 Luc Bellier 2013http://www.flickr.com/photos/ajpresto714/761178431/

Les métadonnées» Les métadonnées pour la recherche : les catalogues

Page 5: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

5 Luc Bellier 2013

Les métadonnées

» Fonctionnement binaire et linéaire : critère recherché présent : oui / non listes d’entrées d’index

» Recherches uniques, avec liste de résultat unique

» Recherche dans les « métadonnées »

» « Web invisible » / web visible

» Les métadonnées pour la recherche : les catalogues

Page 6: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

6 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche : les moteurs

Page 7: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

7 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche : les moteurs

Page 8: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

8 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche : les moteurs

Page 9: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

9 Luc Bellier 2013

Critère 1 Critère 2 Critère 3 Critère 4 Critère …

RéponseRecherche

Les métadonnées» Les métadonnées pour la recherche : les moteurs

Page 10: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

10 Luc Bellier 2013

Les métadonnées

» Si le nombre de résultats ne correspond pas au nombre de documents (pages web), à quoi correspond-il ?

» Réponse: au nombre des entrées d’index

» Les métadonnées pour la recherche : les moteurs

Page 11: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

11 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche : les moteurs

Page 12: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

12 Luc Bellier 2013

Les métadonnées

» Les documents du web et ce que peut voir un moteur de recherche :

» Mise en forme

» Texte et autres caractères internes

» Le document devient sa propre description

» Les métadonnées pour la recherche : les moteurs

Page 13: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

13 Luc Bellier 2013

Adresse

Liens générés automatiquement

Zone de texte : titre gras

Formulaire de saisie

Image

Liste à puces avec liens

Titre

Page 14: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

14 Luc Bellier 2013

» Que peut voir un moteur de recherche dans une bibliothèque numérique ?

Page 15: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

15 Luc Bellier 2013

Les métadonnées

» Recherche en texte intégral

» Recherche statistique ou associative fréquence du mot à l’intérieur du document rareté du mot dans la collection longueur du mot trouvé par rapport à la longueur du champ

» Recherche linguistique exploitation du vocabulaire et de la grammaire lemmatisation de l’index catégorisation des mots-outils extraction d’entités nommées

» Recherche sémantique : exploitation d’un modèle de connaissance ou référentiel extraction terminologique (couplée à l'analyse sémantique) détection du contexte global du document classification automatique des mots du texte expansion de requête navigation dans un thésaurus de haut niveau calcul des relations entre thèmes (lexicométrie) filtrage des thèmes en fonction de leur pertinence

» Les métadonnées pour la recherche : les moteurs

Page 16: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

16 Luc Bellier 2013

Les métadonnées

» Le principe des moteurs sémantiques

» Intégration de chaque mot significatif dans une chaîne d’équivalents sémantiques Par exemple, une recherche sur le mot « élection » retrouvera les documents

contenant les mots « voix », « urne » et « vote », même si le mot « élection » ne se trouve pas explicitement dans le texte.

» Cartographie et extraction de connaissances Proposition d’une liste de critères pertinents qui ont émergé des documents, ce

qui évite d’avoir à affiner la recherche par une « chaîne de caractères » Recherche par similarité avec un texte existant (qui sera analysé et dont tous

les mots significatifs seront utilisés comme critères de recherche).

» Désambiguisation des requêtes / Multilinguisme Par exemple : avocat (juriste) / avocat (plante) Par exemple : pain (fr : aliment) / pain (en : douleur)

» Les métadonnées pour la recherche : approche sémantique

Page 17: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

17 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche

Page 18: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

18 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche

Page 19: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

19 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche

Page 20: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

20 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche

Page 21: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

21 Luc Bellier 2013

Modèle de l’arbre

Notice : Les Misérables

Titre

Auteur : Victor Hugo

Ressource (doc. numérisé)

Catalogue

Notice : Victor Hugo

dates

bio

Notice : portrait de V. Hugo

titre

auteur

Sujet : Victor Hugo

Lien explicite

Lien implicite

Ressource (doc. numérisé)

Corpus : littérature française

Les métadonnées» Les métadonnées pour la recherche : approche sémantique

Page 22: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

22 Luc Bellier 2013

Les métadonnées

» Utiliser des identifiants accessibles via les protocoles du web (http)

» Donner l’accès aux données utiles en utilisant les standards SPARQL et RDF

BUT : Lier et interroger des données dispersées sur le Web avec les technologies du Web sémantique

Principes du LOD par Tim Berners-Lee

» Les métadonnées pour la recherche : approche sémantique

Page 23: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

23 Luc Bellier 2013http://wimmics.inria.fr/projects/dbpedia/doc/index.php/Documentation#Processus_d.27extraction_des_donn.C3.A9es_de_Wikip.C3.A9dia

Les métadonnées » Les métadonnées pour la recherche : approche sémantique

Page 24: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

24 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

Page 25: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

25 Luc Bellier 2013

Les métadonnées

» Les métadonnées comme point d’accès : Accès centralisés Accès distribués

Page 26: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

26 Luc Bellier 2013

» L’accès centralisé : exemple de la presse sur Gallica

La presse dans Gallica :

» à raison d’un n° par jour

» pendant 50 ans ou plus

» une liste de plusieurs dizaines de milliers de n° disponibles !!!

Les métadonnées comme point d’accès

Page 27: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

27 Luc Bellier 2013

Les métadonnées comme point d’accès» L’accès centralisé : exemple de la presse sur Gallica

Page 28: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

28 Luc Bellier 2013

Les métadonnées comme point d’accès» L’accès centralisé : exemple de la presse sur Gallica

Page 29: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

29 Luc Bellier 2013

Les métadonnées comme point d’accès» L’accès centralisé : Open content Alliance

Page 30: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

30 Luc Bellier 2013

L’accès centralisé : Hati Trust

Les métadonnées comme point d’accès

Page 31: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

31 Luc Bellier 2013

Les métadonnées comme point d’accès

L’accès centralisé : google Books Search

Page 32: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

32 Luc Bellier 2013

L’accès distribué : les systèmes fermés

Les métadonnées comme point d’accès

» EBSCO

» PROQUEST

» JSTOR

» CAIRN

» Etc.

Page 33: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

33 Luc Bellier 2013

Les métadonnées comme point d’accèsL’accès distribué : OAI Europeana

Page 34: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

34 Luc Bellier 2013

Les métadonnées comme point d’accèsL’accès distribué : l’OAI de Gallica

Page 35: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

35 Luc Bellier 2013

Les métadonnées comme point d’accèsL’accès distribué : l’OAI de Gallica

Page 36: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

36 Luc Bellier 2013

EntrepôtB

Programme moissonneur

Requête utilisateur

EntrepôtA

OAI-PMH

Résultats

Base A

Base B Index

http

http

xml

xml

EntrepôtCBase C

xml

http

www serveur

Protocole d’échanges de données

Les métadonnées comme point d’accès» Les accès distribués

Page 37: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

37 Luc Bellier 2013

Interopérabilité des données (OAI-PMH, Entrepôts OAI) Initiative OAI : Open Archive Initiative (1999)

Objectif : améliorer le signalement des e-prints, des publications scientifiques et l’interopérabilité des bases d’archives ouvertes

Moyen : création d’un protocole technique de diffusion et de collecte de métadonnées

OAI-PMH : Protocol for Metadata Harvesting Intérêt dans le domaine culturel et patrimonial

Collections partagées dans des architectures réparties

Interrogation centraliséeFournisseurs de données

Fournisseurs de services

Les métadonnées comme point d’accèsL’accès distribué : l’OAI

Page 38: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

38 Luc Bellier 2013

BIUM3970 notices

Bibliothèques virtuelles humanistes

186 notices

363 notices

Library of Congress

serveur OAI

serveur OAI

serveur OAI

Consultation de ces documents sur les autres sites

site BIUM

site LOC

site BVH

Base de données

serveur OAI

CNUM91 notices

site CNUM

Universités de Strasbourg

serveur OAI

435 notices

site SICD Strasbourg

Syndicat national de l’édition

5546 notices

Editeurs

serveur OAI

serveur OAI

Les métadonnées comme point d’accèsL’accès distribué : l’OAI

Page 39: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

39 Luc Bellier 2013

» Initiative OAI : Open Archive Initiative (1999) Objectif : améliorer le signalement des e-prints, des publications scientifiques et

l’interopérabilité des bases d’archives ouvertes Moyen : création d’un protocole technique de diffusion et de collecte de

métadonnées

» OAI-PMH : Protocol for Metadata Harvesting (Protocole de l’OAI pour le « moissonnage » des métadonnées) Convention de Santa Fe, 1999 Version 2, juin 2002

» Intérêt dans le domaine culturel et patrimonial

Les métadonnées comme point d’accès» Les accès distribués

Page 40: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

40 Luc Bellier 2013

Un protocole simple et ouvert qui

» favorise l’interopérabilité et le signalement complémentaire des ressources culturelles sans duplication ni déchargement des documents numériques primaires

» accroît la visibilité sur le web de l’offre documentaire en abattant certaines barrières du web invisible en rendant possible le signalement de ressources non accessibles aux moteurs

de recherche

Le protocole OAI-PMH

Les métadonnées comme point d’accès» Les accès distribués

Page 41: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

41 Luc Bellier 2013

Un protocole simple et ouvert qui

» permet une gestion simple et automatisable des mises à jour par le fournisseur de service mécanisme asynchrone prévoit l’actualisation des liens, en répercutant les dernières modifications des

réservoirs sources, sans copier à nouveau l’intégralité des données (la charge n’en étant que plus légère pour les serveurs)

» s’appuie sur un format de description générique (Dublin Core simple) pour les besoins transdisciplinaires Dublin Core simple : format obligatoire sans interdire des formats adaptés à des besoins plus spécialisés

» échange les métadonnées, pas les objets

Le protocole OAI-PMH

Les métadonnées comme point d’accès» Les accès distribués

Page 42: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

42 Luc Bellier 2013

Les métadonnées comme point d’accès» Les accès distribués

Le protocole OPDS

Page 43: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

43 Luc Bellier 2013

Les métadonnées comme point d’accès

« Créer un écosystème basé sur des standards ouverts, permettant à n'importe qui de constituer une collection, de naviguer dans celle-ci et d'acquérir des ressources associées, depuis n'importe quelle source, et dans n'importe quel environnement »

Hadrien Gardeur FeedBooks http://opds-spec.org/

» Format adapté aux catalogues de libraires en ligne

» Permet de gérer une collection publique et/ou privée, de gérer l’accès à la ressource en ligne quelque soit l’utilisateur du catalogue.

» Permet d’assurer une médiation vers la ressource aisée pour l’utilisateur, dans le respect des conditions voulues par le créateur.

» Les accès distribués

Le protocole OPDS

Page 44: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

44 Luc Bellier 2013

L’accès distribué: les fils rss

Les métadonnées comme point d’accès

Page 45: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

45 Luc Bellier 2013

L’accès distribué: les fils rss

Les métadonnées comme point d’accès

Page 46: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

46 Luc Bellier 2013

L’accès distribué: les fils rss

Les métadonnées comme point d’accès

Page 47: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

47 Luc Bellier 2013

L’accès distribué: les fils rss

Les métadonnées comme point d’accès

Page 48: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

48 Luc Bellier 2013

L’accès distribué: les fils rss

Les métadonnées comme point d’accès

Page 49: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

49 Luc Bellier 2013

L’accès distribué: les fils rss

Les métadonnées comme point d’accès

Notice : Les Misérables

Titre

Auteur : Victor Hugo

Ressource (doc. numérisé)

Corpus : littérature française

Page 50: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

50 Luc Bellier 2013

Les métadonnées comme point d’accès

» Modèle marchand fermé (EBSCO, CAIRN, PROQUEST) contre un modèle ouvert non marchand (wikipedia, Internet Archive, Archives ouvertes) En témoigne les récents débats sur les activités de l’INIST, les accords de la

BnF avec Proquest

» Modèle distribué (EBSCO, OAI-PMH) contre modèle centralisé (Google Books, Hathi Trust)

» Stratégie collective organisant l’offre et la demande (Couperin, Carel, Open Archive) contre politique centralisée organisant la stabilité des acteurs de l’offre (financements CNRS ou CNL)

» Concentration de l’offre et de la demande : Concentration dans l’édition scientifique depuis 20 ans, l’édition litt. Générale

depuis 10 autour des enjeux numériques (plateformes Hachette, Editis, Gallimard-Flammarion-Le Seuil)

Concentration de la demande : licence nationale négociée par Agence ou Consortiums (CAREL, Couperin)

Concentration de la chaine de la valeur (verrou logiciel, intégration verticale des acteurs nationaux Fnac-Kobo, internationaux – Apple, Amazon)

Les accès : théâtre des tensions de l’édition scientifique

Page 51: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

51 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

Page 52: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

52 Luc Bellier 2013

Les métadonnées comme point d’accès

» Interopérabilité sémantique

Page 53: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

53 Luc Bellier 2013

Les métadonnées comme point d’accès

Interopérabilité sémantique

Page 54: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

54 Luc Bellier 2013

Les métadonnées comme point d’accès

Interopérabilité sémantique

Page 55: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

55 Luc Bellier 2013

Les métadonnées comme point d’accès

Interopérabilité sémantique

Page 56: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

56 Luc Bellier 2013

Bibliosurf – carte des romans policiers

Les métadonnées comme point d’accès

Interopérabilité sémantique

Page 57: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

57 Luc Bellier 2013

Les métadonnées comme point d’accès

Interopérabilité sémantique

Page 58: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

58 Luc Bellier 2013

Les métadonnées comme point d’accès

» « Web sémantique » ou « web de données », plutôt que web de documents

» RDF (Resource Description Framework) Cadre de description d’une ressource

• Modélisation générale : vide de forme, vide de contenu• Triplets : ressource (sujet), prédicat (relation), valeur (description)

» SKOS (Simple Knowledge Organisation System) Système simple d’organisation des connaissances SKOS permet d’organiser les rapports entre concepts

» SPARQL (Sparql Protocol and Query Language) Protocole Sparql et langage d’interrogation SPARQL est le pour interroger des données stockées en RDF

Interopérabilité sémantique

Page 59: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

59 Luc Bellier 2013

Les métadonnées comme point d’accès

Interopérabilité sémantique

Page 60: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

60 Luc Bellier 2013

Les métadonnées comme point d’accès

Interopérabilité sémantique

Page 61: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

61 Luc Bellier 2013

Les métadonnées comme point d’accès

Une convergence inachevée : Les bibliothèques, les mondes marchand et les acteurs de référence

Pour aller plus loin :

la nouvelle classification de la CLIL : http://www.clil.org/information/detailDoc.html?docId=34

Un rapprochement entre les bibliothèques et l’édition :http://www.bnf.fr/fr/professionnels/autres_journees_professionnelles/a.journee_afnor_2012.html

Interopérabilité sémantique

Page 62: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

62 Luc Bellier 2013

Les métadonnées comme point d’accès

» Les nouvelles indexations

Page 63: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

63 Luc Bellier 2013

» Définition un processus de classification collaborative par des mots-clés librement choisis le résultat de cette classification

» Inconvénients vocabulaire non normalisé :

• problèmes de polysémie, synonymie• lemmatisation,orthographe

vocabulaire non structuré, sans hiérarchie ni relation sémantique vocabulaire hétérogène

• mêlant le très spécifique (éventuellement à haut niveau d’expertise) et le très superficiel

• pouvant être trop simple, trop peu d’expertise• utilisant implicitement des univers de références

vocabulaire personnel (à lire, lu, à acheter, à la bibliothèque sur LibraryThing, moi sur Flickr)

confusion entre pertinence et popularité

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

Page 64: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

64 Luc Bellier 2013

» Avantages : indexation simple, gratuite et rapide indexation cumulative couverture documentaire totale

• sans exclusion des œuvres de fiction• sans exclusion de types de documents• incluant la description du contenu, et non seulement la classification sujet

(roman policier / peste) largement auto-régulée conforme aux usages du web

• dans les fonctions de recherche• par les aspects égotiques et ludiques

- simultanéité de la consultation et de l’indexation- absence de contrainte- intervention personnelle : approche subjective, permettant l’indexation

orientée utilisateur / tâche- défiance par rapport aux experts et à leur langage compliqué

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

Page 65: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

65 Luc Bellier 2013

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

Page 66: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

66 Luc Bellier 2013

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

Page 67: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

67 Luc Bellier 2013

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

Page 68: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

68 Luc Bellier 2013

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

Page 69: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

69 Luc Bellier 2013

» Une question en suspens Quelle perception par les utilisateurs ?

• Différence entre un catalogue de bibliothèque et les autres sites web• Calcul de la « pertinence » non remis en question

- Supériorité des algorithmes de classement dans la relation avec les utilisateurs

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

Page 70: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

70 Luc Bellier 2013

Les métadonnées comme point d’accès

Multiplier les points d’accès

Page 71: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

71 Luc Bellier 2013

Les métadonnées comme point d’accès

Multiplier les points d’accès

Page 72: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

72 Luc Bellier 2013

En allégeant les développements

Les métadonnées comme point d’accès

Multiplier les points d’accès

Page 73: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

73 Luc Bellier 2013

Les métadonnées comme point d’accès

» Le document numérique est sur la toile Le lecteur n’a plus besoin d’aller à la

bibliothèque pour lire son livre… Et pas non plus sur le site de la

bibliothèque numérique, ou chez un libraire

Page 74: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

74 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

Page 75: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

75 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Librairies en ligne, enjeux des dispositifs et des formats, longue traine et économie de l’attention

Page 76: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

76 Luc Bellier 2013

Les enjeux des accès et de la médiation

Page 77: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

77 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Maitrise de la chaine et des formats

Page 78: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

78 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Maitrise de la chaine et des formats

Exemple : ePub Fnac non lisible sur une autre tablette que la Kobo

Page 79: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

79 Luc Bellier 2013

Les enjeux des accès et de la médiation

http://www.bnf.fr/fr/professionnels/autres_journees_professionnelles/a.journee_afnor_2012.html

» Maitrise de la chaine et des formats

Page 80: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

81 Luc Bellier 2013

Les enjeux des accès et de la médiation

Rédaction Edition FabricationVente numérique

Manuscrit

Illustration

Iconographie

RelectureCorrections

NumérisationChargement

Préparation du pivot XML

Liens avec les documents externes

Ajouts des métadonnées

Archivage

Versions numériques

Import xml pivot

Transformation xml selon maquete

Exports des xml modifiés

Versions imprimées

Import xml pivot

Transformation xml selon plateforme

Exports des xml modifiés

BAT

BAT

Mise à disposition des intermédiaires

Modifications des

métadonnées selon

plateformes

Chargement sur les plateformes

et validation

» Maitrise de la chaine et des formats

Page 81: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

82 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Le Format Apple Ibooks En avance technologique sur le marché Lecture sur Tablette et Smartphone Intègre des éléments multimédia Fonctionnalités du reader avancées

» Le format Amazon KindleVersion Mobi 7 est un Epub version 1 Destiné à une liseuse à Encre électronique Version KF8 s’approche de l’Epub 3 Destiné à une tablette

» Le format ADELisible sur le reader de Adobe

» SDK (DevKit) repris par de nombreux readers : tablettes et liseuses

» Maitrise de la chaine et des formats

Page 82: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

83 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Maitrise de la chaine s’oppose au développement du marché : Le lecteur veut un livre qui se lit n’importe où et s’achète n’importe où Le marché propose des livres selon le terminal de lecture Le lecteur veut lire et relire sur tous ses terminaux Le marché n’autorise qu’un terminal ou seuls les terminaux autorisés par le

revendeur Je veux lire mes livres même si je change de terminal Le marché ne m’autorise pas à changer de terminal sans renoncer à mes livres

» Maitrise de la chaine et des formats

Page 83: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

84 Luc Bellier 2013

Les enjeux des accès et de la médiation

» La maitrise des conditions de lecture et donc de mise en valeur du texte passe par : La maitrise des formats et de leurs possibilités (sous-traitant des éditeurs) La maitrise des dispositifs et appareils (fabricants) ainsi que les modalités d’exploitation des fichiers

(éditeurs de logiciel) Au moment de l’édition du document et à tout moment après (obsolescence des formats,

incompatibilité ascendante) La maitrise des conditions de mise en vente ou d’accès sur la plate-forme (mise en avant, conditions

tarifaires, accompagnement etc.)

» Cette maitrise n’est jamais totalement partagée : la médiation et la maitrise technique de la totalité de la chaine sont donc imparfaites, avec un fort avantage aux grandes plateforme Apple et Amazon. Par le financement de la création de contenus adaptés à leur format et sur les segments définis par

eux. Par la validation préalable des contenus proposés avant la mise en vente :

• Un manuel scolaire gratuit et sous licence CC retiré par Apple : http://www.ralentirtravaux.com/le_blog/?p=1843

• Changement des conditions juridiques aboutissant au retrait d’ouvrages y compris quand ils ont été vendus : http://www.ebouquin.fr/2009/07/20/amazon-fait-disparaitre-des-livres-de-orwell-sur-le-kindle/

» Maitrise de la chaine et des formats

Page 84: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

85 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

Page 85: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

86 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Maitrise de la chaine et des formats

Page 86: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

87 Luc Bellier 2013

» De nouvelles conditions définissent de nouvelles règles et de nouvelles façons de travailler : la longue traine notion apparue en 2004, sous la plume de Chris Anderson pour décrire le

modèle économique de sociétés comme Amazon. La masse critique permise par un marché ouvert et par l’absence de magasin

physique grâce au web permet d’élargir le catalogue des produits à vendre

» L’économie de l’attention : dans le cadre d’une concurrence entre les médias, la bataille se livre sur « le temps de cerveau disponible ». La concurrence n’est donc pas uniquement au sein du monde marchand, mais entre l’ensemble des espaces qui proposent des ressources

http://fr.wikipedia.org/wiki/%C3%89conomie_de_l%27attention http://fr.slideshare.net/phcouve/lconomie-de-lattention-presentation

Les enjeux des accès et de la médiation

» Longue traine et économie de l’attention

http://fr.wikipedia.org/wiki/Longue_tra%C3%AEnehttp://www.bibliobsession.net/2011/04/27/quels-criteres-pour-utiliser-la-longue-traine-2/

Page 87: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

88 Luc Bellier 2013

Les enjeux des accès et de la médiationWeb media révolutionne le modèle économique

Temps discontinu

Temps continu

rareté abondance

édition

Tv radios Satellite

Seuil indicatif de rentabilité

Zone de hypothétique de

partage entre paiement par les annonceurs et les

particuliers

Tv radios TNT

Presse

revuescinéma

Page 88: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

89 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

Page 89: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

90 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Appréhender la collection numérique : le cas des bibliothèques

Page 90: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

91 Luc Bellier 2013

Les enjeux des accès et de la médiation

CollecterProduire

IdentifierSélectionner

StockerPréserver Transformer

Gérer

Bibliothèque numérique

en ligne

CommuniquerDiffuser

Données / Métadonnées

» Appréhender la collection numérique

Page 91: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

92 Luc Bellier 2013

Les enjeux des accès et de la médiation

Données / Métadonnées

Catalogue

Serveurs d’archives

Serveurs de consultation

Catalogue public (OAI)

BdD de gestion

» Appréhender la collection numérique

Page 92: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

93 Luc Bellier 2013

Les enjeux des accès et de la médiation

Reliés

Films

?Numérique natif

La collection numérique

Les collections

» Appréhender la collection numérique

Page 93: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

94 Luc Bellier 2013

Les enjeux des accès et de la médiation

Données / Métadonnées

Catalogue

Serveurs d’archives

Serveurs de consultation

Catalogues ouverts (OAI)

BdD de gestion

Accès

Centre de ressources partenairesCentre de ressources (Bibliothèques centre de documentation)

Numérique natif

Entrepôt (OAI)

» Appréhender la collection numérique

Page 94: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

95 Luc Bellier 2013

Les enjeux des accès et de la médiation

Données / Métadonnées

Catalogue

Serveurs d’archives

Serveurs de consultation

Catalogues ouverts (OAI)

BdD de gestion

Accès par abonnement Prestataire, Éditeur, agrégateurCentre de ressources

(Bibliothèques centre de documentation)

Numérique natif

» Appréhender la collection numérique

Page 96: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

97 Luc Bellier 2013

Les enjeux des accès et de la médiation

LOC

» Appréhender la collection numérique

Page 97: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

98 Luc Bellier 2013

Les enjeux des accès et de la médiation

» La dispersion documentaire des collections numériques est aussi une dispersion ou un partage des tâches, des compétences et des responsabilités.

» Elle soulève la question de l’investissement des professionnels de l’information dans les questions informatiques et/ou des professionnels de l’informatiques dans le domaine documentaire.

» Ce rapprochement ne peut s’opérer sans une formation des professionnels de l’information aux technologies de plus en plus pointue de l’informatique documentaire, dont le champs dépasse celui du catalogue : Archivage et conservation Accès Formats de structuration des documents numériques.

» Appréhender la collection numérique

Page 98: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

99 Luc Bellier 2013

Outil de stockageOutil de diffusion

Dispositif de lecture,Outil d’accès

Division technique de la lecture

=> + =>

+

+

http://www.

+

Dispositif de lecture,Outil de stockageOutil de diffusion, Outil d’accès

Outil de stockage

Outil d’accèsOutil de stockageOutil de diffusion

Outil de diffusionOutil d’accès

Outil d’accèsOutil de stockageDispositif de lecture

lu/vu/su

su

lu/vulu/vu

lu

vu/su

Page 99: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

100 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

Page 100: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

101 Luc Bellier 2013

Les enjeux des accès et de la médiation

» La médiation autour des documents numériques

Page 101: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

102 Luc Bellier 2013

Intégration dans un environnement personnel

» Un nouveau cadre de signalement Rejoindre l’utilisateur dans son lieu de travail / de consultation

(la bibliothèque hors les murs et le prêt entre bibliothèques) Offrir de nouveaux services de veille

(étagère des nouvelles acquisitions, lettre d’information, expositions temporaires)

Faciliter la consultation des documents

Page 102: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

103 Luc Bellier 2013

» S’adresser à l’utilisateur et l’Informer des nouveautés, lui permettre de faire ce qu’il n’appelle pas la « veille documentaire »

lettres d’information

Fils RSS : actualité de la bibliothèque uniquement (Cervantes virtual)

Fils RSS sur les contenus • paramétrage générique (BU Laval, BU Illinois, Jubil, SCD Lyon 3, WNCLN,

Project Gutenberg)• paramétrage par l’utilisateur

- lors de la recherche (Saphir, enssib, National Libr. of Ireland)- après authentification (WNCLN)

• paramétrage par type de document : si ressources audio numérisées, prévoir l’abonnement au podcast (Collège de France, Kankakee Public Library Podcast)

• dans bibliothèque numérique ou sur le portail de l’institution

Intégration dans un environnement personnel

Page 103: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

104 Luc Bellier 2013

Intégration dans un environnement personnel

Page 104: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

105

Intégration dans un environnement personnel

Page 105: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

106 Luc Bellier 2013

Intégration dans un environnement personnel

Page 106: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

107 Luc Bellier 2013

Page 107: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

108 Luc Bellier 2013

Page 108: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

De nouveaux outils de signalement

»les protocoles d’échanges de métadonnées

»Multiplier les documents numériques

»La médiation numérique

Page 109: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

110

Auteur : David Liziard

Les médiations numériques

Page 110: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

111 Luc Bellier 2013

» Ajouter une interface de publication flexible ? Intégrer la bibliothèque numérique à la bibliothèque ou à l’institution ? comment ? Qui l’alimente et à quel rythme ? En quel nom ?

» Blog La solution du blog est-elle la meilleure ? Un blog séparé avec seulement un fil RSS

inclus dans le portail de la bibliothèque numérique ?

Le blog permet d’autres relations avec l’usager qui sortent du cadre de la veille : • Proximité de ton• Publier des critiques d’ouvrages (prescription)• Faire participer la communauté (commentaires)• Rendre la bibliothèque plus transparente & expliquer le fonctionnement, le jargon,

le backoffice de la bibliothèque numérique, les évolutions des fonctionnalités, les dysfonctionnements, les perspectives

Rendre compte des animations

Le blog permet éventuellement de favoriser un travail de médiation léger et collaboratif

La communauté d’une bibliothèque

Page 111: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

112 Luc Bellier 2013

La communauté d’une bibliothèque

Page 112: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

113 Luc Bellier 2013

Les contenus libres ou librement accessibles et les nouvelles formes de la médiation

Page 113: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

114 Luc Bellier 2013

Page 114: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

115 Luc Bellier 2013

Page 115: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

De nouveaux outils de signalement

»les protocoles d’échanges de métadonnées

»Multiplier les documents numériques

»La médiation numérique… la recommandation par les lecteurs…

Page 116: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

117 Luc Bellier 2013

Un nouveau signalement : la recommandation

» Explicite / Implicite

» Par service dédié extérieur à la bibliothèque numérique / à l’intérieur de la bibliothèque

Page 117: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

118 Luc Bellier 2013

Un nouveau signalement : la recommandation

Page 118: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

119

Un nouveau signalement : la recommandation

Page 119: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

120 Luc Bellier 2013

Un nouveau signalement : la recommandation

Page 121: Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

122 Luc Bellier 2013

Un nouveau signalement : la recommandation