Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

Post on 13-Nov-2014

2.035 views 0 download

Tags:

description

 

Transcript of Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

Le document numérique

Produire et décrire le document numérique : les identifiants

2 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

3 Luc Bellier 2013

Le document numérique

» Les métadonnées : Les métadonnées pour la recherche : Catalogues, Moteurs Approche sémantique

4 Luc Bellier 2013http://www.flickr.com/photos/ajpresto714/761178431/

Les métadonnées» Les métadonnées pour la recherche : les catalogues

5 Luc Bellier 2013

Les métadonnées

» Fonctionnement binaire et linéaire : critère recherché présent : oui / non listes d’entrées d’index

» Recherches uniques, avec liste de résultat unique

» Recherche dans les « métadonnées »

» « Web invisible » / web visible

» Les métadonnées pour la recherche : les catalogues

6 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche : les moteurs

7 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche : les moteurs

8 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche : les moteurs

9 Luc Bellier 2013

Critère 1 Critère 2 Critère 3 Critère 4 Critère …

RéponseRecherche

Les métadonnées» Les métadonnées pour la recherche : les moteurs

10 Luc Bellier 2013

Les métadonnées

» Si le nombre de résultats ne correspond pas au nombre de documents (pages web), à quoi correspond-il ?

» Réponse: au nombre des entrées d’index

» Les métadonnées pour la recherche : les moteurs

11 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche : les moteurs

12 Luc Bellier 2013

Les métadonnées

» Les documents du web et ce que peut voir un moteur de recherche :

» Mise en forme

» Texte et autres caractères internes

» Le document devient sa propre description

» Les métadonnées pour la recherche : les moteurs

13 Luc Bellier 2013

Adresse

Liens générés automatiquement

Zone de texte : titre gras

Formulaire de saisie

Image

Liste à puces avec liens

Titre

14 Luc Bellier 2013

» Que peut voir un moteur de recherche dans une bibliothèque numérique ?

15 Luc Bellier 2013

Les métadonnées

» Recherche en texte intégral

» Recherche statistique ou associative fréquence du mot à l’intérieur du document rareté du mot dans la collection longueur du mot trouvé par rapport à la longueur du champ

» Recherche linguistique exploitation du vocabulaire et de la grammaire lemmatisation de l’index catégorisation des mots-outils extraction d’entités nommées

» Recherche sémantique : exploitation d’un modèle de connaissance ou référentiel extraction terminologique (couplée à l'analyse sémantique) détection du contexte global du document classification automatique des mots du texte expansion de requête navigation dans un thésaurus de haut niveau calcul des relations entre thèmes (lexicométrie) filtrage des thèmes en fonction de leur pertinence

» Les métadonnées pour la recherche : les moteurs

16 Luc Bellier 2013

Les métadonnées

» Le principe des moteurs sémantiques

» Intégration de chaque mot significatif dans une chaîne d’équivalents sémantiques Par exemple, une recherche sur le mot « élection » retrouvera les documents

contenant les mots « voix », « urne » et « vote », même si le mot « élection » ne se trouve pas explicitement dans le texte.

» Cartographie et extraction de connaissances Proposition d’une liste de critères pertinents qui ont émergé des documents, ce

qui évite d’avoir à affiner la recherche par une « chaîne de caractères » Recherche par similarité avec un texte existant (qui sera analysé et dont tous

les mots significatifs seront utilisés comme critères de recherche).

» Désambiguisation des requêtes / Multilinguisme Par exemple : avocat (juriste) / avocat (plante) Par exemple : pain (fr : aliment) / pain (en : douleur)

» Les métadonnées pour la recherche : approche sémantique

17 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche

18 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche

19 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche

20 Luc Bellier 2013

Les métadonnées» Les métadonnées pour la recherche

21 Luc Bellier 2013

Modèle de l’arbre

Notice : Les Misérables

Titre

Auteur : Victor Hugo

Ressource (doc. numérisé)

Catalogue

Notice : Victor Hugo

dates

bio

Notice : portrait de V. Hugo

titre

auteur

Sujet : Victor Hugo

Lien explicite

Lien implicite

Ressource (doc. numérisé)

Corpus : littérature française

Les métadonnées» Les métadonnées pour la recherche : approche sémantique

22 Luc Bellier 2013

Les métadonnées

» Utiliser des identifiants accessibles via les protocoles du web (http)

» Donner l’accès aux données utiles en utilisant les standards SPARQL et RDF

BUT : Lier et interroger des données dispersées sur le Web avec les technologies du Web sémantique

Principes du LOD par Tim Berners-Lee

» Les métadonnées pour la recherche : approche sémantique

23 Luc Bellier 2013http://wimmics.inria.fr/projects/dbpedia/doc/index.php/Documentation#Processus_d.27extraction_des_donn.C3.A9es_de_Wikip.C3.A9dia

Les métadonnées » Les métadonnées pour la recherche : approche sémantique

24 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

25 Luc Bellier 2013

Les métadonnées

» Les métadonnées comme point d’accès : Accès centralisés Accès distribués

26 Luc Bellier 2013

» L’accès centralisé : exemple de la presse sur Gallica

La presse dans Gallica :

» à raison d’un n° par jour

» pendant 50 ans ou plus

» une liste de plusieurs dizaines de milliers de n° disponibles !!!

Les métadonnées comme point d’accès

27 Luc Bellier 2013

Les métadonnées comme point d’accès» L’accès centralisé : exemple de la presse sur Gallica

28 Luc Bellier 2013

Les métadonnées comme point d’accès» L’accès centralisé : exemple de la presse sur Gallica

29 Luc Bellier 2013

Les métadonnées comme point d’accès» L’accès centralisé : Open content Alliance

30 Luc Bellier 2013

L’accès centralisé : Hati Trust

Les métadonnées comme point d’accès

31 Luc Bellier 2013

Les métadonnées comme point d’accès

L’accès centralisé : google Books Search

32 Luc Bellier 2013

L’accès distribué : les systèmes fermés

Les métadonnées comme point d’accès

» EBSCO

» PROQUEST

» JSTOR

» CAIRN

» Etc.

33 Luc Bellier 2013

Les métadonnées comme point d’accèsL’accès distribué : OAI Europeana

34 Luc Bellier 2013

Les métadonnées comme point d’accèsL’accès distribué : l’OAI de Gallica

35 Luc Bellier 2013

Les métadonnées comme point d’accèsL’accès distribué : l’OAI de Gallica

36 Luc Bellier 2013

EntrepôtB

Programme moissonneur

Requête utilisateur

EntrepôtA

OAI-PMH

Résultats

Base A

Base B Index

http

http

xml

xml

EntrepôtCBase C

xml

http

www serveur

Protocole d’échanges de données

Les métadonnées comme point d’accès» Les accès distribués

37 Luc Bellier 2013

Interopérabilité des données (OAI-PMH, Entrepôts OAI) Initiative OAI : Open Archive Initiative (1999)

Objectif : améliorer le signalement des e-prints, des publications scientifiques et l’interopérabilité des bases d’archives ouvertes

Moyen : création d’un protocole technique de diffusion et de collecte de métadonnées

OAI-PMH : Protocol for Metadata Harvesting Intérêt dans le domaine culturel et patrimonial

Collections partagées dans des architectures réparties

Interrogation centraliséeFournisseurs de données

Fournisseurs de services

Les métadonnées comme point d’accèsL’accès distribué : l’OAI

38 Luc Bellier 2013

BIUM3970 notices

Bibliothèques virtuelles humanistes

186 notices

363 notices

Library of Congress

serveur OAI

serveur OAI

serveur OAI

Consultation de ces documents sur les autres sites

site BIUM

site LOC

site BVH

Base de données

serveur OAI

CNUM91 notices

site CNUM

Universités de Strasbourg

serveur OAI

435 notices

site SICD Strasbourg

Syndicat national de l’édition

5546 notices

Editeurs

serveur OAI

serveur OAI

Les métadonnées comme point d’accèsL’accès distribué : l’OAI

39 Luc Bellier 2013

» Initiative OAI : Open Archive Initiative (1999) Objectif : améliorer le signalement des e-prints, des publications scientifiques et

l’interopérabilité des bases d’archives ouvertes Moyen : création d’un protocole technique de diffusion et de collecte de

métadonnées

» OAI-PMH : Protocol for Metadata Harvesting (Protocole de l’OAI pour le « moissonnage » des métadonnées) Convention de Santa Fe, 1999 Version 2, juin 2002

» Intérêt dans le domaine culturel et patrimonial

Les métadonnées comme point d’accès» Les accès distribués

40 Luc Bellier 2013

Un protocole simple et ouvert qui

» favorise l’interopérabilité et le signalement complémentaire des ressources culturelles sans duplication ni déchargement des documents numériques primaires

» accroît la visibilité sur le web de l’offre documentaire en abattant certaines barrières du web invisible en rendant possible le signalement de ressources non accessibles aux moteurs

de recherche

Le protocole OAI-PMH

Les métadonnées comme point d’accès» Les accès distribués

41 Luc Bellier 2013

Un protocole simple et ouvert qui

» permet une gestion simple et automatisable des mises à jour par le fournisseur de service mécanisme asynchrone prévoit l’actualisation des liens, en répercutant les dernières modifications des

réservoirs sources, sans copier à nouveau l’intégralité des données (la charge n’en étant que plus légère pour les serveurs)

» s’appuie sur un format de description générique (Dublin Core simple) pour les besoins transdisciplinaires Dublin Core simple : format obligatoire sans interdire des formats adaptés à des besoins plus spécialisés

» échange les métadonnées, pas les objets

Le protocole OAI-PMH

Les métadonnées comme point d’accès» Les accès distribués

42 Luc Bellier 2013

Les métadonnées comme point d’accès» Les accès distribués

Le protocole OPDS

43 Luc Bellier 2013

Les métadonnées comme point d’accès

« Créer un écosystème basé sur des standards ouverts, permettant à n'importe qui de constituer une collection, de naviguer dans celle-ci et d'acquérir des ressources associées, depuis n'importe quelle source, et dans n'importe quel environnement »

Hadrien Gardeur FeedBooks http://opds-spec.org/

» Format adapté aux catalogues de libraires en ligne

» Permet de gérer une collection publique et/ou privée, de gérer l’accès à la ressource en ligne quelque soit l’utilisateur du catalogue.

» Permet d’assurer une médiation vers la ressource aisée pour l’utilisateur, dans le respect des conditions voulues par le créateur.

» Les accès distribués

Le protocole OPDS

44 Luc Bellier 2013

L’accès distribué: les fils rss

Les métadonnées comme point d’accès

45 Luc Bellier 2013

L’accès distribué: les fils rss

Les métadonnées comme point d’accès

46 Luc Bellier 2013

L’accès distribué: les fils rss

Les métadonnées comme point d’accès

47 Luc Bellier 2013

L’accès distribué: les fils rss

Les métadonnées comme point d’accès

48 Luc Bellier 2013

L’accès distribué: les fils rss

Les métadonnées comme point d’accès

49 Luc Bellier 2013

L’accès distribué: les fils rss

Les métadonnées comme point d’accès

Notice : Les Misérables

Titre

Auteur : Victor Hugo

Ressource (doc. numérisé)

Corpus : littérature française

50 Luc Bellier 2013

Les métadonnées comme point d’accès

» Modèle marchand fermé (EBSCO, CAIRN, PROQUEST) contre un modèle ouvert non marchand (wikipedia, Internet Archive, Archives ouvertes) En témoigne les récents débats sur les activités de l’INIST, les accords de la

BnF avec Proquest

» Modèle distribué (EBSCO, OAI-PMH) contre modèle centralisé (Google Books, Hathi Trust)

» Stratégie collective organisant l’offre et la demande (Couperin, Carel, Open Archive) contre politique centralisée organisant la stabilité des acteurs de l’offre (financements CNRS ou CNL)

» Concentration de l’offre et de la demande : Concentration dans l’édition scientifique depuis 20 ans, l’édition litt. Générale

depuis 10 autour des enjeux numériques (plateformes Hachette, Editis, Gallimard-Flammarion-Le Seuil)

Concentration de la demande : licence nationale négociée par Agence ou Consortiums (CAREL, Couperin)

Concentration de la chaine de la valeur (verrou logiciel, intégration verticale des acteurs nationaux Fnac-Kobo, internationaux – Apple, Amazon)

Les accès : théâtre des tensions de l’édition scientifique

51 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

52 Luc Bellier 2013

Les métadonnées comme point d’accès

» Interopérabilité sémantique

53 Luc Bellier 2013

Les métadonnées comme point d’accès

Interopérabilité sémantique

54 Luc Bellier 2013

Les métadonnées comme point d’accès

Interopérabilité sémantique

55 Luc Bellier 2013

Les métadonnées comme point d’accès

Interopérabilité sémantique

56 Luc Bellier 2013

Bibliosurf – carte des romans policiers

Les métadonnées comme point d’accès

Interopérabilité sémantique

57 Luc Bellier 2013

Les métadonnées comme point d’accès

Interopérabilité sémantique

58 Luc Bellier 2013

Les métadonnées comme point d’accès

» « Web sémantique » ou « web de données », plutôt que web de documents

» RDF (Resource Description Framework) Cadre de description d’une ressource

• Modélisation générale : vide de forme, vide de contenu• Triplets : ressource (sujet), prédicat (relation), valeur (description)

» SKOS (Simple Knowledge Organisation System) Système simple d’organisation des connaissances SKOS permet d’organiser les rapports entre concepts

» SPARQL (Sparql Protocol and Query Language) Protocole Sparql et langage d’interrogation SPARQL est le pour interroger des données stockées en RDF

Interopérabilité sémantique

59 Luc Bellier 2013

Les métadonnées comme point d’accès

Interopérabilité sémantique

60 Luc Bellier 2013

Les métadonnées comme point d’accès

Interopérabilité sémantique

61 Luc Bellier 2013

Les métadonnées comme point d’accès

Une convergence inachevée : Les bibliothèques, les mondes marchand et les acteurs de référence

Pour aller plus loin :

la nouvelle classification de la CLIL : http://www.clil.org/information/detailDoc.html?docId=34

Un rapprochement entre les bibliothèques et l’édition :http://www.bnf.fr/fr/professionnels/autres_journees_professionnelles/a.journee_afnor_2012.html

Interopérabilité sémantique

62 Luc Bellier 2013

Les métadonnées comme point d’accès

» Les nouvelles indexations

63 Luc Bellier 2013

» Définition un processus de classification collaborative par des mots-clés librement choisis le résultat de cette classification

» Inconvénients vocabulaire non normalisé :

• problèmes de polysémie, synonymie• lemmatisation,orthographe

vocabulaire non structuré, sans hiérarchie ni relation sémantique vocabulaire hétérogène

• mêlant le très spécifique (éventuellement à haut niveau d’expertise) et le très superficiel

• pouvant être trop simple, trop peu d’expertise• utilisant implicitement des univers de références

vocabulaire personnel (à lire, lu, à acheter, à la bibliothèque sur LibraryThing, moi sur Flickr)

confusion entre pertinence et popularité

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

64 Luc Bellier 2013

» Avantages : indexation simple, gratuite et rapide indexation cumulative couverture documentaire totale

• sans exclusion des œuvres de fiction• sans exclusion de types de documents• incluant la description du contenu, et non seulement la classification sujet

(roman policier / peste) largement auto-régulée conforme aux usages du web

• dans les fonctions de recherche• par les aspects égotiques et ludiques

- simultanéité de la consultation et de l’indexation- absence de contrainte- intervention personnelle : approche subjective, permettant l’indexation

orientée utilisateur / tâche- défiance par rapport aux experts et à leur langage compliqué

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

65 Luc Bellier 2013

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

66 Luc Bellier 2013

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

67 Luc Bellier 2013

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

68 Luc Bellier 2013

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

69 Luc Bellier 2013

» Une question en suspens Quelle perception par les utilisateurs ?

• Différence entre un catalogue de bibliothèque et les autres sites web• Calcul de la « pertinence » non remis en question

- Supériorité des algorithmes de classement dans la relation avec les utilisateurs

Les métadonnées comme point d’accès

Les nouvelles indexations : Folksonomies

70 Luc Bellier 2013

Les métadonnées comme point d’accès

Multiplier les points d’accès

71 Luc Bellier 2013

Les métadonnées comme point d’accès

Multiplier les points d’accès

72 Luc Bellier 2013

En allégeant les développements

Les métadonnées comme point d’accès

Multiplier les points d’accès

73 Luc Bellier 2013

Les métadonnées comme point d’accès

» Le document numérique est sur la toile Le lecteur n’a plus besoin d’aller à la

bibliothèque pour lire son livre… Et pas non plus sur le site de la

bibliothèque numérique, ou chez un libraire

74 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

75 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Librairies en ligne, enjeux des dispositifs et des formats, longue traine et économie de l’attention

76 Luc Bellier 2013

Les enjeux des accès et de la médiation

77 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Maitrise de la chaine et des formats

78 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Maitrise de la chaine et des formats

Exemple : ePub Fnac non lisible sur une autre tablette que la Kobo

79 Luc Bellier 2013

Les enjeux des accès et de la médiation

http://www.bnf.fr/fr/professionnels/autres_journees_professionnelles/a.journee_afnor_2012.html

» Maitrise de la chaine et des formats

81 Luc Bellier 2013

Les enjeux des accès et de la médiation

Rédaction Edition FabricationVente numérique

Manuscrit

Illustration

Iconographie

RelectureCorrections

NumérisationChargement

Préparation du pivot XML

Liens avec les documents externes

Ajouts des métadonnées

Archivage

Versions numériques

Import xml pivot

Transformation xml selon maquete

Exports des xml modifiés

Versions imprimées

Import xml pivot

Transformation xml selon plateforme

Exports des xml modifiés

BAT

BAT

Mise à disposition des intermédiaires

Modifications des

métadonnées selon

plateformes

Chargement sur les plateformes

et validation

» Maitrise de la chaine et des formats

82 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Le Format Apple Ibooks En avance technologique sur le marché Lecture sur Tablette et Smartphone Intègre des éléments multimédia Fonctionnalités du reader avancées

» Le format Amazon KindleVersion Mobi 7 est un Epub version 1 Destiné à une liseuse à Encre électronique Version KF8 s’approche de l’Epub 3 Destiné à une tablette

» Le format ADELisible sur le reader de Adobe

» SDK (DevKit) repris par de nombreux readers : tablettes et liseuses

» Maitrise de la chaine et des formats

83 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Maitrise de la chaine s’oppose au développement du marché : Le lecteur veut un livre qui se lit n’importe où et s’achète n’importe où Le marché propose des livres selon le terminal de lecture Le lecteur veut lire et relire sur tous ses terminaux Le marché n’autorise qu’un terminal ou seuls les terminaux autorisés par le

revendeur Je veux lire mes livres même si je change de terminal Le marché ne m’autorise pas à changer de terminal sans renoncer à mes livres

» Maitrise de la chaine et des formats

84 Luc Bellier 2013

Les enjeux des accès et de la médiation

» La maitrise des conditions de lecture et donc de mise en valeur du texte passe par : La maitrise des formats et de leurs possibilités (sous-traitant des éditeurs) La maitrise des dispositifs et appareils (fabricants) ainsi que les modalités d’exploitation des fichiers

(éditeurs de logiciel) Au moment de l’édition du document et à tout moment après (obsolescence des formats,

incompatibilité ascendante) La maitrise des conditions de mise en vente ou d’accès sur la plate-forme (mise en avant, conditions

tarifaires, accompagnement etc.)

» Cette maitrise n’est jamais totalement partagée : la médiation et la maitrise technique de la totalité de la chaine sont donc imparfaites, avec un fort avantage aux grandes plateforme Apple et Amazon. Par le financement de la création de contenus adaptés à leur format et sur les segments définis par

eux. Par la validation préalable des contenus proposés avant la mise en vente :

• Un manuel scolaire gratuit et sous licence CC retiré par Apple : http://www.ralentirtravaux.com/le_blog/?p=1843

• Changement des conditions juridiques aboutissant au retrait d’ouvrages y compris quand ils ont été vendus : http://www.ebouquin.fr/2009/07/20/amazon-fait-disparaitre-des-livres-de-orwell-sur-le-kindle/

» Maitrise de la chaine et des formats

85 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

86 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Maitrise de la chaine et des formats

87 Luc Bellier 2013

» De nouvelles conditions définissent de nouvelles règles et de nouvelles façons de travailler : la longue traine notion apparue en 2004, sous la plume de Chris Anderson pour décrire le

modèle économique de sociétés comme Amazon. La masse critique permise par un marché ouvert et par l’absence de magasin

physique grâce au web permet d’élargir le catalogue des produits à vendre

» L’économie de l’attention : dans le cadre d’une concurrence entre les médias, la bataille se livre sur « le temps de cerveau disponible ». La concurrence n’est donc pas uniquement au sein du monde marchand, mais entre l’ensemble des espaces qui proposent des ressources

http://fr.wikipedia.org/wiki/%C3%89conomie_de_l%27attention http://fr.slideshare.net/phcouve/lconomie-de-lattention-presentation

Les enjeux des accès et de la médiation

» Longue traine et économie de l’attention

http://fr.wikipedia.org/wiki/Longue_tra%C3%AEnehttp://www.bibliobsession.net/2011/04/27/quels-criteres-pour-utiliser-la-longue-traine-2/

88 Luc Bellier 2013

Les enjeux des accès et de la médiationWeb media révolutionne le modèle économique

Temps discontinu

Temps continu

rareté abondance

édition

Tv radios Satellite

Seuil indicatif de rentabilité

Zone de hypothétique de

partage entre paiement par les annonceurs et les

particuliers

Tv radios TNT

Presse

revuescinéma

89 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

90 Luc Bellier 2013

Les enjeux des accès et de la médiation

» Appréhender la collection numérique : le cas des bibliothèques

91 Luc Bellier 2013

Les enjeux des accès et de la médiation

CollecterProduire

IdentifierSélectionner

StockerPréserver Transformer

Gérer

Bibliothèque numérique

en ligne

CommuniquerDiffuser

Données / Métadonnées

» Appréhender la collection numérique

92 Luc Bellier 2013

Les enjeux des accès et de la médiation

Données / Métadonnées

Catalogue

Serveurs d’archives

Serveurs de consultation

Catalogue public (OAI)

BdD de gestion

» Appréhender la collection numérique

93 Luc Bellier 2013

Les enjeux des accès et de la médiation

Reliés

Films

?Numérique natif

La collection numérique

Les collections

» Appréhender la collection numérique

94 Luc Bellier 2013

Les enjeux des accès et de la médiation

Données / Métadonnées

Catalogue

Serveurs d’archives

Serveurs de consultation

Catalogues ouverts (OAI)

BdD de gestion

Accès

Centre de ressources partenairesCentre de ressources (Bibliothèques centre de documentation)

Numérique natif

Entrepôt (OAI)

» Appréhender la collection numérique

95 Luc Bellier 2013

Les enjeux des accès et de la médiation

Données / Métadonnées

Catalogue

Serveurs d’archives

Serveurs de consultation

Catalogues ouverts (OAI)

BdD de gestion

Accès par abonnement Prestataire, Éditeur, agrégateurCentre de ressources

(Bibliothèques centre de documentation)

Numérique natif

» Appréhender la collection numérique

97 Luc Bellier 2013

Les enjeux des accès et de la médiation

LOC

» Appréhender la collection numérique

98 Luc Bellier 2013

Les enjeux des accès et de la médiation

» La dispersion documentaire des collections numériques est aussi une dispersion ou un partage des tâches, des compétences et des responsabilités.

» Elle soulève la question de l’investissement des professionnels de l’information dans les questions informatiques et/ou des professionnels de l’informatiques dans le domaine documentaire.

» Ce rapprochement ne peut s’opérer sans une formation des professionnels de l’information aux technologies de plus en plus pointue de l’informatique documentaire, dont le champs dépasse celui du catalogue : Archivage et conservation Accès Formats de structuration des documents numériques.

» Appréhender la collection numérique

99 Luc Bellier 2013

Outil de stockageOutil de diffusion

Dispositif de lecture,Outil d’accès

Division technique de la lecture

=> + =>

+

+

http://www.

+

Dispositif de lecture,Outil de stockageOutil de diffusion, Outil d’accès

Outil de stockage

Outil d’accèsOutil de stockageOutil de diffusion

Outil de diffusionOutil d’accès

Outil d’accèsOutil de stockageDispositif de lecture

lu/vu/su

su

lu/vulu/vu

lu

vu/su

100 Luc Bellier 2013

Le document numérique

» Nature et structure du document numérique La notion de document : d’une définition formelle à une approche par écosystème Les types de fichiers : Les formats textes, les formats images, les formats multimédia La granularité du document, structuration et déstructuration

» Produire et décrire le document numérique Le cas de la numérisation Le cas des de ePub Les identifiants

» Les métadonnées Les métadonnées pour la recherche

• Le cas des catalogues• Le cas des moteurs • Approche sémantique

Les métadonnées comme point d’accès• Accès centralisés (catalogue et/ou moteur)• Accès distribués fermés et ouverts (OAI, RSS et OPDS)• L’interopérabilité sémantique• Les nouvelles métadonnées (folksonomies)• Multiplier les accès et multiplier les documents

» Les enjeux des accès et de la médiation: Maitrise de la chaîne et des formats Longue traine et économie de l’attention Appréhender la collection numérique : le cas des bibliothèques La médiation autour des documents numériques

101 Luc Bellier 2013

Les enjeux des accès et de la médiation

» La médiation autour des documents numériques

102 Luc Bellier 2013

Intégration dans un environnement personnel

» Un nouveau cadre de signalement Rejoindre l’utilisateur dans son lieu de travail / de consultation

(la bibliothèque hors les murs et le prêt entre bibliothèques) Offrir de nouveaux services de veille

(étagère des nouvelles acquisitions, lettre d’information, expositions temporaires)

Faciliter la consultation des documents

103 Luc Bellier 2013

» S’adresser à l’utilisateur et l’Informer des nouveautés, lui permettre de faire ce qu’il n’appelle pas la « veille documentaire »

lettres d’information

Fils RSS : actualité de la bibliothèque uniquement (Cervantes virtual)

Fils RSS sur les contenus • paramétrage générique (BU Laval, BU Illinois, Jubil, SCD Lyon 3, WNCLN,

Project Gutenberg)• paramétrage par l’utilisateur

- lors de la recherche (Saphir, enssib, National Libr. of Ireland)- après authentification (WNCLN)

• paramétrage par type de document : si ressources audio numérisées, prévoir l’abonnement au podcast (Collège de France, Kankakee Public Library Podcast)

• dans bibliothèque numérique ou sur le portail de l’institution

Intégration dans un environnement personnel

104 Luc Bellier 2013

Intégration dans un environnement personnel

105

Intégration dans un environnement personnel

106 Luc Bellier 2013

Intégration dans un environnement personnel

107 Luc Bellier 2013

108 Luc Bellier 2013

De nouveaux outils de signalement

»les protocoles d’échanges de métadonnées

»Multiplier les documents numériques

»La médiation numérique

110

Auteur : David Liziard

Les médiations numériques

111 Luc Bellier 2013

» Ajouter une interface de publication flexible ? Intégrer la bibliothèque numérique à la bibliothèque ou à l’institution ? comment ? Qui l’alimente et à quel rythme ? En quel nom ?

» Blog La solution du blog est-elle la meilleure ? Un blog séparé avec seulement un fil RSS

inclus dans le portail de la bibliothèque numérique ?

Le blog permet d’autres relations avec l’usager qui sortent du cadre de la veille : • Proximité de ton• Publier des critiques d’ouvrages (prescription)• Faire participer la communauté (commentaires)• Rendre la bibliothèque plus transparente & expliquer le fonctionnement, le jargon,

le backoffice de la bibliothèque numérique, les évolutions des fonctionnalités, les dysfonctionnements, les perspectives

Rendre compte des animations

Le blog permet éventuellement de favoriser un travail de médiation léger et collaboratif

La communauté d’une bibliothèque

112 Luc Bellier 2013

La communauté d’une bibliothèque

113 Luc Bellier 2013

Les contenus libres ou librement accessibles et les nouvelles formes de la médiation

114 Luc Bellier 2013

115 Luc Bellier 2013

De nouveaux outils de signalement

»les protocoles d’échanges de métadonnées

»Multiplier les documents numériques

»La médiation numérique… la recommandation par les lecteurs…

117 Luc Bellier 2013

Un nouveau signalement : la recommandation

» Explicite / Implicite

» Par service dédié extérieur à la bibliothèque numérique / à l’intérieur de la bibliothèque

118 Luc Bellier 2013

Un nouveau signalement : la recommandation

119

Un nouveau signalement : la recommandation

120 Luc Bellier 2013

Un nouveau signalement : la recommandation

122 Luc Bellier 2013

Un nouveau signalement : la recommandation