Votre "data" je vous la sers comment ?

27
Votre « data » je vous la sers comment ? Journée d’étude "Big et Open Data : conséquences et compétences pour les professionnels de l'information ?”, Rennes, 28 mai 2015 Dominique Cotte Réflexions sur la nébuleuse de la « data » et les impacts sur les activités des professionnels de l’information. 1

Transcript of Votre "data" je vous la sers comment ?

Page 1: Votre "data" je vous la sers comment ?

1

Votre « data » je vous la sers comment ?

Journée d’étude "Big et Open Data : conséquences et compétences pour les professionnels de l'information ?”,

Rennes, 28 mai 2015Dominique Cotte

Réflexions sur la nébuleuse de la « data » et les impacts sur les activités des professionnels de

l’information.

Page 2: Votre "data" je vous la sers comment ?

2

Déroulé• Introduction • Prolégomènes : du document à la « data » et retour• Open Data• Open Resarch Data• Les promesses du Big Data• Conclusion sur les activités et spécialités de la gestion de l’information

Page 3: Votre "data" je vous la sers comment ?

3

Data

Open

Linked

Big

Long

Introduction : Une nouvelle série d’objets à prendre en compte, comment, pourquoi ?

Une nouvelle manière de mettre

en valeur et en relation des

éléments singuliers pour produire de la connaissanceSmart

Web de données

Page 4: Votre "data" je vous la sers comment ?

4

Documents, données, hybrides…

• Sont-ils des opposables ?

• Quels rapports entretiennent ces objets ?

• Passe-t-on d’un monde à un autre monde ?

Page 5: Votre "data" je vous la sers comment ?

5

Construction, structure

• Est-il légitime de dire d’un document qu’il est « non structuré » ?

• Et de l’opposer aux données qui seraient, par nature « structurées » ?

Page 6: Votre "data" je vous la sers comment ?

6

Brevet Article scientifique

« Une » de journal

Page 7: Votre "data" je vous la sers comment ?

7

Des approches plus fines des contenus des documents

• Data mining, text mining• Balisage• Gestion de contenus structurés• Outils de recherche

Page 8: Votre "data" je vous la sers comment ?

8

De nouvelles sources : les documents, dé-composés

8

Du document… … à la donnée

Édité

Autoporteur

Possédant un sens global

Pérenne

Détachée

Volatile

Recombinable

Dynamique

« Le mouvement d’atomisation conduit les professionnels de l’information à changer d’échelle pour l’organisation, la documentation et la description, l’archivage, la mémorisation… des données, de leur appareillage, de leurs métadonnées. »

Page 9: Votre "data" je vous la sers comment ?

9

Les modes de production de la donnée

• Recueil automatique, capteurs• Réseaux sociaux• Production documentaire démultipliée• Appareillages scientifiques• Métadonnées

Page 10: Votre "data" je vous la sers comment ?

10

Trois exemples

• Domaine des énergies fossiles : « dématérialistation » de rapports papier parfois anciens (permanence de l’information incluse dans ces études) afin de pouvoir en exploiter et traiter les contenus (dont les données )

• Les cahiers de laboratoire dans l’industrie pharmaceutique• Publications de l’OCDE, problématique de la ré-utilisation de

contenus éditoriaux et de la mixité entre des contenus analytiques (séries statistiques, datasets, et d’éléments de monographie)

Page 11: Votre "data" je vous la sers comment ?

11

Cahier de laboratoire Pratiques hétérogènes

Ecritures mixtes

Copier/coller

Analogique/numérique

Page 12: Votre "data" je vous la sers comment ?

12

Site d’accès aux publications de l’OCDE

Page 13: Votre "data" je vous la sers comment ?

13

Ce qu’implique l’exploitation des données

13

Au documentDe la donnée

Protocoles de recueil

Mise en collections

Traitements

Plans de gestion

Documentarisation

Mises en perspectives

Mises en formes

Commentaires

Métadonnées

Page 14: Votre "data" je vous la sers comment ?

14

L’open Data et ses qualifications documentaires

Qualification

Recherche

Description de contenu

Métadonnées

Qualité des données

Systèmes d’information

Indexation

Page 15: Votre "data" je vous la sers comment ?

15

La data dans « l’open research data »

InvestigationsExpériences

Datadatasets

Etudes,communications

Bases documen-

taires

Page 16: Votre "data" je vous la sers comment ?

16

Une complexification du paysage documentaire, comme « écosystème »

Données (quantitatif)

Travaux préparatoiresPublications, actes, articles

Retombées, vulgarisation

Blogs,collaboratif Qualification

CurationAccompagnementMédiation

Page 17: Votre "data" je vous la sers comment ?

17

• Promesse technique :• Quantitatif

• Volume • Vitesse

• Infrastructures

• Capteurs

• Mobilité

Les promesses des « données massives »

Page 18: Votre "data" je vous la sers comment ?

18

http://www.internetlivestats.com/twitter-statistics/(consulté le 13 janvier 2015)

Page 19: Votre "data" je vous la sers comment ?

19

• « Grand » çà commence quand ?

• Promesse d’usages :

• Variété : rapprochement de ressources

• Emergence de nouvelles connaissances via des inférences et des rapprochements d’information

• Prédictions d’événements (démarche probabiliste)

Les promesses des « données massives »

Page 20: Votre "data" je vous la sers comment ?

20

• Les univers de déploiement :

• Marketing et vente• Comportement clients

• Santé

• Tourisme et territoires

• Sécurité

• …

Les promesses des « données massives »

• Data scientists• Statisticiens• Professionnels de

l’information• …

Page 21: Votre "data" je vous la sers comment ?

21

• La marguerite de la data :

BESOINS• Santé• Tourisme• Economie• Culture• …

TRAITEMENT

• Rapprochement des données

• Alignement des référentiels

• Exposition des ressources• …

PRATIQUES SOCIALES

• Mobilité

• Hyper-connectivité

• Participation

• …

INFRASTRUCTURE

• Stockage

• Réseau

• Outils de captation

• …

Les promesses des « données massives »

Page 22: Votre "data" je vous la sers comment ?

22

• Atouts (en général)• Connaissances et pratiques :

• Des données et de leur description• Des référentiels• Des outils de traitement : text mining, analyse statistique, sémantique

• Contenus spécifiques• Maillage, « dé-silotage »• Dématérialisation de documents• Approches métiers des fonds et des documents

• Validation, Véracité

Impacts sur activités des professionnels de l’information

Page 23: Votre "data" je vous la sers comment ?

23

• Exemple : mise en commun de catalogues• Cycle vertueux• Récupération de données pour enrichir des contenus

• Ex. avis de lecteurs de Babelio, Libfly• Open Data, récupération de biographies

• Exposition des données• Mise en visibilité• Echange

• Mutualisation• Fédération de catalogues• Rebonds et circulation dans les données• Enrichissement et redressement des données et retour au producteur

• Ex. ISIDORE (Huma-Num CNRS)

Impacts sur activités des professionnels de l’information

Page 24: Votre "data" je vous la sers comment ?

24

• Enjeux et opportunités

• Pilotage : mieux connaître les environnements et les publics• Rapprocher corpus et données

• Accès aux données de la recherche• Accès aux données publiques• Accès aux ressources (ou aux références) à partir des données• Améliorer l’exposition et la visibilité des fonds• Enrichir les catalogues• Exposer les éléments cachés dans de nouvelles formes de mises en relation

(cf. CARTIER A., Bibliothèque et OpenData. Et si on ouvrait les bibliothèques sur l’avenir ?, Mémoire Enssib,2013)

Impacts sur activités des professionnels de l’information

Page 25: Votre "data" je vous la sers comment ?

25

Besoins

• Repérage, Qualification• Modèles, formats, référentiels• Curation• Documentarisation• Mise en liens, rapprochements

Page 26: Votre "data" je vous la sers comment ?

26

Conclusion• Des objets documentaires qui s’hybrident sous l’influence des

technologies numériques• Des spécialités qui doivent dialoguer pour confronter des expériences• Des emprunts nécessaires en termes de réflexions, méthodes,

techniques, modèles, formats…

Page 27: Votre "data" je vous la sers comment ?

27

Merci de votre attention.