Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 avril 2012

Post on 22-Jun-2015

669 views 0 download

Transcript of Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 avril 2012

Patrick PeccatteChercheur associé au

Laboratoire d'histoire visuelle contemporaine(Lhivic/EHESS)

peccatte@softexperience.comTwitter: @ppeccatte

Facebook: patrick.peccatteGoogle+: Patrick Peccatte

Flickr: patrickpeccatte et photosnormandieTumblr: dubruitausignal.tumblr.com

Objets informationnels et objets culturels

http://culturevisuelle.org/dejavu

Journée d’étude et atelier expérimental

Ouverture et réutilisation des données« Open Data culturel »

École supérieure d’art d’Aix-en-Provence – 19 & 20 avril 2012

Ouverture et réutilisation des données(programme et résumés des présentations)

Données, etc.(selon les résumés des présentations)

Base de données (di Filippi) Contenus, contenus numériques (Bermès, Domange) Document (Peccatte, Simon) Données, data, données ouvertes, open data(Aillagon, Artin, Bermès, di Filippi, Labelle & Holken, Nepote, Simon Vernet) Information (Artin, Domange, Peccatte) Rédactionnels, monographies, œuvres d'art, photographies, témoignages (Bekkers) Ressources, ressources numériques(Aillagon, Bermès, Simon)

Accès (Domange) Appropriation (Aillagon) Consommation (Aillagon) Diffusion (Aillagon, Bermès, di Filippi) Exploitation (Simon) Exposition (Simon) Indexation (Peccatte) Mashup (Artin) Mise à disposition (Domange) Navigation (Bermès) Ouverture (Intro, Simon, Vernet) Partage (Bekkers) Réutilisation (Intro, di Filippi, Simon) Restitution (Artin, Bekkers) Usage (Aillagon, Vernet) Valorisation (Aillagon)

Actions sur les données ?(selon les résumés des présentations)

Types de données Textes Nombres et visualisations de nombres Sons Images fixes Images animées Structures (tables, triplets, etc.)

Opérations informatiques majeures Stockage Recherche, accès (et quelques autres...)

Deux notions importantes à ajouter

Programmation✔ implicite car les données dont nous parlons

sont numériques Métadonnées (≈ description des données)

✔ implicite car les métadonnées sont des données

Le projet "Digital Public Library of America"

Les données sont documentarisées à travers les métadonnées ?

Recherche de texteUne phrase énigmatique

« Tap da sac'h 'ta, breur kozh »???

Recherche de texte

« Tap da sac'h 'ta, breur kozh »

Prends donc ton sac, vieux frèrePoème de Youenn Gwernig (en breton)

Recherche d'une partie d'image

D'où vient ce lolcat ?

Recherche d'une partie d'image

D'où vient ce lolcat ?

Jérôme Bosch, Le Jardin des délices, 1504

Reconnaissance de musique

Des logiciels grand public comme Shazam ou SoundHound permettent de reconnaître des mélodies

Culture et mémorisation

La culture ne peut plus être considérée comme une accumulation passive de connaissances diverses

La reconnaissance des œuvres peut être efficacement simulée par des algorithmes

Thèse faible✔ Ces applications Internet ne constituent qu'une

extension de notre mémoire

Thèse forte✔ Notre rapport au savoir et à la culture est profondément

modifié par les nouvelles possibilités informationnelles

"Penser en objets" - Background

Philosophie✔ Ontologie (plutôt analytique...)✔ Philosophie de l'information (Luciano Floridi)

Informatique✔ Représentation des connaissances [ontologies]✔ Programmation par objets

Une ontologie rudimentaire

Entités naturelles (Soleil, Lune)

Êtres physiques (hommes, animaux)

Êtres sociaux

Événements (naturels, historiographiques, etc.)

Artefacts (fabriqués par l'homme)✔ Objets techniques✔ Objets culturels, matériels ou immatériels

✗ Objets artistiques (peinture, musique, etc.)✔ Objets informationnels

L'information – un concept très complexe

théories de l'information (plusieurs)information sémantique

information physiqueinformation biologiqueinformation économiqueSIC: Sciences de l'information et de la communication

etc.

Informatique :traitement des données, traitement de l'information

Théories de l'information

Théorie de Shannon (1948)Théorie algorithmique de l'information

✔ Solomonov, Kolmogorov (années 1960)✔ Chaitin✔ etc.

Théorie algorithmique de l'information(grosso modo...)

Évaluation de la complexité d'une suite de signes S≈ quantité d'information

Une suite de signes est toujours le résultat de l'exécution d'au moins un programme

✔ À la recherche du temps perdu✔ print "Longtemps, je me suis couché de bonne

heure, etc."La quantité d'information d'une suite S est la longueur du plus court programme qui engendre S

Donnée = défaut d'uniformité représentable à l'aide de symboles

Information = Données + Interprétation

Conception sémantique de l'information

Objet computationnel (informatique)✔ collection de données numériques (informatiques)

brutes formant un tout

Objet informationnel✔ collection structurée d'informations

(pas obligatoirement numériques) formant un tout✔ un objet informationnel numérique est un objet

informatique(mais l'inverse n'est pas toujours vrai)

Objet computationnel et Objet informationnel

Un objet computationnel est une instance de classe

Old cars all in a neat row, by deflam, Creative Commonshttp://www.flickr.com/photos/freeparking/502609973/

Aspect méréologique des objets informationnels numériques(la méréologie est l'étude des relations entre la partie et le tout)

objet informationnel = collection structurée d'informations formant un tout auquel on accède à travers une ou plusieurs de ses parties

objet informationnel [o. i.]► o.i. immatériel

► o.i. numérique► o.i. numérique du Web

► o.i. numérique du Web recherchable► o.i. numérique du Web recherchablepar une ou plusieurs de ses parties

MéréologiePetite typologie des objets informationnels

La hiérarchisation des objets informationnels sur le Web

ressourceressourceressourceressourceressourceressourceressource

Liste de ressources dont on ne consulte que le haut.vue sur Google ≈ rasoir d'Occam

Représentation des textes - codage Unicode

Important et "invisible": Unicode Collation Algorithm (UCA) algorithme définissant un ordre normalisé pour le tri, la reconnaissance et la

recherche de texte

Représentation des sons et des images – empreintes (fingerprints)

Une empreinte acoustique d'un son (ou une empreinte visuelle d'une image) est une représentation simplifiée d'un signal audio (ou vidéo)Conception unifiée mettant en œuvre des méthodes d'accès aux objets à partir de fragments

Méthodes d'accès

Algorithmes✔ sur des classements, des hiérarchisations et valorisations ✔ sur des représentations textuelles directes (codages) ou

indirectes (contextes de publication, métadonnées) mais en fait, nommer ou décrire, c'est déjà classer

✔ sur des représentations d'objets ou de fragments d'objets (empreintes)

Accès aux objets≈ détermination des parties communes

Puissance (et limite) du calcul"Calculabilité externe"

Les objets informationnels numériques sont construits pour être ordonnés, recherchés et retrouvés, comparés et reliés entre euxLes recherches d'informations quelconques peuvent alors s'effectuer "mécaniquement"

Puissance (et limite) du calcul"Calculabilité interne"

Exemple Computable Document Format de Wolfram

Le document devient objet informationnel

Ce n'est pas seulement la mémoire humaine qui est impactée par le Web.

C'est notre conception même de la culture.

Document

Indexation,métadonnées

Statique

Localisé

Objet informationnel

Méthodes d'accès

Calculé, dynamique

Non localisé

Objection 1 : Ce n'est que du calcul

RéponsesLa théorie algorithmique de l'information lie les concepts d'information et de programmeLes propositions pour lesquelles il existe une démonstration [un algorithme] constituent une classe bien particulièreIl est remarquable que l'on puisse répondre à une question en mettant en œuvre un algorithme sur un corpus de données

Objection 2: Les humains ne fonctionnent pas ainsi

Grief semblable formulé à l'encontre du programme de l'Intelligence Artificielle dans les années 60

Big Mouth by angel_shark, (Flickr, Creative Commons) / Cyana by Ifremer, (Wikimedia Commons)

« Se demander si un ordinateur peut penser n'a pas plus d'intérêt que de se demander si un sous-marin peut nager. » Edsger Dijkstra

Émergence ?

Apparition de nouvelles informations qui s'agglomèrent aux objets informationnels sur le Web, provoquée par:

✔ l'interconnexion de ressources diverses✔ l'ouverture aux ressources dans des langues inconnues auparavant inaccessibles✔ l'insertion dans des flux informationnels✔ la sérendipité (capacité de découvrir quelque chose sans l'avoir cherché)

L'émergence en ontologie: apparition de nouvelles propriétés des objets au delà d'une certaine complexité

Émergence et cultures

Émergence d'applications et d'usages nouveaux lors de l'ouverture des données

Cultures: organisations selon des propriétés émergentes de la masse informationnelle rendue intelligible par des méthodes d'accès diversesUne multiplicité de cultures émergent et remplacent une culture classique normativeVers une "pluralité et une relativité" des ontologies culturelles (?)