Gestion des donnees personnelles.

Post on 19-Dec-2014

5.605 views 6 download

description

Conférence dans la cadre de l'école d'été en architecture de l'information. Moteurs et réseaux sociaux : quelle clef de voûte pour une architecture de l'information ?

Transcript of Gestion des donnees personnelles.

Gestion des données

personnellesLyon-Montréal.

13 Mai 2011

Olivier Ertzscheid // Maître de conférences// Sciences de l’information et de la communication //

Université de Nantes // IUT La Roche sur YonSite : http://www.affordance.info

Moteurs et réseaux sociaux

Quelle clef de voûte pour une architecture de l’information ?

Le pitch

• CONSTAT.– Le web : un gigantesque entrepôt de données en mouvement.– Dont des données « personnelles ». Beaucoup.– Les moteurs et les réseaux sociaux s’en nourrissent. – Nous les alimentons sans cesse.

• QUESTIONS.– Pourquoi ? – D’où viennent ces données ? – Comment sont-elles traitées ? Dans quel but ? – Comment les « données personnelles » en sont-elles venues à occuper

une telle place dans un média de masse numérique ? – Que changent-elles dans « les » pratiques documentaires ? Dans nos

représentations de la documentation et de l’information ?2

PRÉAMBULE1934. 1978. 2011.

3

1934. Paul Otlet. Traité de documentation.

4Architecture de l’information = « traitement documentaire »

1978. Le projet SAFARI

• projet des années 70 d’interconnexion des administrations à partir d’un matricule commun dont le rejet avait été à l’origine de la loi "Informatique, fichiers et libertés" du 6 janvier 1978.

• http://www.legalis.net/breves-article.php3?id_article=870 5

INTERCONNEXION

6

2011. La famille des données documentaires s’agrandit ...

Plus qu’interconnectées, des données réunifiées

1995

2005

2011

Web public

Web privéWeb « invisible »

Web personnel(Desktop)

Web intime(Mail)

Web public Web privé

Web personnel(Desktop)

Web intime(Mail)

Web extime(blogs)

Web public Web privé

Web personnel(Desktop)

Web intime(Mail)

Web extime(blogs)

indexé

non-indexé

7

Dérive des continents documentaires, des « gisements de données »

ARCHITECTURE DE

L’INFORMATION

8

Architecture ?

9

« L’architecture, c’est ce qui reste de l’édifice, une fois la pierre ôtée. » Plotin.

Architecture de l’information ?

10

« L’architecture de l’information, c’est ce qui reste une fois l’information ôtée. »

du systèmede la navigationde la recherchede l’infrastructuredes données

du systèmede la navigationde la recherchede l’infrastructuredes données

Archi de l’info selon Google

• Une architecture de serveurs (datacenters)• Une architecture de pages (PageRank)• Une architecture de relations (liens entre

les pages)• Lectures industrielles

• Ecosystème ouvert (galaxie de services) et entonnoir central

• Une indexation d’info documentaires + ingénierie « de popularité » (procède par agglutination)

11

Archi de l’info selon Facebook

• Une architecture de serveurs (datacenters)• Une architecture de profils (graphe social) • Une architecture de relations (liens entre les

profils)• Industrialisation de l’intime

• Ecosystème fermé avec droit de douanes pour services tiers.

• Une collecte d’informations personnelles déclaratives + ingénierie virale (procède par contamination)

2 écoles ?

Similarités Différences

12

Navigation

Données

Serveurs &Datacenters

Degré zéro de l’architecture de l’info

Services

13

Architecture de l’info 2.0

Architecture de l’info 1.0

Le portail du visible

La clé vers l’invisible

Données

Données ???

Architecture de l’info 2.0

14Navigation

Datacenters

Serveurs

15

Architecture de l’info 2.0

Services

Services

Services

16

Architecture de l’info 2.0

Données

Données

Données

Données

17

Entre design ...(services, navigation, etc.)

Et industrie lourde(infrastructures, datacenters, gisements de données etc.)

Architecture de l’information

DESIGN & FOUILLE DE DONNÉES

18

Design visible• Ravalement de façade• Logos (colorés), Coins (arrondis),

Couleurs (pastels), Polices (typos), etc.

19

Design invisible• Ergonomie « souterraine »• Rich snippets, Microformats,

RDF• Web-Services• Web socio-sémantique

Expérience utilisateur. Clic gagnant

+

LOOK... and ... FEEL

20

Design de données (exemples)

« Journalisme de données » http://data.owni.fr

Générateur de visualisations.http://www-958.ibm.com/software/data/cognos/manyeyes/

Nouvelle(s) expérience(s) documentaire(s)

Fouille de données : du datamining au web-mining

21

Mr Google

Mr Facebook

données

Privacy zone

22

Les nouvelles mines sont ... dans les nuages

Données sont aussi des métadonnées

23

• Géolocalisation sur Foursquare + partage dans Facebook

– Données : latitude, longitude, horaire, nom du bar lounge.

– Métadonnées : comportementales

• Recherche d’info sur Google– Ma requête sur Google = donnée « mot-

clé »– Toutes mes requêtes sur Google

(historique) = métadonnées documentaires

Question de point de vue

Avant, pendant, après. Des données sur tout. Des données partout. Des données pour tout.

24

A. Mes données et leur historique(déclaratives, comport. et techniques)

B. Les données de mes prochesCouche Ingénieries relationnelles

C. Les données de tout le mondePassage à l’échelle (statistique)

Mes données et celles de mes proches

(A and B)

Mes données ou celles de mes proches et

celles de tout le monde(A or B) and C

Mes données et celles de tout le monde

(A and C)

Les données de mes proches et celles de tout le monde

(B and C)

Sur un site marchand AMAZON.COM

Données « natives »« intentions d’achat »,

« préférences »

Sur un site marchand AMAZON.COM

Données « natives »« intentions d’achat »,

« préférences »

Sur un site social FACEBOOK.COM

Données « captives »Rétention

« amis, groupes, réseaux »

Sur un site social FACEBOOK.COM

Données « captives »Rétention

« amis, groupes, réseaux »

Dans 1 écosystème ouvert de sitesGOOGLE / YOUTUBE / GMAIL

Données natives et « moissonnées »

Dans 1 écosystème ouvert de sitesGOOGLE / YOUTUBE / GMAIL

Données natives et « moissonnées »

Que possèdent-ils ?? Des donnéesQue possèdent-ils ?? Des données

Qu’en font-ils ?? Des croisementsQu’en font-ils ?? Des croisements

Comment procèdent-ils ?? Par captationComment procèdent-ils ?? Par captation

Que produisent-ils ? D’autres données, de la richesse et de la redocumentarisationQue produisent-ils ? D’autres données, de la richesse et de la redocumentarisation

1er exemple.

25

26« Données »

1. Documents d’identité

27

2. Documenter l’identité

« Information »

28

3. « Redocumentariser » l’identité

« Redocumentariser, c’est documentariser à nouveau un document ou une collection en permettant à un bénéficiaire de réarticuler les contenus sémiotiques selon son interprétation et ses usages. » Manuel Zacklad in « Eléments théoriques pour l’étude des pratiques grand public de la documentarisation : réseaux et communautés d’imaginaire »

« connaissances »

Redocumentarisation par l’exemple :Facebook EST L’interface

« 1 » identitédocumentéedocumentaire

« n » profils

« x » profondeurs

29

LA GUERRE DES DONNÉES

30

Données personnelles ?

31

DES DONNEES « Ensemble des informations qui permettent sous quelque forme que ce soit, directement ou

non, l’identification des personnes physiques auxquelles elles se rapportent ». DES TRAITEMENTS « toute opération ou ensemble d’opérations portant sur des données à caractère personnel,

quel que soit le procédé utilisé ». Collecte, enregistrement, conservation, adaptation, modification, extraction, consultation, utilisation, communication par transmission, diffusion ou toute autre forme de mise à disposition, le rapprochement ou l’interconnexion, ainsi que le verrouillage, l’effacement ou la destruction »

Lionel MAUREL

Techniques : Adresse IP, Cookies ...

Déclaratives : mon profil facebook, date de naissance ...

Navigationnelles : requêtes, types d’achats ...

Comportementales (diachroniques) : historique de recherche

C’est la loi

32

INFORMATION. La loi impose d’informer les personnes « fichées » que des données nominatives les concernant sont collectéesDROIT DE RETRAIT. NON-DIVULGATION À DES TIERS.DATE LIMITE DE VALIDITÉ.

SOURCE : LIONEL MAUREL

C’est le business

Pot de terre des législations nationales contre ...(jack)pot de fer de la dérégulation des marchés

Fichiers « log »A chaque fois qu’un utilisateur se connecte, le

serveur enregistre un log.

33

123.45.67.89 - 25/Mar/2007 10:15:32 - http://www.google.com/search?q=flowers - Firefox 2.0.0.7; Windows NT 5.1 - dac465aa86edd2dc

• « This idea that a cookie is nonpersonal information no longer really applies in this digital age. You don't need to know a person's name to know a person — to understand their likes and their dislikes, the contents of what they read, what they put in their shopping cart. It's really personal now. » Jeff Chester, directeur exécutif du Center for Digital Democracy

• Personna numerique VS DATA

COOKIES

De 2003 à 2005, Google cookie expirant en 2038 ...Préconisations G29 (rassemblement CNIL européennes) : 6 moisGoogle : Adresse IP « anonymisée » au bout de 9 mois (2 derniers chiffres seulement) Cookies supprimés au bout de 18 moisMicrosoft : cookies supprimés au bout de 6 mois

Petites machineries entre amis.

Pacte Faustien ??

• Pourquoi cette quête de données personnelles ?– Pour lutter contre l’infobésité (personnalisation)– Pour maintenir un modèle économique (marketing ciblé, pub. contextuelle)– Pour améliorer l’expérience utilisateur (personnalisation) 34

Participation

active ...

35

et massive

!!!

Base de donnée des intentions (John Battelle)

36

« We don’t need taxonomy of knowledge. We need taxonomy of desire, a marketplace of intent » Prabhakar Raghavan.

Head of Research and Strategy chez Yahoo! Sept. 2008

Le carré magique des usages

37

SHOPPING (digital

cameras)

HEALTH (Diabetes)

TRAVEL (United 875)

LOCAL (French

Restaurant)

Rech

erch

e U

nive

rsel

le :

le p

rinci

pe

38

• Données « personnelles, sociales » (mes amis, mes amours, mes emmerdes) ? Territoires de socialisation

• Données intentionnelles (achat, déplacement, sorties, restaurant) ? Territoire du marketing

• Données documentaires (textes, statuts, articles, photos, vidéos, tags ...) ? Territoire de la qualification 39

La guerre des données ?

40

2ème exemple.

41

La guerre des carnets d’adresses

• Mais d’abord une devinette.• Bataille Google / Facebook. • Enjeu : amorçage.• Résultat : olivier.ertzscheid@facebook.com• Courriel = cheval de troie idéal de nos

pratiques connectées. Pourquoi ?– "synthétise" notre réseau relationnel (nos "contacts"),– point d'entrée le plus aisé vers le cloud computing– "intime", "personnel » (pub contextuelle)– point pivot autour duquel hiérarchiser l'ensemble des

autres données

42

3ème exemple. Le cas Facebook 43

Facebook privacy policy timeline(cf http://www.eff.org/deeplinks/2010/04/facebook-timeline/)

44

« No personal information that you submit to Thefacebook will be available to any user of the Web Site who does not belong to at least one of the groups specified by you in your privacy settings »

2005 « Moi et les miens »

45

We understand you may not want everyone in the world to have the information you share on Facebook; that is why we give you control of your information. Our default privacy settings limit the information displayed in your profile to your school, your specified local area, and other reasonable community limitations that we tell you about.

2006

Moi et ma communauté étenduePrivauté « par défaut »

2007

Profile information you submit to Facebook will be available to users of Facebook who belong to at least one of the networks you allow to access the information through your privacy settings (e.g., school, geography, friends of friends). Your name, school name, and profile picture thumbnail will be available in search results across the Facebook network unless you alter your privacy settings.

Arrivée du « search »Arrivée de l’opt-out

Certain categories of information such as your name, profile photo, list of friends and pages you are a fan of, gender, geographic region, and networks you belong to are considered publicly available to everyone, including Facebook-enhanced applications, and therefore do not have privacy settings.

46

Information set to “everyone” is publicly available information, may be accessed by everyone on the Internet (including people not logged into Facebook), is subject to indexing by third party search engines, may be associated with you outside of Facebook (such as when you visit other sites on the internet), and may be imported and exported by us and others without privacy limitations. The default privacy setting for certain types of information you post on Facebook is set to “everyone.” You can review and change the default settings in your privacy settings

Nov.2009

Abolition de la frontière « plateforme »Opt-out systématique et étendu

Abolition pure et simple de la privauté « profilaire », « identitaire »

Déc.2009

4ème exemple. Syndrome de Blanche-Neige

© http://www.radidesigners.com/miroir1.htm

47

L’illusion de la page blanche

48

Le syndrôme de Blanche-Neige

49

Attention !!!!!

50

Pêché originel

cherche …

51

Moi …

52

CONSÉQUENCES

53

Pour ...

Mon nom est personne

• Personnalisation :– « Invisible »– « Persistante »– « Participative »

54Pour l’individu

Une « universalité »

trèstrèstrès

« personnalisée »

ALGORITHMIE AMBIANTE

55Pour « la société »

Facebook comme nouveau panopticon.

56

Surveillance ET sous-veillance.LITTLE SISTERS

Pour les « communautés »

Cocktail explosifPersonnalisation

+ « universalité » des recherches+ Migration dans les nuages+ Massification (des accès)+ Communautarisation (des pratiques)+ Économie de l’attention+ Confusion des pratiques

57

=Pour les enjeux documentaires

• Ce que l’on savait déjà :– Explosion de la masse documentaire

• Ce que l’on ne savait pas : – Bombe à fragmentation

• Fragmentation– Des documents (world wide web)– Des usages– Des synchronicités (world life web)– Des modalités

• de diffusion, d’appropriation, d’édition …

BOUM !

58Pour les enjeux documentaires

59

5ème et 6ème exemples.

60

Moteur de recherche « de voisinage »

61

Everyblock.com / http://chicago.everyblock.com/news/

Adresse / numéro de sécurité sociale / historique déménagements et changements d'adresse depuis 10 ans / Date de naissance / Casier judiciaire / Diverses amendes / Dates mariages et divorces / le nom et n° tél voisins / Montant du bien immobilier qu'il possède (sa maison), sa date d'achat et le nom de celui qui lui a vendu / la taille du "lot" (cadastre) sur lequel elle (sa maison) est implantée / une vue satellite de chez lui / Âge moyen des femmes et des hommes habitant dans son voisinage / Nombre de meurtres, de viols, de vols de véhicule et autres larcins dans son quartier / Composition ethnique du quartier / Niveau d'éducation et les langues parlées / les permis qu'il possède (permis de conduire mais aussi permis bateau, avion, moto, etc ...)

http://www.Intelius.com

62

"Nous cherchons dans des milliards de données publiques pour vous aider à trouver ce que vous cherchez. Nous analysons des listes de vente, des commandes sur catalogue, des abonnements à des magazines, des enregistrements d'adresse, des enregistrements de propriété immobilière, des arrêts de cour (...) et toute une série d'autres enregistrements publics et de sources publiques pour vous."

CONCLUSION

1 constat. 1 morale. 2 questions. 3 conseils.

63

64

information

connaissanceconnaissance

Documents

individus

DONNÉESDONNÉES

Changement de perspective

"nous sommes en train de passer d'un web de documents connectés à un web de données connectées." John Markoff. NY Times. 12 No. 2006 http://www.nytimes.com/2006/11/12/business/12web.html

DONNÉES

Traitement documentaire Traitement computationnel

Moralité ?

• Pour les moteurs …• Pour les réseaux sociaux

« un document »

Indexable, cherchable, Profilable, « monétisable » …

65

66

« L’antilope qui court dans les plaines d’Afrique ne peut être considérée comme un document…»

« Mais si elle est capturée… et devient un objet d’études, on la considère alors comme un document. Elle devient une preuve physique. » Suzanne Briet

67

Quelle clé de voûte pour l’architecture de l’information ?

?

requêtes

profils

usages

Documents

informations

Individus

d o n n é e s

d o n n é e s

d o n n é e s

d o

n n

é e

s

d o n n é e s

d o n n é e s

d o n n é e s

d o n n é e s

d o n n é e s

Quel écosystème informationnel ?

Indexation

Mer des pratiques

Moteurs & réseaux sociaux

Monétisation

Océan des données

Collaboration, participation,

User Generated Content

Résultats

Technologies de la capillarité

Comportements, profils 69

Moteurs & réseaux sociaux

70

Et 2 conseils de lecture

Le mien• Le web, TOUT le web, est un espace public. AUCUNE « intimité » n’y est

possible. Au mieux peut-on espérer quelques infimes zones de privauté sur quelques parcelles d’espace semi-publics.

• « Quand la technologie devient l’architecte de notre intimité ». Hubert Guillaud in Internet Actu. En ligne : http://www.internetactu.net/2011/01/19/quand-la-technologie-devient-larchitecte-de-notre-intimite/

• « Scroogled » de Cory Doctorow. Trad. Française « Engooglés »

.Merci..?. questions .?. questions .?.

SAV : olivier.ertzscheid AT gmail.com

71