Gestion des donnees personnelles.

71
Gestion des données personnelles Lyon-Montréal. 13 Mai 2011 Olivier Ertzscheid // Maître de conférences // Sciences de l’information et de la communication // Université de Nantes // IUT La Roche sur Yon Moteurs et réseaux sociaux Quelle clef de voûte pour une architecture de l’information ?

description

Conférence dans la cadre de l'école d'été en architecture de l'information. Moteurs et réseaux sociaux : quelle clef de voûte pour une architecture de l'information ?

Transcript of Gestion des donnees personnelles.

Page 1: Gestion des donnees personnelles.

Gestion des données

personnellesLyon-Montréal.

13 Mai 2011

Olivier Ertzscheid // Maître de conférences// Sciences de l’information et de la communication //

Université de Nantes // IUT La Roche sur YonSite : http://www.affordance.info

Moteurs et réseaux sociaux

Quelle clef de voûte pour une architecture de l’information ?

Page 2: Gestion des donnees personnelles.

Le pitch

• CONSTAT.– Le web : un gigantesque entrepôt de données en mouvement.– Dont des données « personnelles ». Beaucoup.– Les moteurs et les réseaux sociaux s’en nourrissent. – Nous les alimentons sans cesse.

• QUESTIONS.– Pourquoi ? – D’où viennent ces données ? – Comment sont-elles traitées ? Dans quel but ? – Comment les « données personnelles » en sont-elles venues à occuper

une telle place dans un média de masse numérique ? – Que changent-elles dans « les » pratiques documentaires ? Dans nos

représentations de la documentation et de l’information ?2

Page 3: Gestion des donnees personnelles.

PRÉAMBULE1934. 1978. 2011.

3

Page 4: Gestion des donnees personnelles.

1934. Paul Otlet. Traité de documentation.

4Architecture de l’information = « traitement documentaire »

Page 5: Gestion des donnees personnelles.

1978. Le projet SAFARI

• projet des années 70 d’interconnexion des administrations à partir d’un matricule commun dont le rejet avait été à l’origine de la loi "Informatique, fichiers et libertés" du 6 janvier 1978.

• http://www.legalis.net/breves-article.php3?id_article=870 5

INTERCONNEXION

Page 6: Gestion des donnees personnelles.

6

2011. La famille des données documentaires s’agrandit ...

Page 7: Gestion des donnees personnelles.

Plus qu’interconnectées, des données réunifiées

1995

2005

2011

Web public

Web privéWeb « invisible »

Web personnel(Desktop)

Web intime(Mail)

Web public Web privé

Web personnel(Desktop)

Web intime(Mail)

Web extime(blogs)

Web public Web privé

Web personnel(Desktop)

Web intime(Mail)

Web extime(blogs)

indexé

non-indexé

7

Dérive des continents documentaires, des « gisements de données »

Page 8: Gestion des donnees personnelles.

ARCHITECTURE DE

L’INFORMATION

8

Page 9: Gestion des donnees personnelles.

Architecture ?

9

« L’architecture, c’est ce qui reste de l’édifice, une fois la pierre ôtée. » Plotin.

Page 10: Gestion des donnees personnelles.

Architecture de l’information ?

10

« L’architecture de l’information, c’est ce qui reste une fois l’information ôtée. »

du systèmede la navigationde la recherchede l’infrastructuredes données

du systèmede la navigationde la recherchede l’infrastructuredes données

Page 11: Gestion des donnees personnelles.

Archi de l’info selon Google

• Une architecture de serveurs (datacenters)• Une architecture de pages (PageRank)• Une architecture de relations (liens entre

les pages)• Lectures industrielles

• Ecosystème ouvert (galaxie de services) et entonnoir central

• Une indexation d’info documentaires + ingénierie « de popularité » (procède par agglutination)

11

Archi de l’info selon Facebook

• Une architecture de serveurs (datacenters)• Une architecture de profils (graphe social) • Une architecture de relations (liens entre les

profils)• Industrialisation de l’intime

• Ecosystème fermé avec droit de douanes pour services tiers.

• Une collecte d’informations personnelles déclaratives + ingénierie virale (procède par contamination)

2 écoles ?

Similarités Différences

Page 12: Gestion des donnees personnelles.

12

Navigation

Données

Serveurs &Datacenters

Degré zéro de l’architecture de l’info

Services

Page 13: Gestion des donnees personnelles.

13

Architecture de l’info 2.0

Architecture de l’info 1.0

Le portail du visible

La clé vers l’invisible

Données

Données ???

Page 14: Gestion des donnees personnelles.

Architecture de l’info 2.0

14Navigation

Datacenters

Serveurs

Page 15: Gestion des donnees personnelles.

15

Architecture de l’info 2.0

Services

Services

Services

Page 16: Gestion des donnees personnelles.

16

Architecture de l’info 2.0

Données

Données

Données

Données

Page 17: Gestion des donnees personnelles.

17

Entre design ...(services, navigation, etc.)

Et industrie lourde(infrastructures, datacenters, gisements de données etc.)

Architecture de l’information

Page 18: Gestion des donnees personnelles.

DESIGN & FOUILLE DE DONNÉES

18

Page 19: Gestion des donnees personnelles.

Design visible• Ravalement de façade• Logos (colorés), Coins (arrondis),

Couleurs (pastels), Polices (typos), etc.

19

Design invisible• Ergonomie « souterraine »• Rich snippets, Microformats,

RDF• Web-Services• Web socio-sémantique

Expérience utilisateur. Clic gagnant

+

LOOK... and ... FEEL

Page 20: Gestion des donnees personnelles.

20

Design de données (exemples)

« Journalisme de données » http://data.owni.fr

Générateur de visualisations.http://www-958.ibm.com/software/data/cognos/manyeyes/

Nouvelle(s) expérience(s) documentaire(s)

Page 21: Gestion des donnees personnelles.

Fouille de données : du datamining au web-mining

21

Mr Google

Mr Facebook

données

Privacy zone

Page 22: Gestion des donnees personnelles.

22

Les nouvelles mines sont ... dans les nuages

Page 23: Gestion des donnees personnelles.

Données sont aussi des métadonnées

23

• Géolocalisation sur Foursquare + partage dans Facebook

– Données : latitude, longitude, horaire, nom du bar lounge.

– Métadonnées : comportementales

• Recherche d’info sur Google– Ma requête sur Google = donnée « mot-

clé »– Toutes mes requêtes sur Google

(historique) = métadonnées documentaires

Question de point de vue

Page 24: Gestion des donnees personnelles.

Avant, pendant, après. Des données sur tout. Des données partout. Des données pour tout.

24

A. Mes données et leur historique(déclaratives, comport. et techniques)

B. Les données de mes prochesCouche Ingénieries relationnelles

C. Les données de tout le mondePassage à l’échelle (statistique)

Mes données et celles de mes proches

(A and B)

Mes données ou celles de mes proches et

celles de tout le monde(A or B) and C

Mes données et celles de tout le monde

(A and C)

Les données de mes proches et celles de tout le monde

(B and C)

Sur un site marchand AMAZON.COM

Données « natives »« intentions d’achat »,

« préférences »

Sur un site marchand AMAZON.COM

Données « natives »« intentions d’achat »,

« préférences »

Sur un site social FACEBOOK.COM

Données « captives »Rétention

« amis, groupes, réseaux »

Sur un site social FACEBOOK.COM

Données « captives »Rétention

« amis, groupes, réseaux »

Dans 1 écosystème ouvert de sitesGOOGLE / YOUTUBE / GMAIL

Données natives et « moissonnées »

Dans 1 écosystème ouvert de sitesGOOGLE / YOUTUBE / GMAIL

Données natives et « moissonnées »

Que possèdent-ils ?? Des donnéesQue possèdent-ils ?? Des données

Qu’en font-ils ?? Des croisementsQu’en font-ils ?? Des croisements

Comment procèdent-ils ?? Par captationComment procèdent-ils ?? Par captation

Que produisent-ils ? D’autres données, de la richesse et de la redocumentarisationQue produisent-ils ? D’autres données, de la richesse et de la redocumentarisation

Page 25: Gestion des donnees personnelles.

1er exemple.

25

Page 26: Gestion des donnees personnelles.

26« Données »

1. Documents d’identité

Page 27: Gestion des donnees personnelles.

27

2. Documenter l’identité

« Information »

Page 28: Gestion des donnees personnelles.

28

3. « Redocumentariser » l’identité

« Redocumentariser, c’est documentariser à nouveau un document ou une collection en permettant à un bénéficiaire de réarticuler les contenus sémiotiques selon son interprétation et ses usages. » Manuel Zacklad in « Eléments théoriques pour l’étude des pratiques grand public de la documentarisation : réseaux et communautés d’imaginaire »

« connaissances »

Page 29: Gestion des donnees personnelles.

Redocumentarisation par l’exemple :Facebook EST L’interface

« 1 » identitédocumentéedocumentaire

« n » profils

« x » profondeurs

29

Page 30: Gestion des donnees personnelles.

LA GUERRE DES DONNÉES

30

Page 31: Gestion des donnees personnelles.

Données personnelles ?

31

DES DONNEES « Ensemble des informations qui permettent sous quelque forme que ce soit, directement ou

non, l’identification des personnes physiques auxquelles elles se rapportent ». DES TRAITEMENTS « toute opération ou ensemble d’opérations portant sur des données à caractère personnel,

quel que soit le procédé utilisé ». Collecte, enregistrement, conservation, adaptation, modification, extraction, consultation, utilisation, communication par transmission, diffusion ou toute autre forme de mise à disposition, le rapprochement ou l’interconnexion, ainsi que le verrouillage, l’effacement ou la destruction »

Lionel MAUREL

Techniques : Adresse IP, Cookies ...

Déclaratives : mon profil facebook, date de naissance ...

Navigationnelles : requêtes, types d’achats ...

Comportementales (diachroniques) : historique de recherche

Page 32: Gestion des donnees personnelles.

C’est la loi

32

INFORMATION. La loi impose d’informer les personnes « fichées » que des données nominatives les concernant sont collectéesDROIT DE RETRAIT. NON-DIVULGATION À DES TIERS.DATE LIMITE DE VALIDITÉ.

SOURCE : LIONEL MAUREL

C’est le business

Pot de terre des législations nationales contre ...(jack)pot de fer de la dérégulation des marchés

Page 33: Gestion des donnees personnelles.

Fichiers « log »A chaque fois qu’un utilisateur se connecte, le

serveur enregistre un log.

33

123.45.67.89 - 25/Mar/2007 10:15:32 - http://www.google.com/search?q=flowers - Firefox 2.0.0.7; Windows NT 5.1 - dac465aa86edd2dc

• « This idea that a cookie is nonpersonal information no longer really applies in this digital age. You don't need to know a person's name to know a person — to understand their likes and their dislikes, the contents of what they read, what they put in their shopping cart. It's really personal now. » Jeff Chester, directeur exécutif du Center for Digital Democracy

• Personna numerique VS DATA

COOKIES

De 2003 à 2005, Google cookie expirant en 2038 ...Préconisations G29 (rassemblement CNIL européennes) : 6 moisGoogle : Adresse IP « anonymisée » au bout de 9 mois (2 derniers chiffres seulement) Cookies supprimés au bout de 18 moisMicrosoft : cookies supprimés au bout de 6 mois

Petites machineries entre amis.

Page 34: Gestion des donnees personnelles.

Pacte Faustien ??

• Pourquoi cette quête de données personnelles ?– Pour lutter contre l’infobésité (personnalisation)– Pour maintenir un modèle économique (marketing ciblé, pub. contextuelle)– Pour améliorer l’expérience utilisateur (personnalisation) 34

Page 35: Gestion des donnees personnelles.

Participation

active ...

35

et massive

!!!

Page 36: Gestion des donnees personnelles.

Base de donnée des intentions (John Battelle)

36

« We don’t need taxonomy of knowledge. We need taxonomy of desire, a marketplace of intent » Prabhakar Raghavan.

Head of Research and Strategy chez Yahoo! Sept. 2008

Page 37: Gestion des donnees personnelles.

Le carré magique des usages

37

SHOPPING (digital

cameras)

HEALTH (Diabetes)

TRAVEL (United 875)

LOCAL (French

Restaurant)

Page 38: Gestion des donnees personnelles.

Rech

erch

e U

nive

rsel

le :

le p

rinci

pe

38

Page 39: Gestion des donnees personnelles.

• Données « personnelles, sociales » (mes amis, mes amours, mes emmerdes) ? Territoires de socialisation

• Données intentionnelles (achat, déplacement, sorties, restaurant) ? Territoire du marketing

• Données documentaires (textes, statuts, articles, photos, vidéos, tags ...) ? Territoire de la qualification 39

La guerre des données ?

Page 40: Gestion des donnees personnelles.

40

Page 41: Gestion des donnees personnelles.

2ème exemple.

41

Page 42: Gestion des donnees personnelles.

La guerre des carnets d’adresses

• Mais d’abord une devinette.• Bataille Google / Facebook. • Enjeu : amorçage.• Résultat : [email protected]• Courriel = cheval de troie idéal de nos

pratiques connectées. Pourquoi ?– "synthétise" notre réseau relationnel (nos "contacts"),– point d'entrée le plus aisé vers le cloud computing– "intime", "personnel » (pub contextuelle)– point pivot autour duquel hiérarchiser l'ensemble des

autres données

42

Page 43: Gestion des donnees personnelles.

3ème exemple. Le cas Facebook 43

Page 44: Gestion des donnees personnelles.

Facebook privacy policy timeline(cf http://www.eff.org/deeplinks/2010/04/facebook-timeline/)

44

« No personal information that you submit to Thefacebook will be available to any user of the Web Site who does not belong to at least one of the groups specified by you in your privacy settings »

2005 « Moi et les miens »

Page 45: Gestion des donnees personnelles.

45

We understand you may not want everyone in the world to have the information you share on Facebook; that is why we give you control of your information. Our default privacy settings limit the information displayed in your profile to your school, your specified local area, and other reasonable community limitations that we tell you about.

2006

Moi et ma communauté étenduePrivauté « par défaut »

2007

Profile information you submit to Facebook will be available to users of Facebook who belong to at least one of the networks you allow to access the information through your privacy settings (e.g., school, geography, friends of friends). Your name, school name, and profile picture thumbnail will be available in search results across the Facebook network unless you alter your privacy settings.

Arrivée du « search »Arrivée de l’opt-out

Page 46: Gestion des donnees personnelles.

Certain categories of information such as your name, profile photo, list of friends and pages you are a fan of, gender, geographic region, and networks you belong to are considered publicly available to everyone, including Facebook-enhanced applications, and therefore do not have privacy settings.

46

Information set to “everyone” is publicly available information, may be accessed by everyone on the Internet (including people not logged into Facebook), is subject to indexing by third party search engines, may be associated with you outside of Facebook (such as when you visit other sites on the internet), and may be imported and exported by us and others without privacy limitations. The default privacy setting for certain types of information you post on Facebook is set to “everyone.” You can review and change the default settings in your privacy settings

Nov.2009

Abolition de la frontière « plateforme »Opt-out systématique et étendu

Abolition pure et simple de la privauté « profilaire », « identitaire »

Déc.2009

Page 47: Gestion des donnees personnelles.

4ème exemple. Syndrome de Blanche-Neige

© http://www.radidesigners.com/miroir1.htm

47

Page 48: Gestion des donnees personnelles.

L’illusion de la page blanche

48

Page 49: Gestion des donnees personnelles.

Le syndrôme de Blanche-Neige

49

Page 50: Gestion des donnees personnelles.

Attention !!!!!

50

Page 51: Gestion des donnees personnelles.

Pêché originel

cherche …

51

Page 52: Gestion des donnees personnelles.

Moi …

52

Page 53: Gestion des donnees personnelles.

CONSÉQUENCES

53

Pour ...

Page 54: Gestion des donnees personnelles.

Mon nom est personne

• Personnalisation :– « Invisible »– « Persistante »– « Participative »

54Pour l’individu

Page 55: Gestion des donnees personnelles.

Une « universalité »

trèstrèstrès

« personnalisée »

ALGORITHMIE AMBIANTE

55Pour « la société »

Page 56: Gestion des donnees personnelles.

Facebook comme nouveau panopticon.

56

Surveillance ET sous-veillance.LITTLE SISTERS

Pour les « communautés »

Page 57: Gestion des donnees personnelles.

Cocktail explosifPersonnalisation

+ « universalité » des recherches+ Migration dans les nuages+ Massification (des accès)+ Communautarisation (des pratiques)+ Économie de l’attention+ Confusion des pratiques

57

=Pour les enjeux documentaires

Page 58: Gestion des donnees personnelles.

• Ce que l’on savait déjà :– Explosion de la masse documentaire

• Ce que l’on ne savait pas : – Bombe à fragmentation

• Fragmentation– Des documents (world wide web)– Des usages– Des synchronicités (world life web)– Des modalités

• de diffusion, d’appropriation, d’édition …

BOUM !

58Pour les enjeux documentaires

Page 59: Gestion des donnees personnelles.

59

Page 60: Gestion des donnees personnelles.

5ème et 6ème exemples.

60

Page 61: Gestion des donnees personnelles.

Moteur de recherche « de voisinage »

61

Everyblock.com / http://chicago.everyblock.com/news/

Adresse / numéro de sécurité sociale / historique déménagements et changements d'adresse depuis 10 ans / Date de naissance / Casier judiciaire / Diverses amendes / Dates mariages et divorces / le nom et n° tél voisins / Montant du bien immobilier qu'il possède (sa maison), sa date d'achat et le nom de celui qui lui a vendu / la taille du "lot" (cadastre) sur lequel elle (sa maison) est implantée / une vue satellite de chez lui / Âge moyen des femmes et des hommes habitant dans son voisinage / Nombre de meurtres, de viols, de vols de véhicule et autres larcins dans son quartier / Composition ethnique du quartier / Niveau d'éducation et les langues parlées / les permis qu'il possède (permis de conduire mais aussi permis bateau, avion, moto, etc ...)

Page 62: Gestion des donnees personnelles.

http://www.Intelius.com

62

"Nous cherchons dans des milliards de données publiques pour vous aider à trouver ce que vous cherchez. Nous analysons des listes de vente, des commandes sur catalogue, des abonnements à des magazines, des enregistrements d'adresse, des enregistrements de propriété immobilière, des arrêts de cour (...) et toute une série d'autres enregistrements publics et de sources publiques pour vous."

Page 63: Gestion des donnees personnelles.

CONCLUSION

1 constat. 1 morale. 2 questions. 3 conseils.

63

Page 64: Gestion des donnees personnelles.

64

information

connaissanceconnaissance

Documents

individus

DONNÉESDONNÉES

Changement de perspective

"nous sommes en train de passer d'un web de documents connectés à un web de données connectées." John Markoff. NY Times. 12 No. 2006 http://www.nytimes.com/2006/11/12/business/12web.html

DONNÉES

Traitement documentaire Traitement computationnel

Page 65: Gestion des donnees personnelles.

Moralité ?

• Pour les moteurs …• Pour les réseaux sociaux

« un document »

Indexable, cherchable, Profilable, « monétisable » …

65

Page 66: Gestion des donnees personnelles.

66

« L’antilope qui court dans les plaines d’Afrique ne peut être considérée comme un document…»

« Mais si elle est capturée… et devient un objet d’études, on la considère alors comme un document. Elle devient une preuve physique. » Suzanne Briet

Page 67: Gestion des donnees personnelles.

67

Quelle clé de voûte pour l’architecture de l’information ?

?

Page 68: Gestion des donnees personnelles.

requêtes

profils

usages

Documents

informations

Individus

d o n n é e s

d o n n é e s

d o n n é e s

d o

n n

é e

s

d o n n é e s

d o n n é e s

d o n n é e s

d o n n é e s

d o n n é e s

Page 69: Gestion des donnees personnelles.

Quel écosystème informationnel ?

Indexation

Mer des pratiques

Moteurs & réseaux sociaux

Monétisation

Océan des données

Collaboration, participation,

User Generated Content

Résultats

Technologies de la capillarité

Comportements, profils 69

Moteurs & réseaux sociaux

Page 70: Gestion des donnees personnelles.

70

Et 2 conseils de lecture

Le mien• Le web, TOUT le web, est un espace public. AUCUNE « intimité » n’y est

possible. Au mieux peut-on espérer quelques infimes zones de privauté sur quelques parcelles d’espace semi-publics.

• « Quand la technologie devient l’architecte de notre intimité ». Hubert Guillaud in Internet Actu. En ligne : http://www.internetactu.net/2011/01/19/quand-la-technologie-devient-larchitecte-de-notre-intimite/

• « Scroogled » de Cory Doctorow. Trad. Française « Engooglés »

Page 71: Gestion des donnees personnelles.

.Merci..?. questions .?. questions .?.

SAV : olivier.ertzscheid AT gmail.com

71