Infopresse cgt-final

53
CGT talk atInfopresse @cgtheoret La Révolution des données sociales

description

Presentation given in French at Infoopresse

Transcript of Infopresse cgt-final

Page 1: Infopresse cgt-final

CGT talk atInfopresse@cgtheoret

La Révolution des données sociales

Page 2: Infopresse cgt-final

Chaque minute:

• 48 hrs de vidéo sont téléchargées sur Youtube

• 320 nouveaux comptes et 98,000 tweets surTwitter

• 168,000,000 millions de courriels envoyés

• 20,000 nouveaux billets sur Tumblr

• 6,600 photos téléchargées sur Flickr

• De plus 20% de tous les site web sont des CMS/wordpress/etc…

@cgtheoret

Page 3: Infopresse cgt-final

@cgtheoret

Page 4: Infopresse cgt-final

@cgtheoret

Page 5: Infopresse cgt-final

@cgtheoret

Page 6: Infopresse cgt-final

@cgtheoret

Page 7: Infopresse cgt-final

@cgtheoret

Page 8: Infopresse cgt-final

@cgtheoret

Page 9: Infopresse cgt-final

@cgtheoret

Page 10: Infopresse cgt-final

@cgtheoret

Page 11: Infopresse cgt-final

Mais…

• Facebook a perdu 1,5 million d’utilisateurs aux Canada et 6 millions aux Etats-Unis

• Étude de Yahoo: 50% du contenu lu et partagé par des humains est généré par seulement 20 000 comptes

@cgtheoret

Page 12: Infopresse cgt-final

@cgtheoret

Page 13: Infopresse cgt-final

Alors, ce flux diluvien de données ne se mesure pas seulement à une échelle presque humainement inconcevable, il y a aussi plusieurs dynamiques internes qui entrent en cause et qui compliquent la compréhension…

@cgtheoret

Page 14: Infopresse cgt-final

@cgtheoret

Page 15: Infopresse cgt-final

@cgtheoret

Page 16: Infopresse cgt-final

Ceci est tellement compliqué que Standfordoffre maintenant un cours sur le sujet :

@cgtheoret

Page 17: Infopresse cgt-final

Qui est le professeur qui donne ces cours de statistiques et de marketing ?

Un physicien bien sûr…

Andreas Wiegend : avant d’accepter une position à Stanford, il était « Chief Data Scientist » chez Amazon. L’appellation « Social Data Revolution » lui appartient.

@cgtheoret

Page 18: Infopresse cgt-final

Facebook (et Zynga) sont assis sur la base de données sociologique la plus vaste et détaillée jamais créée par l’être humain.

Facebook possède toutes ces données et il ne les partage pas.

Cette base de données est utilisée exclusivement pour mieux vous vendre de la publicité et …?

@cgtheoret

Page 19: Infopresse cgt-final

Le cas du Robin des Bois des données sociales ?

Pete Warden

@cgtheoret

Page 20: Infopresse cgt-final

Pete Warden était un ingénieur chez Apple et a décidé de partir pour créer une startup…

La startup n’a pas fonctionné et dans son temps libre, il a développé un crawler de Facebook, légal, tout en utilisant leur API de développeur.

En 2010, son crawler a roulé pendant 6 mois et a recueilli de l’information sur 215 million d’utilisateurs, qu’il a regroupés par ville, état, etc., tout en conservant leur anonymat.

@cgtheoret

Page 21: Infopresse cgt-final

@cgtheoret

Page 22: Infopresse cgt-final

@cgtheoret

Page 23: Infopresse cgt-final

@cgtheoret

Page 24: Infopresse cgt-final

En 2010, LinkedIn a embauché une équipe de

17 personnes pour faire la même chose :

@cgtheoret

Page 25: Infopresse cgt-final

Mais est-ce qu’une personne ou une entreprise “normale” peut faire du sens de cette masse de données sans avoir recours à des équipes d’experts et d’énormes budgets ?

Il existe actuellement des centaines d’outils pour faire le « monitoring » des médias sociaux :

195 outils ici:

http://www.salesrescueteam.com/social-media-measurement-tools/

@cgtheoret

Page 26: Infopresse cgt-final

Il existe même un wiki qui répertorie 224 outils : http://wiki.kenburbary.com/

@cgtheoret

Page 27: Infopresse cgt-final

Mais même avec le succès monstre de certaines compagnies de « monitoring » :

Radian6 : 326 $millions / revenues ~20 $Millions

Sysomos : 34 $millions / revenues ~2 $Millions

Scoutlabs : 20$ millions / revenues ~1 $Millions

Postrank : acheté par Google, BackType : acheté par Twitter, ect…

@cgtheoret

Page 28: Infopresse cgt-final

@cgtheoret

Page 29: Infopresse cgt-final

@cgtheoret

Page 30: Infopresse cgt-final

Monitoring / Analyse• Les outils de « monitoring » présentent les

données du web social comme un tableau Excel:

– Une liste de “nodes”, i.e., billets de blogues, tweets, etc.

– Présenté en séquence, un après l’autre par ordre de date

– L’emphase est mise sur le temps réel – Cela fonctionne pour quelques dizaines, des

centaines de billets… mais que faire avec des milliers de billets ?

– Cela devient très cher et laborieux de faire du sens de tous ces billets

@cgtheoret

Page 31: Infopresse cgt-final

Monitoring / Analyse• La valeur ajoutée – supplémentaire -

dans les médias sociaux n’est pas dans les données brute, mais dans les connexions entre les personnes

Et entre les idées• C’est fondamentalement un réseau

…et un réseau = les relations

• Pour comprendre le réseau, il faut comprendre les relations

• Pour bien comprendre un élément dans les réseaux, il faut comprendre son contexte

@cgtheoret

Page 32: Infopresse cgt-final

Avec le « Social Graph » on peut calculer « qui parle à qui », « qui est connecté à qui », et possiblement où.

Mais on peut aller plus loin…

@cgtheoret

Page 33: Infopresse cgt-final

Avec plus d’informations et de calculs, on peut voir ce qui intéresse les gens et comment leurs intérêts sont liés…

Ceci est le deuxième défi

de Facebook :

« The interest graph »

Comment les idées et les conversations se connectent sur le web social.

@cgtheoret

Page 34: Infopresse cgt-final

@cgtheoret

Page 35: Infopresse cgt-final

Zeitgeist

@cgtheoret

Page 36: Infopresse cgt-final

Zeitgeist

@cgtheoret

Page 37: Infopresse cgt-final

« L’esprit de notre ère »

Esprit et ère : deux concepts qui sont difficilement mesurables…encore plus si on les

combine…

@cgtheoret

Page 38: Infopresse cgt-final

@cgtheoret

Page 39: Infopresse cgt-final

@cgtheoret

Page 40: Infopresse cgt-final

@cgtheoret

Page 41: Infopresse cgt-final

@cgtheoret

Page 42: Infopresse cgt-final

Ça mange quoi en hiver un « interest graph »?

Prenons un exemple concret.

Appelons le Réjean…

6’2’’, 35 ans, marié, habite Val D’Or…

Selon la recherche marketing traditionnelle…

@cgtheoret

Page 43: Infopresse cgt-final

@cgtheoret

Page 44: Infopresse cgt-final

@cgtheoret

Page 45: Infopresse cgt-final

@cgtheoret

Page 46: Infopresse cgt-final

@cgtheoret

Page 47: Infopresse cgt-final

Pourquoi faut-il une « personne spéciale » pour comprendre la révolution des données sociale ?

@cgtheoret

Page 48: Infopresse cgt-final

@cgtheoret

Page 49: Infopresse cgt-final

Pourquoi faut-il un physicien pour comprendre la révolution des données sociale ?

Parce qu’il n’est pas seulement un physicien!! Il comprend le comportement social humain…

@cgtheoret

Page 50: Infopresse cgt-final

@cgtheoret

Page 51: Infopresse cgt-final

@cgtheoret

Page 52: Infopresse cgt-final

@cgtheoret