Infopresse cgt-final

Post on 02-Jul-2015

7.874 views 3 download

description

Presentation given in French at Infoopresse

Transcript of Infopresse cgt-final

CGT talk atInfopresse@cgtheoret

La Révolution des données sociales

Chaque minute:

• 48 hrs de vidéo sont téléchargées sur Youtube

• 320 nouveaux comptes et 98,000 tweets surTwitter

• 168,000,000 millions de courriels envoyés

• 20,000 nouveaux billets sur Tumblr

• 6,600 photos téléchargées sur Flickr

• De plus 20% de tous les site web sont des CMS/wordpress/etc…

@cgtheoret

@cgtheoret

@cgtheoret

@cgtheoret

@cgtheoret

@cgtheoret

@cgtheoret

@cgtheoret

@cgtheoret

Mais…

• Facebook a perdu 1,5 million d’utilisateurs aux Canada et 6 millions aux Etats-Unis

• Étude de Yahoo: 50% du contenu lu et partagé par des humains est généré par seulement 20 000 comptes

@cgtheoret

@cgtheoret

Alors, ce flux diluvien de données ne se mesure pas seulement à une échelle presque humainement inconcevable, il y a aussi plusieurs dynamiques internes qui entrent en cause et qui compliquent la compréhension…

@cgtheoret

@cgtheoret

@cgtheoret

Ceci est tellement compliqué que Standfordoffre maintenant un cours sur le sujet :

@cgtheoret

Qui est le professeur qui donne ces cours de statistiques et de marketing ?

Un physicien bien sûr…

Andreas Wiegend : avant d’accepter une position à Stanford, il était « Chief Data Scientist » chez Amazon. L’appellation « Social Data Revolution » lui appartient.

@cgtheoret

Facebook (et Zynga) sont assis sur la base de données sociologique la plus vaste et détaillée jamais créée par l’être humain.

Facebook possède toutes ces données et il ne les partage pas.

Cette base de données est utilisée exclusivement pour mieux vous vendre de la publicité et …?

@cgtheoret

Le cas du Robin des Bois des données sociales ?

Pete Warden

@cgtheoret

Pete Warden était un ingénieur chez Apple et a décidé de partir pour créer une startup…

La startup n’a pas fonctionné et dans son temps libre, il a développé un crawler de Facebook, légal, tout en utilisant leur API de développeur.

En 2010, son crawler a roulé pendant 6 mois et a recueilli de l’information sur 215 million d’utilisateurs, qu’il a regroupés par ville, état, etc., tout en conservant leur anonymat.

@cgtheoret

@cgtheoret

@cgtheoret

@cgtheoret

En 2010, LinkedIn a embauché une équipe de

17 personnes pour faire la même chose :

@cgtheoret

Mais est-ce qu’une personne ou une entreprise “normale” peut faire du sens de cette masse de données sans avoir recours à des équipes d’experts et d’énormes budgets ?

Il existe actuellement des centaines d’outils pour faire le « monitoring » des médias sociaux :

195 outils ici:

http://www.salesrescueteam.com/social-media-measurement-tools/

@cgtheoret

Il existe même un wiki qui répertorie 224 outils : http://wiki.kenburbary.com/

@cgtheoret

Mais même avec le succès monstre de certaines compagnies de « monitoring » :

Radian6 : 326 $millions / revenues ~20 $Millions

Sysomos : 34 $millions / revenues ~2 $Millions

Scoutlabs : 20$ millions / revenues ~1 $Millions

Postrank : acheté par Google, BackType : acheté par Twitter, ect…

@cgtheoret

@cgtheoret

@cgtheoret

Monitoring / Analyse• Les outils de « monitoring » présentent les

données du web social comme un tableau Excel:

– Une liste de “nodes”, i.e., billets de blogues, tweets, etc.

– Présenté en séquence, un après l’autre par ordre de date

– L’emphase est mise sur le temps réel – Cela fonctionne pour quelques dizaines, des

centaines de billets… mais que faire avec des milliers de billets ?

– Cela devient très cher et laborieux de faire du sens de tous ces billets

@cgtheoret

Monitoring / Analyse• La valeur ajoutée – supplémentaire -

dans les médias sociaux n’est pas dans les données brute, mais dans les connexions entre les personnes

Et entre les idées• C’est fondamentalement un réseau

…et un réseau = les relations

• Pour comprendre le réseau, il faut comprendre les relations

• Pour bien comprendre un élément dans les réseaux, il faut comprendre son contexte

@cgtheoret

Avec le « Social Graph » on peut calculer « qui parle à qui », « qui est connecté à qui », et possiblement où.

Mais on peut aller plus loin…

@cgtheoret

Avec plus d’informations et de calculs, on peut voir ce qui intéresse les gens et comment leurs intérêts sont liés…

Ceci est le deuxième défi

de Facebook :

« The interest graph »

Comment les idées et les conversations se connectent sur le web social.

@cgtheoret

@cgtheoret

Zeitgeist

@cgtheoret

Zeitgeist

@cgtheoret

« L’esprit de notre ère »

Esprit et ère : deux concepts qui sont difficilement mesurables…encore plus si on les

combine…

@cgtheoret

@cgtheoret

@cgtheoret

@cgtheoret

@cgtheoret

Ça mange quoi en hiver un « interest graph »?

Prenons un exemple concret.

Appelons le Réjean…

6’2’’, 35 ans, marié, habite Val D’Or…

Selon la recherche marketing traditionnelle…

@cgtheoret

@cgtheoret

@cgtheoret

@cgtheoret

@cgtheoret

Pourquoi faut-il une « personne spéciale » pour comprendre la révolution des données sociale ?

@cgtheoret

@cgtheoret

Pourquoi faut-il un physicien pour comprendre la révolution des données sociale ?

Parce qu’il n’est pas seulement un physicien!! Il comprend le comportement social humain…

@cgtheoret

@cgtheoret

@cgtheoret

@cgtheoret