2013 smrf-nodexl-sna-socialmedia-fr version -130320011951-phpapp01-1 2

Post on 04-Dec-2014

594 views 0 download

description

Présentation française de l'outil d'analyse des réseaux sociaux NodeXL de la fondation SMR du Dr Marc Smith. Traduit et adapté par M. Cyrille Papon, doctorat à l'ED 509 de l'université du sud Toulon Var, membre du laboratoire I3M & IRENav.

Transcript of 2013 smrf-nodexl-sna-socialmedia-fr version -130320011951-phpapp01-1 2

Marc A. SmithDocteur en sciences humaines et socialesGroupe “Connected Action Consulting”marc@connectedaction.nethttp://www.connectedaction.nethttp://nodexl.codeplex.com/

Un projet de la fondation de recherche sur les médias sociaux: http://www.smrfoundation.org

Etablir une bibiothèque des relations sur les médias sociaux:

Elaborer des graphes relationnels et effectuer des mesures à l’aide

de NodeXL

Translated & adapted in french by Cyrille Papon - PhD student in SOCMINT / SONEINT – AMISNI Project – TLN Univ/I3M/IRENav/FMES

Traduit et adapté en français par Cyrille Papon – étudiant en thèse SIC en R2SI / RMSI – projet MAR2SI – Univ TLN/I3M/IRENav/FMES

About Me

Qui suis-je ?

Marc A. SmithDocteur en sciences humaines et socialesGroupe “Connected Action Consulting”

Marc@connectedaction.nethttp://www.connectedaction.nethttp://www.codeplex.com/nodexlhttp://www.twitter.com/marc_smithhttp://delicious.com/marc_smith/Paper http://www.flickr.com/photos/marc_smithhttp://www.facebook.com/marc.smith.sociologisthttp://www.linkedin.com/in/marcasmithhttp://www.slideshare.net/Marc_A_Smithhttp://www.smrfoundation.org

La fondation de recherche sur les médias sociauxhttp://smrfoundation.org

Les réseaux & médias sociaux(email, Facebook, Twitter, YouTube, and more) sont faits deconnections

d’individu

à individu.

4

Des traces sont laissées derrière

nous

5

Il y a toute sorte de relations….

http://www.flickr.com/photos/stevendepolo/3254238329

Aimer, relier, répondre, évaluer, introduire, apprécier, l’amitié, suivre, transférer, éditer, tagger, commenter, vérifier…

Le vocabled’Internet

World Wide Web

Chacun d’entre-eux contenant un ou plusieurs

réseaux sociaux

Localisation, localisation,Localistation

Position, Position, Position

http://www.flickr.com/photos/fullaperture/81266869/

La force des liens faibles

Réseaux sociaux

• Histoire: Une certaine antériorité.

• Théorie et méthode: 1934 ->

• Jacob L. Moreno

• http://en.wikipedia.org/wiki/Jacob_L._Moreno

Jacob Moreno’s early social network diagram of positive and negative relationships among members of a football team.

Originally published in Moreno, J. L. (1934). Who shall survive? Washington, DC: Nervous and Mental Disease Publishing Company.

A nearly social network diagram of relationships among workers in a factory illustrates the positions different workers occupy within the workgroup.

Originally published in Roethlisberger, F., and Dickson, W. (1939). Management andthe worker. Cambridge, UK: Cambridge University Press.

Introduction to NodeXL

Like MSPaint™ for graphs.— the Community

PublicationVisualisationAnalyseRéservoirsFournisseurs

Analyse du flux de données

http://www.flickr.com/photos/badgopher/3264760070/

Fournisseurs de données

Fournisseurs

http://www.flickr.com/photos/druclimb/2212572259/in/photostream/

Réservoirs de données

Réservoir

Analyse de données

http://www.flickr.com/photos/hchalkley/47839243/

Analyse

Visualisation de données

http://www.flickr.com/photos/rvwithtito/4236716778

Visualisation

http://www.flickr.com/photos/62693815@N03/6277208708/

Publication de données

Publication

Ce que les graphes des réseaux sociaux révèlent

Les influenceurs sur chaque sujet.

Les clusters.

Les hubs.

Les hubs

Les ponts

Les îles

http://www.flickr.com/photos/storm-crypt/3047698741

http://www.flickr.com/photos/library_of_congress/3295494976/sizes/o/in/photostream/

Les clusters

http://www.flickr.com/photos/amycgx/3119640267/

Les foules

Réseaux de connections sur le Hashtag “#Debate AND Obama” mentionnant les utilisateurs Twitter

Dian

e a u

n de

gré

impo

rtant

Heather a une

forte interm

édiarité

Un réseau simple peut illustrer les différentes valeurs

que peuvent prendre les noeuds du réseau: centralité

et dégré

NodeXL : Add-on pour Excel 2007/2010/2013 pour la découverte et exploration des principales caractéristiques du réseau

6 types d’architecture réseau sur Twitter

POLARISEE: Deux clusters denses avec peu d’interconnexions

INTER-RESEAU: Des clusters identifiés et isolés, avec des interconnexions

importantes.

SUJET PUBLIC/MARKETING: De nombreux clusters isolés en petits

groupes faiblement interconnectés.

BAZAAR: De nombreux clusters de taille moyenne, certains si

isolés.

DIFFUSION: Un hub qui est retweeté par de nombreux abonnés non

interconnectés.

SUPPORT: Un hub qui répond à de nombreux abonnés non

interconnectés.

#My2K

Architecture polarisée

#CMgrChat

Architecture en groupes/communautés

Lumia

Architecture de sujet d’actualité/de marque

#FLOTUS

Architecture “en bazar”

New York Times ArticlePaul Krugman

Architecture “diffusion” (audience et communauté)

Dell Listens/Dellcares

Architecture de support/entretien

• Principe majeur : les structures sociales émergent de l’ensemble des relations parmi les individus d’une population.

• Phénomène d’intérêt : l’émergence des groupes ou des clusters à partir de configurations de relations entre les individus – centralité (noyau), périphérie (noeuds isolés), proximité, diamètre, intermédiarité.

• Methodes : enquêtes, interviews, observations, analysis de fichiers, calcul matriciel

(Hampton &Wellman, 1999; Paolillo, 2001; Wellman, 2001)

Source: Richards, W. (1986). The NEGOPY network analysis program. Burnaby, BC: Department of Communication, Simon Fraser University. pp.7-16

La théorie des réseauxhttp://en.wikipedia.org/wiki/Social_network

L’analyse des réseaux• “Node/vertex” ou noeud

– acteur sur lequel la relation agit; réseau orienté ou non-orienté.• “Edge/link” ou lien

– Relation connectant les noeuds; peut être directionnel.• “Cohesive Sub-Group” ou cluster

– Groupe fortement connecté ou cluster.• “Key Metrics” ou principales mesures

– “Centrality” ou centralité (mesure individuelle ou pour un groupe)• Nombre de connections directes qu’un individu possède avec les autres individus dans un groupe

(généralement à partir des connexions entrantes) ;• Mesure au niveau individuel (noeud) ou au niveau du groupe (composant connecté ou cluster).

– “Average shortest path” ou diamètre (mesure pour un groupe)• Facilité avec laquelle un réseau se connecte et s’interconnecte ;• Série de mesure calculant le chemin le plus court entre les pairs de noeuds au niveau du réseau,

reflètant la distance moyenne du réseau. – “Density” ou densité (group measure)

• Robustesse du réseau ;• Nombre de connexions qui existe au sein d’un groupe par rapport au nombre maximum de

connexions.– “Betweenness” ou intermédiarité (mesure individuelle)

• Nombre de chemins les plus courts entre chaque pair de noeuds incluant le noeud concerné ;• Mesure au niveau individuel (du noeud)

• “Node roles” ou rôle des noeuds– Periphérique – en-deça de la centralité moyenne du réseau– Noeud central – au-dessus de la centralité moyennedu réseau– Broker – au-dessus de l’intermédiarité moyennedu réseau

E

D

F

A

CB

H

G

IC

D

E

A B D E

NodeXL : Une extension gratuite d’Excel 2007/10/13 pour l’analyse des réseaux sociaux

Simplifier l’emploi de la théorie des graphes en produisant un graphe complet, avec des mesures intégrées.

http://www.youtube.com/watch?v=0M3T65Iw3Ac

Nod

eXL

en v

ideo

NodeXL en video

Le but: simplifier l’analyse des réseaux sociaux

• Les outils d’analyse des réseaux sociaux existants sont complexes pour les utilisateurs débutants ;

• Les outils comme Excel sont largement employés ;

• La production d’un tableur hôte pour l’analyse des réseaux sociaux facilite l’analyse et la visualisation des données.

Réseau Twitter de la communauté de recherche de Microsoft*AVANT*

Réseau Twitter de la communauté de recherche de Microsoft*APRES*

Simplification des motifs du réseau

Cody Dunne, University of Maryland

Une BDD réseaux sociaux

“NodeXL Graph Gallery”

Disponible

Les communautés

dans le cyberespace

This graph represents a directed network of 1,360 Twitter users whose recent tweets contained "contraceptive OR contraception". The network was obtained on Friday, 08 June 2012 at 13:22 UTC. There is an edge for each follows relationship. There is

an edge for each "replies-to" relationship in a tweet. There is an edge for each "mentions" relationship in a tweet. There is a self-loop edge for each tweet that is

not a "replies-to" or "mentions". The tweets were made over the 2-day period from Thursday, 07 June 2012 at 18:46 UTC to Friday, 08 June 2012 at 13:06 UTC. The

graph's vertices were grouped by cluster using the Clauset-Newman-Moore cluster algorithm. The edge colors are based on relationship values. The vertex sizes are based on each user’s number of followers. Table 1 reports the summary network

metrics that describe the graph.

Production NodeXL: Synthèse réseau

Une synthèse contextuelle

Un graphe complet

Production NodeXL: mesures du réseau

Cette feuille de calcul liste les sommets (comptes Twitter) qui ont contribué au Tweet contenant les termes

“contraception OR contraceptives” durant 2 jours en juin 2012. Les utilisateurs sont classés en fonction de la

“centralité d’intermédiarité” calculée par rapport au niceau de suivi, de réponse, et de mention des arêtes. Inclu les comptes Twitter: @thinkprogress, @gatesfoundation,

@SandraFluke, @maleeek, @Change, @foxandfriends, @melindagates, @AshleyJudd, @cnalive, and @SOHLTC.

Welser, Howard T., Eric Gleave, Danyel Fisher, and Marc Smith. 2007. Visualizing the Signatures of Social Roles in Online Discussion Groups. The Journal of Social Structure. 8(2).

Experts and “Answer People”

Discussion starters, Topic setters

Discussion people, Topic setters

Visualisation: “Architecture” des réseaux

NodeXL & calcul des principales mesures en analyse réseau et textuelle

Paramètres d’analyse réseau

Paramètres d’analyse textuelle

Mise en contraste des groupes relationnels

Le contenu de la synthèse de la feuille de calcul NodeXL montre les URL’s les plus fréquentes, les hashtags les plus fréquents, et les comptes abonnées les plus importants à l’intérieur du réseau et des sous-groupes du réseau.

Mise en contraste des “hashtags” entre les groupes 2 &4

Mise en contraste des liens URL

Mise en contraste des pairs de mots

Mise en contraste des noeuds de relations inter-groupes au sein du réseau

Le ruban Excel de NodeXL

Import depuis les réseaux sociaux Facebook, Twitter,

Flickr et You Tube

Import des données à l’aide de NodeXL

Example d’import de données depuis le réseau social Twitter –

mode recherche Twitter

Paramètres de téléchargement des données : suivi des relations – suivi des réponses – suivi des mentions –

suivi des Tweets

Paramètres de limitation des noeuds du réseau, des Tweets et de

statistiques

Import de liens issus de la recherche Twitter

NodeXL permet de produire et d’extraire ici les sous-graphes de chaque noeud.

Elaboration des noeuds du réseau

Automatisation

Effectuer des analyses se

manière automatisée et simple, en juste

un clic

Simplification de l’automatisation de l’analyse

NodeXL Network Metrics

Mesures – théorie des graphes

Calcul des degrés

Calcul de la centralité

PageRank, clustering, etc…

Paramétrage des données à visualiser dans le graphe

Paramétrage des sous-graphes des noeuds du graphe

Niveau des relationsDes sous-graphes

Paramétrage des flitres dynamiques des paramètres du réseau

Automatisation des mesures du réseau

Visualisation du réseau

Visualisation du réseau

• Développer le “FireFox des fichiers type GraphML” de l’analyse des réseaux sociaux, avec des outils simples et facilement exploitables ;

• Connecter les utilisateurs de l’analyse des réseaux sociaux en facilitant la lecture et la compréhension des graphes ;

• Permettre aux chercheurs de se consulter et de travailler sur des bases de données importantes ;

• Collecter et rassembler une large base de données en analyse des réseaux sociaux par les utilisateurs eux-mêmes ;

• Créer un accès libre aux publications et aux moteurs de recherche ;

• Rendre les “collections de connexions” facile à employer pour les utilisateurs.

Qu’est ce que la SRM tente de réaliser: l’accès à des outils en source ouverte, facilité le libre-accès aux données et favoriser une formation….

• L’add-on d’Excel: NodeXL• Fournisseurs de données (“spigots”)

– ThreadMill Message Board– Exchange Enterprise Email– Voson Hyperlink– SharePoint– Facebook– Twitter– YouTube– Flickr

Ce que la fondation SRM a déjà réalisé : des outils d’analyse des réseaux sociaux

• Une bibliothèque de fichiers d’analyse des réseaux sociaux:

NodeXLGraphGallery.org

– Une collection de graphes réseaux, de sets de données et de commentaires publiés par les utilisteurs ;

– Une base de donnée collective disponible pour la communauté de recherche ;

– Des collections de données publiées sur un large panel de sujets facilitant le travail des étudiants et des chercheurs dans le domaine de l’analyse des réseaux sociaux.

Ce que la fondation SRM a déjà réalisé : des données facilement accessible

• Webshop 2011, 2012: NSF, Google, Intel, Yahoo– 4 Days, 55 Students, 20 Speakers

• Other Workshops: – ICWSM12, NetSci, HyperText12, Cape

Town, Korea, Italy, Russia

Ce que la fondation SRM a déjà réalisé : un réseau de recherche universitaire et privé au profit du savoir

Ce que la fondation SRM a déjà réalisé :

un réseau de recherche

universitaire et privé au profit du

savoir

Ce que la fondation SRM souhaite réaliser: développer des outils pour construire une cartographie des réseaux sociaux de l’Internet

• Porter NodeXL vers le Web: (Node[NOT]XL)– NodeXL pour les feuilles de calcul de GoogleDocs ?– WebGL Canvas? D3.JS? Sigma.JS ?

• Se connecter à d’ autres sources de données:– RDF, MediaWikis, Gmail, NYT, Citation Networks

• Résoudre les problèmes de manipulations réseaux via l’interface utilisateur:– Transformation modale, séries temporelles, affichages automatiques

• Développer et maintenir les archives des collections de sets de données des réseaux sociaux pour la recherche.

• Améliorer la formation en science des réseaux:– Groupes de travail sur l’analyse des réseaux sociaux– Présentations et lectures au travers de sessions en public– Vidéos et supports de formation à disposition des utilisateurs

Comment vous pouvez contribuer à ce projet ?

• Sponsoriser une capacité du projet NodeXL• Sponsoriser les groupes de travail• Sponsoriser le travail d’un étudiant• Planifier des formations• Sponsoriser la fondation SRM• Apporter votre soutien au projet : financier,

programmation, stockage, formation, données, etc…

• Soutenir le travail de la fondation SRM

Marc A. SmithDocteur en sciences humaines et socialesGroupe “Connected Action Consulting”marc@connectedaction.nethttp://www.connectedaction.nethttp://nodexl.codeplex.com/

Un projet de la fondation de recherche sur les médias sociaux: http://www.smrfoundation.org

Etablir une bibiothèque des relations sur les médias sociaux:

Elaborer des graphes relationnels et

effectuer des mesures à l’aide de NodeXL

Translated & adapted in french by Cyrille Papon - PhD student in SOCMINT / SONEINT – AMISNI Project – TLN Univ/I3M/IRENav/FMES

Traduit et adapté en français par Cyrille Papon – étudiant en thèse SIC en R2SI / RMSI – projet MAR2SI – Univ TLN/I3M/IRENav/FMES