2013 smrf-nodexl-sna-socialmedia-fr version -130320011951-phpapp01-1 2
-
Upload
cyrille-papon -
Category
Social Media
-
view
594 -
download
0
description
Transcript of 2013 smrf-nodexl-sna-socialmedia-fr version -130320011951-phpapp01-1 2
Marc A. SmithDocteur en sciences humaines et socialesGroupe “Connected Action Consulting”[email protected]://www.connectedaction.nethttp://nodexl.codeplex.com/
Un projet de la fondation de recherche sur les médias sociaux: http://www.smrfoundation.org
Etablir une bibiothèque des relations sur les médias sociaux:
Elaborer des graphes relationnels et effectuer des mesures à l’aide
de NodeXL
Translated & adapted in french by Cyrille Papon - PhD student in SOCMINT / SONEINT – AMISNI Project – TLN Univ/I3M/IRENav/FMES
Traduit et adapté en français par Cyrille Papon – étudiant en thèse SIC en R2SI / RMSI – projet MAR2SI – Univ TLN/I3M/IRENav/FMES
About Me
Qui suis-je ?
Marc A. SmithDocteur en sciences humaines et socialesGroupe “Connected Action Consulting”
[email protected]://www.connectedaction.nethttp://www.codeplex.com/nodexlhttp://www.twitter.com/marc_smithhttp://delicious.com/marc_smith/Paper http://www.flickr.com/photos/marc_smithhttp://www.facebook.com/marc.smith.sociologisthttp://www.linkedin.com/in/marcasmithhttp://www.slideshare.net/Marc_A_Smithhttp://www.smrfoundation.org
La fondation de recherche sur les médias sociauxhttp://smrfoundation.org
Les réseaux & médias sociaux(email, Facebook, Twitter, YouTube, and more) sont faits deconnections
d’individu
à individu.
4
Des traces sont laissées derrière
nous
5
Il y a toute sorte de relations….
http://www.flickr.com/photos/stevendepolo/3254238329
Aimer, relier, répondre, évaluer, introduire, apprécier, l’amitié, suivre, transférer, éditer, tagger, commenter, vérifier…
Le vocabled’Internet
“Lien de l’esprit”Noeuds & Liens
est lié à
A B
World Wide Web
Chacun d’entre-eux contenant un ou plusieurs
réseaux sociaux
Localisation, localisation,Localistation
Position, Position, Position
Liens faibles
http://www.flickr.com/photos/fullaperture/81266869/
La force des liens faibles
Réseaux sociaux
• Histoire: Une certaine antériorité.
• Théorie et méthode: 1934 ->
• Jacob L. Moreno
• http://en.wikipedia.org/wiki/Jacob_L._Moreno
Jacob Moreno’s early social network diagram of positive and negative relationships among members of a football team.
Originally published in Moreno, J. L. (1934). Who shall survive? Washington, DC: Nervous and Mental Disease Publishing Company.
A nearly social network diagram of relationships among workers in a factory illustrates the positions different workers occupy within the workgroup.
Originally published in Roethlisberger, F., and Dickson, W. (1939). Management andthe worker. Cambridge, UK: Cambridge University Press.
Introduction to NodeXL
Like MSPaint™ for graphs.— the Community
PublicationVisualisationAnalyseRéservoirsFournisseurs
Analyse du flux de données
http://www.flickr.com/photos/badgopher/3264760070/
Fournisseurs de données
Fournisseurs
http://www.flickr.com/photos/druclimb/2212572259/in/photostream/
Réservoirs de données
Réservoir
Analyse de données
http://www.flickr.com/photos/hchalkley/47839243/
Analyse
Visualisation de données
http://www.flickr.com/photos/rvwithtito/4236716778
Visualisation
http://www.flickr.com/photos/62693815@N03/6277208708/
Publication de données
Publication
Ce que les graphes des réseaux sociaux révèlent
Les influenceurs sur chaque sujet.
Les clusters.
Les hubs.
Les hubs
Les ponts
Les îles
http://www.flickr.com/photos/storm-crypt/3047698741
http://www.flickr.com/photos/library_of_congress/3295494976/sizes/o/in/photostream/
Les clusters
http://www.flickr.com/photos/amycgx/3119640267/
Les foules
Réseaux de connections sur le Hashtag “#Debate AND Obama” mentionnant les utilisateurs Twitter
Dian
e a u
n de
gré
impo
rtant
Heather a une
forte interm
édiarité
Un réseau simple peut illustrer les différentes valeurs
que peuvent prendre les noeuds du réseau: centralité
et dégré
NodeXL : Add-on pour Excel 2007/2010/2013 pour la découverte et exploration des principales caractéristiques du réseau
6 types d’architecture réseau sur Twitter
POLARISEE: Deux clusters denses avec peu d’interconnexions
INTER-RESEAU: Des clusters identifiés et isolés, avec des interconnexions
importantes.
SUJET PUBLIC/MARKETING: De nombreux clusters isolés en petits
groupes faiblement interconnectés.
BAZAAR: De nombreux clusters de taille moyenne, certains si
isolés.
DIFFUSION: Un hub qui est retweeté par de nombreux abonnés non
interconnectés.
SUPPORT: Un hub qui répond à de nombreux abonnés non
interconnectés.
#My2K
Architecture polarisée
#CMgrChat
Architecture en groupes/communautés
Lumia
Architecture de sujet d’actualité/de marque
#FLOTUS
Architecture “en bazar”
New York Times ArticlePaul Krugman
Architecture “diffusion” (audience et communauté)
Dell Listens/Dellcares
Architecture de support/entretien
#occupywallstreet15 Novembre 2011
#teaparty15 Novembre 2011
http://www.newscientist.com/blogs/onepercent/2011/11/occupy-vs-tea-party-what-their.html
• Principe majeur : les structures sociales émergent de l’ensemble des relations parmi les individus d’une population.
• Phénomène d’intérêt : l’émergence des groupes ou des clusters à partir de configurations de relations entre les individus – centralité (noyau), périphérie (noeuds isolés), proximité, diamètre, intermédiarité.
• Methodes : enquêtes, interviews, observations, analysis de fichiers, calcul matriciel
(Hampton &Wellman, 1999; Paolillo, 2001; Wellman, 2001)
Source: Richards, W. (1986). The NEGOPY network analysis program. Burnaby, BC: Department of Communication, Simon Fraser University. pp.7-16
La théorie des réseauxhttp://en.wikipedia.org/wiki/Social_network
L’analyse des réseaux• “Node/vertex” ou noeud
– acteur sur lequel la relation agit; réseau orienté ou non-orienté.• “Edge/link” ou lien
– Relation connectant les noeuds; peut être directionnel.• “Cohesive Sub-Group” ou cluster
– Groupe fortement connecté ou cluster.• “Key Metrics” ou principales mesures
– “Centrality” ou centralité (mesure individuelle ou pour un groupe)• Nombre de connections directes qu’un individu possède avec les autres individus dans un groupe
(généralement à partir des connexions entrantes) ;• Mesure au niveau individuel (noeud) ou au niveau du groupe (composant connecté ou cluster).
– “Average shortest path” ou diamètre (mesure pour un groupe)• Facilité avec laquelle un réseau se connecte et s’interconnecte ;• Série de mesure calculant le chemin le plus court entre les pairs de noeuds au niveau du réseau,
reflètant la distance moyenne du réseau. – “Density” ou densité (group measure)
• Robustesse du réseau ;• Nombre de connexions qui existe au sein d’un groupe par rapport au nombre maximum de
connexions.– “Betweenness” ou intermédiarité (mesure individuelle)
• Nombre de chemins les plus courts entre chaque pair de noeuds incluant le noeud concerné ;• Mesure au niveau individuel (du noeud)
• “Node roles” ou rôle des noeuds– Periphérique – en-deça de la centralité moyenne du réseau– Noeud central – au-dessus de la centralité moyennedu réseau– Broker – au-dessus de l’intermédiarité moyennedu réseau
E
D
F
A
CB
H
G
IC
D
E
A B D E
NodeXL : Une extension gratuite d’Excel 2007/10/13 pour l’analyse des réseaux sociaux
Simplifier l’emploi de la théorie des graphes en produisant un graphe complet, avec des mesures intégrées.
http://www.youtube.com/watch?v=0M3T65Iw3Ac
Nod
eXL
en v
ideo
NodeXL en video
Le but: simplifier l’analyse des réseaux sociaux
• Les outils d’analyse des réseaux sociaux existants sont complexes pour les utilisateurs débutants ;
• Les outils comme Excel sont largement employés ;
• La production d’un tableur hôte pour l’analyse des réseaux sociaux facilite l’analyse et la visualisation des données.
Réseau Twitter de la communauté de recherche de Microsoft*AVANT*
Réseau Twitter de la communauté de recherche de Microsoft*APRES*
Simplification des motifs du réseau
Cody Dunne, University of Maryland
Une BDD réseaux sociaux
“NodeXL Graph Gallery”
Disponible
Les communautés
dans le cyberespace
This graph represents a directed network of 1,360 Twitter users whose recent tweets contained "contraceptive OR contraception". The network was obtained on Friday, 08 June 2012 at 13:22 UTC. There is an edge for each follows relationship. There is
an edge for each "replies-to" relationship in a tweet. There is an edge for each "mentions" relationship in a tweet. There is a self-loop edge for each tweet that is
not a "replies-to" or "mentions". The tweets were made over the 2-day period from Thursday, 07 June 2012 at 18:46 UTC to Friday, 08 June 2012 at 13:06 UTC. The
graph's vertices were grouped by cluster using the Clauset-Newman-Moore cluster algorithm. The edge colors are based on relationship values. The vertex sizes are based on each user’s number of followers. Table 1 reports the summary network
metrics that describe the graph.
Production NodeXL: Synthèse réseau
Une synthèse contextuelle
Un graphe complet
Production NodeXL: mesures du réseau
Cette feuille de calcul liste les sommets (comptes Twitter) qui ont contribué au Tweet contenant les termes
“contraception OR contraceptives” durant 2 jours en juin 2012. Les utilisateurs sont classés en fonction de la
“centralité d’intermédiarité” calculée par rapport au niceau de suivi, de réponse, et de mention des arêtes. Inclu les comptes Twitter: @thinkprogress, @gatesfoundation,
@SandraFluke, @maleeek, @Change, @foxandfriends, @melindagates, @AshleyJudd, @cnalive, and @SOHLTC.
Welser, Howard T., Eric Gleave, Danyel Fisher, and Marc Smith. 2007. Visualizing the Signatures of Social Roles in Online Discussion Groups. The Journal of Social Structure. 8(2).
Experts and “Answer People”
Discussion starters, Topic setters
Discussion people, Topic setters
Visualisation: “Architecture” des réseaux
NodeXL & calcul des principales mesures en analyse réseau et textuelle
Paramètres d’analyse réseau
Paramètres d’analyse textuelle
Mise en contraste des groupes relationnels
Le contenu de la synthèse de la feuille de calcul NodeXL montre les URL’s les plus fréquentes, les hashtags les plus fréquents, et les comptes abonnées les plus importants à l’intérieur du réseau et des sous-groupes du réseau.
Mise en contraste des “hashtags” entre les groupes 2 &4
Mise en contraste des liens URL
Mise en contraste des pairs de mots
Mise en contraste des noeuds de relations inter-groupes au sein du réseau
Le ruban Excel de NodeXL
Import depuis les réseaux sociaux Facebook, Twitter,
Flickr et You Tube
Import des données à l’aide de NodeXL
Example d’import de données depuis le réseau social Twitter –
mode recherche Twitter
Paramètres de téléchargement des données : suivi des relations – suivi des réponses – suivi des mentions –
suivi des Tweets
Paramètres de limitation des noeuds du réseau, des Tweets et de
statistiques
Import de liens issus de la recherche Twitter
NodeXL permet de produire et d’extraire ici les sous-graphes de chaque noeud.
Elaboration des noeuds du réseau
Automatisation
Effectuer des analyses se
manière automatisée et simple, en juste
un clic
Simplification de l’automatisation de l’analyse
NodeXL Network Metrics
Mesures – théorie des graphes
Calcul des degrés
Calcul de la centralité
PageRank, clustering, etc…
Paramétrage des données à visualiser dans le graphe
Paramétrage des sous-graphes des noeuds du graphe
Niveau des relationsDes sous-graphes
Paramétrage des flitres dynamiques des paramètres du réseau
Automatisation des mesures du réseau
Visualisation du réseau
Visualisation du réseau
People Disciplines Institutions
University Faculty
Computer Science University of Maryland
Students HCI, CSCW Oxford Internet Institute
Industry Machine Learning Stanford University
Independent Information Visualization Microsoft Research
Researchers UI/UX Illinois Institute of Technology
Developers Social Science/Sociology Connected Action
Network Analysis Cornell
Collective Action Morningside Analytics
Présentation de la fondation de recherche sur les réseaux sociaux
• Développer le “FireFox des fichiers type GraphML” de l’analyse des réseaux sociaux, avec des outils simples et facilement exploitables ;
• Connecter les utilisateurs de l’analyse des réseaux sociaux en facilitant la lecture et la compréhension des graphes ;
• Permettre aux chercheurs de se consulter et de travailler sur des bases de données importantes ;
• Collecter et rassembler une large base de données en analyse des réseaux sociaux par les utilisateurs eux-mêmes ;
• Créer un accès libre aux publications et aux moteurs de recherche ;
• Rendre les “collections de connexions” facile à employer pour les utilisateurs.
Qu’est ce que la SRM tente de réaliser: l’accès à des outils en source ouverte, facilité le libre-accès aux données et favoriser une formation….
• L’add-on d’Excel: NodeXL• Fournisseurs de données (“spigots”)
– ThreadMill Message Board– Exchange Enterprise Email– Voson Hyperlink– SharePoint– Facebook– Twitter– YouTube– Flickr
Ce que la fondation SRM a déjà réalisé : des outils d’analyse des réseaux sociaux
• Une bibliothèque de fichiers d’analyse des réseaux sociaux:
NodeXLGraphGallery.org
– Une collection de graphes réseaux, de sets de données et de commentaires publiés par les utilisteurs ;
– Une base de donnée collective disponible pour la communauté de recherche ;
– Des collections de données publiées sur un large panel de sujets facilitant le travail des étudiants et des chercheurs dans le domaine de l’analyse des réseaux sociaux.
Ce que la fondation SRM a déjà réalisé : des données facilement accessible
• Webshop 2011, 2012: NSF, Google, Intel, Yahoo– 4 Days, 55 Students, 20 Speakers
• Other Workshops: – ICWSM12, NetSci, HyperText12, Cape
Town, Korea, Italy, Russia
Ce que la fondation SRM a déjà réalisé : un réseau de recherche universitaire et privé au profit du savoir
Ce que la fondation SRM a déjà réalisé :
un réseau de recherche
universitaire et privé au profit du
savoir
Ce que la fondation SRM souhaite réaliser: développer des outils pour construire une cartographie des réseaux sociaux de l’Internet
• Porter NodeXL vers le Web: (Node[NOT]XL)– NodeXL pour les feuilles de calcul de GoogleDocs ?– WebGL Canvas? D3.JS? Sigma.JS ?
• Se connecter à d’ autres sources de données:– RDF, MediaWikis, Gmail, NYT, Citation Networks
• Résoudre les problèmes de manipulations réseaux via l’interface utilisateur:– Transformation modale, séries temporelles, affichages automatiques
• Développer et maintenir les archives des collections de sets de données des réseaux sociaux pour la recherche.
• Améliorer la formation en science des réseaux:– Groupes de travail sur l’analyse des réseaux sociaux– Présentations et lectures au travers de sessions en public– Vidéos et supports de formation à disposition des utilisateurs
Comment vous pouvez contribuer à ce projet ?
• Sponsoriser une capacité du projet NodeXL• Sponsoriser les groupes de travail• Sponsoriser le travail d’un étudiant• Planifier des formations• Sponsoriser la fondation SRM• Apporter votre soutien au projet : financier,
programmation, stockage, formation, données, etc…
• Soutenir le travail de la fondation SRM
Marc A. SmithDocteur en sciences humaines et socialesGroupe “Connected Action Consulting”[email protected]://www.connectedaction.nethttp://nodexl.codeplex.com/
Un projet de la fondation de recherche sur les médias sociaux: http://www.smrfoundation.org
Etablir une bibiothèque des relations sur les médias sociaux:
Elaborer des graphes relationnels et
effectuer des mesures à l’aide de NodeXL
Translated & adapted in french by Cyrille Papon - PhD student in SOCMINT / SONEINT – AMISNI Project – TLN Univ/I3M/IRENav/FMES
Traduit et adapté en français par Cyrille Papon – étudiant en thèse SIC en R2SI / RMSI – projet MAR2SI – Univ TLN/I3M/IRENav/FMES