Analyse de réseaux en sciences sociales en général... et en histoire en particulier

42

Transcript of Analyse de réseaux en sciences sociales en général... et en histoire en particulier

Analyse de réseaux en SHS

Analyse de réseaux en sciences sociales en

général. . . et en histoire en particulier

Laurent Beauguitte (CNRS, UMR IDEES)

http://groupefmr.hypotheses.org/

Août 2014 - École thématique Ferney-Voltaire

Analyse de réseaux en SHS

Introduction et rappels

Graphe & réseau

Sommets, liens et attributs

Mesures locales et globales

Cliques, clusters et communautés

Analyse de réseaux en SHS

Introduction et rappels

Graphe : points et lignes. Graphe + attributs = réseau

Points : n÷uds, sommets, acteurs, vertex (plu. vertices), nodes,actors

Lignes : arêtes, arcs, liens, edges, links

3 manières courantes de représenter un graphe : graphe, matrice,liste(s)

Analyse de réseaux en SHS

Introduction et rappels

Format matriciel très lourd : non recommandé

Format le plus économique : 1 ligne par sommet (attributs etrelations)

code;nom;sexe;age;dom;rel1;rel2 etc.

1;Bob;M;29;Paris;2;3

2;Bobby;M;32;Pau;1

3;Bobette;F;27;Frejus;1

Format trop compliqué pour les logiciels. . .

Analyse de réseaux en SHS

Introduction et rappels

Manière la plus courante de structurer ses données :I liste de liens (et attributs)I liste de sommets (et attributs)

#fichier liens

1;2

2;1

1;3

...

#fichier sommets

code;nom;sexe;age;dom;

1;Bob;M;29;Paris

2;Bobby;M;32;Pau

3;Bobette;F;27;Frejus

Analyse de réseaux en SHS

Introduction et rappels

Types de réseaux

Analyse de réseaux en SHS

Introduction et rappels

Types de réseaux

Analyse de réseaux en SHS

Introduction et rappels

Types de réseaux

Analyse de réseaux en SHS

Introduction et rappels

Types de réseaux

Analyse de réseaux en SHS

Introduction et rappels

Mesures locales : au niveau d'un sommet ou d'un lien. Surtout desmesures de centralité (degré, intermédiarité, etc.)

Mesures globales : caractériser le graphe dans son ensemble(densité, diamètre, nombre de composantes connexes, etc.)

Cliques, clusters, communautés : recherche des sous-groupesfortement inter-connectés

Modélisations statistiques (dynamique ou écart à un modèle)

Connaître le vocabulaire anglophone est nécessaire. . .

Analyse de réseaux en SHS

Introduction et rappels

Analyse de réseau issue de la théorie des graphes

Mesures sur graphe = calcul matriciel

Calcul matriciel = logiciel obligatoire

Au moins 80 logiciels permettant de faire de l'analyse de réseaux. . .

http://www.gmw.rug.nl/ huisman/sna/software.htmlhttp://groupefmr.hypotheses.org/1750

Analyse de réseaux en SHS

Précisions terminologiques

Réseau 6= analyse d'un réseau 6= analyse de réseau

Réseaux sociaux et/ou réseaux spatiaux et/ou réseaux complexes

Réseaux sociaux 6= supports techniques (facebook, twitter, etc.)

Analyse de réseaux en SHS

Précisions terminologiques

3 grands modèles = 3 processus de formation

Proximité, attachement préférentiel et processus aléatoire

Source : http://jasss.soc.surrey.ac.uk/8/4/8/Figure%201.gif

Analyse de réseaux en SHS

Un survol historiographique multi-disciplinaire

Mathématiques : théorie des graphes (depuis 1759 - Euler et lesponts de Königsberg)

Sociologie : sociométrie (30s), anthropologie (50s), Social Network

Analysis (70s à nos jours)

Géographie (60s à nos jours)

Biologie : interactions moléculaires (depuis 90s ?)

Écologie : réseau biparti (proie - prédateur ; plante - pollinisateuretc.). Mesures et outils spéci�ques ((50s à nos jours)

Physique et informatique (90s à nos jours)

Analyse de réseaux en SHS

Un survol historiographique multi-disciplinaire

Tradition mathématique : graphe eulérien, hamiltonien, plus courtchemin, etc.

Source : http://jmbellot.blogs.com/personnel/images/koenigsberg_bridges.jpg

Social network analysis, issue de la sociométrie, 2 grandestraditions : réseau de relations entre personnes (petit graphe,orienté, booléen), réseau biparti (conseils d'administration :interlock)

Nombreuses intuitions dans Moreno (1934) mais suppose calculmatriciel -> développement années 70. Ouverture longtemps faibleaux autres disciplines (colloques, associations, logiciels)

Source : http://www.pnas.org/content/103/23/8577/F2.large.jpg

Analyse de réseaux en SHS

Un survol historiographique multi-disciplinaire

Tradition en géographie : réseaux d'infrastructures (transport,énergie, etc.), planaires, le plus souvent valués et non orientés. Peud'interactions avec les autres disciplines.

Utilisation de logiciels (SIG) et de mesures spéci�ques

Questions de recherche : accessibilité, optimisation des �ux,vulnérabilité

Source : Kansky, 1963, Structure of transportation networks, p. 19

Analyse de réseaux en SHS

Un survol historiographique multi-disciplinaire

L'arrivée sauvage des physiciens (90s à aujourd'hui)

Absence totale de complexe par rapport aux données, capacités demodélisation et de programmation, force de frappe scienti�que,ignorance quasi totale (au départ) des autres disciplines

Réseaux de grande taille (dit complexes) : suppose l'élaboration denouveaux outils et de nouvelles méthodes

Modèles innovants (small-world, scale-free) et quelques avancéesmajeures

Et en histoire ?

Dans monde francophone, liens forts avec l'analyse de réseauxsociaux

Tradition de modélisation forte en archéologie

Hybridation croissante des approches et des méthodes :collaboration de plus en plus fréquente avec des informaticiens, desgéographes, etc.

Jernite et al., 2014, The random subgraph model for the analysis of an ecclesiastical network

in Merovingian Gaul, The Annals of Applied Statistics, 8(1) :377-405

Analyse de réseaux en SHS

Quand et comment utiliser l'analyse de réseaux ?

Quand utiliser l'analyse de réseaux ?. . .

. . .quand vous en avez envie !

Quelques atouts :I e�et de mode scienti�que ;I présentation des résultats (parfois) attrayante ;I outil favorisant dialogue inter-disciplinaire ;I pas (pas encore) de normes scienti�ques rigides (mais ça

viendra. . .)

Analyse de réseaux en SHS

Quand et comment utiliser l'analyse de réseaux ?

Comment utiliser l'analyse de réseaux ?

Au départ : questions de recherche et hypothèses

Structure des donnéesI que représentent les points ?I que représentent les liens ?I comment peut-on transformer ces données ?I quels sont les indicateurs pertinents ?I comment interpréter les résultats ?I d'autres méthodes sont-elles utilisables ?

Analyse de réseaux en SHS

Quand et comment utiliser l'analyse de réseaux ?

Un exemple sur les votes à l'AG de l'ONU

Hypothèse : étude des votes à l'ONU permet de mettre en évidenceune régionalisation politique du monde

Données : résultats de votes de résolutions par session

Création d'un tableau État - résolution avec 4 modalités de vote

Transformation de ce tableau en matrice de similarité État - État(0, votes toujours di�érents à 100, votes toujours identiques) :graphe valué non orienté

Session 59 (2005-2006), similarité supérieure ou égale à 98%

I que représentent les points et les liens ?

I comment peut-on transformer ces données ?

I quels sont les indicateurs pertinents et comment interpréter les

résultats ?

I d'autres méthodes sont-elles utilisables ?

Méthode de clustering dérivée de l'algorithme CONCOR(corrélation de corrélation) : permet de garder l'intensité des liens,crée une partition au niveau mondial

I d'autres méthodes sont-elles utilisables ?

Analyse de réseaux en SHS

Quand et comment utiliser l'analyse de réseaux ?

Un exemple sur les discours onusiens

Orateurs : représentants d'États, de groupes régionaux, d'OIG, etc.

Hypothèses :I les groupes prennent de plus en plus souvent la parole ;I les États soutiennent de plus en plus souvent les déclarations

faites par des groupes

Données : PV des sessions de l'Assemblée générale

Analyse de réseaux en SHS

Quand et comment utiliser l'analyse de réseaux ?

Recherche d'occurrences du type : le représentant de l'État Asoutient la déclaration faite au nom du groupe A′

Transformation en graphe biparti État - groupe

Mesures (ordre, taille, densité) et visualisation

I que représentent les points et les liens ?

I comment peut-on transformer ces données ?

I quels sont les indicateurs pertinents et comment interpréter les

résultats ?

I d'autres méthodes sont-elles utilisables ?

Analyse de réseaux en SHS

Quand et comment utiliser l'analyse de réseaux ?

L'AR en histoire : vraies questions et faux problèmes

(Quelques) vraies questions :I pertinence de l'approche

I choix des méthodes et des outilsI structuration des données

Analyse de réseaux en SHS

Quand et comment utiliser l'analyse de réseaux ?

L'AR en histoire : vraies questions et faux problèmes

(Quelques) vraies questions :I pertinence de l'approcheI choix des méthodes et des outils

I structuration des données

Analyse de réseaux en SHS

Quand et comment utiliser l'analyse de réseaux ?

L'AR en histoire : vraies questions et faux problèmes

(Quelques) vraies questions :I pertinence de l'approcheI choix des méthodes et des outilsI structuration des données

Analyse de réseaux en SHS

Quand et comment utiliser l'analyse de réseaux ?

(Quelques) faux problèmes :I l'incomplétude des données

I ce n'est pas un � vrai � réseauI c'est trop compliqué et il faut apprendre des tas de logiciels. . .

Analyse de réseaux en SHS

Quand et comment utiliser l'analyse de réseaux ?

(Quelques) faux problèmes :I l'incomplétude des donnéesI ce n'est pas un � vrai � réseau

I c'est trop compliqué et il faut apprendre des tas de logiciels. . .

Analyse de réseaux en SHS

Quand et comment utiliser l'analyse de réseaux ?

(Quelques) faux problèmes :I l'incomplétude des donnéesI ce n'est pas un � vrai � réseauI c'est trop compliqué et il faut apprendre des tas de logiciels. . .

Analyse de réseaux en SHS

Visualisation des données

Le graphe comme image : exploration vs communication

ExplorationI scripts et lignes de commandeI esthétique super�ueI plus les données sont complètes et précises, mieux c'est

Analyse de réseaux en SHS

Visualisation des données

Le graphe pour communiquer

I nécessité d'une légende claire, précise, complèteI transparence sur l'outil et la méthode (quel logiciel ? quel

algorithme de visualisation ?)I plus le graphe re�ète vos données, moins il est lisible :

sélection indispensable

Analyse de réseaux en SHS

Visualisation des données

Nécessité de �ltrer les données (+ de 20 sommets et 30 liens)

Varier les teintes, les couleurs, les épaisseurs, déplacer les sommets,ajouter une légende

Sortie brute de logiciel

library(statnet)

g <- rgraph(40, tprob = 0.1, mode="graph")

gplot(g)

Supprimer les �èches, taille proportionnelle au degré (ssi le degréest pertinent. . .)

gplot(g, vertex.cex=sqrt(degree(g))/2, usearrows=FALSE,

mode="fruchtermanreingold")

Pour quoi faire ?. . .

Source : http://msb.embopress.org/content/2/1/42

Quelques optionsI visualiser autrement (distribution des degrés, matrice bloquée)I zoomer sur les lieux densesI passer du graphe à l'ego-network

Analyse de réseaux en SHS

Visualisation des données

Combiner les approches

Visualisation mixte graphe - matrice (logiciel NodeTrix)

http://www.aviz.fr/wiki/uploads/Research/NodeTrix.png

Analyse de réseaux en SHS

C'est à vous

Des questions ?. . .