Combiner classification et visualisation pour l’exploration de grands réseaux

download Combiner classification et visualisation pour l’exploration de grands réseaux

of 77

  • date post

    11-May-2015
  • Category

    Science

  • view

    92
  • download

    0

Embed Size (px)

description

January, 12th 2012 Séminaire de Probabilités et Statistique de l’Institut de Mathématiques de Bordeaux

Transcript of Combiner classification et visualisation pour l’exploration de grands réseaux

  • 1.Combiner classication et visualisation pour lexploration de grands rseaux Nathalie Villa-Vialaneix http://www.nathalievilla.org nathalie.villa@univ-paris1.fr Sminaire, Bordeaux, 12 Janvier 2012 Travail joint avec Fabrice Rossi (SAMM, Universit Paris 1) Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 1 / 24

2. Visualisation de graphes : pourquoi ? Plan 1 Visualisation de graphes : pourquoi ? 2 Visualisation par classication hirarchique Obtention dune hirarchie de classications Visualisation dune hirarchie de classications Exemples et comparaisons Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 2 / 24 3. Visualisation de graphes : pourquoi ? Contexte et problmatique Un rseau (graphe) G = (V, E, W) avec n sommets V = {x1, . . . , xn} ; des artes, E, pondres par des poids Wij = Wji 0 (Wii = 0). Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 3 / 24 4. Visualisation de graphes : pourquoi ? Visualisation : un outil pour comprendre le graphe Approche courante pour explorer le graphe : visualisation par algorithme de forces (FDP), par exemple [Fruchterman and Reingold, 1991] Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 4 / 24 5. Visualisation de graphes : pourquoi ? Visualisation : un outil pour comprendre le graphe Approche courante pour explorer le graphe : visualisation par algorithme de forces (FDP), par exemple [Fruchterman and Reingold, 1991] forces attractives : le long des artes (analogues des ressorts) Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 4 / 24 6. Visualisation de graphes : pourquoi ? Visualisation : un outil pour comprendre le graphe Approche courante pour explorer le graphe : visualisation par algorithme de forces (FDP), par exemple [Fruchterman and Reingold, 1991] forces attractives : le long des artes (analogues des ressorts) forces rpulsives : entre toutes les paires de sommets (analogues des forces lectriques) Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 4 / 24 7. Visualisation de graphes : pourquoi ? Visualisation : un outil pour comprendre le graphe Approche courante pour explorer le graphe : visualisation par algorithme de forces (FDP), par exemple [Fruchterman and Reingold, 1991] forces attractives : le long des artes (analogues des ressorts) forces rpulsives : entre toutes les paires de sommets (analogues des forces lectriques) algorithme itratif jusqu stabilisation des positions des sommets. Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 4 / 24 8. Visualisation de graphes : pourquoi ? Exemple (avec Gephi 1 ) 1 http://gephi.org Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 5 / 24 9. Visualisation de graphes : pourquoi ? Limites des approches FDP lents (difciles mettre en uvre pour des graphes de trs grande taille) ; Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 6 / 24 10. Visualisation de graphes : pourquoi ? Limites des approches FDP lents (difciles mettre en uvre pour des graphes de trs grande taille) ; privilgient lesthtique linterprtabilit : Tendance : artes courtes et de tailles uniformes Consquence ngative : regroupement des nuds de forts degrs au centre de la gure Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 6 / 24 11. Visualisation de graphes : pourquoi ? Limites des approches FDP lents (difciles mettre en uvre pour des graphes de trs grande taille) ; privilgient lesthtique linterprtabilit : Tendance : artes courtes et de tailles uniformes Consquence ngative : regroupement des nuds de forts degrs au centre de la gure Or, approche naturelle dexploration dun graphe : 1 reprer la structure macroscopique : recherche de communauts et de leurs relations ; 2 afner les dtails dans certaines parties. Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 6 / 24 12. Visualisation de graphes : pourquoi ? Mettre en valeur les communauts lors de la reprsentation 1 approche globale : reprsenter tous les sommets du graphe en modiant les forces de manire mettre en valeur les zones denses : [Noack, 2007] algorithme LinLog Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 7 / 24 13. Visualisation de graphes : pourquoi ? Mettre en valeur les communauts lors de la reprsentation 1 approche globale 2 faire une classication des sommets puis une reprsentation simplie [Herman et al., 2000] classication des sommets en classes V1, . . . , VC ; reprsenter le graphe des classes : sommets V1, . . . , VC (aire proportionnelle |Vj|) et artes dpaisseur proportionnelle xk Vi ,xk Vj Wij Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 7 / 24 14. Visualisation de graphes : pourquoi ? Mettre en valeur les communauts lors de la reprsentation 1 approche globale 2 faire une classication des sommets puis une reprsentation simplie [Herman et al., 2000] classication des sommets en classes V1, . . . , VC ; reprsenter le graphe des classes : sommets V1, . . . , VC (aire proportionnelle |Vj|) et artes dpaisseur proportionnelle xk Vi ,xk Vj Wij problme : Modier FDP pour sommets de tailles variables. Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 7 / 24 15. Visualisation de graphes : pourquoi ? Mettre en valeur les communauts lors de la reprsentation 1 approche globale 2 faire une classication des sommets puis une reprsentation simplie approche alternative : classication et placement simultans sur une carte auto-organisatrice [Rossi and Villa-Vialaneix, 2010] Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 7 / 24 16. Visualisation de graphes : pourquoi ? Mettre en valeur les communauts lors de la reprsentation 1 approche globale 2 faire une classication des sommets puis une reprsentation simplie 3 approche hybride : reprsentations hirarchiques dont la prcision augmente [Auber et al., 2003, Auber and Jourdan, 2005, Sei et al., 2010] Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 7 / 24 17. Visualisation de graphes : pourquoi ? Dans cette prsentation... ... approche hirarchique combinant visualisation et classication base sur la modularit [Rossi and Villa-Vialaneix, 2011]. Classication (C1, . . . , CK ), Q(C1, . . . , CK ) = 1 2m K k=1 xi,xjCk (Wij Pij) avec Pij poids dun modle nul (mme distribution des degrs mais les poids dpendent seulement des degrs des sommets et non de leurs classes) : Pij = didj 2m avec di = 1 2 j i Wij. Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 8 / 24 18. Visualisation de graphes : pourquoi ? Interprtation Une bonne classication maximise la modularit : Q quand (xi, xj) sont dans la mme classe et Wij Pij Q quand (xi, xj) sont dans deux classes diffrentes et Wij Pij car Q(C) + 1 2m k k iCk , jCk (Wij Pij) = 0. Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 9 / 24 19. Visualisation de graphes : pourquoi ? Interprtation Une bonne classication maximise la modularit : Q quand (xi, xj) sont dans la mme classe et Wij Pij Q quand (xi, xj) sont dans deux classes diffrentes et Wij Pij car Q(C) + 1 2m k k iCk , jCk (Wij Pij) = 0. Modularit : aide sparer des hubs ( spectral clustering ou critre de coupe minimal) mais petit dfaut de rsolution (voir [Fortunato and Barthlmy, 2007]). Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 9 / 24 20. Visualisation de graphes : pourquoi ? Interprtation Une bonne classication maximise la modularit : Q quand (xi, xj) sont dans la mme classe et Wij Pij Q quand (xi, xj) sont dans deux classes diffrentes et Wij Pij car Q(C) + 1 2m k k iCk , jCk (Wij Pij) = 0. Modularit : aide sparer des hubs ( spectral clustering ou critre de coupe minimal) mais petit dfaut de rsolution (voir [Fortunato and Barthlmy, 2007]). Problme : Optimisation = Pb NP-complet (recherche exhaustive impossible pour des graphes de plus de qq centaines de sommets) Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 9 / 24 21. Visualisation par classication hirarchique Plan 1 Visualisation de graphes : pourquoi ? 2 Visualisation par classication hirarchique Obtention dune hirarchie de classications Visualisation dune hirarchie de classications Exemples et comparaisons Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 10 / 24 22. Visualisation par classication hirarchique Prsentation gnrale de la mthodologie 2 tapes combines : Obtention dune hirarchie de classications (par optimisation de la modularit) + test de la signicativit du partitionnement chaque niveau ; Reprsentations des divers niveaux de la hirarchie avec algorithme de forces modi. Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 11 / 24 23. Visualisation par classication hirarchique Obtention dune hirarchie de classications Plan 1 Visualisation de graphes : pourquoi ? 2 Visualisation par classication hirarchique Obtention dune hirarchie de classications Visualisation dune hirarchie de classications Exemples et comparaisons Visualisation de rseaux (Sem. Bordeaux) Nathalie Villa-Vialaneix & Fabrice Rossi 12 Janvier 2012 12 / 24 24. Visualisation par classication hirarchique Obtention dune hirarc