Une analyse des graphes et des discours autour du #Mariagepourtous

Post on 02-Jul-2015

337 views 0 download

description

Communication à la Journée d’étude: « Ancrer le discours sur le genre. Commentaires en ligne et fouille d'opinion », Lyon, 27-28 novembre 2014

Transcript of Une analyse des graphes et des discours autour du #Mariagepourtous

Une analyse des graphes et des discours autour du hashtag�

�#Mariagepourtous �

Pierre Ratinaud

Université Toulouse 2

Nikos Smyrnaios Université Toulouse 3

Journée d’étude: « Ancrer le discours sur le genre. Commentaires en ligne et fouille d'opinion »,

Lyon, 27-28 novembre 2014

Le contexte

« Mariage pour tous »: donner le droit au mariage et à l’adoption aux couples homosexuels

Entre la présentation du texte au conseil de

ministres (11/2012) et le 1er mariage (5/2013):

- Nombreuses manifestations pour et contre

- Débats houleux à l’Assemblée et au Sénat

- Polémiques médiatiques

La méthode

Collecte des tweets comportant le mot clé mariagepourtous du 7/11/2012 au 31/07 2013

Le corpus se compose de 1 260 092 tweets, 195 441

utilisateurs dont 56,55% avec un seul message

Etape 1: analyse lexicométrique des tweets avec Iramuteq

Etape 2: repérage de clusters avec Gephi et

exploration « manuelle »

Etape 2: lien entre clusters et classes de discours

Le corpus

Les pics de tweets correspond à l’actualité retweets Surreprésentation de retweets (61%)

Analyse lexicometrique

Elimination des retweets=> 453 107 tweets

Elimination des urls et du hashtag du corpus texte

6 474 386 occurrences, 73 380 hapax

Méthode Reinert avec IRaMuTeQ

On obtient 12 classes de plus de 10 500 tweets

Analyse lexicometrique

Méthode Reinert -  Formes « pleines » porteuses de signification

(substantifs, adjectifs, adverbes, verbes)

-  Segment de texte comme unite : tweet

-  Bis-partitions successives du corpus par analyse factorielle

-  Résultat: ensembles de segments de textes regroupés sur le critère de la cooccurrence du

lexique (classes)

Analyse lexicometrique

Conflit, insultes

Humour, blagues

Appel manif

Religion Livetweet AN

Critique exécutif

Droite et violence

Libérté de Conscience

Sondages PMA GPA

Livetweet Sénat

Famille Télévision, people

Analyse des réseaux

Graphe orienté basé sur les retweets des comptes avec >4 tweets dans Gephi

58 587 comptes, 418 844 liens

Application de la Méthode de Louvain : algorithme

hiérarchique proposé dans Blondel et al. (2008)

Lien clusters & classes de discours

Liberté de conscience

Critique du gouvernement

Mouvement opposition

Sondages GPA MPA

Evocation de la famille

Humour

TV, people

Conflits, insultes

Religion

Appel à manifester

Opposants: critique du gouvernement, commentaires sur la perception du mouvement anti (violence), PMA/GPA

LGBT: débats parlementaires, manifestations

Autres: blagues, insultes

Les pro: communauté LGBT très active. Registre d’information et de mobilisation (appel à manifester,

livetweet débats parlementaires)

Les anti : registre d’indignation, discours très politisé et « moraliste » (gouvernement, PMA/GPA)

Autres (autour des comptes people): humour, satyre

et/ou un mode d’échange conflictuel, apolitiques)

Politiciens: débat de fond (religion, violence, liberté de conscience

Médias: enjeux politiques et jeux des acteurs (liberté

de conscience, débat AN)

Confirmation de tendances

Sur Twitter mélange mobilisation, information + ironie, humour, indignation, etc.

Glissement du sujet, on parle d’autre chose (religion,

politique, mœurs)

Interactions (retweets, mentions) => débat structuré, non juxtaposition d’individus

Cohérence entre les communautés d’usagers

repérées par l’analyse de graphes et les classes de discours repérées avec Iramuteq

Limites

Population loin d’être representative de la société (CSP+, jeunes, diplômés, métiers intellectuels)

Echantillon ad hoc biaisé par le choix du mot clé

(résultats différents avec #mariagehomo)

Logique internes de la plateforme

Pauvreté lexicale