Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à...

15
Le débat Hollande-Sarkozy du 3 mai Analyse sémantique Un document réalisé par Proxem Avant-propos Le discours tenu par un personnage politique est révélateur de sa pensée à plusieurs niveaux : le choix des termes, des concepts utilisés, la syntaxe employée, sont conjointement étudiés par les spécialistes du langage pour mieux comprendre ce qui est exprimé. Au-delà du sens apparent, perceptible à une lecture ordinaire, des disciplines telles que la sémiologie, la synergologie, la linguistique, etc., étudient le discours verbal et non-verbal pour en extraire des interprétations complémentaires. Dans cette perspective, l’analyse sémantique d’un document est une technologie qui permet d’automatiser une partie de la construction de ces interprétations. Au moyen d’algorithmes hérités de l’intelligence artificielle, l’analyse sémantique identifie les unités de sens et permet de visualiser et d’organiser de façon macroscopique le sens général exprimé dans un document. Méthodologie Pour la présente analyse, nous avons utilisé la retranscription du débat télévisé du 3 mai entre François Hollande et Nicolas Sarkozy faite par lemonde.fr. 1 Les nuages d’expressions sont générés par nos services aux termes de plusieurs étapes comprenant notamment une extraction terminologique et l’attribution d’un score de pertinence à chaque terme (syntagme). Les graphes de concepts sont quant à eux basés sur la catégorisation Wikipédia : notre outil identifie les catégories les plus proches sémantiquement des termes employés dans le document et les représente en suivant le graphe des catégories de Wikipédia. Toutes les visualisations sont présentées brutes, avec seulement quelques modifications mineures d’ordre cosmétique facilitant leur lecture. 1 « Sarkozy-Hollande : le compte rendu intégral du débat, thème par thème » (3 mai 2012) : http://www.lemonde.fr/election-presidentielle-2012/article/2012/05/03/sarkozy-hollande-le- compte-rendu-integral-du-debat-theme-par-theme_1694802_1471069.html

Transcript of Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à...

Page 1: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste

Le débat Hollande-Sarkozy du 3 mai Analyse sémantique

Un document réalisé par Proxem

Avant-propos Le discours tenu par un personnage politique est révélateur de sa pensée à plusieurs niveaux :

le choix des termes, des concepts utilisés, la syntaxe employée, sont conjointement étudiés

par les spécialistes du langage pour mieux comprendre ce qui est exprimé. Au-delà du sens

apparent, perceptible à une lecture ordinaire, des disciplines telles que la sémiologie, la

synergologie, la linguistique, etc., étudient le discours verbal et non-verbal pour en extraire

des interprétations complémentaires.

Dans cette perspective, l’analyse sémantique d’un document est une technologie qui permet

d’automatiser une partie de la construction de ces interprétations. Au moyen d’algorithmes

hérités de l’intelligence artificielle, l’analyse sémantique identifie les unités de sens et permet

de visualiser et d’organiser de façon macroscopique le sens général exprimé dans un

document.

Méthodologie Pour la présente analyse, nous avons utilisé la retranscription du débat télévisé du 3 mai

entre François Hollande et Nicolas Sarkozy faite par lemonde.fr.1

Les nuages d’expressions sont générés par nos services aux termes de plusieurs étapes

comprenant notamment une extraction terminologique et l’attribution d’un score de

pertinence à chaque terme (syntagme).

Les graphes de concepts sont quant à eux basés sur la catégorisation Wikipédia : notre outil

identifie les catégories les plus proches sémantiquement des termes employés dans le

document et les représente en suivant le graphe des catégories de Wikipédia.

Toutes les visualisations sont présentées brutes, avec seulement quelques modifications

mineures d’ordre cosmétique facilitant leur lecture.

1 « Sarkozy-Hollande : le compte rendu intégral du débat, thème par thème » (3 mai 2012) : http://www.lemonde.fr/election-presidentielle-2012/article/2012/05/03/sarkozy-hollande-le-compte-rendu-integral-du-debat-theme-par-theme_1694802_1471069.html

Page 2: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste

Nous suivons le découpage en cinq actes choisi par lemonde.fr.

Vision d’ensemble La visualisation suivante présente, dans leur ensemble, les expressions et concepts les plus

utilisés par chacun des candidats. A l’inverse d’un « nuage de mots-clés » traditionnel, cette

visualisation présente les expressions d’un ou plusieurs mots employées, et valorise, en

même temps que le degré de récurrence, la rareté de chacune. Les termes employés par

François Hollande apparaissent en rose, et ceux de Nicolas Sarkozy en bleu.

Le terme qui saute aux yeux est le terme « France », abondamment utilisé par Nicolas

Sarkozy. Dans sa bouche, le terme prend une dimension quasi-mythologique et désigne tour

à tour le lieu, le pays, l’Etat, et l’ensemble des Français : la France du côté de laquelle on

regarde, la France qui n’a pas connu de récession, etc. François Hollande préfère le terme de

« Français » – un collectif à rapprocher de l’expression « esprit de rassemblement » utilisée

par ailleurs – moins large mais plus inclusif.

L’expression « président de la République » est également très présente dans la bouche des

deux candidats, sans surprise puisque la présidence de la République était l’enjeu du débat.

Dans l’ensemble, le réseau d’expressions est dense et se répartit sur une loi normale où une

minorité d’éléments forts émerge d’une longue traîne moins chargée sémantiquement.

Voyons-les plus précisément.

Page 3: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste

Le vocabulaire de François Hollande

Les deux termes qui émergent avant tout autre du discours tenu par François Hollande sont,

d’une part, son interlocuteur (« Nicolas Sarkozy ») et d’autre part, l’objet du débat

(« président de la République »). Le discours est donc structuré autour de ces deux termes

qui ne sont pas superposables mais opposés dialectiquement : à l’heure du débat, « président

de la République » qualifie Nicolas Sarkozy, mais c’est précisément ce titre qui est mis en jeu

à travers le débat. Si l’on peut dire, tout l’objet du discours de François Hollande est de faire

dialoguer ces termes, de montrer comment l’un et l’autre se superposent ou non, pendant le

débat et à l’avenir.

Ensuite, deux thématiques se démarquent : le droit de vote [des immigrés] et les

prélèvements libératoires. Notons qu’en récurrence pure, ces thématiques ne sont pas les

plus fréquentes (respectivement 11 et 8 occurrences) mais elles obtiennent des scores

importants en vertu de la prime à la rareté accordée par notre outil aux expressions peu

fréquentes. De fait, ces thématiques (ainsi que, pour la première, les expressions proches

« centres de rétention », « immigration économique », « immigration légale », etc. décrivant

également la question de l’immigration) ont été des points houleux et abondamment discutés

lors du débat. Notons également qu’ils sont chaque fois évoqués avec la même terminologie,

les mêmes mots, d’où leur prééminence dans notre nuage d’expression. D’autres

thématiques, telles que le pouvoir d’achat ou l’énergie renouvelable, sont bien visibles : à

défaut d’être des points cruciaux du programme du candidat Hollande, tous ces sujets ont

largement mobilisé l’opinion – on dira qu’ils sont « à la mode » – et étaient donc très

attendus.

On ne manquera pas de remarquer l’expression « Moi président de la République » qui a

marqué les esprits et se retrouve telle quelle dans notre analyse, signe de sa rareté et de sa

spécificité. Cette reprise anaphorique n’a pas émaillé le débat sur toute sa longueur, mais elle

a été suffisamment présente localement pour apparaître dans cette vision d’ensemble.

Page 4: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste

Le vocabulaire de Nicolas Sarkozy

Nicolas Sarkozy s’est abondamment adressé à son interlocuteur : « Monsieur Hollande »

apparaît 61 fois. Là où François Hollande parlait de lui-même (« Moi président de la

République »), Nicolas Sarkozy semble quant à lui tourné vers son interlocuteur. Celui-ci est

le centre de gravité de son discours, qui repose sur le fait d’être adressé à un interlocuteur

présent. On peut y voir la traduction sémantique d’une posture de challenger qui n’est plus là

pour parler de lui, se valoriser, se défendre, mais pour réduire l’impact de la présence de celui

qui était déjà annoncé vainqueur. Il est difficile d’interpréter a posteriori de telles données de

façon neutre, mais la prééminence de l’expression « Monsieur Hollande » est telle qu’elle

semble difficilement équivoque.

Cette posture est confirmée par un autre aspect du discours de Nicolas Sarkozy : ce débat

repose sur la candidature à un nouveau mandat, mais il marque aussi la conclusion du

mandat précédent. Cette dimension conclusive est marquée dans son discours qui contient

des éléments de bilan et de synthèse du mandat : ses interlocuteurs sont amenés à porter un

jugement sur les 5 années de présidence de Nicolas Sarkozy. Forme de bilan s’il en est, la

référence à la « Cour des comptes » appelle un bilan chiffré, factuel. Le syntagme

« présidence partisane » formule un jugement synthétique subjectif dudit mandat. La

formule est reprise, martelée par un Nicolas Sarkozy indigné (« Comment osez-vous… ? »)

pour être contestée et réfutée. On retrouve également des thématiques qui furent celle de sa

campagne de 2007 (« heures supplémentaires », « pouvoir d’achat ») et qui confirment l’idée

d’un bilan à la fois synthétique, factuel et thématique.

Enfin, autre élément marquant, la surabondance de l’apposition du titre - « Monsieur » ou

« Madame » - des individus évoqués (« Monsieur Hollande », mais aussi « Monsieur

Mitterrand », « Monsieur Jospin », « Madame Aubry », etc.) Cette apposition n’est pas

systématique – on a au contraire « Jacques Chirac », « le Général de Gaulle » - ce qui laisse

penser qu’elle traduit une distance, physique, de point de vue ou encore de couleur politique

entre Nicolas Sarkozy et la personne citée.

Page 5: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste

Découpage par acte et graphes de concepts

Graphe de concepts : Acte 1 Dans l’acte 1, chaque candidat exprime ses attentes quant au débat, puis la question de

l’emploi est lancée. On observe chez l’un comme l’autre des généralités (philosophie

politique, morale, rhétorique) ainsi qu’une variété de sujets abordés (précarité, chômage, aide

sociale). Toutefois, les termes centraux chez Hollande sont fortement conceptuels (branche

de la philosophie, philosophie politique, concept sociologique) là où l’on rencontre chez

Sarkozy un duo travail et morale connectés entre eux et au centre du réseau de concepts. On

retrouve ainsi, en plus des catégories de thématiques abordées, le style d’expression et les

concepts de prédilection propres à chacun.

Page 6: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste
Page 7: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste

Graphe de concepts : Acte 2 Dans cette partie, la discussion se concentre sur les thématiques économiques et sociales,

avec notamment la question de la TVA sociale, du pouvoir d’achat et du prix de l’essence. Les

catégories invoquées sont relativement symétriques et relèvent surtout de l’économie :

économie du travail, fiscalité, économie de l’OCDE. Le social est présent mais plutôt en demi-

teinte : c’est surtout le vocabulaire économique qui domine.

Page 8: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste
Page 9: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste

Graphe de concepts : Acte 3 Cette partie prolonge la discussion économique avec un développement de la question des

finances et de la dette ; il y est question du financement de la création de 60 000 postes

d’enseignants proposée par Hollande. Finance et fiscalité sont effectivement très présents.

C’est toutefois le concept d’économie d’entreprise, en demi-teinte, qui est central chez les

deux candidats. Aussi, comme dans les actes précédents, le travail se retrouve au centre du

discours sarkozyien.

Page 10: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste
Page 11: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste

Graphe de concepts : acte 4 Cette quatrième partie est consacrée à la question de l’immigration, des centres de rétention

et du droit de vote des étrangers. Ces thématiques se confirment bien sur notre graphe en

étant à la fois centraux dans les concepts et abondamment cités. A nouveau, le vocabulaire

utilisé est assez symétrique, à une nuance près : la présence chez Hollande de « Sociologie de

l’intégration » et celle chez Sarkozy de « Réfugié » et « Camps de réfugié », ce qui traduit a

priori une approche différente de la question de l’immigration.

Page 12: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste
Page 13: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste

Graphe de concepts : acte 5 Cette dernière partie aborde, en guise de conclusion du débat, divers sujets tels que le

nucléaire, la politique étrangère, les institutions. Les graphes sont effectivement bien plus

diffus, et affichent quelques sujets marquants en périphérie : le droit constitutionnel chez

Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement

marqué par rapport au reste du graphe). La politique au sens large est centrale dans les deux

graphes, et l’on voit à nouveau apparaître la trace de la tirade « Moi président de la

République » dans le discours de Hollande. Enfin, on observe une grande diversité de

concepts chez Sarkozy (néologisme en politique, rhétorique, humanitaire, théorie du

complot, etc.) là où le graphe des propos de Hollande s’organise plus nettement en

thématiques regroupant plusieurs concepts : Légion d’honneur, éducation, personnalité

politique.

Page 14: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste
Page 15: Le débat Hollande-Sarkozy du 3 mai Analyse sémantique · Hollande, les chefs d’Etat à l’international chez Sarkozy (ce dernier étant extrêmement marqué par rapport au reste

Conclusion A nouveau, beaucoup de choses peuvent être dites à partir de ce type de visualisation, et il est

difficile de ne pas céder à la tentation de sur-interpréter à la lumière des résultats des

élections présidentielles. On notera tout de même quelques conclusions générales :

- Le discours de François Hollande est plus conceptuel, celui de Nicolas Sarkozy est

plus empirique ;

- Le discours de François Hollande est également plus structuré, s’articulant en grandes

thématiques regroupant des concepts, là où celui de Nicolas Sarkozy est plus varié

voire éclectique ;

- Les valeurs morales sont très présentes chez François Hollande ;

- La notion de travail émaille tout le discours de Nicolas Sarkozy ;

- Le discours de François Hollande est plus centré sur lui-même et sur l’affirmation de

principes, là où le discours de Nicolas Sarkozy parle davantage de son interlocuteur et

des principes qu’il a exprimés.

On peut donc voir, au global, l’opposition entre le discours d’un président sortant, revenant

empirique sur les choses accomplies, et celui d’un candidat formulant des propositions

conceptuelles. L’objet du débat, posé en ces termes, et cette fois à la lumière des résultats, est

donc le bilan du président sortant, et l’annonce, la présentation, en un mot, le programme, du

président à venir.

A propos de Proxem Proxem est le spécialiste français de l’analyse sémantique. Nous aidons les organisations à

améliorer leur performance en mettant en œuvre des technologies sémantiques. Nous

analysons de grandes quantités de textes quelle qu’en soit la source pour y trouver

l’information pertinente pour vous. Proxem a effectué une première levée de fonds début

2011, et est à l’équilibre. Ubiq est commercialisé depuis septembre 2010. Plusieurs clients

nous font déjà confiance dans différents secteurs : distribution (notamment Auchan,

Intermarché et Carrefour), banque, RH, audiovisuel…

Nous contacter :

François-Régis Chaumartin CEO [email protected] +33 1 42 39 18 19 Mobile : +33 6 12 16 59 23 www.proxem.com

Eglantine Schmitt Chargée de communication [email protected] +33 1 42 39 18 19 Twitter : @egschmitt www.proxem.com