Mémoire Data-journalisme
-
Upload
alexischailloux -
Category
Documents
-
view
7.548 -
download
12
Embed Size (px)
description
Transcript of Mémoire Data-journalisme

UNIVERSITE DE PARIS IV – SORBONNE
CELSA
Ecole des hautes études en sciences de l’information et de la communication
MASTER 2ème année
Mention : Information et Communication Spécialité : Médias et Communication
« Data-Hari » : le journalisme sacrifié sur l’autel des données ?
Préparé sous la direction du Professeur Véronique RICHARD
Nom, Prénom : Alexis Chailloux Promotion : 2011-2012 Option : MISC (Médias Informatisés et Stratégies de Communication) Soutenu le : 22 octobre 2012 Note du mémoire : Mention :


2
Remerciements
Je voudrais remercier avant toute chose mon rapporteur universitaire, Étienne Candel,
ainsi que mon rapporteur professionnel, Anthony Hamelle, pour les nombreuses pistes ouvertes et
l’intérêt consacré à mon travail.
Je remercie les personnes ayant pris de leur temps personnel pour s’entretenir avec moi :
Caroline Goulard, à la passion contagieuse, Pierre Romera, un « ami pour la vie » grâce à
Twitter, et Jean-Christophe Féraud, pour sa ferveur du journalisme « avec un grand J ». J’espère
les recroiser très vite et poursuivre nos discussions.
J’adresse un immense merci à ma grand-mère, ange-gardienne bienveillante et
attentionnée durant toute la période de rédaction, sans qui ce mémoire n’aurait jamais pu voir le
jour dans les délais impartis. À l’heure d’écrire ces lignes, j’ai une pensée particulière pour elle.
Je n’oublie pas mes deux parents, relecteurs d’une rare réactivité, pour leurs
commentaires parfois fantasques, souvent rigoureux, toujours utiles. Leur investissement
quotidien à mes côtés fut d’une aide précieuse.
Merci encore à Marion, Claire et Alix, qui ont participé à la fastidieuse mais nécessaire
tâche de relecture.
Merci enfin à toute la promotion des MISC 2012, pour les rires, les pleurs, les joies, les
déprimes et les encouragements au moment, si redouté, de rédiger le mémoire. Sans ce salutaire
espace de décompression, la tâche aurait été plus périlleuse encore.

3
Introduction
En 1989, Bill Dedman reçoit le prix Pulitzer du journalisme d’investigation pour son
enquête « The Color of Money », publiée dans The Atlanta Journal1. En croisant des bases de
données ethno-démographiques et bancaires, il démontre, cartes à l’appui, que l’appartenance
ethnique est, toutes choses égales par ailleurs, un facteur de discrimination au moment d’attribuer
un prêt immobilier.
En 2012, Michal J. Berens et Ken Amstrong reçoivent le prix Pulitzer du journalisme
d’investigation pour leur enquête « Methadone and the politics of pain », publiée dans The Seattle
Times2. En croisant des bases de données de certificats de décès, d’hospitalisations et de pauvreté,
ils démontrent, cartes à l’appui, que la méthadone, analgésique réputé pour sa dangerosité, est
systématiquement prescrite par Medicaid, l’assurance-santé publique destinée aux plus démunis,
à des fins d’économie budgétaire3.
La première enquête relève simplement du journalisme d’investigation, quand la seconde
est considérée comme une récompense pour le « journalisme de données »4. Comment expliquer
une telle différence de traitement ?
1 FANEN, Sophian, « Les Américains défricheurs du déchiffrage », Ecrans, [disponible en ligne], 4 janvier 2012 (lorsqu’un article a été consulté en ligne, la mention « disponible en ligne » sera faite, l’URL complète et la date de consultation étant indiquées en bibliographie). 2 « Seattle Times methadone investigation wins Pulitzer Prize », The Seattle Times, [disponible en ligne], 16 avril 2012. 3 BERENS, Michael. J., « How we linked methadone to powerty », The Seattle Times, [disponible en ligne], 10 décembre 2011. 4 « Le journalisme de données récompensé », Courrier International, [disponible en ligne], 28 juin 2012.

4
Contextualisation
Une première réponse est apportée par le concept d’ « intermédialité », défini par André
Gauderault et Philippe Marion pour décrire la genèse du cinéma. Dans ce cadre théorique, un
« média naît toujours deux fois5» : une « naissance intégrative » (ou « fausse naissance »), puis
une « naissance différentielle » (ou « autonomisation identitaire »). La « naissance intégrative »
correspond au moment où une nouvelle technique de traitement de l’information apparaît. À ce
moment, le média est encore dépendant d’autres formes médiatiques : « dépourvu de réelle
épaisseur paradigmatique (…) son identité lui échappe encore6 ». La « naissance différentielle »
intervient lorsque le média s’affirme dans sa singularité, en développant des spécificités
identitaires (mode de communication, esthétique, champ sémantique, etc.). Elle coïncide
généralement avec une reconnaissance institutionnelle, et se traduit par une augmentation
sensible des ressources économiques qui lui sont allouées.
À croire Sylvain Parasie, sociologue à l’Université Paris-Est Marne-la-Vallée, la
« naissance intégrative » du data-journalisme7 daterait de la fin des années 1960, lorsque « l’idée
d’utiliser des bases de données comme support à la production d’information apparaît en
Amérique du nord8 ». Philip Meyer révèle ainsi en 1967 dans le Detroit Free Press, que les
jeunes étudiants Noirs ont autant participé aux émeutes de la ville que les jeunes Noirs sans
qualification, contrairement à une théorie « populaire chez les éditorialistes9 ». Mû par l’idée
d’exploiter les outils statistiques des sciences sociales à des fins d’investigation, et séduit par les
promesses du développement de l’informatique, il rédige même un manuel, The New Precision
Journalism10. Cette technique, qui prend finalement le nom de CAR - Computer Assisted
5 GAUDERAULT, André, MARION, Philippe, « Un média naît toujours deux fois ... », Sociétés et représentations, n° 9, 2000, pp. 21-36. 6 Ibid., p. 21. Appliqué à l’objet de leur recherche, deux auteurs montrent ainsi que le cinéma des premiers temps n’était pas considéré comme tel – le début d’un nouveau genre médiatique - mais comme un moyen parmi d’autres de réaliser des disciplines bien établis (fééries, mystères, etc.). 7 Tout au long de ce mémoire, les terminologies « data-journalisme » et « journalisme de données » seront utilisées sans guillemets et indifféremment pour désigner l’objet de recherche. Lorsqu’il s’agira de souligner une orthographe particulière, des guillemets seront systématiquement ajoutés. 8 Cité dans : INIZAN, Maël, « Chicago : de la prohibition au data-journalisme », Sillicon Maniacs, [disponible en ligne], 24 mars 2011. 9 [« Popular with editorial writers »] in MEYER, Philip, The New Precision Journalism, 4e Éd (1973), Rowman & Littlefield Publishers, 2002, p. 14. 10 Ibid., 304 p.

5
Reporting11 -, fait quelques émules dans les années 1980 où plusieurs prix Pulitzer sont récoltés.
Elle ne jouira cependant jamais d’une reconnaissance institutionnelle propre, les journalistes qui
l’utilisent étant systématiquement rattachés au journalisme d’investigation, genre déjà bien établi.
La « naissance différentielle » intervient dans les années 2000, lorsque des acteurs issus
du mouvement du logiciel libre, intéressés par les problématiques d’information, investissement
le champ journalistique à la faveur du mouvement d’ « open data »12. La figure emblématique de
ce phénomène est Adrian Holovaty. Développeur et journaliste, il se fait connaître au Washington
Post en lançant en 2005 Chicagocrime.org, carte localisant les crimes et délits à partir des fichiers
de police. Il écrit l’année suivante un court texte13, présenté aujourd’hui par les commentateurs
comme le « manifeste du data journalisme14 ». Le succès rencontré par ces acteurs amène les
grands titres de presse américains – New York Times, Washington Post, Chicago Tribune, Los
Angeles Times - à constituer des équipes dédiées et à les intégrer dans les rédactions, établissant
ainsi le data-journalisme comme une pratique légitime, dotée d’une reconnaissance
institutionnelle.
Construction de l’objet de recherche
Le « journalisme de données » mobilise deux termes polysémiques : « journalisme » et
« données ». Il convient de définir quelles significations de chacun de ces deux mots sont
mobilisées lorsque l’expression est employée.
11 « Journalisme Assisté par Ordinateur » 12 Aussi dénommé « mouvement de libération des données publiques », ce mouvement enjoint les administrations publiques à mettre à disposition des données librement réutilisables. 13 HOLOVATY, Adrian, « A fundamental way newspapers need to change », [disponible en ligne], 6 septembre 2006. 14 GUILLAUD, Hubert, « Les données pour comprendre le monde », InternetActu, [disponible en ligne], 19 juillet 2011.

6
La donnée comme production humaine
Le Trésor de la Langue Française Informatisé (TLFI) apporte, à l’entrée « donnée », au
moins deux significations intéressantes dans le cadre de ce travail. (i) « Quantité connue dans
l’énoncé d’un problème », la donnée est avant tout un élément quantifiable, que l’on peut
mesurer, manipuler, calculer. (ii) « Ensemble des indications enregistrées en machine pour
permettre l’analyse et/ou la recherche automatique d’informations », la donnée se veut
également manipulable par les outils informatiques. L’entrée « statistiques » - « recueil de
données numériques concernant des faits économiques et sociaux », - permet de discerner une
troisième acception du terme « donnée » : une production humaine ayant pour objectif
d’appréhender le social. Dans ce sens, la donnée est le fruit d’un processus, d’une médiation, elle
n’est donc paradoxalement pas « donnée ». En résumé, la donnée est quantifiable, informatisée,
mais également le fruit d’un processus du recueil. Cette dernière approche est développée par le
sociologue Olivier Martin.
Dans un débat sur « la vérité des chiffres15 », il présente les trois éléments qui, selon lui,
composent un chiffre. C’est d’abord une notion, c’est-à-dire ce que l’on veut mesurer, plus ou
moins latente selon les cas : si le statut matrimonial d’un individu est objectivable, ne serait-ce
que par le droit, il semble plus périlleux d'exprimer l’intelligence. C’est ensuite un process, soit le
dispositif humain d’enregistrement et les méthodes statistiques appliquées aux résultats ; la
donnée est bien le résultat d’une médiation humaine. C’est enfin une institution, qui réalise la
mesure dans un objectif défini : la recherche (laboratoire universitaire), le pilotage de l’action
publique (Etat), l’information (média), le commerce (institut de sondage), la dénonciation
(association), etc. Autrement dit, le chiffre statistique n’est pas simplement un nombre, mais la
représentation d’un dispositif de mesure conçu par des humains, et commandité par une
institution dans un but précis.
Lorsqu’il est utilisé dans le cadre des médias informatisés, le terme de « donnée » a
cependant tendance « à “avaler” [son] environnement, à jeter dans l’ombre des concepts
15 MARTIN, Olivier, « La vérité des chiffres : une illusion ? Débat entre entre Alain Blum, démographe, et Olivier Martin, sociologue. », La Vie des idées, [disponible en ligne], 12 novembre 2009.

7
connexes16 ». Selon Valérie Peugeot, il est utilisé à la fois pour désigner les métadonnées - les
éléments qui qualifient et donnent un sens à un document -, les données – au sens de chiffres
statistiques – et les documents numérisés – simples photographies de documents papier. La
majorité des réalisations estampillées « data-journalisme » concernent le second sens, mais il
existe des cas utilisant des métadonnées – une cartographie des auteurs de Wikipédia par
exemple17 -, ou se servant de documents numérisés – l’enquête sur les notes de frais des députés
britanniques notamment18. Au détour d’une phrase, Pierre Romera utilise ainsi clairement le mot
« donnée » pour signifier un document papier : « tu sais quand on parle de Wikileaks comme
révolution c’est complètement faux. Depuis toujours les journalistes utilisent des données, ou
qu’ils ont volées ou alors qu’ils ont trouvées, oubliées sur une photocopieuse.19 ».
Pour une dé-ontologie du journalisme
Tenter de donner une définition transnationale et atemporelle du journalisme serait, pour
reprendre les mots d’Erik Neveu, retomber dans « l’illusion essentialiste20 ». En premier lieu,
parce que le journalisme est ancré dans des histoires nationales propres, où les rapports aux
champs littéraires, économiques et politiques ne sont pas les mêmes. Jean Chalaby a ainsi pointé
les différences entre un modèle anglo-américain, devenu la norme internationale par son souci
d’indépendance, et un modèle français, marqué par sa plus lente autonomisation vis-à-vis du
pouvoir politique et du monde littéraire21. Ces deux pôles sont complétés par toute une série de
modèles intermédiaires, à l’instar du journalisme brésilien22. En second lieu, même au sein d’un
pays donné, les frontières de la profession de journaliste se révèlent « flou[es]23 ». Dans ces
16 PEUGEOT, Valérie, « Web des données, données ouvertes », France Telecom R&D, [disponible en ligne], Janvier 2010, p. 25. 17 http://wikiproject.oii.ox.ac.uk/mapping_wikipedia/ (consulté le 31 août 2012), cité in: « Les data en forme », OWNI, [disponible en ligne], 17 avril 2012. 18 LEON, Yann et ORMAN, Évelyne, « La ronde des chiffres du journalisme de données », La Croix, [disponible en ligne], 22 octobre 2010. 19 Entretien avec Pierre Romera (annexe 2) 20 NEVEU, Erik, « News without journalists : real threat or horror show », Brazilian Journalism Research, Vol. 6/1, 2010, p. 31. 21 CHALABY, Jean, The invention of journalism, Palgrave Mc Millan, 1998, 224 p. 22 MARQUES de MELO (José), 2009, « Journalistic Thinking. Brasil’s Modern Tradition », Journalism, Vol 10/1, pp. 9-27. 23 RUELLAN, Denis, Le professionnalisme du flou, Presses Universitaires de Grenoble, 1993, 232 p.

8
conditions, il semble nécessaire de réaliser une « dé-ontologie24 » du journalisme, et accepter que
le terme ne renvoie pas à une réalité univoque. Ce qui ne doit pas nous empêcher pour autant de
définir les grands registres de sens mobilisés lorsque le terme est employé.
À l’entrée « journalisme », le Trésor de la Langue Française Informatisé en indique au
moins trois. C’est avant tout la « profession de ceux ou celles qui exercent le métier de
journaliste », une corporation avec ses rivalités, son éthique, ses contraintes économiques. C’est
également « une manière de présenter les faits et les événements sous un éclairage propre », une
technique permettant le recueil, l’assemblage, la vérification d’informations afin de les rendre
intelligibles à un public. « Ensemble des journaux », le journalisme représente enfin une force
« comme moyen d’action ou de pression » : c’est un pouvoir, une autorité, une respectabilité.
Yves Jeanneret et Emmanuel Souchier proposent un triptyque comparable pour appréhender le
métier de journaliste. Il se composerait de trois éléments : « un marché », « une écriture », « une
responsabilité »25.
Erik Neveu décrit lui quatre « repères ou imaginaires professionnels26 » permettant de lier
les différentes pratiques du journalisme. Premièrement, un certain « ordre du discours » au sens
foucaldien27, entendu comme ce qui est pensable et dicible en société. Le journalisme se
caractérise par une manière de s’exprimer identifiée comme journalistique, qui se distingue des
paroles politiques, littéraires ou publicitaires. Deuxièmement, une pratique de recueil et de
transformation de l’information qui lui permet de ne pas répéter docilement celle produite par les
sources, en particulier les plus puissantes, le pouvoir économique et politique. Troisièmement,
une autorité : par la prétention à une certaine fidélité aux faits, le journaliste acquiert une parole
respectée, et une réputation de confiance. Enfin, la prégnance d’un certain nombre de mythes
fondateurs de la profession28 : la noblesse du métier, le service rendu au public ou l’idée de
bouclier de protection de la démocratie. C’est cette approche en termes d’imaginaires
professionnels qui sera utilisée ici.
24 RASTIER, François, « Ontologie(s) », Revue des sciences et technologies de l’information, Vol. 18/1, 2004, pp. 15-40. 25 JEANNERET, Yves et SOUCHIER, Emmanuel, « Introduction. Internet vu du journalisme », Communication et langages, n° 129, 3e trimestre 2001, p. 36. 26 NEVEU, Art. cit., p. 32. 27 FOUCAULT, Michel, L’ordre du discours, Gallimard, 1971, 81 p. 28 LE BOHEC, Jacques, 2000, Les mythes professionnels des journalistes, L’Harmattan, 395 p.

9
Problématique
Le développement du data-journalisme est porteur d’une promesse forte de transparence.
« Faculté de mettre en lumière29 » selon Thierry Libaert, le terme prend ici deux significations30.
Il peut s’agir de révéler des « vérités » masquées dans les chiffres par le croisement avisé de jeux
statistiques, comme l’enquête de Philippe Meyer sur les émeutes de Détroit en 1967. Dans ce cas,
la « libération » de données publiques à l’œuvre depuis quelques années n’est-elle pas une
aubaine pour ce type de travail journalistique ? La transparence peut également s’entendre
comme la prétention à « dévoiler » les coulisses du pouvoir, ses secrets inavouables et
comportements amoraux. C’est la figure installée du journaliste d’investigation, qui pose ses
yeux là où les puissants ne veulent pas. Ce dernier n’a-t-il pas tout à gagner de la numérisation
des documents politiques, rendant leur accessibilité et leur transmission bien plus aisées31 ? Tim
Berners-Lee, l’inventeur du web, et Eric Mettout, rédacteur en chef de Lexpress.fr, ne s’y
trompent pas : pour le premier, « data journalism is the future32 », pour le second c’est « l’avenir
en marche33 ».
Pourtant, force est de constater que le data-journalisme est encore peu présent dans les
organisations médiatiques « traditionnelles ». Confiné à l’étranger dans des grands titres de
presse, autour de figures tutélaires – Simon Rogers au Guardian, Aaron Pilhofer au New York
Times, Brian Boyer au Chicago Tribune -, le journalisme de données est même absent des
principaux titres français. Et lorsqu’un grand quotidien comme Le Monde lance un blog sur le
29 LIBAERT, Thierry, La transparence en trompe-l’œil, Descartes & Cie, coll. « Gouvernance et démocratie », 2003, p. 13. 30 CARDON, Dominique, « Zoomer ou dézoomer ? Les enjeux politiques des données ouvertes », OWNI, [disponible en ligne], 21 février 2011. 31 Olivier Tesquet, ancien d’OWNI passé chez Télérama, explique ainsi le péhnomène Wikileaks par cette relative facilité pour obtenir de l’information confidentielle : « C’est beaucoup plus facile de pirater des données confidentielles comme des mémos diplomatiques aujourd’hui qu’il y a 20 ans. 850 000 personnes ont accès à des documents top secret sur Intellipédia, (un wiki classifié des renseignements américain) », voir INIZAN, Maël, « L’open data appliqué au journalisme », Sillicon Maniacs, [disponible en ligne], 23 octobre 2011. 32 ARTHUR, Charles, « Analysing data is the future, says Time Berners-Lee », The Guardian, [disponible en ligne], 22 novembre 2010. 33 METTOUT, Eric, « Pourquoi le data-journalisme c’est l’avenir en marche », L’Express, [disponible en ligne], 7 avril 2010.

10
modèle du Guardian 34 , celui-ci ferme au bout de deux articles. Les seules expériences
revendiquées en France se trouvent à OWNI35, autrement dit à la marge des rédactions36.
Comment dès lors expliquer ce paradoxe entre des promesses faramineuses et une
institutionnalisation encore faible dans le secteur du journalisme ? Au-delà des arguments
économiques - une presse en crise -, ou historiques – une tradition inégale de CAR, « Computer
Assisted Reporting -, n’y a-t-il pas des raisons « communicationnelles » qui justifient cet écart ?
Un deuxième type de promesses du data-journalisme, que l’on nommera « objectivistes »,
pourrait abonder dans ce sens. Dans un des premiers articles sur le sujet en France, Nicolas
Vambremeersch utilise à plusieurs reprises l’expression de « données objectives37 » pour justifier
son propos. Pourtant, selon Jean-Christophe Féraud, journaliste « technologies » à Libération,
« la subjectivité ne se met pas en données, or le journalisme est un genre subjectif38 ». Il pointe
ainsi ce qu’il perçoit comme « une tendance à vouloir objectiviser à outrance la réalité39 ». Il
ajoute un second grief, estimant que le data-journalisme porte le risque d’une automatisation
néfaste du métier de journaliste : « à tous les zélotes du “data journalism”, qui sont [les] mêmes
que les partisans du “robot-journalisme”, je dis : “nous ne sommes pas des numéros !”. » Il
défend au contraire une « Information avec un grand “I”, de la chair, du sang et de l’histoire
dedans40 », où le journaliste se renseigne en profondeur sur un terrain, et restitue au lecteur
l’information mise en perspective grâce à la « puissance narrative de l’écrit41 ».
Cette opinion tranchée permet de distinguer des points de tension entre la perception du
data-journalisme et certains imaginaires du journalisme, tels que définis plus haut. Ainsi, à
écouter Jean-Christophe Féraud, « l’ordre du discours » journalistique est sérieusement remis en
34 Le blog « Données moi ! », avait ainsi pour signature « le blog data d’un data journaliste du Monde », et comme URL http://datablog.blog.lemonde.fr/ (consulté le 31 août 2012), clin d’œil explicite au datablog du Guardian, qui recueille toutes les réalisation du journal en matière de data-journalisme. 35 OWNI se présente comme « un média d’enquête, de reportage et de data-journalism, dédié aux cultures numériques ainsi qu’aux nouveaux enjeux de société ». 36 Pour preuve, ce n’est que très récemment qu’un journaliste de formation - Guillaume Dasquié - a remplacé Nicolas Voisin, entrepreneur, comme directeur de la publication. Voir : RICHÉ, Pascal, « OWNI se déchire (en deux) pour mieux redémarrer », Rue89, [disponible en ligne], 25 mai 2012. 37 VAMBREMEERSH, Nicolas, « Pour un journalisme de données », Slate, [disponible en ligne], 30 juillet 2009. 38 Entretien avec Jean-Christophe Féraud (Annexe 3) 39 FERAUD, Jean-Christophe, « Le “data journalism” contre Albert Londres », Sur mon écran radar, [disponible en ligne], 9 février 2010. 40 Entretien avec Jean-Christophe Féraud (Annexe 3) 41 Ibid.

11
cause par le journalisme de données : « le métier de journaliste c'est d'abord raconter les ressorts
d'une actualité en répondant le mieux possible aux fameux "5W42" (…). Or les chiffres à eux seuls
sont bien incapables de répondre à ce questionnement43 ».
Alors que le terme de « data-journalisme » suggère une inscription naturelle dans le
champ journalistique, cette citation pose la question de l’effectivité de ces liens : le data-
journalisme est-il « du journalisme » ? L’existence de deux signifiants suggère le contraire.
Avons-nous plutôt affaire à un genre journalistique, au même titre que l’enquête, le reportage ou
l’interview ? Si tel est le cas, pourquoi certains journalistes se revendiquent-ils du data-
journalisme, tandis que d’autres le rejettent ? Par quels mécanismes ?
Finalement, et ce sera le fil directeur de ce mémoire, il s’agira de se demander comment
les promesses du data-journalisme s’articulent avec les repères et imaginaires du
journalisme professionnel.
Méthodologie
Le choix d’une méthodologie suit logiquement la phase de problématisation, entendu que
toutes les méthodes ne conviennent pas à tous les questionnements. Une telle affirmation s’inscrit
en porte-à-faux avec des remises en cause récentes de la valeur scientifique de l’entretien semi-
directif, en particulier dans le cadre de mémoires étudiants44. Or, comme le notent Gilles Pinson
et Valérie Sala Pala, en réponse à l’article précité, « les spécificités de chaque recherche devront
être prises en compte pour déterminer quelle combinaison méthodologique saura le mieux rendre
compte de l’objet de recherche 45 ». En ce sens, ce mémoire proposera trois approches
complémentaires : l’analyse de discours, l’analyse sémiotique, ainsi que des entretiens semi-
directifs, qui permettent une approche compréhensive des discours des acteurs. 42 Les cinq « W » correspondent aux adverbes interrogatifs anglais « Who », « What », « When », « Where », « Why », auxquels une production journalistique se devrait de répondre. 43 FERAUD, Art. cit. 44 BONGRAND, Philippe et LABORIER, Pascale, « L’entretien dans l’analyse des politiques publiques : un impensé méthodologique ? », Revue française de science politique, Vol. 55, 2005, pp. 73-111. 45 PINSON, Gilles et SALA PALA, Valérie. « Peut-on vraiment se passer de l'entretien en sociologie de l'action publique ? », Revue française de science politique, Vol. 57, 2007, p. 596.

12
L’analyse de discours
L’ « analyse de discours » est à distinguer de l’ « analyse de contenus ». Cette dernière
permet d’analyser un corpus extrêmement large de textes, d’y repérer des occurrences et sortir
des statistiques. La première préfère une approche qualitative, se fondant davantage sur l’analyse
de la rhétorique employée (champs lexicaux, syntaxe, etc.), à une approche quantitative. Nous
nous intéresserons dans ce cadre aux discours des promoteurs du data-journalisme, ainsi qu’à
ceux portés par les médias. Le corpus principal a été constitué de manière partiellement
automatisée, par la mise en place d’alertes mails quotidiennes sur les termes « journalisme +
données », ainsi que « data + journalisme », faisant remonter les articles en français. Des
recherches régulières sur le web ont permis de compléter le corpus, en ciblant les articles français
utilisant une orthographe distincte (« datajournalism » par exemple), ainsi que les articles en
anglais particulièrement cités.
Une sémiologie graphique et linguistique
Pour Ferdinand de Saussure, la sémiologie est la « science qui étudie la vie des signes au
sein de la vie sociale46 ». En linguistique, un signe se compose d’un signifié (le sens, abstrait,
mental) et d’un signifiant (la forme, concrète, visible). Nous utiliserons l’analyse sémiologique
dans cette dimension linguistique, à travers l’étude des connotations des signifiants, tel le préfixe
« data » dans l’expression « datajournalisme ». Elle sera également mobilisée pour analyser les
connotations des signes graphiques, qu’ils soient plastiques – pouvant être examinés du point de
vue de la forme, des couleurs, de la texture, etc. -, ou iconiques – qui renvoient aux objets du
monde. Nous appliquerons cette « rhétorique de l’image47 » aux logos de certaines institutions,
ainsi qu’aux dispositifs se revendiquant du data-journalisme, dans une approche plus techno-
sémiotique. Ces deux dimensions - linguistique et graphique – sont cependant intimement liées,
et seront donc articulées dans l’analyse.
46 SAUSSURE (DE), Ferdinand, Cours de linguistique générale, Payot, édition 1973 (1916), p. 33. 47 BARTHES, Roland, « Rhétorique de l’image », Communications, Vol. 4/4, pp. 40-51.

13
Des entretiens semi-directifs dans une démarche compréhensive
Enfin, des entretiens semi-directifs se révèlent ici intéressants en raison de l’approche
compréhensive de ce travail. Or comme le notent Gilles Pinson et Valérie Sala Pala :
Dans la démarche compréhensive, l’objectif du chercheur n’est pas – tout du moins dans une
première phase de l’enquête – de rechercher la vérité des pratiques et représentations, de chercher à savoir si les acteurs disent la vérité ou pas, mais de comprendre pourquoi ce qu’ils disent est vérité48.
En effet, selon Jean-Claude Kaufmann, « la compréhension de la personne n’est qu’un
instrument : le but est l’explication compréhensive du social49 ». C’est bien dans cette approche
que s’inscrit notre recherche : comprendre la vérité des principaux promoteurs du data-
journalisme afin d’en discerner les promesses. Mais il s’agit aussi de reconnaître les limites d’une
telle méthode, en particulier le caractère un peu artificiel de l’information recueillie,
nécessairement « provoquée » par l’enquêteur. La stratégie adoptée a été de reprendre dès que
possible le vocabulaire des acteurs dans la formulation des questions, afin de limiter le
« conditionnement » des réponses. Une certaine honnêteté intellectuelle force cependant à
confesser que l’exercice n’est pas aisé : il est souvent tentant de faire dire à l’enquêté ce que l’on
souhaite qu’il dise, que cela soit - parfois - conscient, ou – souvent - inconscient. C’est la raison
pour laquelle, la méthode de l’entretien semi-directif a été articulée avec les précédentes.
Trois entretiens ont été réalisés par nos soins. Le premier avec Caroline Goulard, 25 ans,
diplômée en management des médias (IEP Rennes), formée au management des nouvelles
technologies (HEC / Telecom), co-fondatrice de la start-up de « visualisation interactive de
données » Dataveyes, et figure clé du data-journalisme en France50. Le deuxième avec Pierre
Romera, 23 ans, développeur, hacker, passé au pôle data-journalisme d’OWNI, fondateur de la
start-up Journalism++ avec son collègue Nicolas Kayser-Bril, et intervenant dans les écoles de
journalisme (ESJ Lille, CFPJ, IEP Paris). Le troisième, téléphonique, avec Jean-Christophe
48 PINSON, SALA PALA, Art. cit. 49 KAUFMANN, Jean-Claude, L’entretien compréhensif, Paris, Nathan, 1996, p. 16. 50 « LA spécialiste française » même, aux dires d’Eric Mettout. Voir : METTOUT, Art. cit.

14
Féraud, journaliste économique et technologique, passé par La Tribune, l’Expansion et les Echos,
aujourd’hui à Libération. « Journaliste gonzo, Twitter Addict, blogueur erratique, digitalien,
Punk avec un futur51 » selon ses propres termes, il s’est fait remarquer par un billet remonté à
l’encontre du data-journalisme52.
Trois autres entretiens ont été mobilisés occasionnellement afin de dresser un tableau
complet du data-journalisme en France. Deux sont tirés du mémoire de 4e année de Marlène
Quintard53, étudiante en journalisme au CELSA. Il s’agit de Karen Bastien, ancienne journaliste à
Libération, fondatrice de la start-up de visualisation de données We Do Data ; ainsi que Johan
Hufnagel, journaliste web à Libération, Marianne et 20 Minutes, aujourd’hui co-fondateur et
rédacteur en chef de Slate.fr. Enfin, un dernier réalisé par Yannick Estienne, chercheur en SIC à
l’ESJ Lille, en la personne de Jean-Marc Manach54. Hacker, journaliste d’investigation passé au
Monde Diplomatique, au Canard Enchaîné, à France Inter, France 5 et Internet Actu, il est
aujourd’hui blogueur pour Le Monde et journaliste à OWNI, intervenant dans les écoles de
journalisme (ESJ Lille, CFPJ, IEP Paris).
Manque à ce panel un entretien avec Nicolas Kayser-Bril. Âgé de 25 ans, formé en
économie des médias (IEP Lille), directeur du « pôle datajournalisme » à OWNI avant de fonder
Journalism++, c’est la deuxième figure clé du data-journalisme en France55. Deux explications à
ce manque : le fait qu’il réside désormais à Berlin, et le risque de faire redondance avec son
collègue Pierre Romera, avec qui il travaille depuis plus de deux ans. À défaut d’entretien
compréhensif, nous nous contenterons donc de ses nombreuses prises de parole dans les médias.
51 Présentation de Jean-Christophe Féraud sur : http://monecranradar.blogspot.fr/ (consulté le 31 août 2012) 52 FERAUD, Opcit. 53 QUINTARD, Marlène, Le datajournalisme, un nouveau genre journalistique. Ou comment rendre accessible une base de données complexe, Mémoire de master 1 en Journalisme, CELSA, 2012. 54 ESTIENNE, Yannick, « Evolution des pratiques journalistiques sur Internet : journalisme “augmenté”, data journalism et journalisme hacker (entretien avec Jean-Marc Manach) », Les Cahiers du journalisme, Vol. 22/23, Automne 2011, pp. 134-143. 55 « un des grands spécialistes » pour Flavien Chantrel, fondateur du Blog du Modérateur. Voir : CHANTREL, Flavien, « Le data-journalisme, enjeux et perspectives : interview de Nicolas Kayser-Bril », Le blog du modérateur, [disponible en ligne], 18 mars 2011.

15
Hypothèses et annonce du plan
Rappelons notre problématique : comment les promesses du data-journalisme s’articulent-
elles avec les repères et imaginaires du journalisme professionnel ? La réponse se fera en trois
mouvements.
Le premier tente de caractériser le data-journalisme. Il s’inscrit pour cela sous l’égide de la
catégorie descriptive de « trivialité56 », développée par Yves Jeanneret. L’hypothèse est que
l’expression a été principalement « réquisitionnée57 » par des acteurs extérieurs au journalisme
(hackers, acteurs économiques). Si les pratiques journalistiques auxquelles ils se réfèrent
(traitement automatisé de données, visualisation de statistiques, récit non linéaire) ne sont pas
nouvelles, le choix des signifiants – en particulier le terme « data » - leur confèrent une forte
connotation, autour de l’idée de richesse des données (métaphore du gisement) et d’une nécessité
à agir (une bannière « data » à rejoindre). Ce caractère injonctif est confirmé par l’analyse des
discours de ces mêmes acteurs. À ce stade de la réflexion, l’origine des principaux acteurs du
data-journalisme soulève un premier point de tension entre data-journalisme et imaginaires du
journalisme professionnel.
Le deuxième mouvement poursuit cette idée, en s’efforçant d’évaluer l’effectivité des
critiques adressées par certains journalistes à un journalisme centré sur le traitement de données
chiffrées (prétention objectiviste, robotisation de la profession). Il y est démontré que malgré
certaines tentations objectivistes indéniables, véhiculées par un amalgame fait / donnée, les
promoteurs du data-journalisme sont conscients de la subjectivité de l’élaboration des données,
La médiation humaine est revendiquée, afin que le traitement et la narration des données soient
faits par un professionnel maîtrisant la statistique et le récit journalistique : le data-journaliste.
Les imaginaires liés à « l’ordre du discours » et aux pratiques journalistiques sont donc réalisés
dans ces discours d’escorte. La conclusion de ce mouvement porterait à considérer le data-
journalisme se renforce d’une proximité avec les imaginaires du journalisme professionnel. 56 JEANNERET, Yves, Penser la trivialité. Volume 1 : La vie triviale des êtres culturels, Hermès-Lavoisier, coll. « Communication, médiation et construits sociaux », 2008, 266 p. 57 LABELLE, Sarah, « “La société de l’information” : Formule, récit et réquisition », in CHOUTEAU, Marianne et NGUYEN, Céline (dir.), Mises en récit de la technique, Éditions des Archives Contemporaines, 2011, pp. 33-44

16
Le troisième temps, centré sur le projet politique de « rénovation » du journalisme porté par
les tenants du data-journalisme, mettra en exergue les altérités entre ces deux blocs théoriques. Si
certaines convergences se font autour de l’actualisation de la figure démocratique du « journaliste
justicier58 », les autres propositions mettent à mal les repères du journalisme professionnel. Dans
le rôle social du journalisme d’abord : par l’individualisation de l’interprétation des réalisations
journalistiques, les dispositifs de data-journalisme favorisent la figure de l’ « individu rationnel »,
maximisant ses intérêts au détriment du reste de la collectivité. Dans l’autorité de la figure du
journaliste ensuite : en militant pour une mythique organisation horizontale de la société, les
promoteurs du data-journalisme veulent faire du journaliste un chef de projet, maillon parmi
d’autres, et comme les autres, dans la production de l’information.
58 LEMIEUX, Cyril, « Les formats de l’égalitarisme : transformations et limites de la figure du journalisme justicier dans la France contemporaine », Quaderni, n° 45, 2001, pp. 53-68.

17
I. Le data-journalisme comme action collective
« The only new thing in the world is the history you don’t know59. »
Harry S. Truman
La « trivialité » selon Yves Jeanneret ne doit pas s’entendre au sens courant –
« commun », « rebattu », « facile » -, mais au sens étymologique, du latin trivium, « carrefour de
quatre voies60 ». C’est un endroit de circulation, où l’on choisit le chemin à suivre. Appliqué à
l’étude du social, le terme devient concept, et désigne un monde en mouvement, où « les objets
culturels circulent et sont réinvestis en permanence par les acteurs qui les utilisent61 ».
Lorsque l’on veut caractériser le data-journalisme, l’idée de trivialité éclaire les limites
d’une approche essentialiste (A), qui décrit des objets stables, universels, atemporels. Le concept
est également d’une aide précieuse pour se concentrer sur les acteurs – non journalistes la plupart
- qui utilisent l’expression « data-journalisme » et l’investissent de sens (B). Enfin, il permet
d’étudier les connotations du signifiant « data », faux synonyme de « donnée » aux riches
promesses, utilisé comme bannière par des acteurs économiques émergents (C).
59 MILLER, Merle, Plain speaking : an oral biography of Harry S. Truman, Berkeley Publishing Corporation, 1974, p. 26. 60 JEANNERET, Yves, « Figures politiques de la trivialité : le symbolique, le populaire, et le public », in Économie politique de la trivialité, organisé par CELSA, Département « Médias et Communication », Neuilly-sur-Seine, 11 octobre 2011. 61 JEANNERET, Yves, Penser la trivialité, Op. cit., p. 16.

18
A. Des signifiés multiples : l’impossible approche essentialiste
Les entretiens conduits et l’analyse de discours ont permis de recueillir une grande variété
de définitions du data-journalisme. Nous les avons regroupées en deux catégories : les approches
« disciplinaires » (1) et les approches « culinaires » (2). Devant cette diversité de définitions,
parfois contradictoires, il semble impossible de trouver un référent au data-journalisme. Tout
juste peut-on construire un idéal-type, par définition insatisfaisant (3).
1. Les approches « disciplinaires »
Ces approches situent le journalisme en relation – d’assimilation, d’inclusion ou
d’exclusion – avec des disciplines supposées clairement identifiées, insistant ainsi sur la
continuité avec des pratiques antérieures. Selon Pierre Romera, le data-journalisme recouvre
« toutes les manières de faire du journalisme innovant62 » ; définition confirmée lorsqu’il évoque
sa « start-up » : « j’ai fondé Journalism++, société spécialisée dans le data-journalisme (…)
mais au sens large. On parle vraiment d’aider les médias à innover63 ». Pour son collègue
Nicolas Kayser-Bril, ce serait plutôt un synonyme de « journalisme digital64 », soit toutes les
possibilités pour faire du journalisme en ligne :
C’est la réponse technologique à [l’arrivée d’internet] en disant : on a un nouveau canal, des nouveaux outils, des nouveaux métiers qui apparaissent, on va les utiliser pour faire du journalisme aussi. (…). On peut faire ça avec de la donnée, la dimension masse de données est extrêmement importante, mais on peut faire ça aussi avec d’autres moyens65.
D’autres vont définir le terme par le regroupement de plusieurs disciplines. Les « data
journalism awards »66 présentent ainsi trois catégories de prix : « data-driven investigations »,
« data visualisation and storytelling », « data driven applications », signifiant par là qu’il s’agit
62 Entretien avec Pierre Romera (annexe 2) 63 Ibid. 64 C’est d’ailleurs le reproche que fait Caroline Goulard à cette définition quelques minutes plus tard. 65 Intervention dans : PORTE (DE LA), Xavier, « Le “data-journalisme” ou comment faire du journalisme avec les données », France Culture, Place de la Toile, [disponible en ligne], diffusée le 14 novembre 2010. 66 Lancés cette année par le GEN (Global Editor Network), en partenariat avec l’EJC (European Journalism Center) et Google, ils récompensent les réalisations de data-journalisme les plus réussies. Voir : http://datajournalismawards.org/ (consulté le 31 août 2012)

19
de sous-catégories du data-journalisme. Dans un commentaire à son propre article, Caroline
Goulard le situe « dans des courants comme le web sémantique, l’ouverture des données
publiques, la visualisation de la complexité, la structuration de données67 ». Pierre Romera a un
raisonnement similaire lorsque, plus tard dans l’entretien, il affine sa définition :
Si tu veux, moi j’ai tendance à prendre le data-journalisme, et à mettre dedans : “journalisme hacker”, qui est une discipline à part entière ; “visualisation de données”, parce que c’est aussi quelque chose qui a ses codes, ses règles, avec des méthodos très particulières ; “crowdsourcing68”, c’est l’exemple que je t’ai donné avec le Guardian et les notes de frais ; et il y en a un quatrième… (silence) Oui voilà c’est tout ce dont je te parle, tout ce qui a trait à la “sécurité”, à la maîtrise de l’outil informatique69.
Enfin, certains vont avoir des définitions restrictives, situant le data-journalisme au
croisement de plusieurs pratiques. Aux dires de Sylvain Parasie, le data-journaliste serait ainsi un
profil hybride entre journaliste et développeur. C’est le sens de ses articles sur la construction de
la figure du « journaliste-programmeur » ou « journaliste “hacker” »70. Pour Caroline Goulard et
Benoît Vidal, instigateurs du projet étudiant ActuVisu sur le data-journalisme, puis de la « start-
up » Dataveyes, l’essence de data-journalisme serait plutôt à trouver au croisement de trois
disciplines - le développement, le journalisme et le design -, comme en témoigne ce visuel.
Figure 1 : Image tirée de la présentation d’ActuVisu le 1e juillet 2010, lors du « Café Data » organisé par le Social Media Club France à la Cantine, sur le thème du « Datajournalism ».
67 En commentaire de : GOULARD, Caroline, « Ce qu’aurait pu être le Sarkomètre du Nouvel Obs », OWNI, [disponible en ligne], 10 février 2010. 68 Le « crowdsourcing », « approvisionnement par la foule » en français, désigne le phénomène d’externalisation d’une tâche à un grand nombre de personnes. 69 Entretien avec Pierre Romera (annexe 2) 70 DAGIRAL, Eric et PARASIE, Sylvain, « Portrait du journaliste en programmeur : l’émergence d’une figure de journaliste “hacker” », Les Cahiers du Journalisme, n° 22/23, 2011, pp. 144-155.

20
2. Les approches « culinaires »
Ces approches ont été nommées ainsi car, pour filer la métaphore culinaire, elles
définissent le data-journalisme à partir de sa « cuisine », c’est-à-dire le travail de transformation
d’une matière première – « les ingrédients » – en un produit fini – « le mets » - , après avoir suivi
un processus de traitement– « la cuisine ». En décrivant un processus singulier, ces approches
insistent sur la nouveauté du data-journalisme.
Beaucoup d’acteurs partent ainsi de « l’ingrédient principal », en l’occurrence la donnée,
pour caractériser le data-journalisme. Selon Karen Bastien, co-fondatrice de la « start-up » de
visualisation de données We do data, « [la] matière première, au lieu d’être des heures de rushs
de bandes son, des interviews ou du reportage terrain, va être de la “data”71 ». Et Jean-Marc
Manach de confirmer : « au lieu de faire de l’investigation avec des témoins, des sources, des
“gorges profondes”, on va faire de l’investigation avec les données72 ». Pour pouvoir être
traitées, ces données doivent être structurées et permettre une lecture automatisée73. Elles
nécessitent même, de l’avis de Caroline Goulard, une certaine complexité pour « mériter »
l’appellation « data-journalisme » :
Quand OWNI fait une carte interactive où tu peux cliquer sur les régions et il y a une petite info-bulle, avec un texte, une photo et une mini vidéo, ok… La base de données derrière elle doit faire vingt lignes à tout casser : c’est pas vraiment ce que j’appelle du data-journalisme74.
Certains prennent la position opposée et définissent le journalisme de données à partir du
« mets ». Olivier Tredan, doctorant en SIC, estime ainsi que le data-journalisme « se singularise
avant tout par la médiation d’une interface web75 ». Karen Bastien ajoute que la réalisation de
data-journalisme répond d’une esthétique propre : « il faut mettre une couche de design et
d’interface qui vont faire que l’objet chiffré va devenir intéressant, ludique. C’est 71 Entretien avec Karen Bastien (annexe 4) 72 Entretien avec Jean-Marc Manach (annexe 6), in ESTIENNE, Art. cit., p. 135 73 KAYSER-BRIL, Nicolas, « On l’a pas en format ordinateur », ActuVisu, [disponible en ligne], 15 décembre 2009. 74 Entretien avec Caroline Goulard (annexe 1) 75 C’est peut-être là la principale différence entre les deux exemples introductifs de ce mémoire. Voir : TREDAN, Olivier, « Quand le journalisme se saisit du web : l’exemple du datajournalism », in 1e colloque international – Les Mutations structurelles du journalisme, [disponible en ligne], Organisé par l’Université de Brasilia, Brasilia, 25-28 avril 2011, p. 2.

21
indispensable.76 ». On perçoit dans cette approche l’idée d’ « interactivité » : pour Alain Joannès
« une visualisation labellisée data journalism doit être interactive77 ». Ce terme est entendu
comme récit non-linéaire, faisant croire à l’utilisateur que c’est lui qui suscite les contenus78. Pour
Johan Hufnagel, une telle personnalisation de la navigation serait parée de vertus pédagogiques :
En bâtissant des interfaces graphiques pour accéder aux bases de données, le journalisme de données (...) offre aussi à l’usager la possibilité d’interroger n’importe quelle partie de cette base de données, de la rendre accessible et compréhensible instantanément : choix du zoom, délimitation de la zone géographique, sélection des dimensions comparées, personnalisation des critères de visualisation.79
Finalement, d’autres acteurs préfèrent une approche par la « cuisine », le processus de
transformation en quelque sorte. Aux dires du même Johan Hufnagel, le data-journalisme se
caractériserait par « du recueil et de la vérification de données, du récit, de la mise en forme80 » ;
et de poursuivre « tout cela fait partie du travail journalistique81 ». Le propre de ce genre serait à
trouver entre « l’ingrédient » et « le mets », dans l’angle donné au sujet : « on n’est pas dans la
production d’objet où l’on ferait juste des interfaces pour des bases de données, on raconte autre
chose82 ». Dans cette approche, comme dans celle par l’« ingrédient », le « mets » importe peu :
Le journalisme hacker, ce sont des processus plus ou moins automatisés et du bricolage, pour aller récupérer de la donnée. Après ce [que Jean-Marc Manach] en fait ça ne va pas forcément être un graphique interactif, ça pas forcément être une “app”, ça va être tout simplement un article, où il exploite ces données, et ça il peut le faire aussi bien sur papier que sur le web. Et pourtant ça c’est du data-journalisme83.
On se trouve dans une situation marquée par une multiplicité de définitions, certaines
étant même contradictoires, sur l’importance du rendu final notamment. Cela rend difficile
l’établissement d’un idéal-type satisfaisant.
76 Entretien avec Karen Bastien (annexe 4) 77 JOANNÈS, Alain, Data journalism. Bases de données et visualisation de l’information, Éditions du CFPJ, Décembre 2010, p. 90. 78 MITROPOULOU, Eléni, Médias, multimédia et interactivité : jeux de rôle et enjeux sémiotiques. Thèse de doctorat en sémiotique, Université de Limoges, 2007. 79 GOULARD, Caroline, « Journalisme de données », Art. cit. 80 Entretien avec Johan Hufnagel (annexe 5) 81 Ibid. 82 Entretien avec Karen Bastien (annexe 4) 83 Entretien avec Pierre Romera (annexe 2)

22
3. Des idéaux-types insatisfaisants
Ces deux grands types d’approche résultent d’un travail de typologie, mais on pourrait
encore multiplier les définitions. Dans une démarche de transparence, le blog militant Uppecult
définit « le data-journalisme [comme] le fait de contredire (ou d’approuver) les croyances ou les
discours en s’appuyant sur des faits chiffrés.84 ». Dans une approche plus managériale, Caroline
Goulard estime que « le journalisme de données, c’est avant tout une transformation de
l’organisation85 ». Finalement, il semble impossible d’arriver à une définition satisfaisante dans
le « système référentiel » (ce à quoi réfère un terme) de l’approche ontologique. La confession de
Pierre Romera est sur ce point éclairante :
Nicolas c’est mon associé aujourd’hui et toutes les trois semaines on essaie de trouver la bonne “baseline” pour notre boîte. En gros on cherche une nouvelle définition au data-journalisme, un truc qui corresponde vraiment à ce qu’on fait, et qui soit pérenne, qui survive un peu au “buzzword”86.
Une solution consiste cependant à rechercher un idéal-type, au sens wébérien. Se fondant
sur le hiatus irrationalis, ou postulat d’incomplétude, Weber affirme que « la réalité est
irréductible au concept 87 », qu’elle est si complexe qu’aucune théorie ne peut l’épuiser.
Cependant, cela n’empêche pas de définir des concepts hypothétiques – des idéaux-types –, à
comparer avec la réalité du phénomène social étudié. Transporté à la linguistique, ce concept
s’avère fécond : si aucun terme ne peut englober l’intégralité d’une idée, il est possible construire
des modèles, relativement exhaustifs, se rapprochant de la vision que les acteurs s’en font.
Trois travaux de recherche, entendue au sens large, peuvent être mobilisés en ce sens.
Celui d’ActuVisu d’abord, projet étudiant au long-cours, dont les conclusions sont symbolisées
par l’image présentée plus haut : une discipline au croisement du journalisme, du développement
et du design. En entretien, Caroline Goulard précise que la « data visualisation » implique de
« mobiliser de l’infographie interactive88 ». Celui de Marlène Quintard ensuite, qui, dans son
mémoire, donne cinq éléments de définition : « un travail journalistique », « un travail
84 BADOUARD, Thibault, « Introduction au data-journalisme », Uppercult, [disponible en ligne], 27 février 2012. 85 Entretien avec Caroline Goulard (annexe 1) 86 Entretien avec Pierre Romera (annexe 2) 87 GONTHIER, Frédéric, « Weber et la notion de « compréhension », Cahiers internationaux de sociologie, n°116, 2004, pp. 35-54. 88 Entretien avec Caroline Goulard (annexe 1)

23
collectif », « des références », « la donnée comme matière première », « la visualisation et
l’interactivité »89. Enfin, celui d’Olivier Tredan, qui caractérise le journalisme de données comme
« une pratique fondée sur le recueil, l'analyse statistique, la visualisation de données sur Internet
et leur traitement journalistique90 ». Dans chacune de ces définitions, les trois éléments des
« approches culinaires » reviennent en filigrane : les bases des données comme matières
premières (« l’ingrédient principal »), une pratique journalistique (« la cuisine ») et une interface
web de visualisation des données, non linéaire (« le mets »), formant ainsi un idéal-type du data-
journalisme.
Cette multiplicité de définitions du data-journalisme, et la difficulté à élaborer un idéal-
type satisfaisant montrent bien les limites d’une approche essentialiste. Comme le suggère le
cadre descriptif de la trivialité, il semble plus pertinent de tenir une démarche socio-historique, et
s’intéresser au type d’acteurs qui investissent l’expression de sens.
B. Une expression investie et promue par des acteurs extérieurs au journalisme
Il est marquant d’observer qu’à quelques exceptions près – Simon Rogers en Grande-
Bretagne ou Aaron Pilhofer aux Etats-Unis - les principaux promoteurs du journalisme de
données n’ont pas reçu de formation en journalisme. Effectivement, la « naissance différentielle »
du data-journalisme s’est faite aux Etats-Unis sous l’impulsion de « programmeurs autodidactes,
entrepreneurs du web, gestionnaires de projets web, programmeurs engagés dans les
communautés du logiciel libre ou militants de l’open data 91 », mais rarement journalistes
professionnels.
Dans le cas français, le constat est comparable, mais les acteurs diffèrent : le terme a été
« réquisitionné » principalement par des entrepreneurs du web, et non des développeurs (1). Ce
concept de « réquisition » permet d’ailleurs d’observer deux traits caractéristiques du data-
journalisme : une prétention abusive à la nouveauté (2) ainsi qu’une injonction à agir (3). 89 QUINTARD, Marlène, Op. cit., pp. 14-15. 90 TREDAN, Olivier, Art. cit., p. 1. 91 PARASIE, Art. cit., p. 3.

24
1. En France, une « réquisition » par des entrepreneurs web
Sur le web français, le tout premier article92 traitant du journalisme de données est
pourtant le fait d’un journaliste professionnel : Fabrice Gonthier - formé à l’IJBA, journaliste
local, et intervenant « multimédia » en écoles de journalisme (ESJ Lille puis CFPJ) -, qui
s’entretient sur son blog93 avec Nicolas Kayser-Bril. Les terminologies utilisées sont alors
« database journalism » et sa traduction française littérale « journalisme de base de données ». Le
post est repris dans l’article de veille hebdomadaire du site InternetActu94, sous la catégorie
« données publiques », signe que le data-journalisme ne jouit pas encore d’une existence propre
en France. Deux autres exemples soutiennent cette thèse. En mars 2008, Jean-Marc Manach
évoque la campagne « free our data » lancée par le Guardian, sans évoquer aucun des signifiants
utilisés pour caractériser le data-journalisme. Dans son mémoire de recherche de master 1, rédigé
durant l’été 2009, Caroline Goulard n’utilise aucune des terminologies non plus, alors qu’un
passage fait explicitement référence aux bases de données :
Internet abolit les longueurs imposées par les maquettes de la presse papier, incite à écrire des articles plus courts mais autorise en revanche la publication des textes intégraux d’interviews, d’infographies interactives, de bases de données ou de documents de travail.95.
En juillet 2009 toujours, un second article – intitulé « Pour un journalisme de données » -,
est publié sur le tout jeune magazine en ligne, Slate96. Il est l’œuvre de Nicolas Vambremeersh,
ancien blogueur politique, et dirigeant d’une agence de communication digitale, Spintank.
Jusqu’en mars 2010 pourtant, la terminologie est hésitante entre « database journalism » et « data
journalism » ; en témoignent le blog lancé par Caroline Goulard97 ou l’utilisation des mots-clés
92 Pour déterminer les premiers articles traitant du sujet, il a été utilisé la requête « daterange: » du moteur de recherche Google, qui permet de chercher des contenus publiés entre deux dates précises. Il est néanmoins possible que des articles antérieurs aient été dé-publiés ou soient inaccessibles, comme le blog de Nicolas Kayser-Bril, « Window on the Media ». 93 GONTIER, Fabrice, « Database journalism : “un renversement de perspective” (itw) », Esprit Blog, [disponible en ligne], 4 juillet 2009. 94 « A lire ailleurs du 22 juin au 9 juillet », InternetActu, [disponible en ligne], 10 juillet 2009. 95 GOULARD, Caroline. Mutations des entreprises de presse liées au développement de leurs activités numériques. Mémoire de master 1 en Management des organisations, Sciences Po Rennes, 2009, p. 49. 96 VAMBREMEERSH, Art. cit. 97 http://databasejournalism.wordpress.com/, lancé le 1 novembre 2009, consulté le 31 août 2012.

25
dans les articles d’OWNI98. Le mouvement se développe alors autour de deux pôles : ActuVisu,
projet de visualisation de l’information porté par des étudiants de l’IEP de Rennes et de l’HETIC,
lancé en avril 2010, et représenté par Caroline Goulard ; et OWNI, qui commence à publier des
articles sur le sujet. Une convergence se fait même au sein d’OWNI entre mars et août 2010, à la
faveur du lancement du « pôle datajournalisme », dirigé par Nicolas Kayser-Brill99 ; avant
qu’ActuVisu ne quitte définitivement OWNI - non sans quelques frictions - au moment du
lancement de Dataveyes,. Nicolas Kayser-Brill partira lui aussi en octobre 2011, pour fonder
Journalism++ avec Pierre Romera. Il semblerait que ce soit durant ce court moment de
convergence que la terminologie se stabilise sur « data journalism » - malgré quelques hésitations
orthographiques persistantes (cf. infra) -, et son pendant français de « journalisme de données ».
Ce sont en tout cas ces deux expressions reprises par les médias pour décrire le phénomène100.
Les recherches de Sarah Labelle sur « la société de l’information » sont éclairantes pour
comprendre le processus d’autonomisation du data-journalisme. Comme « société de
l’information », « fracture numérique » ou « développement durable101 », un terme émerge, puis
s’impose, sans avoir de signification précise. Le terme est alors « réquisitionné » par un certain
nombre d’acteurs – dans le cas du data-journalisme : des hackers aux Etats-Unis, des
entrepreneurs du web en France -, utilisé massivement, le rendant ainsi, « incontournable ».
À l’instar de « la société de l’information » (Labelle, 2001), plus qu’un matériau idéologique ordinaire, c’est un signe écrit global qui s’apparente, comme la marque, à un nom de baptême pour tout un univers (Peninou, 1971) Nous sommes dans le régime de l’“incontournable”. L’inscription est omniprésente (…) Dans cet univers de réquisition (Labelle, 2007), il est moins coûteux pour tous, militant qui défend une cause ou équipe qui engage une recherche, de prétendre œuvrer pour un réel développement durable et pour la vraie société de l’information, que de remettre en cause ces catégories102.
La mobilisation de ce concept aide à penser deux caractéristiques du data-journalisme : la
prétention, abusive, à une nouveauté radicale dans les pratiques journalistiques, ainsi qu’une
injonction à l’action, qui masque en réalité ce flou sémantique.
98 De septembre 2009 à mars 2010, sont utilisés indifféremment les mots clés « database journalism » et « data journalism » pour qualifier les articles, avant que ce dernier ne devienne la norme. 99 GOULARD, Caroline, « La fabrique du data-journalisme », OWNI, [disponible en ligne], 20 mars 2010 ; ou KAYSER-BRIL, Nicolas, « La fabrique du data #2 », OWNI, [disponible en ligne], 25 mai 2010. 100 FANEN, Sophian, « Les journalistes à data sur les données », Libération, [disponible en ligne], 3 janvier 2012. 101 JEANNERET, Yves, « L’optique du sustainable : territoires médiatisés et savoirs visibles », Questions de communication, n°17, 2010, pp. 59-80. 102 Ibid. p. 60.

26
2. Une prétention abusive à la nouveauté
C’est le propre d’une expression « réquisitionnée » : pour justifier son utilisation courante,
il faut considérer que tout ce qui se faisait auparavant était peut-être proche, mais d’une nature
différente. Selon Philippe Breton il ne s’agit pas d’un phénomène conscient, mais de
« cryptomnésie » : « nous identifions comme nouveau quelque-chose que nous connaissons déjà
mais que nous avons oublié comme tel103 ». Pourtant si l’on se réfère à l’idéal-type complet du
data-journalisme, défini plus haut, aucun des éléments ne semble particulièrement novateur : le
travail journalistique (la « cuisine »), n’est évidemment pas inédit, mais les deux autres éléments
non plus. Ainsi, le traitement de bases de données à des fins journalistiques (« l’ingrédient ») était
déjà à l’œuvre dans les années 1960 aux Etats-Unis, avec le CAR (cf. supra). La filiation est
d’ailleurs clairement assumée 104 . En revanche, concernant l’interface de visualisation
« interactive » (le « mets »), la tentation à faire « table rase » du passé est plus prégnante.
Si nul ne prétend avoir « inventé » la visualisation de statistiques, il est intéressant à ce
propos de noter l’apparition du terme « dataviz », diminutif de l’anglais « data visualization »,
qui caractériserait « l’art d’organiser les données sous forme graphique 105 ». Signifiant
intimement lié au data-journalisme par son préfixe commun, il suggère, par sa seule nouveauté,
des réalisations graphiques inédites, sans doute plus créatives, plus esthétiques, plus pertinentes,
en un mot plus abouties. Pourtant, les imaginaires créatifs – cartes de métro, lecture par flèches,
nuages de mots – peuvent être assez redondants, et les formes graphiques – histogramme
circulaire, cartogramme, cosmographe – inventées il y a parfois plusieurs siècles. Deux
illustrations étayent ce propos. Premièrement, la tentative – humoristique mais signifiante - de
mise en abîme de la notion de « dataviz », par la « start-up » We Do Data (annexe 7)106.
Deuxièmement, l’affiche de présentation d’un concours de « dataviz » organisé par Google à
l’occasion des élections présidentielles françaises de 2012 (annexe 8)107.
103 BRETON, Philippe, L’utopie de la communication : le mythe du « village planétaire », La Découverte, 2004, p.103. 104 Entretiens avec Caroline Goulard (annexe 1) et Pierre Romera (annexe 2) 105 GEVAUDAN, Camille, « Zoom sur 50 classiques de la “dataviz” », Ecrans, [disponible en ligne], 26 juin 2012. 106 « La dataviz de la dataviz », réalisée à l’occasion de l’événement « Expoviz » (annexe 7) 107 « Concours Google de dataviz » (annexe 8)

27
Michaël Friendly, psychologue et statisticien à l’Université de York au Canada, remet la
représentation statistique dans une perspective historique de long terme108. Il montre que la
plupart des inventions se sont faîtes au XIXe siècle, en particulier pendant sa seconde moitié,
dans ce qu’il nomme un « âge doré109 » de la statistique graphique. Les figures clés de ce
mouvement sont Charles Minard (graphique à plusieurs variables, annexe 9 110), Florence
Nightingale (histogramme circulaire), Emile Levasseur (cartogramme), Emile Cheysson (carte en
anamorphose) ou Francis Galton (concept de corrélation). Beaucoup de représentations
contemporaines répandues s’inspirent ainsi de ces inventions, parfois de manière frappante
(annexes 10 et 11)111.
Enfin, en ce qui concerne l’ « interactivité », les promesses de personnalisation de la
navigation ne sont pas si neuves non plus. Dans les années 1980, autour de l’ « invention » du
lien hypertexte par Ted Nelson, l’image qui dominait était celle d’un « lecteur actif112 ». À la
différence des livres traditionnels au récit linéaire, l’époque encensait le nœud, le lien,
l’arborescence, le fragment ; autant de figures qui furent à la base du web tel qu’inventé par Tim
Berners-Lee en 1989. La promesse était celle d’un lecteur « libre », construisant son propre
parcours à l’aide de grandes arborescences. Le succès des « romans dont vous êtes le héros »
dans les années 1980 et 1990 en est emblématique113. Au sujet des sites d’information en ligne,
John Knox observe cette « représentation idéologique » voulant que « l’internaute [puisse] se
constituer son propre chemin114 ». Il remarque pourtant que ce sont les éditeurs du site qui
« déterminent le paradigme idéologique et le positionnement de chaque information à l’intérieur
108 Voir son projet « Milestrones in the history of thematic cartography, statistical graphics, and data visualization », accessible sur http://www.datavis.ca/milestones/ (consulté le 31 août 2012) 109 FRIENDLY, Michael, « The golden age of statistical graphics », Statistical Science, Vol. 23, 2008, pp. 502-535. 110 Voir notamment sa célèbre carte figurative des pertes de l’armée napoléonienne durant la campagne de Russie (annexe 9) 111 A titre d’exemple, nous comparons en annexe 10 les représentations graphiques de Charles de Fourcroy (1782) et de Guardian (2011), et en annexe 11 les histogrammes circulaires de Florence Nightingale (1857) et d’ActuVisu (2010) 112 JEANNERET, Yves, « Entre héritages et ruptures, la dynamique de l’obsolescence», in Économie politique de la trivialité, organisé par CELSA, Département « Médias et Communication », Neuilly-sur-Seine, 8 novembre 2011. 113 GANTIER, BOLKA, « L’expérience immersive du web documentaire : études de cas et pistes de réflexion », Les Cahiers du journalisme, n° 22/23 – automne 2011, p. 127. 114 DAGIRAL, Eric et PARASIE, Sylvain, « Presse en ligne : où en est la recherche ? », Réseaux, n° 160-161, 2010/2, p. 23.

28
de celui-ci115 ». Encadré par les dispositifs techno-sémiotiques, le lecteur n’est donc pas si
« libre » qu’il y paraît.
En somme, aucun des éléments de l’idéal-type ne relève d’un changement de nature par
rapport à des pratiques antérieures. Même en combinant les trois – donnée comme matière
première, travail journalistique, interface web de visualisation non-linéaire -, il existe des
exemples antérieurs à l’apparition du terme « data-journalisme », les représentations
d’assemblées par groupes politiques après une élection par exemple, où l’utilisateur pouvait
naviguer entre différents scrutins.
3. Une injonction à agir
Si les discours d’escorte des termes « réquisitionnés » réactualisent des promesses
anciennes, ils sont également caractérisés par le mode de l’injonction : à l’instar du phénomène
d’ « open data »116, on ne sait pas très bien ce que c’est, mais « il faut y aller ». Dans l’incapacité
de définir précisément l’objet, la rhétorique se fait impérative, et impose le terme en soulignant sa
nécessité. « Pour un journalisme de données117 », « Assez d’articles, on veut des contenus ! 118 » :
les titres utilisant ce registre sont courants au moment où l’expression « data journalisme » fait
son apparition en France. Le tableau ne serait pas complet sans mentionner le texte d’Adrian
Holovaty « A fundamental way newspapers need to change119 », écrit en 2006, et considéré par
beaucoup de commentateurs comme le « manifeste » du data-journalisme, soit le texte fondateur
d’un mouvement.
115 KNOX, John, « Visual-verbal communication on online newspaper home pages », Visual communication, vol. 6(1), 2007, p. 47. Cité et traduit in : DAGIRAL, PARASIE, Ibid. 116 L’injonction est même plus forte encore dans le cas de l’open data, le signifiant « open » étant conjugué impératif. Voir GOETA, Samuel, Open data : qu’ouvre-t-on avec les données publiques ?, Mémoire de master 2 en Sciences de l’Information et de la Communication, CELSA, 2011, pp. 10-11. 117 VAMBREMEERSCH, Art. cit. 118 GOULARD, Caroline, « Assez d’articles, on veut des contenus ! », OWNI, [disponible en ligne], 17 novembre 2009 ; reproduction de l’article originel GOULARD, Caroline, « Le database journalism pour nous sauver du “frogboiling” », Database journalism, [disponible en ligne], 10 novembre 2009. 119 HOLOVATY, Adrian, Art. cit.

29
La filiation suggérée par le terme est pertinente ici : tout comme le mouvement du logiciel
libre, regroupé autour de la « figure emblématique120 » de Richard Stallman et du projet GNU, on
peut dire que le mouvement du data-journalisme s’est organisé autour d’une personne - Adrian
Holovaty – et de son texte de 2006. L’article de Caroline Goulard, renommé par OWNI « assez
d’articles, on veut des contenus ! », paraphrasant ainsi la dernière phrase, était initialement
intitulé « le database journalism pour nous sauver du frogboiling121 ». Or ce titre, en plus
d’utiliser le registre de la salvation, fait explicitement référence à l’argumentaire d’Adrian
Holovaty dans son « manifeste ». Par cette répétition de l’argumentaire, les militants français se
font « apôtres122 », diffusant la « parole122 » du data-journalisme. La métaphore religieuse est
d’ailleurs très présente dans les discours d’accompagnement : on ne compte plus les « pape123 »,
« bible124 » ou « voies125 » en matière de data-journalisme.
Le rapport sacré au data-journalisme est doublé d’une prétention d’inéluctabilité. Dans
cette vision, rien de sert de lutter : le journalisme de données représente « l’avenir en marche126 ».
La question n’est plus de discuter l’opportunité pour les rédactions de lancer des projets dans
cette direction, mais de se demander « pourquoi les médias français se s’y mettent pas127 », alors
que « quelques grands exemples anglo-saxons ont clairement montré la voie128 ». Beaucoup
d’articles sur le sujet dissertent ainsi autour du supposé « retard129 » de la France par rapport à ces
pays. Ce type de discours d’accompagnement a été mis en perspective par les travaux de Julie
120 PROULX, Serge, « Les militants du code : la construction d’une culture technique alternative », in Le logiciel libre en tant que modèle d’innovation socio-technique. Pratique et développement de coopération dans les communautés, [disponible en ligne], Congrès de l’ACFAS, Université Mc Gill, Montréal, 16 mai 2006, p. 3. 121 Le « frogboiling » correspond à une légende selon laquelle si une grenouille entre dans une casserole d’eau bouillante, elle en sort immédiatement, consciente du danger. En revanche, si cette même grenouille rentre dans une casserole d’eau froide chauffée progressivement, elle ne sortira jamais et mourra de chaleur. Par analogie, on comprend que le journalisme traditionnel ne s’intéresserait qu’aux événements extraordinaires – un incendie mortel par exemple -, alors que le journalisme de données mettrait en perspective sur du long terme – disons les coupures budgétaires chez les pompiers -, jouant le rôle de lanceur d’alerte en cas de dégradation avancée d’une situation. 122 ROMERA, Pierre, « Le data-journalism notre religion », OWNI, [disponible en ligne], 30 août 2011. 123 FANEN, « Le journalisme à data sur les données », Art. cit. 124 LEDUC, Caroline, « Le data journalisme a désormais sa bible », Journalismes, [disponible en ligne], 5 décembre 2010. 125 GOULARD, Caroline, « Les quatre voies du datajournalism », OWNI, [disponible en ligne], 7 avril 2010. 126 METTOUT, Art. cit. 127 GOULARD, Caroline, « Data journalism : pourquoi les médias français ne s’y mettent pas ? », OWNI, [disponible en ligne], 8 mars 2010. 128 Entretien avec Caroline Goulard (annexe 1) 129 CASTELLI, Elodie, « Le data-journalisme peine à se développer en France », Journalismes, [disponible en ligne], le 24 janvier 2010.

30
Bouchard sur « le retard français130 ». Elle montre que ces discours sont fondés sur l’angoisse et
qu’ils ne peuvent être remis en cause : lorsque l’on est dans l’urgence il est trop tard pour
réfléchir. Derrière, on perçoit un discours de type consultant, qui essaie de vendre un produit à un
dirigeant, pour « ne pas être à la traîne ». Une mise en perspective stimulante dès lors que les
principaux promoteurs français sont aujourd’hui dirigeants de « start-up ».
La mobilisation du concept de « réquisition » a permis de porter notre attention sur les
acteurs de ce que l’on peut désormais appeler le « mouvement » du data-journalisme, dans une
dimension socio-historique et communicationnelle. Dans une approche en termes de trivialité, il
convient désormais de s’attacher plus en détail les des connotations signifiants choisis pour
évoquer le data-journalisme.
C. Une dé-ontologie du data-journalisme : les riches connotations du mot « data »
Peut être encore plus que pour le « journalisme » (cf. supra), réaliser une « dé-
ontologie 131 » du « data-journalisme », et donc se concentrer sur les signifiants, s’avère
indispensable à l’analyse. En étudiant les médias informatisés, Yves Jeanneret remarque ainsi que
« le discours (…) est présent d’emblée dans la désignation des objets qu’il est censé
accompagner », dans la mesure où « l'imaginaire contenu dans les mots et les images fait
davantage qu'accompagner les objets, il les constitue132 ».
En partant de ce postulat, on remarque que les terminologies utilisées en France pour
désigner le data-journalisme sont fortement connotées. A l’inverse des expressions utilisées
outre-Atlantique, elles orientent le regard sur les données (1), et suggèrent dans le même temps
un sentiment de multitude, de foisonnement (2) ainsi que l’appartenance à un mouvement plus
large, regroupé sous une bannière « data » (3).
130 BOUCHARD, Julie, Comment le retard vient aux Français. Analyse d’un discours sur la recherche, l’innovation et la compétitivité 1940-1970, Septentrion, 2008, 328 p. 131 RASTIER, Art. cit. 132 JEANNERET, Yves, « Autre chose qu’un discours, davantage qu’un accompagnement, mieux qu’une résistance », in La communication entre libéralisme et démocratie, Terminal, n° 75, été 2011, L’Harmattan, pp. 107-117.

31
1. La « data » au cœur de la terminologie française
Les expressions employées pour qualifier le data-journalisme sont extrêmement
nombreuses : « data journalism », bien sûr, mais également « database journalism », « hacker
journalism » et leurs déclinaisons françaises respectives 133 , ainsi que « data-driven
journalism134 », « computational journalism135 », ou encore « programmer-journalism136». Ces
différentes terminologies partagent beaucoup de références et de pratiques mais « ne mettent pas
exactement l’accent sur les mêmes éléments137 ». Certaines mettent ainsi l’accent sur les outils
utilisés. C’est le cas de « computational journalism », qui insiste le rôle de l’informatique, mais
également « data-driven journalism » par une référence aux logiciels de traitement de données :
"Data driven” était plus intéressant par rapport aux technos notamment. Par exemple en visualisation de données, on utilise beaucoup une librairie en Javascript qui s’appelle D3js pour “data driven documents”, donc “data driven documents”, “data driven journalism” : je pense que ce n’est pas anodin138.
Mais le plus marquant est l’opposition entre les terminologies utilisées uniquement dans
le monde anglo-saxon – « programmer journalism » et « hacker journalism » -, et celles
plébiscitées en France – « database journalism » puis « data journalism », ainsi que leurs
traductions littérales. Les premières insistent sur « une figure d’acteurs étrangère aux salles de
rédactions139 », mettant en exergue le brouillage des identités professionnelles du métier de
journaliste. Les secondes mettent au contraire l’accent sur les données, faisant miroiter les
perspectives journalistiques – entendu ici au sens de pratiques propres - d’un champ encore
relativement vierge. 133 PARASIE, Art. cit. 134 DAGIRAL, Eric et PARASIE, Sylvain, « Data-driven journalism and the public good : “Computer Assisted Reporters and “programmer-journalists” in Chicago », à paraître. 135 COHEN, Sarah, HAMILTON, James et TURNER, Fred, « Computational journalism », Communication of the ACM, Vol. 54, n° 10, pp. 66-71. 136 BETANCOURT, Leah, « How Programmer-Journalists are changing the news », Mashable, [disponible en ligne], 11 décembre 2009. 137 DAGIRAL, PARASIE, « Portrait du journaliste en programmeur : l’émergence d’une figure de journaliste “hacker” », Art. cit., p. 144. 138 Entretien avec Caroline Goulard (annexe 1) 139 DAGIRAL, PARASIE, « Portrait du journaliste en programmeur : l’émergence d’une figure de journaliste “hacker” », Art. cit., p. 144.

32
La connotation est plus fine encore : ce ne sont pas tant les « données » que ces
terminologies évoquent mais plus précisément la « data ». Il est ainsi significatif de voir que les
promoteurs français du data-journalisme, non contents de choisir les expressions relatives aux
données, ont parfois préféré franciser la terminologie anglaise plutôt que de la traduire
littéralement. Ainsi, à côté des « datajournalism » et « data journalism », coexistent aujourd’hui
les orthographes « datajournalisme », « data journalisme » et « data-journalisme ». Par la
terminaison « -isme », et l’ajout d’un tiret, l’expression prend une tonalité toute autre, plus
française, et naturalise ainsi son existence : il est à l’oreille moins perturbant d’entendre
« data-journalisme » que « datajournalism140 ». La nuance peut paraître marginale au premier
regard ; elle devient très signifiante au second. Un détour par l’étymologie permet de l’expliciter.
2. Un sentiment de multitude
Dans un article de 2005141, traduit récemment en français142, Norman Gray, astronome de
l’université de Glasgow, propose de relire le sens du mot « data » à la faveur des usages de la
langue. L’origine étymologique du terme est latine : « datum » est le participe passé neutre
singulier du verbe « dare », « donner », également utilisé comme nom commun – « une chose
donnée ». « Data » correspondant au pluriel. Il est employé en anglais dans ce sens mais, à
l’instar de « media » ou « agenda », s’impose à l’usage comme un singulier, jusqu’à ce que
« datum » disparaisse purement et simplement. Dans cet usage, « data » ne peut désormais plus
être simplement le pluriel de « datum » :
Privé d'ancrage, il s'est éloigné de ce simple sens dérivé pour un sens en soi distinct et indépendant. Il a alors construit des règles d'usage pour lui-même, sans être entravé par son passé latin. (…) Data ne signifie plus juste une (foutu) [sic] datum après une autre. (…) Cette acception universelle de data comme mesurable plutôt que comptable met sans ambiguïté le mot dans la même catégorie grammaticale que le "charbon", le "blé" ou le "minerai", qui est celle des noms de masse ou d'agrégat143.
La distinction anglaise entre « how much » (« quelle quantité de ») et « how many »
(« quel nombre de »), rend bien compte de cette distinction. Cette subtilité syntaxique est 140 À prononcer avec une terminaison anglaise. 141 GRAY, Norman, « Data is a singular noun », [disponible en ligne], 2 janvier 2005. 142 SALAUN, Jean-Michel, « Singulière data », [disponible en ligne], 10 avril 2012. 143 Ibid. Traduction de GRAY, Art. cit.

33
masquée par l’adverbe interrogatif « combien », traduisant indifféremment la quantité et le
nombre en français. Or la traduction en « données » reproduit l'emploi originel du terme : il est
tout à fait possible en français d’additionner, compter, dénombrer des données ; on ne les
considère pas comme un bloc indivisible.
On comprend dès lors la nuance à la réquisition du terme « data » plutôt que « données ».
Alors que « la donnée » se représente facilement au singulier, - la donnée d’un problème, la
donnée du jour -, cela semble inconcevable, grammaticalement incorrect, pour « la data » :
lorsque l’on parle de « la data », on évoque un agrégat d’éléments insécables. En utilisant ainsi un
nom singulier figurant pour un tout, on signifie automatiquement la multitude, la profusion, la
masse. Johan Hufnagel, non sans quelques hésitations syntaxiques, abonde dans ce sens : « pour
moi le data c’est le recueil et le traitement de données massives (…) quand je parle de data, je
fais la différence entre le data et l’infographie, les datas c’est vraiment des données massives.
C’est un traitement de plusieurs centaines voire milliers de données144 ».
Figure 2 : Couverture de The Economist, semaine du 27 février au 5 mars 2010
Figure 3 : Capture d’une présentation de Dataveyes intitulée « transformation de notre paysage informationnel & journalisme de données »
144 Entretien avec Johan Hufnagel (annexe 5), in QUINTARD, Op. cit.

34
Le sentiment est renforcé par la métaphore – très présente -‐, du « déluge »145 : pour
Karen Bastien « la data, qui était en petite quantité jusqu’ici, arrive par flux, par trombe
d’eau146 ». Elle suggère la surabondance, l’envahissement de l’espace personnel par un amas
de données, mais également, par le choix d’un terme apocalyptique, un univers menaçant,
incontrôlable, confirmant ainsi la manipulation du registre de l’angoisse147. Mais plus
encore que le data-‐journalisme, cet imaginaire sied au « Big Data148 », signe que toutes les
expressions composées par le « data » se répondent, dans un univers sémantique commun.
3. Le rattachement à une bannière « data »
Saussure, fondamentalement opposé à l’approche classique de la grammaire, selon
laquelle un mot correspond à une chose du monde, avait posé l’idée que les mots n’ont de sens
que de manière négative, par opposition les uns avec les autres. Ils signifient « par ce qu’ils ne
sont pas », dans la mesure où chaque mot a au moins un élément de différence avec un autre.
François Rastier pousse la réflexion à son terme, et affirme que le langage se caractérise par un
« système différentiel d’oppositions et non un codage d’identités référentielles149 ». Dès lors,
« data-journalisme », à la différence du « journalisme de données », s’enrichit du sens des autres
expressions francisées partageant le terme « data » : « le Big Data », « l’open data », « la
dataviz », « le data mining ». Passons en revue leurs différentes connotations.
Par l'adjonction d’un adjectif représentant la grandeur – alors que « data » le suggère déjà
-, et le choix de majuscules, « Big Data » se place dans un registre pléonastique, signifiant plus
fortement encore ce sentiment de multitude. Le terme « open data » évoque lui une triple
signification : une transparence politique, un mouvement social et une injonction150. « Dataviz »
figure plutôt les réalisations, le « mets », en mettant l’accent sur la mobilisation d’une « narration
145 BAYET, Antoine et DUCHAMP, Agathe, « Les nouveaux habits du journalisme dans le monde du déluge des données », Regards Sur Le Numérique, [disponible en ligne], 10 mars 2011. 146 Entretien avec Karen Bastien (annexe 4) 147 BOUCHARD, Opcit. 148 GUILLAUD, Hubert, « Big data : les progrès de l’analyse de données », Internet Actu, [disponible en ligne], 3 octobre 2011. 149 RASTIER, François, « Le silence de Saussure ou l’ontologie refusée », in BOUQUET, Simon, Saussure, L’Herne, 2003, p. 26. 150 GOETA, Opcit., pp. 10-11.

35
visuelle151 », plutôt qu’une « narration verbale151 », assimilée au journalisme traditionnel. Quant à
« data mining », il procède sans équivoque de la métaphore du gisement, d’une richesse enfouie à
aller déterrer. Le « data-journalisme », bien plus que le « journalisme de données » se renforce de
toutes ces connotations. En témoigne cette très longue citation de Caroline Goulard :
En fait ça a un sens parce que le mot “data” ce n’est pas uniquement la version anglaise de “donnée”. Quand on utilise le mot data en Français, de plus en plus c’est pour parler des données un peu “nouvelle génération”, parce tu as “Big Data”, “open data”, “data-vizualization”, “data-journalisme”. Parfois les gens en Français, ils vont dire “on a de la data”, pourquoi il ne disent pas “on a de la donnée” ? Le sous entendu pour moi là-dedans, c’est que quand tu parles de la data, tu as des données riches, volumineuses, en temps réel, profondes, tu es au dessus de la donnée. La donnée, c’est la « business intelligence » à l’ancienne, c’est les données pas valorisées, considérées comme des résidus de l’activité de l’entreprise. Aujourd’hui quand tu parles de data, c’est du volume, de la profondeur, de la richesse, de l’intelligence, du “Big Data”… C’est marrant d’ailleurs, parce qu’un truc comme le “data Tuesday” c’est un rassemblement tous les 1e mardi du mois. Tu as des gens qui viennent du “Big Data”, de “l’open data”, et de la visualisation, data-journalisme, et tu retrouves pas du tout les gens de la BI [Business Intelligence]. Eux ils ont un groupe dont j’ai oublié le nom. Et là c’est des vieux de la BI qui se disent comment on va mieux faire nos camemberts, c’est un peu la “BI à la papa” qu’il faut quand même renouveler un peu, mais dans une approche radicalement différente de ceux qui travaillent sur la data. Eux ils travaillent sur la donnée, ça va être des grands relecteurs de Tukey. Mais ça incarne des approches différentes (…) Je dirai qu’il y une différence générationnelle, pas forcément au niveau des personnes, mais au niveau des boîtes derrière152.
L’idée centrale ici est celle de « données nouvelle génération », affublées de toute une
séries de qualités - « volume », « profondeur », « intelligence », « richesse » -, qui, par négation,
permettent de caractériser les données « ancienne génération ». Entre les lignes, on lit ainsi une
volonté de se défaire des représentations statistiques classiques, représentées par l’image du
« camembert » et la figure du statisticien John Tukey 153 . Mais on comprend que le
renouvellement « générationnel » se fait surtout au niveau des personnes et institutions qui
promeuvent la « data ». Comme le suggérait Samuel Goëta dans son analyse de l’ « open data »,
on se trouve face à un « mouvement social », entendu ici au sens d’ « action collective » ou
« action commune ayant pour fin d’atteindre des fins partagées154 ». Ce mouvement dispose de
ses lieux de rencontre – les « data Tuesday » organisées par les « start-up » Data Publica, Captain
151 THIBAUT, Nirina, « Datajournalism : les chiffres nous parlent, écoutons les ! », YCAW, [disponible en ligne], 6 juillet 2010. 152 Entretien avec Caroline Goulard (annexe 1) 153 Grand statisticien du XXe siècle, John Tukey est renommé pour ses découvertes en mathématiques algorithmiques (transformée de Fourier rapide, etc.) et en représentations graphiques de statistiques (diagramme en boîte ou « boîte à moustache, etc.) 154 MANN, Patrice, L’action collective. Mobilisation et organisation des minorités actives, Armand Colin, 1991, coll. « U Sociologie », p. 20.

36
Dash et MFG Labs155 ou les éphémères « cafés data » du Social Media Club France (cf. supra) -,
et de ses références propres, à l’esthétique plus « sexy156 » – David Mc Candless, Manuel Lima,
Hans Rosling ou Nathan Yau157. Il est principalement porté par des acteurs économiques
émergents, qui, pour différencier leur offre d’autres entreprises déjà implantées, manipulent un
double registre d’angoisse – le déluge, l’absence de contrôle -, et d’espoir – la richesse,
l’intelligence, la créativité. C’est sous l’angle de cette action collective, de cette
bannière identitaire « data » que doit aussi se comprendre le data-journalisme.
Sous l’égide de la catégorie descriptive de trivialité, ce premier mouvement a permis de se
détacher d’une approche ontologique, rendue de toute manière impossible par la variété des
définitions récoltées. Par une analyse successive du discours des acteurs ayant installé
l’expression dans le paysage français, puis des connotations du terme « data-journalisme », il a
été possible de rattacher l’objet de recherche à une bannière plus large de la « data », décrivant
une situation, prétendument neuve, marquée les métaphores contradictoires de l’agrégat
(multitude, indivisibilité, danger) et de gisement (rareté, granularité, richesse). Ce double
discours d’angoisse et d’espoir, mobilisé autour d’une bannière commune, permet à ces acteurs
de pousser les rédactions à l’action.
Il apporte ainsi des premiers éléments de réponse à la question de la compatibilité entre
promesses du data-journalisme et imaginaires du journalisme, par la nature des promoteurs - non-
journalistes -, et des discours tenus, parfois plus commerciaux que journalistiques. Il convient
cependant de poursuivre la réflexion en examinant la critique « subjectiviste » adressée au data-
journalisme. Si l’idéal-type défini plus haut encourage à penser qu’une médiation journalistique
est nécessaire, la prétention de certains à un journalisme « objectif » invite à étudier cette
question en profondeur.
155 DESAUTEZ, Ludovic, « “Data Tuesday”, c’est parti », Les Echos, [disponible en ligne], 6 novembre 2011. 156 DESAUTEZ, Ludovic, « Avec le 1e “data Tuesday”, la data se fait plus “sexy” », Les Echos, [disponible en ligne], 17 novembre 2011. 157 SCHERER, Eric, « Données publiques et journalisme : une mine de richesses ! », OWNI, [disponible en ligne], 7 juillet 2010.

37
II. Le data-journalisme comme médiation
professionnelle
"Pour moi, l'objectivité n'existe pas (…) Seule importe l'honnêteté intellectuelle158"
David Dufresne, journaliste.
Dans une émission télévisuelle intitulée « l’avènement du data-journalisme signe-t-il le
retour vers un besoin d’objectivité ? », Fabrice Epelboin, hacker, entrepreneur web et co-
fondateur d’OWNI, explique qu’une des forces du data-journalisme est de s’appuyer sur des
« faits indiscutables159 ». Dans une chronique radio, un étudiant en journalisme loue lui les
potentialités de cette nouvelle discipline qu’il nomme « journalisme Excel160 », insistant par là sur
l’aide apportée par les outils informatiques. Ce sont sur ces deux types de promesses, objectivité
et automatisation, que se fondent les principales critiques adressées au data-journalisme.
Et en effet, force est de constater que ces prétentions objectivistes ne sont pas isolées.
Elles procèdent d’un amalgame courant entre « fait » et « donnée » (A). Après avoir rappelé que
la subjectivité est inscrite dans les données à toutes les étapes de leur production (B), il s’agira de
démontrer les acteurs qui se revendiquent du data-journalisme sont conscients de ces biais. C’est
pourquoi ils défendent la nécessité d’un travail professionnel de médiation dans le traitement de
la donnée comme dans sa représentation (C). 158 « L’affaire de Tarnac : “La fabrication d’une menace”, Libération, [disponible en ligne], 16 mars 2012. 159 MENARD, Robert, « L’avénement du data-journalisme signe-t-il un retour vers un besoin d’objectivité ? », Medias[2], [disponible en ligne], juillet 2012. 160 HAUSHALTER, Louis, « Le journalisme Excel », Medias[2], date non mentionnée, [disponible en ligne].

38
A. Une prétention à l’impartialité, dans un amalgame entre « fait » et « donnée »
Les tentations objectivistes se nourrissent d’une sacralisation des faits, renforcée par un
amalgame ente le « fait » et la « donnée » (1). La donnée chiffrée est ainsi perçue par certains
comme précise et impartiale, donc objective (2). Le « fact-checking », pratique journalistique
voulant démêler le vrai du faux dans les discours politique, voire quantifier leur niveau de
« véracité », se présente comme l’aboutissement polémique de ce phénomène (3).
1. Une sacralisation des faits
Le terme « objectivité » revêt en français plusieurs significations161. Dans son sens
philosophique, il correspond à « ce qui existe en soi, indépendamment du sujet pensant ».
Lorsque l’on emploie ce mot, on postule donc que les choses ont leur réalité propre, leur logique
propre, et que l’on ne peut agir sur elles en dehors de cette logique : elles s’imposent à notre
volonté., Nietzsche parle de « faitalisme162 », néologisme né de la fusion entre « fait » et
« fatalisme ». Il critique par là l’impuissance des penseurs positivistes à voir qu’« il n’y a pas de
faits, que des interprétations163 ». La tentation est forte, pour les plus « objectivistes » des
commentateurs, telle cette chroniqueuse de France Inter, de céder à cette définition :
[Le datajournaliste] envisage d'une manière différente son rôle de médiation : il s'interdit de faire appel à sa subjectivité comme dans un récit de reportage (exit le baroudeur), il ne cherche pas à produire un commentaire en contextualisant un fait par le savoir qu'il possède (exit l'éditorialiste)164.
La tension est palpable dans cette définition, entre une subjectivité qui semble
« interdite », et une objectivité absolue, qui semble impossible, en raison de la « médiation » du
journaliste. On comprend finalement que cette dernière doit se limiter à sa plus faible expression,
161 Les différentes définitions sont tirées du Trésor de la Langue Française Informatisé, à l’entrée « objectivité ». 162 CANDEL, Etienne, « Éléments de définition », in La « réalité » une approche communicationnelle, organisé par CELSA, Master 2 « Médias Informatisés et Stratégies de Communication », Neuilly-sur-Seine, 10 janvier 2012. 163 Cité dans : DELEUZE, Gilles, Nietzsche et la philosophie, 6e éd. (1962), PUF, 1983, p. 68. 164 CLARINI, Julie, « Le journalisme de données : nouveau journalisme ? », France Culture, Les idées claires, [disponible en ligne], 10 février 2011.

39
et rester dans un registre de « monstration » plutôt que de « démonstration », à l’instar des grands
reportages dans les premiers temps de la télévision165.
Dans un deuxième sens, l’objectivité se définit comme « le fait d’être dépourvu de toute
partialité ». Dès lors, le journaliste « objectif » se conçoit en opposition au journaliste d’opinion,
idéologique, partisan. S’il accepte l’altération – préjudiciable mais inévitable - des faits par la
médiation journalistique de recueil, traitement, mise en perspective et mise en récit, il s’interdit
de les juger. Dans l’opposition constitutive de la presse contemporaine entre les figures du
journaliste « gatekeeper », qui exige de séparer les faits des opinions pour tirer ce qui est
important dans l’information, et « advocate », militant et pourfendeur du mythe de
l’impartialité166, c’est clairement la première qui est représentée par cette définition. La majorité
des acteurs du data-journalisme, à l’instar de Caroline Goulard, semble se situer dans ce cadre
théorique, non sans une certaine récusation de la figure du journaliste « advocate » :
Derrière, il y aussi le rejet chez Versac, et chez moi aussi, d’un journalisme à la française, beaucoup trop subjectif… pas forcément de rejet mais de lassitude du journalisme français qui est dans le commentaire permanent, dans l’opinion, la subjectivité : on va avoir un éditorialiste qui va donner son avis, etc. Personnellement j’en ai rien à f... ! 167.
La distinction avec le modèle de Janowitz se fait autour d’un amalgame, très répandu les
discours d’escorte, entre « fait » et « donnée ». Dans son texte fondateur, Adrian Holovaty prend
l’exemple d’un fait divers, un incendie mortel, pour démontrer la nécessité du data-journalisme.
Un bon traitement journalistique de cette catastrophe se ferait, selon lui, en récoltant toute une
série de données – date, heure, nombre de victimes, distance de la caserne, années d’expérience
des pompiers, etc. -, et en les comparant avec d’autres incendies pout les mettre en perspective.
Cette approche donne le sentiment que, finalement, un « fait » n’existe que par les « données »
qui le qualifient, ou autrement dit que ces dernières sont constitutives d’un fait.
165 ARQUEMBOURG-MOREAU, Jocelyne, Le temps des événements médiatiques, De Boeck, 2003, 116 p. 166 JANOWITZ, Morris, « Professional Models in Journalism : The Gatekeeper and the Advocate. », Journalism Quarterly, Printemps 1975, pp. 618-626. 167 Entretien avec Caroline Goulard (annexe 1)

40
Figure 4 : logo du « datablog »
Figure 5 : première de couverture d’un ouvrage mis en vente par le Gurdian
Le logo du « datablog168 » du Guardian, semble aller dans le même sens. En associant
« facts are sacred » à l’appellation « datablog », il signifie que les données sont les seuls éléments
capables de représenter fidèlement les faits ; horizon « sacré » d’un bon journaliste. Outre cette
sacralisation critiquable du fait – Nietzsche ne disait-il pas que « les faits sont stupides, ayant de
tout temps ressemblé à un veau plus qu’à un Dieu169 » -, cette association révèle la confusion
entre le « fait » et la « donnée ». La première de couverture d’un ouvrage sur le data-journalisme
mis en vente par le Guardian 170 est encore plus éloquente : c’est la « puissance des
données [power of data] », leur force intrinsèque, qui permet d’évaluer la consistance d’un fait,
et ainsi réaliser la promesse d’une sanctification des faits.
L’amalgame est poussé plus loin encore : par un effet de synecdoque, la « donnée » en
vient à désigner le « fait ». Alors que les discours d’accompagnement utilisent généralement le
mythe de « données brutes » (ou « raw data »), Adrian Holovaty évoque dans son texte des « faits
bruts » (« raw facts171 »). Second exemple, un des premiers articles français sur le data-
journalisme semble utiliser indifféremment les deux termes. Alors qu’il est titré « Pour un
journalisme de données », l’URL de l’article mentionne le titre « Pour un journalisme de
168 Inséré dans le site du Guardian, c’est l’endroit où sont publiées toutes les réalisations de data-journalisme. 169 DELEUZE, Op. cit., p. 68. 170 ROGERS, Simon, Facts are Sacred : The power of data, Guardian Books, 2001, 92 p. 171 HOLOVATY, Art. cit.

41
faits »172. Une différence entre l’URL et le titre visible intervient généralement lorsqu’un article a
été publié sous un premier titre, et que quelqu’un, généralement l’éditeur du site, a préféré en
changer. Il semblerait donc que cette personne ait interverti « faits » et « données », sans estimer
altérer le sens du titre.
Cette utilisation indifférente des deux termes peut s’expliquer par leur prétention
commune à une certaine objectivité. La donnée, par sa nature chiffrée, donc impartiale aux yeux
de beaucoup, jouit sans doute d’un effet d’autorité encore supérieur.
2. L’ « évidence » du chiffre
La différence entre le « journalisme de faits », dont se revendiquent les acteurs, et le data-
journalisme, est à trouver dans l’omniprésence du chiffre chez ce dernier. Or le chiffre, élément
quantifiable et manipulable mathématiquement, charrie avec lui une promesse d’impartialité. Le
quotidien Libération présente ainsi le journalisme de données comme un travail journalistique
s’appuyant sur « des informations chiffrées, qui sont compilées, comparées, questionnées et
présentées afin de fournir la matière objective d’un article173 ». La mission Etalab174, justifie elle
le data-journalisme par « l’exigence d’une information incontestable, qui s’appuie sur des
éléments objectifs.175 ». Et son président, Séverin Naudet, d’appliquer le même raisonnement à
l’ « open data », démarche permettant de fonder les choix « non plus sur des positions
idéologiques a priori, mais sur des analyses informées et nourries de chiffres objectifs176 ». On
pourrait multiplier ainsi les exemples opposant l’ « objectivité » du chiffre, dans son sens
d’impartialité, à l’ « idéologie ». Ce pouvoir de persuasion des données s’explique en grande
partie à leur précision. Comment comprendre autrement le titre de l’ouvrage de Philip Meyer,
pionnier de l’utilisation des bases de données en journalisme, The New Precision Journalism177 ?
172 VAMBREMEERSH, « Pour un journalisme de données », Art. cit. [disponible en ligne : http://www.slate.fr/story/8643/pour-un-journalisme-de-faits], consulté le 31 août 2012. 173 FANEN, « Le journalisme à data sur les données », Art. cit. 174 Mission rattachée au Premier Ministre, chargée de « l’ouverture des données publiques et du développement de la plateforme française d’open data ». 175 « Datajournalisme : des données pour s’informer », Etalab, [disponible en ligne], 11 juillet 2012. 176 « Le discours de Séverin Naudet au congrès i-expo », Les Echos, [disponible en ligne], 22 mai 2011. 177 MEYER, Op. cit.

42
Utiliser une information chiffrée dans le domaine du social revient en effet à « apporter à
la chose dite le caractère de l’exactitude, la validité supposée évidente, voire indiscutable, que
porte un traitement statistique ou mathématique, une mesure178 ». Elle acquiert alors une valeur
d’évidence, et s’impose comme argument par sa seule existence. Cette puissance du chiffre
s’explique selon Abraham Moles par la progression dans nos société de « l’idéologie » de la
précision, qui nous fait passer « d’une constatation : “la précision c’est bien”, à une idéologie :
“n’est bien que ce qui est précis”179 ». Réservée généralement aux sciences exactes - « sciences
susceptibles de manipuler des langages formels et symboliques180 » : statistiques, économie,
économétrie –, la mesure devient également pertinente, dans le cadre de l’ « idéologie de le
précision », pour appréhender les « sciences de l’imprécis », et plus généralement tous les
phénomènes humains. Le raisonnement est celui d’un syllogisme : (i) « n’est bien que ce qui est
précis », (ii) « les interactions du monde social peuvent se mesurer », (iii) « le chiffre est donc
nécessaire pour appréhender le social ». Pierre Romera défend ainsi cette conclusion : « le
problème c’est que la “data” aujourd’hui c’est limite une condition sine qua none pour fournir
de l’information de qualité. Et à trop le négliger… Enfin ça me semble indispensable : une
information il faut la vérifier, il faut l’appuyer avec des chiffres.181 ».
Une information n’est ainsi pertinente dans le cadre du data-journalisme que si elle se
fonde sur des données chiffrées. Ces dernières sont les « briques élémentaires de
l’information182 », « des parcelles d’information, (…) des données brutes qui demandent à être
traitées pour produire des informations183 ». Le data-journalisme se différencie donc de la
pratique éditoriale du « chiffre du jour », étudiée par Etienne Candel, dans la mesure où une
donnée ne se suffit pas en elle-même pour incarner l’information : elle doit être « traitée ». Il s’en
rapproche en revanche dans la convocation de la métaphore de la physique élémentaire, à travers
la notion de « granularité », « qui fait écho à celle de l’atome avec ses nucléons, ses protons et
ses neutrons184 ». Comme l’atome, étymologiquement « qui ne peut être divisé », la donnée est
178 CANDEL, Etienne, « Une ration quotidienne de statistiques. La pratique éditoriale du “chiffre du jour” dans la presse écrite », Médiation Et Information, n° 28, 2008, p. 38. 179 MOLES, Abraham, « Introduction ». Les sciences de l’imprécis, Seuil, 1990, pp. 15-16 180 CANDEL, Art. cit., p. 39. 181 Entretien avec Pierre Romera (annexe 2) 182 JOANNES, Op. cit., p. 16. 183 Idem. 184 Idem.

43
présentée comme l’ « informationnème185 », ou « unité minimale d’information185», entretenant la
confusion entre « faits » et « données ». Le « fact checking » la pousse encore plus loin, en
promettant de vérifier les « faits » à partir de données chiffrées.
3. Le « fact-checking » comme aboutissement
Le « fact checking » est une approche journalistique, mettant l’accent sur la vérification
des « faits » et des « vérités » énoncées par les hommes politiques. On devine aisément les liens
qu’il entretient avec le data-journalisme D’abord, la manipulation fréquente de statistiques : la
grande majorité de ces « vérifications » se base en effet sur des données chiffrées. Ensuite, des
discours d’escorte utilisant la même rhétorique autour du « retard français »186 et entretenant un
rapport quasiment sacré aux « faits », éléments incontestables – donc vérifiables. Enfin, une
prétention commune à réinventer le journalisme sur Internet, concrétisée par une
institutionnalisation progressive dans le monde journalistique187. Ce n’est donc pas un hasard si
les deux expressions sont souvent associées ou analysées conjointement188. Le « fact checking »
relève même pour certains d’un sous-domaine du data-journalisme : « ça rentre dans le data-
journalisme ce terme-là, parce que les compétences auxquelles ça fait appel sont celles d’un
data-journaliste189 », suggère ainsi Pierre Romera.
Il semble cependant que le « fact checking » pousse plus loin encore certaines des
prétentions du data-journalisme. Le site Politifact.com, développé par le quotidien floridien St
Petersbugh Times, et vainqueur d’un Prix Pulitzer en 2009, en est une bonne illustration. La
devise du site promet ainsi de « démêler le vrai du faux en politique [sorting out the truth in
185 CANDEL, Art. cit., p. 41 186 SÉNÉCHAL, Lorrain, « Le “fact checking” peine à s’imposer en France », OWNI, [disponible en ligne], 18 novembre 2011. 187 L’institutionnalisation est même plus poussée dans le cas du fact-checking : différentes grandes rédactions françaises ont désormais leur équipe dédiée, beaucoup à la faveur de la présidentielle (Le Monde, Libération, Le Parisien, Le Nouvel Obs, Rue 89, Sud Ouest, etc.). 188 Voir par exemple la conférence « Réinventer le journalisme avec Internet : Data journalisme, fact-checking, et nouvelles écritures numériques », organisée à la BNF le 6 juin 2012, [disponible en ligne : http://www.bnf.fr/fr/evenements_et_culture/anx_auditoriums/f.rencontres_labo.html?seance=1223907481771, consulté le 31 août 2012. 189 Entretien avec Pierre Romera (annexe 2)

44
politics] ». Les signes du logo sont autant de rappels de ce slogan : l’indice de vérification en
forme de « V », la couleur verte pour ce qui est juste, la rouge pour ce qui est faux, etc.
Figure 5 : logo du site Politifact
Figure 6 : traitement d’une déclaration par le même site
Mais le site ne se contente pas de déceler le vrai du faux, il promet d’évaluer le degré de
véracité de chaque propos par la représentation d’un « truth-o-meter », néologisme désignant un
appareil de mesure (« meter ») de la vérité (« truth »). Cinq possibilités sont envisagées : vrai
(« true »), majoritairement vrai (« mostly true »), à moitié vrai (« half true »), majoritairement
faux (« mostly false ») et faux (« false »). Les déclarations politiques sont ainsi rangées en
catégories et jugées moralement selon leur degré de mensonge.
Car c’est finalement le « produit d’appel » de ces sites : pointer les hommes politiques qui
manipulent les chiffres, puis les comparer entre eux, bien plus qu’ouvrir le débat sur la manière
dont sont réalisés les calculs statistiques. L’appellation « bobaromètre » de la rubrique
« Désintox » de Libération est en ce sens explicite. Le « Véritomètre » d’OWNI procède de la
même logique de classement, en attribuant à chacun des candidats un « indice de crédibilité ».
Dans cette « démesure de la mesure190 », aboutissement de l’« idéologie de la précision »
prétendant même quantifier la vérité, François Hollande aurait ainsi un « taux de crédibilité » de
9,2 points supérieur à celui de Nicolas Sarkozy.
190 CANDEL, « Une ration quotidienne de statistiques. La pratique éditoriale du “chiffre du jour” dans la presse écrite », Art. cit., p. 46.

45
Figure 7 : « Bobaromètre » de Libération Figure 8 : « Véritomètre » d’OWNI
La majorité des sites compense cette quantification outrancière par de longs commentaires
de méthode. Sur Politifact, le jugement d’une déclaration ne s’arrête pas à la répartition dans une
des cinq catégories. Il ouvre sur un article écrit où est explicitée la démarche des journalistes pour
arriver à cette conclusion, quitte à la modifier si des internautes pointent des failles dans le
raisonnement (cas de l’exemple illustré plus haut). La rédaction de la rubrique Désintox de
Libération insiste sur le caractère « ludico-statistique191 » du « bobaromètre » et son absence de
prétention à la « précision scientifique ni à l’exhaustivité191 ». Une éditorialisation est par ailleurs
effectuée pour développer les cas jugés les plus intéressants, et renvoyer l’internaute curieux vers
les sources ayant servi au raisonnement.
OWNI se place dans une position distincte. Si les journalistes affirment leur souci de
référencer chaque assertion en consacrant un onglet « données », l’article explicatif se veut
souvent plus lapidaire, en raison du nombre de cas traités. Ce dispositif tend à restreindre le
jugement d’un fait à la précision d’une donnée. Le 8 mars 2012, Eva Joly était ainsi invitée de la
matinale d’Europe 1, et aurait affirmé au bout de huit minutes et dix-sept secondes : « les
minimas sociaux, on ne peut pas vivre avec 420 euros ». Verdict des journalistes : « incorrect »
(0%) car les minimas sociaux pour une personne seule et sans enfant seraient de 474,93 euros,
soit un chiffre supérieur de plus de 10% à celui avancé par la candidate.
191 « Sarkozy, roi du “bobaromètre” (épisode 6)», Libération, [disponible en ligne], 22 mars 2012.

46
Figure 9 : traitement d’une déclaration par le « Véritomètre » d’OWNI
Cependant, si l’estimation est effectivement incorrecte, eut égard aux statistiques –
considérées ici comme admises de tous -, cela rend-il l’affirmation « incorrecte » pour autant ? La
citation semble avant tout suggérer qu’il est impossible de vivre avec les minimas sociaux. Or ce
n’est pas ce qui est évalué par les journalistes, qui justifient leur verdict négatif par l’écart entre la
déclaration chiffrée et les statistiques mobilisées. On assiste ainsi à un réductionnisme de la
parole politique, et plus généralement du fait, à ses simples dimensions chiffrées. En ce sens le
« fact-checking » est l’aboutissement des prétentions « précisionnistes » du data-journalisme,
fondées sur l’idée que « la véritable médiation avec la réalité se fait par la donnée192 ».
Ces différents éléments montrent que les critiques « objectivistes » formulées à l’encontre
du data-journalisme ne sont pas infondées. Dans un amalgame entre « faits » et « données », la
précision des données est louée, sacralisée, au point de devenir nécessaire pour accéder la réalité.
Cette représentation intellectuelle se fonde sur la croyance qu’il existe des « données brutes ».
B. La « data modelée » ou le mythe de la donnée brute
Durant la conférence TED de 2009, Tim Berners Lee haranguait la foule en lui faisant
répéter « We want raw data ! We want raw data » [« nous voulons des données brutes »],
leitmotiv repris par Benoît Vidal, co-fondateur de Dataveyes, dans un de ses articles193. Pierre
Romera estime lui que le data-journalisme permet de « se réapproprier la matière même du 192 VAMBREMEERSH, Art. cit. 193 VIDAL, Benoît, « Data, data, data », Database journalism, [disponible en ligne], 24 janvier 2010.

47
journalisme : le chiffre, la donnée neutre, brute194 ». Ces deux exemples attestent de la diffusion
du mythe de la donnée brute chez certains acteurs du data-journalisme. Ce mythe est d’autant
plus dangereux ici qu’il est porté par « le “bon côté” de la force : des citoyens, des citadins et/ou
des innovateurs qui veulent améliorer le fonctionnement démocratique au sens large, et non des
managers ou gestionnaires cyniques qui veulent renforcer les moyens de contrôle par des
indicateurs automatiques (des data) fort discutables et fort discutés.195 ». Une situation très
distincte de l’approche barthienne, où le « mythe » est à l’initiative de l’idéologie dominante – la
bourgeoisie -, pour diffuser sa culture et ses valeurs196.
L’expression de « données brutes » est pourtant bel et bien mythique par l’oxymore
qu’elle crée. En sciences naturelles, un corps brut est un corps qui « n’a pas subi de
manipulation, de transformation197 ». Or une « donnée » n’est paradoxalement pas « donnée »,
c’est une construction humaine. Il existe une médiation, donc une altération, à toutes les étapes de
fabrication de la donnée : de la construction catégorielle (1) à la représentation de la donnée (3),
en passant par le processus de captation et de traitement de la mesure (2).
1. La naturalisation des nomenclatures
Dans le débat mentionné en introduction sur « la vérité des chiffres198 », Alain Blum
rappelle que tout chiffre statistique est le fruit d’une histoire. Une partie des indicateurs de
mesure de la « fécondité naturelle » d’un couple, utilisée comme étalon des effets de la
contraception, est ainsi fortement inspirée des travaux du démographe italien Corrardo Gini,
critiqué pour ses conceptions biologisantes, voire eugénistes199. Dans un registre différent, Alain
Desrosières, statisticien, et Laurent Thévenot, sociologue et économiste, ont démontré le poids
des différents groupes professionnels dans la refonte des catégories socio-professionnelles
194 Entretien avec Pierre Romera (annexe 2) 195 Commentaire de Jérôme Denis, sociologue à TELECOM Paris Tech, à l’article : GUILLAUD, Hubert, « Open data (1/4) : Où en est-on ? », InternetActu, [disponible en ligne], 30 mai 2011. 196 BARTHES, Roland, Mythologies, Seuil, coll. « Points », 1970, 233 p. 197 Entrée « brut » du Trésor de la Langue Française Informatisé 198 MARTIN, Art. cit. 199 ROSENTAL, Paul-André, « La nouveauté d’un genre ancien : Louis Henry et la fondation de la démographie historique », Population, Vol. 58/1, 2003, p. 116.

48
françaises, à laquelle ils étaient associés200. Assemblage composite de critères relevant du métier
(le secteur économique), du statut (salarié ou employeur) ou de la qualification (hiérarchie), la
nomenclature française « ne va pas de soi » : c’est une production liée à un contexte socio-
politique. Luc Boltanski avait entamé cette démarche constructiviste quelques années auparavant
en étudiant l’émergence de la catégorie des « cadres »201. D’un noyau originel, organisé autour
d’ingénieurs catholiques de Grandes Ecoles, l’expression de « cadre » attire progressivement des
groupes disparates « démunis jusque-là d’instances de représentations202 ». Sans être homogènes,
les « cadres » se constituent finalement en groupe social dans les années 1960, jouissant d’une
cohérence et d’une institutionnalisation propre. Ces trois exemples démontrent qu’il n’existe pas
de catégories d’analyse naturelles : ces dernières sont des construits.
Elles n’en n’ont pas moins des effets notoires sur le monde. L’exemple classique est celui
des maladies. Dans les années 1970, des médecins de différents pays ont voulu créer une
classification des maladies afin d’organiser la recherche au niveau international. L’élaboration de
la nomenclature s’est faite en regroupant des pathologies par types. Les plus difficiles à associer,
les maladies « orphelines », ont été regroupées dans la catégorie « autres », devenant ainsi des
« monstres », des éléments inclassables. Conséquence de leur exclusion, ces pathologies étaient
moins bien remboursées et recevaient moins de subventions destinées à la recherche. Un
mouvement comme le Téléthon en France, créé pour améliorer les crédits alloués à la recherche
sur la myopathie, trouve son origine dans cette mise à l’écart de la nomenclature internationale203.
Mais ce phénomène d’exclusion s’applique également à des catégories qui semblent beaucoup
plus naturelles. La division administrative hommes/femmes, longtemps considérée comme
« allant de soi », excluait de fait toutes les personnes transgenre. C’est dans cette optique que
l’Australie a récemment créé une troisième catégorie administrative : « indéterminé »204.
Cette dénaturalisation permet également de voir que les catégories ne renvoient pas
nécessairement aux mêmes phénomènes selon les pays, rendant les comparaisons internationales
difficiles. Lorsque CNN et Oméga réalisent une application de data-journalisme sur les femmes 200 DESROSIÈRES, Alain et THÉVENOT, Laurent, Les catégories socio-professionnelles, La Découverte, coll. « Repères », 1998, 127 p. 201 BOLTANSKI, Luc, Les cadres. La formation d’un groupe social, Éditions de Minuit, 1982, 523 p. 202 Ibid., p. 89. 203 Paragraphe inspiré de : DENIS, Jérôme, « Les figures de l’usager », in Sociologie des usages, organisé par CELSA, Master 2 Médias Informatisés et Stratégies de Communication, Neuilly-sur-Seine, 20 octobre 2011. 204 DAUSSY, Laure, « Australie / passeports : homme, femme et “indéterminé” », Arrêt sur images, [disponible en ligne], 15 septembre 2011.

49
entrepreneuses dans le monde on est ainsi en droit de se demander si les réalités comparées sont
effectivement comparables (annexe 12)205. Constater que 12,4% des actifs colombiens sont des
femmes à la tête de leur entreprise, contre moins de 1,65% en France signifie-t-il vraiment que
les femmes colombiennes sont 7,5 fois plus entrepreneuses que les françaises comme le suggère
le titre de l’article ? Ou bien plus vraisemblablement que la précarité des situations pousse ces
femmes vers des métiers peu qualifiés (vente de rue, femme domestique, ouvrière agricole), où la
flexibilité d’une situation d’auto-entreprenariat devient un avantage concurrentiel ?
Ce type d’interrogations encourage à se plonger dans la « boîte noire » de la production
des données.
2. Le processus d’élaboration : une « boîte noire » éludée
Dans sa sociologie des sciences, Bruno Latour, définit les « boîtes noires » de l’innovation
comme les « faits scientifiques ou machines - donnant l'illusion d'exister comme réalités
autonomes, d'avoir une stabilité et de se répandre par elles-mêmes en vertu d'une sorte d'énergie
interne206 ». La production de données répond d’un système comparable, où toute la négociation
humaine, la tension entre le « réalisme » (l’épreuve des faits) et le processus d’élaboration, est
masquée par les chiffres finaux. Ce phénomène de négociation est permanent mais apparaît de
manière notoire à au moins deux étapes : l’objectif donné à la mesure et la traduction d’une
captation en chiffre.
Premièrement, en tant qu’institution, un chiffre se mesure toujours par un acteur donné et
dans un but précis, nous l’avons vu en introduction. Lors de l’année 2010, deux institutions ont
ainsi mesuré le nombre de naissances à Paris : l’INSEE et la municipalité, comptabilisant
respectivement 31 440 et 44 362 nouveau-nés207. Pourquoi un tel écart ? La raison se trouve dans
le mode de calcul : l’INSEE attribue une naissance à une ville en fonction de la localisation du
foyer de la mère, tandis que la mairie le fait en fonction du lieu de naissance, très souvent la
205 BARRINGER, Matt, « Where do the world’s most entrepreunarial women live », CNN, [disponible en ligne], avril 2012 (annexe 12). Cité in : « Les data en forme », OWNI, publié le 17 avril 2012, Art. Cit. 206 QUÉRÉ, Louis, « Les boîtes noires de Bruno Latour ou le lien social dans la machine », Réseaux, 1989, Vol. 7, n°36, p. 97. 207 CHIGNARD, Simon, « En finir avec le mythe de la donnée brute », Données ouvertes, [disponible en ligne], 1e juin 2012.

50
maternité208. Or il y a fort à parier que le choix de la municipalité ait été guidé par la volonté de
mettre en avant des chiffres imposants : les modes de calcul ne sont donc pas « neutres ».
Laurent Muchielli en donne une seconde illustration avec les chiffres de la criminalité :
« on a constaté parfois que, lorsqu’un ministre d’un nouveau gouvernement prenait
l’engagement de faire baisser l’insécurité, les chiffres publiés au début de l’année suivante
enregistraient miraculeusement la baisse espérée 209 ». Il illustre par là les critiques sur
« l’opérationnalisme210 » d’une mesure. Ce risque est courant lorsque des notions sont si
complexes à objectiver – l’intelligence en est un autre exemple -, que la notion se résume à ce qui
est mesuré : est « criminalité » ce que les indicateurs de criminalité mesurent. L’institution à
l’origine de la mesure détient tous les pouvoirs pour faire évoluer les chiffres, sans que la
perception sur le terrain ait changé. Dans cette optique, « les chiffres de la police sont
fondamentalement les résultats de son activité, bien plus que les chiffres de la criminalité.211 ».
Un deuxième biais intervient dans le processus même d’observation et de recueil des
données. La simple présence d’un observateur dans un environnement modifie cet
environnement, et altère donc la notion mesurée. C’est le cas par exemple lorsque le sociologue
réalise une observation participante ou qu’il envoie des questionnaires : les réactions qu’il obtient
sont en partie au moins « provoquées » par son travail de recherche. Face à ces modifications
inévitables de l’environnement, le statisticien « redresse » les mesures obtenues, afin de limiter
l’effet distordant de l’agent observateur. Le cas emblématique est celui des enquêtes
pré-électorales d’intentions de vote, qui voient régulièrement les instituts de sondage redresser les
chiffres de certains candidats « inavouables » - celui du Front National en France -, en appliquant
des algorithmes propres. Or ces méthodes de calcul statistique sont rarement publicisées, ou
lorsque c’est le cas, ne sont analysées uniquement en cas de controverse.
On se trouve face à ce qu’Alain Desrosières nomme un « effet de cliquet » : « une fois la
quantification effectuée, les hésitations, les négociations et les traductions impliquées par le
passage d'un monde de mots à un monde de nombres disparaissent, par un effet de cliquet. On ne 208 Cela explique le chiffre incongru de 17 naissances seulement en 2010 sur les arrondissements de 1 à 9 http://opendata.paris.fr/opendata/jsp/site/Portal.jsp?document_id=61&portlet_id=102 (consulté le 31 août 2012) 209 MUCHIELLI, Laurent, Violences et insécurité. Fantasmes et réalités dans le débat français, La Découverte, 2002, 158 p.. in GOETA, Op. cit., p. 50. 210 MARTIN, Art. cit. 211 MUCHIELLI, Op. cit, in GOETA, Op. cit., p. 50.

51
revient éventuellement en arrière qu'en cas de contestation.212 » Or c’est là le principal risque lié
à la notion mesurée : que l’indicateur chiffré s’autonomise de son contexte de production, de
manière à produire du sens « en soi ». Alain Blum montre ainsi qu’en plus d’être un construit,
hérité d’une histoire, le chiffre est également une « métaphore213 ». Les méthodes d’élaboration
des statistiques étant généralement très complexes, on donne un nom aux indicateurs –
« intelligence », « fécondité », « chômage » -, par souci de simplification. Or ces appellations
sont chargées d’imaginaires, de sorte que le raisonnement prend souvent son autonomie par
rapport à la construction chiffrée. Dans les années 1920-1930, la baisse de la fécondité est
interprétée comme un refus de la naissance, donc nécessairement comme une décadence de la
société. De la même manière, une baisse du PIB, une « récession », est aujourd’hui
automatiquement interprétée comme un appauvrissement de la nation, sans questionner cette
notion de « richesse ».
Ce genre de raisonnement procède d’une confusion dangereuse entre la donnée en tant
que processus de mesure et sa représentation chiffrée. D’autant que l’information chiffrée est
encore plus facilement naturalisée lorsqu’elle est représentée graphiquement.
3. Une visualisation éditorialisée des données
Après être passée d’un « monde de mots à un monde de nombres », la donnée est souvent
représentée dans le « monde des graphiques ». Le data-journalisme ne fait pas entorse à cette
observation, à tel point que certains définissaient les « dataviz » comme l’essence de cette
discipline (cf. supra I. A. 2.). Or cette mise en visibilité influence la perception du lecteur.
C’est le cas lorsque, soucieux d’accentuer son propos, un médiateur déforme une
représentation, au mépris des conventions statistiques. Ces phénomènes sont assez courants en
journalisme ; citons deux exemples. Le 12 janvier 2012, dans l’émission de France 2 dédiée à
l’élection présidentielle, « Des Paroles et des Actes », François Lenglet présente les dépenses
publiques de différents pays ou zones géographiques. La base des histogrammes ne
212 DESROSIÈRES, Alain, « Pour une politique des outils du savoir : le cas de la statistique », in Politics and Knowledge: Democratizing Knowledge in Times of the Expert, Université de Bergen, 21-22 juin 2004. In GOETA, Op. cit, p. 51. 213 BLUM, Alain in MARTIN, Olivier, Art. cit.

52
correspondant pas à zéro, une différence de quinze points entre la France et les Etats-Unis se
traduit par un doublement de la surface (annexe 13). Seconde illustration, lorsque Le Point tente
de démontrer par un graphique (annexe 14) la baisse de l’utilisation du peer-to-peer, et en conclut
que cette pratique « pourrait disparaître dans les prochains mois214 ». En fait, ce graphique
représente sur l’axe des ordonnées une proportion du trafic internet : il ne démontre donc pas que
le peer-to-peer a baissé en valeur absolue, mais que sa part dans le trafic internet a diminué215.
Ces erreurs sont également fréquentes lorsque le beau est favorisé à la bonne lecture des
statistiques, esthétisme qui fait partie des promesses de rénovation du data-journalisme (cf. supra
I. C. 3., ou le titre de l’ouvrage de David McCandless « Information is Beautiful »216). Les deux
représentations qui suivent en sont une bonne illustration217.
Figure 10 : représentation de la répartition de la population à l’horizon 2033
Figure 11 : représentation du fossé entre les pays les plus riches et les plus pauvres
214 PONCET, Guerric, « Le streaming écrase le peer-to-peer : Hadopi dépassée », Le Point, [disponible en ligne], 15 octobre 2009. 215 Exemple cité par : EPELBOIN, Fabrice, « Le journalisme de données, les données ouvertes et la dictature de la transparence », ReadWriteWeb, [disponible en ligne], 19 octobre 2009. 216 MC CANDLESS, David, Information is beautiful, Collins, 2011, 256 p. 217 Exemples tirés de la présentation de Gaëtan Gaborit, « Visualisation de données : les leçons de l’histoire », http://fr.slideshare.net/gaetangab/visualisation-de-donnes-les-leons-de-lhistoire-13139160 (31 août 2012)

53
La première, tirée d’un ouvrage de prospective 218 , représente la répartition de la
population mondiale à l’horizon 2033, dans l’hypothèse où les tendances démographiques
actuelles se poursuivent. Le visuel est indéniablement agréable à regarder, mais est-il plus
pertinent qu’une traditionnelle pyramide des âges ? L’utilisation d’une échelle logarithmique
trouble en effet la perception que le lecteur a des rapports entre les différentes tranches d’âge. La
seconde, pourtant tirée d’un manuel de sociologie219, est également difficile à appréhender en
raison d’une échelle de temps non proportionnelle et d’une utilisation de cercles concentriques
peu évocatrice. La représentation traditionnelle par courbes, pourtant beaucoup plus claire, est
confinée au coin en bas à droite – dernier endroit examiné dans le cadre d’une lecture occidentale
-, comme si l’auteur l’avait cachée, par « honte » de son classicisme.
Outre ces déformations graphiques, la perception des résultats peut également être
influencée par la mise en scène éditoriale des données. Dans une démonstration vidéo portant elle
aussi sur les différences de richesses entre pays, Hans Rosling, médecin et statisticien suédois, en
donne une illustration significative. Chaque disque représente un pays. Pour chacun quatre types
de données sont représentées : l’espérance de vie (ordonnée, échelle linéaire), le PIB par habitant
(abscisse, échelle logarithmique), l’appartenance continentale (couleur) et la taille du pays
(surface). La première capture correspond à la situation en 1812, la seconde en 2012.
Figure 12 : représentation des pays du monde selon l’espérance de vie et le PIB par habitant, en 1812
Figure 13 : idem en 2012
218 RAISSON, Virginie, 2033, Atlas des futurs du monde, Robert Laffont, 2010, 204 p. 219 APPELBAUM, Richard P., CARR, Deborah, DUNEIER, Mitchell, et GIDDENS, Antony, Essentials of sociology, 3e éd., W. W. Norton & Company, 2010, 499 p.

54
La conclusion de la démonstration de Rosling est que les pays du monde convergent
globalement vers un idéal de santé (espérance de vie) et de richesse (PIB par habitant). Cette
convergence est symbolisée par la flèche directionnelle, qui oriente le lecteur dans son
interprétation. Une telle conclusion est pourtant amendable. Premièrement sur les indicateurs
choisis : le PIB par habitant symbolise-t-il vraiment la « richesse » ? Deuxièmement sur l’échelle
logarithmique, qui amoindrit les écarts : en 1812, l’écart entre le pays le plus « riche » et le plus
« pauvre » est grossièrement un rapport de 1 à 10 (400 à 4000) ; alors qu’en 2012, c’est un
rapport de 1 à 100 (400 contre 40000). Dès lors, la conclusion n’est-elle pas à trouver dans une
explosion des inégalités plutôt que dans une convergence mondiale ?
Enfin, sans nécessairement d’ajout sémiotique, telle la flèche de Rosling, la représentation
graphique de différents jeux de données encourage la détection de corrélations, facilement
associées à des causalités par l’œil. Or corrélation n’est pas causalité. Une corrélation est
simplement un lien mathématique entre deux variables, tandis que la causalité nécessite une
relation de cause à effet. La vente de lunettes de soleil et la vente de glaces sont ainsi corrélées.
Pourtant le port de lunettes ne donne pas soif : cette corrélation s’explique par un tiers facteur,
l’ensoleillement. De même, Simon Chignard montre que l’espérance de vie à la naissance et la
part de fumeurs d’un pays sont corrélées (annexe 15)220. Est-ce à dire que la consommation de
cigarettes allonge l’espérance de vie ? Evidement non, bien que la représentation graphique sous
forme de courbe suggère fortement cette idée. Il y a donc un risque de mésinterprétation à voir
une causalité lorsqu’il n’y a que corrélation. L’émergence de sites encourageant l’individu à
réaliser ses propres assemblages (ou « mashups ») de données – Gapminder221, Datamasher222,
etc. – ne fait qu’accentuer ce risque.
Malgré certains discours ambigus, utilisant la figure mythique de la « donnée brute », les
acteurs du data-journalisme sont néanmoins très au fait de tous ces risques, depuis l’intention
jusqu’à la visualisation. C’est pourquoi ils revendiquent que le travail de mise en perspective soit
fait par des professionnels du journalisme et de la statistique : les data-journalistes.
220 CHIGNARD, Art. cit. 221 http://www.gapminder.org/ (consulté le 31 août 2012) 222 http://www.datamasher.org/ (consulté le 31 août 2012)

55
C. Le « data-journaliste » : un professionnel du traitement des données
« Le data-journalisme est du journalisme223 ». Pierre Romera peut difficilement être plus
explicite. Cette affirmation se fonde sur l’idée que la manipulation d’informations chiffrées rend
nécessaire une médiation professionnelle, respectueuse d’une certaine éthique (1). En
conséquence, le data-journalisme laisse entrevoir un nouveau rapport aux médias informatisés, où
la figure du journaliste serait confortée dans son rôle de producteur d’une information à haute
valeur ajoutée (2). On perçoit cependant une défiance de certains acteurs face aux pratiques du
journalisme professionnel, qui encourage à nuancer la citation de Pierre Romera (3).
1. Une médiation nécessaire
La proximité avec le modèle de « gatekeeper » défini par Janowitz n’empêche pas les
data-journalistes d’être conscients des altérations inévitables de l’information dans le travail de
médiation. Comme dans toute autre genre, le journaliste fait jouer sa subjectivité à toutes les
chaînes de la production de l’information : en choisissant un sujet, en hiérarchisant les données,
en les éditorialisant d’une certaine manière, en sélectionnant le type de rendu, etc. Pour Karen
Bastien finalement, « rien n’est objectif : en faisant notre travail de journaliste, on fait une
hiérarchie donc on fait des choix 224 ». Et lorsque Caroline Goulard se revendique du
« journalisme de faits », « ce n’est pas pour dire journalisme “plus objectif que les autres”, c’est
pour dire “journalisme qui va plus s’intéresser à rapporter des événements”, il sera tout aussi
subjectif que les autres225 ». Dès lors, le fait de travailler avec des chiffres ne constitue pas un
moyen plus « objectif » d’atteindre la réalité. Au contraire, il constitue un danger par leur « effet
d’autorité226 », qui rend possible toute sorte d’interprétations erronées.
C’est pourquoi il est si nécessaire pour ces acteurs que le travail de médiation soit fait par
des professionnels consciencieux. Des journalistes pour recueillir les faits, les mettre en 223 Entretien avec Pierre Romera (annexe 2) 224 Entretien avec Karen Bastien (annexe 4) 225 Entretien avec Caroline Goulard (annexe 1) 226 Ibid.

56
perspective, et interroger l’origine des données qui, « comme toute source, doivent être traitées
avec scepticisme227 ». Mais également des personnes maîtrisant les statistiques « qui sauront si les
chiffres sont significatifs et quel sens leur donner228 », et évitent ainsi approximations ou
surinterprétations mentionnées plus haut. La combinaison de ces deux compétences permet de
questionner les raisonnements de certains hommes politiques, non dans une optique de
quantification de la vérité ni de classement, comme suggéraient certaines réalisations de « fact
checking », mais dans le but d’ouvrir un débat sur la production des chiffres. Car à lire certains
points de vue, le data-journalisme se veut paradoxalement un moyen de lutter contre
« l’obsession du chiffre229 », et revaloriser ainsi un objet dévoyé dans le débat public. Karen
Bastien abonde dans ce sens :
Un chiffre en soi ne veut rien dire s’il n’est pas remis dans son contexte. Lors de la présidentielle, que ce soit sur les chiffres de dettes, d’immigration, de justice, d’éducation nationale, les gens ont pu avoir l’impression que les chiffres ne voulaient plus rien dire puisque les partis s’en emparaient pour dire tout et son contraire. Mais une fois que l’on replace le chiffre dans son contexte, cela veut dire quelque chose : c’est ça notre travail de journaliste230.
À entendre ces discours, on peut se demander si les prétentions d’objectivité énumérées
plus haut ne sont pas à comprendre différemment. Aux deux premiers sens – « ce qui existe en
soi » et « ce qui est impartial » - le Trésor de la Langue Français Informatisé en ajoute un
troisième : « qualité de ce qui donne une représentation fidèle de la chose observée ». La nuance
peut sembler faible entre la « fidélité » et l’ « impartialité », elle existe pourtant. L’impartialité
suppose d’éliminer tout jugement personnel, toute pensée propre : elle s’oppose à l’ « idéologie ».
La « représentation fidèle » s’entend plus comme une honnêteté intellectuelle dans la
retranscription d’un événement. Il est possible de prendre parti, mais sans déformation grossière
de ce qui a été observé, sans omission ou surinterprétation mensongère. Dès lors,
l’objectivité revendiquée par certains est l’apanage de tous les journalistes : elle consiste à
conserver une honnêteté intellectuelle dans la construction et le récit de l’information. C’est en
tout cas le sens que donne Caroline Goulard lorsqu’elle emploie le terme d’ « objectivité » :
227 « Like any source, it should be treated with scepticism », Paul Bradshaw, dans l’introduction de BOUNEGRU, Liliana, CHAMBERS, Lucy et GRAY, Jonathan, Data Journalism Handbook, O’Reilly, juillet 2012, [disponible en ligne] 228 Nicolas Kayser-Bril, in GONTIER, Art. cit. 229 LAPOIX, Sylvain, « Mon data-journalisme à l’heure Sarkozy », OWNI, [disponible en ligne], 14 janvier 2010. 230 Entretien avec Karen Bastien (annexe 4)

57
Le journaliste il a une éthique journalistique, qui va être de relater les faits au plus juste de ce qu’il a vu, avec le plus d’objectivité. C’est une éthique. Tu peux très bien déroger à ton éthique, mais ça reste de l’éthique professionnelle. Les journalistes c’est comme les scientifiques, ils essaient d’être proche de la réalité sans jamais l’atteindre, sachant très bien que ce n’est pas la réalité telle quelle qui transparaît dans leurs travaux. Et le journaliste de données c’est exactement pareil : s’il a une éthique, une démarche scientifique, c’est ce qu’on attend de lui sinon c’est un mauvais journalisme de données. Il n’a pas à biaiser les données de manière consciente, il ne doit pas manipuler les données de façon à les dénaturer parce que ça va choquer son éthique, ou sa démarche scientifique, ou les deux. Il va essayer d’être le plus honnête et le rigoureux possible. Ça relève de l’éthique professionnelle231.
C’est cette démarche de mise à distance des faits, cette « éthique professionnelle », qui
fait la spécificité de la parole journalistique, qui la définit et l’assoit par rapport à la parole
littéraire ou la parole politique. Il semble donc à ce niveau de la réflexion que le data-journalisme
comme pratique soit bel et bien « soluble » dans les imaginaires professionnels du journalisme.
Mieux, le data-journalisme permet à la presse d’entretenir un nouveau rapport aux médias
informatisés, devenus non plus un danger, mais une opportunité.
2. Un nouveau rapport aux médias informatisés
Fragilisés dans leur modèle économique, concurrencés par des contributeurs internautes,
pressés par une temporalité distincte, les titres de presses ont d’abord considéré internet, et plus
généralement les médias informatisés, comme une menace. Le data-journalisme se propose d’en
faire une opportunité, un nouveau terrain pour exercer un journalisme à forte valeur ajoutée.
Dans la continuité des discours d’escorte du web 2.0 autour de la figure du
« consommacteur232 », le développement de sites d’information en ligne a porté avec lui la
promesse du « tous journalistes ». Joël de Rosnay, fondateur du site d’information Agoravox,
annonçait ainsi le remplacement des « média de masse [sic] » par les « média des masses
[sic] »233. Au-delà de son caractère essentiellement « messianique234 », cet « imaginaire d’une
231 Entretien avec Caroline Goulard (annexe 1) 232 Néologisme formé par la fusion des termes « consommateurs » et « acteurs », qui prétend décrire l’ « empowerment » rendu possible par la technologie internet. Voir : REBILLARD, Franck, Le web 2.0 en perspective, L’Harmattan, 2007, 158 p. 233 ROSNAY (DE), Joël, La révolte du pronétariat. Des mass média aux média des masses, Fayard, coll. « Transversales », 2006, 250 p. 234 REBILLARD, Franck, « Le journalisme participatif : de l’idéologie à la pratique », Argumentum, n° 6, 2006, p.12.

58
information désintermédiée235 » a favorisé la diffusion de discours considérant le web comme une
menace pour l’identité du journalisme professionnel236. Or le data-journalisme propose justement
au journaliste de « retrouver [le] rôle de médiateur qu’il a quelque peu perdu avec l’arrivée du
numérique237 ». Ce travail de médiation se ferait à partir des données, un terrain difficile d’accès,
où l’internaute ne serait pas encore à même de concurrencer le journaliste. Caroline Goulard
développe cette idée d’un « nouveau territoire à défricher238 » :
Si on avait besoin avant des journalistes, c’est parce qu’ils pouvaient aller chercher l’information là où nous on pouvait pas aller la chercher : dans les pays en guerre, dans les entreprises, au Parlement, etc. En gros s’ils faisaient pas leur travail, on n’avait pas l’information. Et ça a été pas mal bouleversé par les nouvelles technos, les réseaux sociaux en particulier, entre Twitter, les sources qui prennent directement la parole en ligne, la désintermédiation de l’information, (…) son rôle de médiateur s’est un peu amoindri. En revanche les journalistes de données, il y a peu de gens qui ont les capacités d’analyse, les moyens aussi, la capacité d’assembler les compétences pour chercher à de donner du sens, pour aller chercher l’information dans les bases de données et la restituer de façon compréhensible pour le grand public239.
Le data-journalisme, « vecteur de sens240 » pour un public sans les compétences ni le
temps pour analyser les bases de données, formule ainsi la promesse d’un journaliste web
consolidé dans sa position de médiateur. Il prend ainsi le contre-pied des recherches en sciences
sociales dépeignant des « journalistes assis et sous pression241 ». Mobilisés pour des tâches très
courtes242, souvent contraints d’effectuer la réécriture de contenus existants243, dépendants vis-à-
vis des rédactions de presse imprimée244, ces journalistes sont remis en cause dans leur identité
professionnelle245. Le data-journalisme leur offre au contraire la possibilité de s’investir dans des
projets au long cours, étalés sur plusieurs jours voire plusieurs semaines. Il propose de produire 235 TREDAN, Olivier, « Le journalisme citoyen en ligne : un public réifié », Hermès, n° 47, 2007, p. 115. 236 DAGIRAL, PARASIE, « Presse en ligne : où en est la recherche », Art. cit., p. 27. 237 JEANIARD, Lucille, « Grâce au journalisme de données, les professionnels de l’information retrouvent leur rôle de médiateur », Horizons Médiatiques, [disponible en ligne], 5 avril 2012. 238 Entretien avec Jean-Marc Manach (annexe 6) 239 Entretien avec Caroline Goulard (annexe 1) 240 KAYSER-BRIL, Nicolas, « Le data-journalisme, vecteur de sens et de profit », OWNI, [disponible en ligne], 17 avril 2011. 241 DAGIRAL, PARASIE, « Presse en ligne : où en est la recherche », Art. cit., p. 19. 242 QUANDT, Thorsten, « News, Tuning, and Content Management : An Observation Study of Old and News Routines in German Online Newsroom », in PATERSON, David et DOMINGO, Chris, Making online news. The ethnography of New Media Production, Peter Lang, 2008, pp. 76-97. 243 REBILLARD, Franck, « Du traitement de l’information à son retraitement. La publication de l’information journalistique sur l’internet », Réseaux, n° 137, pp. 31-68. 244 CABROLIÉ, Stéphane, « La recomposition d’une organisation de presse : le cas du Parisien.fr », Terrains & travaux, vol. 1, n°15, 2009, pp. 127-145. 245 SINGER, Jane B., « Who are these guys ? The online challenge to the notion of journalistic profesionalism », Journalism, Vol. 4/2, 2003, pp. 139-163

59
de nouveau de « l’information à forte valeur ajoutée 246 », dans des formats difficilement
reproductibles par d’autres sites d’information, et inaccessibles à la presse papier. On observe
même dans certains titres de presse une inversion de la dépendance entre rédaction web et
rédaction papier. Au Guardian par exemple, à la faveur des logs afghans révélés par Wikileaks,
la rédaction de « data-journalistes » a fourni pendant plusieurs mois la version papier en
infographies, articles et autres mises en perspectives247.
Cette double opportunité pour les journalistes – réaffirmation de leur rôle de médiateur,
amélioration des conditions de travail -, se manifeste par la métaphore omniprésente du gisement,
reprenant ainsi les connotations du « data mining » (cf. supra I. C. 3.). Le data-journalisme se
présente ainsi comme un « futur eldorado248 » du journalisme, une « mine de richesse249 »,
permettant d’extraire des « pépites d’or250 » jusque là « enfoui[es]251 » dans une base de données.
Selon Alain Joannès, le journaliste de données est utile dans la mesure où « il sait raffiner les
données brutes pour produire de l’information252 ». La vidéo de présentation de Dataveyes est
encore plus explicite dans cette comparaison.
Figure 14 : capture d’écran tirée de la vidéo de présentation de Dataveyes
246 GOULARD, « Le journalisme de données », Art. cit. 247 ROGERS, Simon, « Wikileaks’ Afghan war logs : how our datajournalism operation work », The Guardian, [disponible en ligne], 27 juillet 2010. 248 KALOUGUINE, Tatiana, « Les données ouvertes, nouvel eldorado du data-journalisme », La voix du dodo, [disponible en ligne], 5 février 2010. 249 SCHERER, Art. cit. 250 Entretien avec Jean-Marc Manach (annexe 6) 251 CLARINI, Art. cit. 252 JOANNES, Op. cit., p. 30.

60
Considérer ainsi les données comme le « nouveau pétrole » permet deux choses.
Premièrement, signifier la haute valeur, la richesse de cet amas masqué au commun des mortels :
comme le diamant, le pétrole, le minerai, l’or ou le gaz, la « data » est une matière qui nécessite
des investissements lourds, mais est porteuse d’une grande rentabilité. Deuxièmement, insister
sur le travail d’ « extraction » et de « raffinage » réalisé par le journaliste : la « data » ne se donne
pas à voir ou à comprendre immédiatement, la médiation de professionnels compétents s’avère
nécessaire. C’est finalement dans ce sens qu’il faut comprendre l’expression de « données
brutes » utilisée par certains. Non comme une donnée naturalisée, niant la médiation humaine,
mais comme une donnée qui n’a pas encore acquis toute sa valeur. Comme le pétrole brut, la
donnée brute nécessite un traitement précis et complexe pour être pleinement exploitable par
l’utilisateur final. On comprend dès lors l’enthousiasme des journalistes face à ce qui se présente
comme un nouveau genre journalistique.
3. Des lignes de fractures entre promoteurs
Si tous s’accordent sur le travail de médiation et d’ « enrichissement des contenus », la
perception des liens entre data-journalisme et journalisme diffère légèrement selon les types de
promoteurs. Pour les journalistes professionnels, ceux ayant reçu une formation en école de
journalisme, le journalisme de données est « avant tout du journalisme253 », qui se distingue
d’autres genres journalistiques par un « champ d’investigation 254 » différent. Les plus
enthousiastes y voient un moyen de faire du « journalisme augmenté255 », mais aucun ne
considère le data-journalisme comme « l’alpha et l’oméga256 » du journalisme, encore moins
comme la « fin de l’histoire 257». Il s’agit à leurs yeux, assez modestement, d’une « corde de plus
à l’arc, une branche de plus sur l’arbre258 ». Nicolas Patte résume remarquablement cette idée :
Le journaliste de données est un journaliste comme les autres. Il n’est ni grand reporter, ni journaliste d’investigation, ni journaliste politique, ni JRI, ni critique littéraire, ni éditorialiste. Comme les
253 Entretien avec Karen Bastien (annexe 4) 254 Entretien avec Johan Hufnagel (annexe 5) 255 Entretien avec Jean-Marc Manach (annexe 6) 256 Entretien avec Johan Hufnagel (annexe 5) 257 Entretien avec Jean-Christophe Féraud (annexe 3) 258 Ibid.

61
autres toutefois il rassemble des faits, les analyse, les transforme, pour informer le public et il poursuit sa mission à travers la même déontologie que ses semblables. Comme un journaliste “traditionnel”, le journaliste de données peut être neutre ou s’engager politiquement259.
Ces développements suggèrent que le journaliste professionnel est la figure la plus à
même de faire du data-journalisme. Pas simplement la figure du journaliste « gatekeeper »,
proche des faits et médiateur proclamé impartial, mais également celle du journaliste
« advocate », engagé, qui se sert de la démarche journalistique pour dénoncer des situations. En
somme, le data-journalisme s’apparente à un « nouveau continent pour le journalisme260 », où le
journaliste continuerait d’appliquer les méthodes qui lui ont permis d’asseoir sa respectabilité et
son autorité de discours.
Les acteurs non journalistes, à l’initiative du mouvement en France comme aux Etats-
Unis, sont plus circonspects quant à ce monopole de la médiation par les journalistes. Ainsi,
l’expression de « professionnels de l’information 261 » est souvent préférée à celle de
« journalistes ». Or cette expression est beaucoup plus large que celle de « journalistes » : elle
renvoie pour Erik Neveu à « un conglomérat de métiers et d’activités ayant comme dimension
commune d’offrir des nouvelles et de l’information à des audiences262 ». Cette définition est
éclairante sur deux points au moins. Premièrement la production d’information peut se faire par
d’autres professionnels. Cette expression ne promet pas l’avènement d’une société où tout le
monde se ferait journaliste, mais remet en question le monopole de la médiation de l’information
par les journalistes professionnels. Pour ces acteurs, la production d’information de qualité ne
passe pas nécessairement par un journaliste titulaire d’une carte de presse. Caroline Goulard reste
ainsi « persuadée qu’il n’y a pas besoin de se définir comme journaliste pour être capable de
remplir ce rôle d’éditorialisation263 ». Deuxièmement, l’utilisation du terme « d’audience »
suggère de penser l’information dans un aspect plus marchand. Elle correspond à une critique
latente adressée par ces acteurs aux journalistes professionnels, qui vivraient le marketing comme
259 PATTE, Nicolas, « Datagenèse », OWNI, [disponible en ligne], 10 juin 2012. 260 HANNE, Isabelle, « “Internet reste un objet étrange dans les rédactions françaises”. Interview de Bertrand Pecquerie », Libération, [disponible en ligne], 29 mai 2012. 261 Interview de Caroline Goulard dans JEANNIARD, Art. cit ; ou RENÉ-WORMS, Pablo, « Les coulisses du journalisme de données », Le Point, [disponible en ligne], 1e décembre 2010. 262 NEVEU, Art. cit., p. 33. 263 GOULARD, « Quatre voies du data-journalisme », Art. cit.

62
« quelque chose de satanique264 », et ne se préoccuperaient pas assez de générer des ressources.
C’est que suggère Pierre Romera lorsqu’il décrit les tensions au sein d’OWNI :
C’est là où ça a commencé à poser problème, parce que quand t’as 20 journalistes, et seulement 5 développeurs pour payer les salaires de tout le monde, il y a forcément un moment où ça coince, (…) il y avait cette disproportion entre les gens qui rapportent de l’argent et les gens qui consomment.
On se trouve finalement dans une situation où les journalistes professionnels acquis à la
cause du data-journalisme voient ce dernier un genre « naturellement » destiné à la profession
journalistique, alors que les premiers promoteurs, non journalistes, partagent une vision plus large
des acteurs capables de réaliser ce travail. À la question « vous considérez-vous comme
journaliste ? », Nicolas Kayser-Bril a cette réponse édifiante : « c’est écrit sur mon contrat de
travail265 ». Il manifeste par là une indifférence à être inclus dans la corporation journalistique, et
un scepticisme quant à la distinction entre journalistes professionnels et non professionnels.
Ce deuxième mouvement a permis de montrer que les critiques les plus courantes à
l’encontre du data-journalisme – objectivisme et automatisation du journalisme -, étaient
globalement infondées. Certes, il existe des prétentions objectivistes chez certains acteurs. Mais
ces discours sont à comprendre dans le sens faible de l’ « objectivité », une honnêteté
intellectuelle doublée d’une rigueur quasi-scientifique. Le mythe de « données brutes » est
finalement peu répandu, et lorsque cette expression est utilisée, elle signifie plutôt, dans une
analogie pétrolière, la nécessité d’une médiation professionnelle pour exploiter un jeu de
données. Concernant l’ « ordre du discours » et les pratiques journalistiques, les imaginaires du
journalisme professionnel semblent donc confortés, même renforcés, par le data-journalisme.
Une divergence de point de vue a cependant été notée entre, d’une part, des journalistes
professionnels convaincus de la nécessité du rôle de la corporation journalistique, et de l’autre,
des acteurs extérieurs au journalisme beaucoup plus ouverts quant à la possibilité de réaliser ce
travail rigoureux de médiation en dehors de la profession journalistique. Cette tension peut
s’expliquer en considérant le data-journalisme comme un projet politique de rénovation du
journalisme, parfois en contradiction avec ses imaginaires et repères constitutifs. 264 Entretien avec Caroline Goulard (annexe 1). 265 In PORTE (DE LA), Art. cit.

63
III. Le data-journalisme comme projet politique de
« réinitialisation » du journalisme
« Libération est (…) un journal fait par des gens avec l’aide de journalistes »
Manifeste du quotidien Libération, 1973.
Le data-journalisme n’est pas simplement un genre journalistique, une discipline dont les
pratiques se veulent en adéquation avec la démarche journalistique : c’est aussi, et peut être avant
tout, un projet politique de rénovation du journalisme.
En effet, l’utilisation de bases de données par des journalistes, ou Computer Assister
Reporting (CAR) n’est pas nouvelle, nous l’avons vu. Elle se développe même particulièrement
au milieu des années 1990 aux Etats-Unis, à la faveur de l’émergence du web et d’une
démocratisation de l’informatique personnelle266. Les journalistes qui se revendiquent du CAR
sont alors dépositaires d’un « modèle épistémologique267 » dans leur pratique du journalisme. Ils
se servent des données pour révéler une « histoire cachée268 » contenue dans les données, souvent
pour démontrer une discrimination entre des groupes sociaux. Ce rôle de dénonciation est vu
comme un moyen de pousser le politique à agir, et renforce donc la figure du journaliste comme
266 GARRISON, Bruce, « Newspaper size as a factor in use of computer-assisted reporting », in Communication Technology and Policy Division of the Association for Education in Journalisme and Mass Communication, [disponible en ligne], Baltimore, août 1998. 267 DAGIRAL, PARASIE, « Data-driven journalism and the public good », Art. cit., p. 9. 268 Ibid., p. 13.

64
œuvrant pour le bien public. L’intégration progressive de hackers dans les rédactions américaines
modifie sensiblement la donne.
Ce rapprochement des mondes du développement et de la presse a été facilitée par des
acteurs institutionnels intermédiaires : la Sunlight Foundation, la Knight Foundation, la Medill
School of Journalism, faculté de journalisme dépendant de la Northwestern University de
Chicago ; ces deux derniers acteurs lançant même un programme de formation à destination des
développeurs269. À la croisée du journalisme, du logiciel libre et de l’ « open data », se forme
ainsi un réseau de personnes gagnées à l’idée de transformer le journalisme à l’aide des outils
informatiques. La plus éloquente manifestation de cette ambition se trouve dans le collectif
« hacks270/hackers », créé par trois personnalités au croisement de ces réseaux271. Leur projet :
faire la « révolution des médias » et « réinitialiser le journalisme » :
Figure 15 : logo du collectif « hacks/hackers »
Cette « réinitialisation » du journalisme se veut porteuse de nouvelles « propositions
épistémologiques272 », parfois divergentes avec le modèle des journalistes de CAR, et plus
généralement avec les imaginaires et repères du journalisme professionnel. Nous en avons
dénombré trois, plus ou moins actualisées selon les personnalités et les projets : une transparence
démocratique radicale (A), la réalisation d’outils pensés avant tout pour l’action individuelle, et
non plus l’action publique (B), et une rénovation organisationnelle des rédactions, fragilisant le
rôle du journaliste dans la production de l’information (C).
269 DAGIRAL, PARASIE, « Portrait du journaliste en programmeur », Art. cit., pp. 149-150. 270 « Hacks » est un mot d’argot américain signifiant « journalistes ». 271 Rich Gordon, professeur d’ « innovation digitale » à la Medill School of Journalism, Burt Herman, ancien correspondant de l’Associated Press, aujourd’hui entrepreneur web, et Aaron Pilhofer, journaliste et dévelopeur, en charge de l’équipe de « data-driven journalism » au New York Times. 272 Ibid., p. 2.

65
A. La promesse d’une transparence démocratique radicale
La notion de transparence propose de « laisser voir ce qui se trouve derrière 273 ».
Appliquée à la démocratie, elle renvoie à la mise en lumière des secrets cachés dans les
interstices du pouvoir. Les réalisations de data-journalisme destinées à surveiller les
comportements de « puissants » - hommes politiques, industriels, etc. - s’avèrent ainsi fréquentes
(1), sans doute car elles réactualisent une figure ancienne du journalisme : le « journaliste-
justicier », qui démêle les intrigues au service du bien public (2). Le projet politique et social de
transparence porté par certains hackers se distingue cependant légèrement de celui des
journalistes par sa radicalité (3).
1. Une surveillance démocratique par les données
Si différentes personnalités se revendiquant de la culture « hacker » ont investi la presse
états-unienne au milieu des années 2000, c’est parce qu’ils font le lien entre leur engagement
démocratique et l’activité de production de l’information. Nombre d’entre eux ont ainsi
abandonné des emplois de développeur, autrement plus rémunérateurs, par souci de « participer à
quelque chose de plus grand274 ».
Ils se donnent comme ambition de renouveler la manière dont les citoyens peuvent
responsabiliser les autorités politiques. Il ne s’agit plus uniquement d’interroger les données
statistiques produites par ces autorités, pour en extraire un sens caché, mais de dénoncer des
agissements incorrects, en rendant public des documents méconnus des citoyens. Ces acteurs,
pour beaucoup également militants de l’ « open data », défendent en effet une accessibilité
maximale aux dossiers publics. La divulgation de documents touchant à l’élaboration des
politiques publiques doit permettre aux citoyens d’exercer une surveillance démocratique sur ses
représentants, en s’assurant que ces décisions ont bien été motivées par l’intérêt général. La
273 Entrée « transparence » du Trésor de la Langue Française Informatisé 274 PARASIE, Art. cit. p. 3.

66
maîtrise des outils informatiques, et non simplement statistiques, est perçue par ces acteurs
comme un moyen de « [pousser] encore plus loin l’impératif de transparence275 ».
Premièrement, parce que le hacker, « bidouilleur » en français, peut mettre en œuvre « des
processus plus ou moins automatisés, du bricolage, pour aller récupérer de la donnée276 ».
Autrement dit, si les données qu’il cherche ne sont pas disponibles sous forme structurée, ce
dernier dispose des capacités techniques pour aller récolter (« scrapper ») et compiler des
informations éparpillées à plusieurs endroits, puis les présenter au lecteur de manière intelligible.
Il est moins dépendant des formats fournis par les autorités publiques. Lorsqu’il était au
Washington Post, Adrian Holovaty a ainsi réuni toutes les informations relatives à l’activité
parlementaire (présence dans l’hémicycle, dépôt d’amendements, questions, etc.) sur un même
site277, inspirant des projets similaires dans différents pays278. Le « journaliste hacker » peut alors,
à l’instar de son prédécesseur « assisté par ordinateur », croiser des jeux de données afin
d’« augmenter279 » l’information. Se servant de la base de données établie par Holovaty, la
Sunlight Foundation a établi de cette manière une corrélation entre l’origine géographique des
sénateurs et leur vote en défaveur de la réforme du système pénitencier, suggérant que les
représentants des Etats les plus peuplés en prisonniers se satisfaisaient assez bien des retombées
économiques du système actuel280.
Ensuite, il peut mettre une grande quantité de documents à disposition des internautes, et
les solliciter pour discerner les comportements potentiellement amoraux des puissants. Lors du
scandale des notes de frais des parlementaires britanniques, le Daily Telegraph s’est ainsi appuyé
sur des milliers d’individus pour faire remonter les notes les plus douteuses281. Dans la même
veine, le site CityPayment.com282 présente toutes les dépenses des autorités locales et encourage
275 PARASIE, Art. cit., p. 9. 276 Entretien avec Pierre Romera (annexe 2) 277 « The US Congress Vote Database », http://projects.washingtonpost.com/congress/112/ (consulté le 31 août 2012) 278 Citons notamment l’initiative française du collectif Regards Citoyens : http://www.nosdeputes.fr/ (consulté le 31 août 2012) 279 Entretien avec Jean-Marc Manach (annexe 6) 280 Le système pénitencier américain étant en partie privé, les propriétaires des établissements jouissent d’un certain pouvoir économique au niveau des Etats. Voir : KIRKPATRICK, Marshall, « What can you do with Government data ? Bust politicans that’s what », ReadWriteWeb, [disponible en ligne], 12 juillet 2009. 281 METTOUT, Art. cit. 282 Ce site permet aux internautes de voir tous les contrats passés par la municipalité, puis de répertorier et commenter ceux qu’il estime « truqués ». Voir : http://www.citypayments.org (consulté le 31 août 2012)

67
l’utilisateur à marquer comme « truquées » [« goofy »] celles qu’il estime suspectes283. Plus
qu’une « surveillance », ces mécanismes portent la promesse d’une « sousveillance284 » au sens
de Jean-Gabriel Ganascia, où le dispositif foucaldien de panoptique285 s’inverse au profit des
« surveillés ». Ce n’est plus un regard unique qui surveille la masse, mais une infinité de regards
qui se posent sur l‘action des dirigeants. Cette inversion se traduit par une surveillance « des
puissants par tous », qui permettrait un contrôle démocratique optimal.
Dans tous ces exemples, l’objectif est cependant de faire la lumière sur des agissements
jugés immoraux (une absence soutenue à l’Assemblée), illégaux (le trucage d’un marché public,
l’achat d’un vote), voire criminels de la part d’autorités ou de personnalités publiques. En cela le
« journaliste hacker » se rapproche de la figure ancienne du journaliste justicier.
2. La réactualisation de la figure du « journaliste-justicier »
Le data-journalisme est fréquemment présenté comme un sous-genre du journalisme
d’investigation. La quatrième de couverture de l’ouvrage d’Alain Joannès affirme par exemple
qu’ « à l'ère du web et du numérique, le data journalism doit désormais figurer dans la panoplie
de l'enquêteur ». Caroline Goulard affirme elle que « l’investigation » est l’une des « quatre
voies » du data-journalisme dans la mesure où il « permet d’éclairer autrement le monde286 ».
L’entrée « journalisme » de Wikipédia est encore plus explicite :
Le journalisme d'investigation qui traite les faits dont la collecte peut être entravée par des tiers intéressés à leur non-divulgation, ou que le sujet étudié réclame un travail de recoupement long et complexe. Le journalisme de données qui consiste à analyser des données complexes ou à extraire des informations pertinentes de quantités importantes de données en est une variante287.
Cette association commune n’est ni anodine, ni fortuite. Elle manifeste les
représentations communes aux « journalistes d’investigation » et « journalistes hacker ».
Ces deux catégories partagent la revendication d’un contrôle démocratique sur les
283 DAGIRAL, PARASIE, « Data-driven journalism and the public good », p. 26. 284 GANASCIA, Jean-Gabriel, Voir et pouvoir, qui nous surveille ?, Le Pommier, 2009, 4e de couverture. 285 FOUCAULT, Michel, Surveiller et punir, Gallimard, 1998 (1975), 360 p. 286 GOULARD, « Les quatre voies du datajournalism », Art. cit. 287 Entrée « journalisme » sur Wikipédia. http://fr.wikipedia.org/wiki/Journalisme#Les_genres_journalistiques (consulté le 31 août 2012)

68
dirigeants, quitte à aller « [écouter] dans les coulisses, [récupérer] des documents cachés (…)
pour révéler les motifs et les logiques qui président aux événements288 ». Elles se retrouvent
également dans la dénonciation d’un « journalisme de connivence289 », qui relaie naïvement
et sans distance les événements tels qu’ils sont rapportés par les puissants. Enfin, toutes les
deux sont attachées à rendre publics les comportements des individus en les désignant
nominativement pour « [obtenir] des résultats concrets 290 » -‐ une condamnation, une
démission, des excuses -‐ : c’est la politique dite du « naming, blaming, claiming291 ». Une
telle proximité renforce le « journalisme hacker » dans la mesure où le personnage du
journaliste d’investigation est fortement ancré dans les imaginaires du journalisme
professionnel, faisant lui-‐même écho à une figure ancienne : le journaliste justicier.
Cyril Lemieux montre que cette dernière figure apparaît en France autour de 1750, à
travers les « journalistes de combat » et « publicistes » qui s’emparent de questions de justice
collective292. Contre une justice partiale, ils prennent le rôle de l’avocat ou du magistrat et
constituent un « tribunal de second recours293 » pour les personnes s’estimant mal jugées. À
l’orée de la Révolution Française, ils dénoncent déjà « l’empire censorial294 » représenté par
les institutions publiques et judiciaires. Au XIXe, le journaliste justicier se réincarne dans la
figure du « journaliste d’enquête », aux allures de détective privé. Magnifié par le genre
émergent du fait-‐divers, il en vient à concurrencer, par son apport présumé dans les affaires
judiciaires, le journaliste tribunicien. Cette prétention à « rendre justice » se réactualise
dans les années 1980-‐1990, avec l’apparition du « journaliste d’investigation ». À la faveur
d’un double mouvement de remise en cause de l’autorité post soixante-‐huitarde, et de
progression de normes de rentabilité favorisant le « scoop », il s’attache désormais à
dénoncer le « comportement moral et légal des élites politico-‐administratives295 » ; rôle
jusque-‐là réservé à l’éditorialiste. 288 CARDON, « Zoomer et dézoomer : les enjeux politiques des données ouvertes », Art. cit. 289 Ibid. 290 KELLER, Thiery, « La révolution hacker », OWNI, [disponible en ligne], 17 avril 2012. 291 FESTINER, William L., « The emergence and transformation of disputes: Naming, Blaming, Claiming”, Law and Society Review, Vol. 15, n° 3/4, 1980, pp. 631-654. 292 LEMIEUX, Cyril, « Les formats de l’égalitarisme : transformations et limites de la figure du journalisme justicier dans la France contemporaine », Quaderni, n° 45, 2001, p. 56. 293 Idem. 294 Expression de Camille Desmoulin, citée in : LEMIEUX, Cyril, « La Révolution française et l’excellence journalistique au sens civique. Notes de recherche », Politix, Vol. 5, n °19, 1992, p. 34. 295 LEMIEUX, « Les formats de l’égalitarisme », p. 57.

69
Cette dernière figure, de laquelle se rapproche celle du « journalisme hacker », se
nourrit néanmoins des prétentions justicières des deux précédentes. Au publiciste du
XVIIIe, il reprend la volonté de faire avancer des causes d’intérêt général. Avec l’enquêteur
du XIXe, il partage un talent pour démêler les intrigues et une méticulosité dans
l’agencement des preuves. Le logo du site d’information ProPublica, fréquemment cité
comme une référence de data-‐journalisme296, rend compte de cette dualité.
Figure 16 : logo du site d’information ProPublica
La loupe fait référence à l’archétype de l’enquêteur privé, suggérant la nécessité d’aller
examiner ce qui est caché, ce qui est invisible à œil, sans se fier naïvement aux discours des
acteurs concernés. Le nom du site et sa devise sont eux sans équivoque quant à l’inscription des
investigations au service de l’intérêt général. On comprend ainsi les liens, étroits, entre data-
journalisme et journalisme d’investigation. La participation importante de hackers à la
construction identitaire du journalisme de données invite néanmoins à noter quelques points de
divergence quant à l’objectif final de la démarche.
3. La transparence « nue » en question
La surveillance démocratique prônée par les hackers s’inscrit dans une aspiration plus
générale à la transparence, « imaginaire constitutif d’internet297 » pour Patrice Flichy. Elle
procède d’une division du monde où ce qui est masqué est par défaut suspect, et mérite d’être
révélé au grand jour, pour s’en assurer. La conscience sociale est secondaire dans la 296 RAPHAËL, Benoît, « Propublica : journalisme à (très) haut coût, financé par des dons », OWNI, [disponible en ligne], 18 novembre 2010. 297 FLICHY, Patrice, Les imaginaires d’internet, La Découverte, 2001, 272 p. In : AIM, Olivier, « La transparence rendue visible. Médiations informatiques de l’écriture », Communication et langages, n° 147, 2006, p. 33.

70
compréhension de leur méfiance à l’égard du pouvoir : ce n’est pas parce qu’un homme politique
agit mal qu’il est avant tout répréhensible, mais parce qu’il cache des informations aux citoyens,
et entrave ainsi la liberté de circulation de l’information. Dès lors le hacker se donne pour objectif
de « rendre visible ce qui est caché et accessible ce qui est confisqué298 », assimilant le bien
public à une transparence radicale. David Brin résume la dichotomie morale de cette pensée :
En un mot, la formule clé de notre nouveau monde est : Ouvert, bon. Fermé, mauvais. Tatouez-la sur votre front. Appliquez la à la technologie, à la vie des affaires, à la philosophie de la vie. C’est le concept gagnant pour les individus, les nations, pour la communauté globale des années à venir299.
Cette foi dans la vertu de « l’ouverture » procède de la théorie cybernétique de Norbert
Wiener. L’abondance de l’information y est perçue comme un objectif vital, un bouclier contre la
propagande des régimes totalitaires, ou la standardisation imposée par les industries de la culture.
Dans une métaphore organiciste, Wiener estime que limiter la communication revient ainsi à
« s’arrêter de respirer ou à s’asphyxier300 ». Et c’est la technologie, la mise en réseaux des
ordinateurs, qui doit permettre d’atteindre cet idéal de libre circulation de l’information et
permettre de construire un monde meilleur. Au secret et à la rétention des puissants, les hackers
opposent la notion de transparence, représentée par la métaphore de la lumière, que ce soit le
faisceau de Wikileaks ou le soleil de la « Sunlight Foundation ».
Figure 17 : image de l’association Wikileaks Figure 18 : logo de la Sunlight Foundation
298 KELLER, Art. cit. 299 Traduction de GOETA, Op. cit., p. 34. Voir : BRIN, David, « The transparent society », Wired, [disponible en ligne], 4 décembre 1996. 300 REBILLARD, Op. cit., p. 90.

71
Le journaliste « justicier » se situe dans une approche partiellement distincte. La
surveillance démocratique qu’il effectue entend contrôler que les décisions publiques servent bien
l’intérêt général. Motivé par une certaine conscience sociale, il cherche à connaître les coulisses
du pouvoir seulement s’il pense qu’un choix ne sert pas l’intérêt général (négligence de sécurité,
discrimination d’un groupe social, népotisme, etc.). Et lorsqu’il soupçonne une motivation
intéressée, le journaliste justicier prend le temps d’enquêter en profondeur, parfois sur plusieurs
mois, pour administrer les preuves de son accusation et présenter au lecteur un récit le plus fidèle
possible de la réalité. Attaché à ce travail poussé de médiation, il fait part d’un certain
scepticisme face à la demande d’une « transparence nue301 », qui érige de fait la manipulation et
l’intéressement comme motivation par défaut de l’action publique.
Dans son essai « Against Transparency », Lawrence Lessig, célèbre juriste de la propriété
intellectuelle, donne l’exemple d’une réalisation de l’association MapLight. Cette dernière révèle
que les représentants ayant voté « oui » à un amendement de dérèglementation du secteur de
l’énergie ont reçu une moyenne de 37 700 dollars des lobbies pétrolier, minier et nucléaire, contre
11 304 dollars en moyenne pour ceux ayant voté non ; suggérant de facto que l’industrie de
l’énergie a acheté les votes de ces députés. En donnant une explication unique au vote de
l’amendement, une telle conclusion nie la complexité des facteurs de décision de chaque
représentant, et encourage le public à se détourner d’une classe politique « achetée ». Lawrence
Lessig, filant la métaphore du soleil, défend ainsi que la transparence n’est pas vertueuse en soi :
There is no questioning the good that transparency creates in a wide range of contexts, government especially. But we should also recognize that the collateral consequence of that good need not itself be good. (…) Sunlight may well be a great disinfectant. But as anyone who has ever waded through a swamp knows, it has other effects as well302.
Finalement, les imaginaires du data-journalisme et du journalisme se retrouvent dans leurs
velléités de ne pas relayer naïvement les discours des puissants, et de contrôler la probité de leurs
301 [« naked transparency »] LESSIG, Lawrence, « Against Transparency. The perils of openness in government », The New Republic, [disponible en ligne], 9 octobre 2009. 302 Ibid. La dernière phrase semble faire référence à la puanteur et/ou l’insalubrité provoquée par le soleil dans un marécage [« Il va sans dire que la transparence crée du bien dans un large éventail de contextes, relatifs à l’Etat en particulier. Mais il faut aussi reconnaître que les conséquences collatérales de ce bien, ne sont pas nécessairement le bien (…) Le soleil peut être un désinfectant très efficace. Mais quiconque a déjà pataugé dans un marécage sait qu’il a aussi d’autres effets »]

72
actions. Si une divergence se fait jour quant à l’importance donnée à la notion de transparence, on
pourrait l’atténuer en remarquant l’utilisation de plus en plus fréquente de la notion de
« décryptage » dans les médias303. Par la promotion des coulisses et du caché comme « grand
motif d’explication du réel304 », cette expression se rapproche en effet de l’attitude de suspicion
hacker. Une divergence politique plus fondamentale est à trouver en analysant le deuxième sens
de la notion de transparence.
B. Des dispositifs pensés pour l’action individuelle
La notion de transparence, « faculté de mettre en lumière », s’entend également dans un
sens moins lié aux coulisses du pouvoir. Elle peut décrire la capacité à « éclairer » des chiffres
statistiques, en sortant au grand jour une « vérité » inaccessible à l’œil profane. C’est par exemple
la démarche qu’adoptaient les « journalistes assistés par ordinateurs » aux Etats-Unis, utilisant les
statistiques publiques pour révéler des discriminations illégales.
Dans le cadre du data-journalisme, le « dévoilement » d’informations contenues dans les
chiffres se fait pourtant dans une ambition sensiblement différente. En s’appuyant sur le dispositif
de la carte « zoomable », qui permet d’entrer dans l’information de manière individuelle (1), le
travail de mise en perspective des données est réduit à sa partie congrue, laissant leur
interprétation à l’utilisateur (2). La figure mobilisée est alors celle de l’individu rationnel, qui
accède à des informations sur son quartier pour maximiser ses intérêts (3).
1. La carte « zoomable » comme dispositif phare
Outre l’ancienneté d’un journalisme « assisté par ordinateur » aux Etats-Unis, le
data-journalisme a profité d’un intérêt renouvelé pour les informations micro-locales au milieu
des années des 2000. Communautés de voisinages, associations de parents d’élèves, clubs sportifs
303 AÏM, Olivier, « Introduction », in Les médias dans les sciences de l’information et de la communication, organisé par CELSA, Département « Médias et Communication », Neuilly-sur-Seine, 21 septembre 2011. 304 Ibid.

73
se sont ainsi manifestés pour obtenir des données concernant leur zone géographique de
référence, que ce soit le quartier, la ville ou une entité plus grande305. C’est sur cet engouement
que se fonde Adrian Holovaty lorsqu’il lance à titre personnel le site Chicagocrimes.com en
2005, carte en ligne de la ville permettant de localiser les données criminelles. Par le travail de
qualification des données, le site permet des requêtes très précises, selon le lieu, la date, le type
d’acte délictueux, etc.306. A l’issue de ces premières expériences menées par des « start-up », de
nombreux sites d’information régionaux – Washington Post, Cincinnati Enquirer, Texas Tribune,
etc. -, emboîtent le pas en proposant des « datastores », des cartes représentant des données ultra
locales. Fort du succès d’audience de ces travaux307, le spectre des données représentées devient
très large : agressions sexuelles, prix de l’immobilier, accidents de vélo, mais aussi boîtes de
croquettes pour chiens rappelées par leur fabriquant ou répartition géographique des gains de tel
ou tel casino308.
L’instrument de navigation proposé par ces différentes initiatives est celui de la « carte
zoomable / dézoomable309 », où l’utilisateur peut jongler entre une situation locale et un aperçu
plus général. Il forme un dispositif au sens d’Yves Jeanneret et Emmanuel Souchier - « ensemble
qui relie le substrat matériel et technique de la communication et d’autre part, les formes
langagières et énonciatives qu’il rend possible310 » -, dans la mesure où il conditionne les
possibilités d’utilisation. Ce type de carte encourage l’utilisateur à aller voir par curiosité « ce qui
se passe » dans son quartier, pour se situer par rapport aux données rapportées. Dominique
Cardon compare cette situation à la première utilisation du service « Google Earth » où le réflexe
est de « partir du globe terrestre pour aller son propre lieu d’habitation311 ». L’impression
donnée est que le monde s’organise autour de la situation de l’individu. En témoignent deux des
exemples les plus cités de data-journalisme : « EveryBlock » et « Police.uk ».
305 GOULARD, « Le journalisme de données », Art. cit. 306 Interview de Sylvain Parasie, in INIZAN, « Chicago : de la prohibition au data-journalisme », Art. cit. 307 Pour le jeune Texas Tribune, plus d’un tiers des visites seraient dues à ces « datastores ». Voir : SMITH, Evan, « Lessons for the Tribune’s First 6 Months », Texas Tribune, [disponible en ligne], 10 mai 2010. 308 GOULARD, Ibid. 309 CARDON, Art. cit. 310 Entrée « dispositif » in ABLALI, Driss et DUCARD, Dominique, Vocabulaire des études sémiotiques et sémiologiques, Honoré Champion, 2009. Cité par : GOMEZ MEJIA, Gustavo, « La quête d’un point de vue communicationnel sur le web », in Poétique et usages du web, organisé par CELSA, Master 2 « Médias Informatisés et Stratégies de Communication », Neuilly-sur-Seine, 25 janvier 2012. 311 CARDON, Art. cit.

74
Figure 19 : logo de l’entreprise EveryBlock
Figure 20 : page d’accueil du site Police.uk Figure 21 : capture du même site après avoir rentré une adresse
« EveryBlock » est la continuation du projet « ChicagoCrimes » lancé par Adrian
Holovaty. Il reprend la même idée – localiser des données sur une carte -, et l’étend à tous les
secteurs de la vie : ouverture de commerces, transactions immobilières, licences de débit
d’alcool, etc. Comme le suggère le logo, c’est le « bloc », le quartier, soit l’unité géographique de
référence au quotidien, qui est au centre du dispositif. Le site Police.uk procède de la même
logique en invitant l’utilisateur à entrer son code postal pour accéder aux données. S’ouvre alors
une carte répertoriant les différents types d’agressions dans un périmètre, modulable, autour de
son lieu de résidence. Contrairement aux cartes traditionnelles où les ensembles, les blocs
s’imposent à l’œil à première lecture, la vision est ici individualisée, quitte à ne montrer qu’une
infime partie de la carte.
Par la force des promesses de ces dispositifs, l’idée d’une approche personnalisée est
reprise par d’autres réalisations de data-journalisme, même en l’absence de carte. Lorsque le
Chicago Tribune présente à ses lecteurs les notes de frais des conseillers municipaux, l’entrée se
fait également par code postal312. Dans un registre différent, le quotidien USA Today a proposé, à
312 BOYER, Brian, DARDRICK, Hal, GERMUSKA, Joe et RYAN, Mark, « City Council’s $3,7 million allowance : how aldermen spent taxpayer money », The Chicago Tribune, [disponible en ligne], 7 avril 2010.

75
l’occasion des dix ans des attentats du 11 septembre 2001, de représenter sur une frise
chronologique, tous les événements liés aux attentats, de 2001 à aujourd’hui. 313 Par une
synchronisation avec le compte Facebook de l’utilisateur, le dispositif permet de mettre en
relation chacun de ces événements avec un événement de la vie personnelle de l’utilisateur
(obtention de diplôme, album photo, mariage, etc.).
Tous ces exemples suggèrent que la meilleure porte d’entrée vers l’information se fait par
la situation individuelle. Une telle posture fragilise le travail de mise en perspective défendu par
les journalistes et les sciences sociales.
2. Un travail de mise en perspective fragilisé
Les journalistes « assistés par ordinateur » avaient pour ambition d’utiliser les données à
des fins de compréhension de la société. L’ouvrage de Philip Meyer, The New Precision
Journalism, disposait ainsi d’un sous-titre : « A Reporter’s Introduction to Social Sciences
Methods ». La filiation avec les sciences sociales était alors pleinement assumée. Revendiquée
même : pour ce pionnier, le journalisme avait beaucoup à apprendre des méthodes d’analyse
statistique des sciences sociales. S’inspirer de leur rigueur permettrait au journaliste de
« produire une information en rupture avec les préjugés314 », à l’image des reportages du même
Philip Meyer ou de Bill Dedman (cf. supra).
Or les usages de la statistique en sciences sociales se sont en partie construits sur deux
oppositions : l’échantillonnage contre l’exhaustivité des données, et la structure contre l’individu.
La première renvoie à l’idée qu’il est possible de rendre compte fidèlement de la réalité à partir
d’un échantillon. Souvent même, l’étude approfondie et problématisée d’ « agrégats
représentatifs315 » est plus riche que l’analyse quantitative d’une base complète et « granulaire »,
mais dont la compréhension fine est difficile. La deuxième opposition souligne la primeur des
catégories sur les individus dans l’explication du social. Les individus intéressent beaucoup
313 http://www.usatoday.com/news/911/plus_me/index.html, (consulté le 31 août 2012). Cité par Caroline Goulard lors de l’atelier de travail de la mission Etalab sur le data-journalisme, le 13 octobre 2011 : http://www.etalab.gouv.fr/pages/Atelier_de_travail_du_13_Octobre_2011_Datajournalisme-5913723.html (consulté le 31 août 2012) 314 PARASIE, « Chicago : le parrain du data-journalisme », Art. cit. 315 CARDON, Art. cit.

76
moins le sociologue, l’historien ou le démographe que « le système qui les fait agir en raison de
certaines de leurs propriétés catégorielles316 ». Il est ainsi fréquent que le chercheur en sciences
sociales, et c’est là une différence fondamentale avec le journaliste d’investigation, anonymise
entièrement un terrain d’enquête pour se préserver d’une explication ad hominem317.
Les dispositifs de « carte zoomable/dézoomable » se situent dans une démarche opposée :
elles favorisent l’entrée subjective pour appréhender le social, ainsi que l’exhaustivité des bases
de données. Fidèles à la conception de transparence évoquée plus haut, les promoteurs de ce
genre de réalisations considèrent que plus la base sera exhaustive, et plus la granularité sera
importante – dans les limites du respect de la vie privée318 -, meilleure sera la connaissance. Le
travail du journaliste ou du statisticien, visant à chercher des vérités masquées dans les chiffres,
n’a dès lors plus lieu d’être, dans la mesure où « les données ne peuvent ni mentir ni cacher
quelque chose si elles sont granulaires, complètes et mises à jour régulièrement319 ». C’est cette
foi absolue et un peu naïve dans la transparence que Jason Grotto, journaliste du Chicago Tribune
formé au CAR, reproche aux projets d’Adrian Holovaty :
J’en questionne l’utilité parce que les données en elles-mêmes, que vous disent-elles ? Certes, vous avez des crimes dans votre voisinage, mais qu’est-ce que cela signifie ? Les journalistes interprètent, filtrent et font toutes sortes de choses que je considère importantes. C’est ce que nous souhaitons apporter. Les données en elles-mêmes et pour elles-mêmes n’ont pas nécessairement de valeur. Elles sont importantes pour des personnes qui savent les utiliser et leur donner du sens, mais pour l’individu lambda, je ne pense pas que cela suffise320.
On comprend bien la critique dans la mesure où l’individu, confronté à une donnée le
concernant personnellement, risque d’en avoir « une réception non rationnelle 321 ». C’est
316 Idem. 317 Voir notamment : LASCOUMES, Pierre (dir.), Favoritisme et corruption à la française. Petits arrangements avec la probité, Presses de Sciences Po, 2010, 283 p. 318 La granularité poussée de certains dispositifs, où le zoom peut se faire jusqu’à l’immeuble, pose cependant question. En incitant ainsi les utilisateurs à observer la situation de leurs voisins, elle fait peser le risque d’une situation de « sous-veillance », entendue cette fois-ci non comme le « contrôle des puissants par tous » mais comme le contrôle « de tous par tous », où chaque geste du voisin est épié. Olivier Aïm propose le terme de « paranoptique318 », néologisme entre « paranoïa » et « panoptisme », pour décrire cet affaissement du regard inquisiteur central en une infinité de regards latéraux, situation où tout le monde est invité à observer tout le monde. Les dernières évolutions du projet EveryBlock, vers un « réseau social de voisinage », où tous les événements du quartier sont rapportés et commentés abonde dans ce sens. Voir : AÏM, Olivier, « Une télévision sous surveillance. Enjeux du panoptisme dans les « dispositifs » de télé-réalité », Communication et langages, n° 141, 2004, pp. 49-59. 319 [« the data cannot lie or hide anything if they are granular, complete, and regularly updated »], in DAGIRAL, PARASIE, « Data-driven journalism and the public good », Art. cit., p. 29. 320 DAGIRAL, PARASIE, « Portrait du journaliste en programmeur », Art. cit., p. 149. 321 CANDEL, Art. cit., p. 47

77
particulièrement vrai en ce qui concerne les données de la criminalité, où il est facile de
sur-interpréter les quelques faits délictueux de son quartier comme un signe de la dangerosité de
la zone. « Le nez collé dans la donnée322 », l’individu concerné ne verrait pas, par exemple, que
certains faits sont liés à une situation conjoncturelle, ou bien qu’ils demeurent très marginaux à
l’échelle nationale ; le risque étant de diffuser un « climat anxiogène323 » pourtant infondé si les
données avaient été mises en perspective.
Une telle critique omet cependant de voir que ces dispositifs n’ont pas pour objectif
l’explication du social, mais la mise à disposition outils d’aide à la décision pour que l’individu
rationnel puisse maximiser ses intérêts en connaissance de cause.
3. Des outils d’aide à la décision rationnelle
La disposition sur une carte de données ultra-locales invite spontanément à une lecture
consumériste et intéressée de ce qui est donné à voir. Ce n’est pas un hasard à ce titre si les
expériences d’utilisation des données publiques les plus populaires sont des cartes du crime324. La
prétention de celles-ci n’est pas de se demander comment évolue la criminalité au niveau macro,
mais « mon quartier est-il suffisamment protégé ? ». De la même manière, on ne s’interroge plus
sur le modèle éducatif national, mais « l’école des mes enfants a-t-elle une bon taux de
réussite ? » ; on ne se questionne pas sur les raisons de la flambée de l’immobilier, mais on
regarde dans quelle mesure son quartier a été épargné.
La conclusion de ce processus intellectuel est l’optimisation de ses intérêts : si un secteur
apparaît comme trop dangereux, ou une école trop mauvaise, l’individu rationnel prendra la
décision de déménager pour un quartier où son « utilité » sera meilleure. Les concepteurs de ces
dispositifs ne s’en cachent d’ailleurs pas : la carte est avant tout un « outil d’aide à la décision ».
322 Citation de Valérie Peugeot, in : KALOUGUINE, Art. cit. 323 Ibid. 324 TRAVIS, Alan et MULHOLLAND, Helen, « Online crime maps crash under weight of 18 million hits an hour », The Guardian, [disponible en ligne], 1e février 2011.

78
It could be a citizen who finds out about something and goes and looks at it, and then makes a decision about the neighborhood, about what they’re going to bring back to their block club or what - you know, if I’m going to live here or not. So it’s a decision-making tool and a research tool for everybody325.
Aux dires de Daniel O’Neil, les dispositifs se voudraient également des « outils de
recherche », conservant ainsi, au moins formellement, l’objectif d’analyse de la société défendue
par les journalistes « assistés par ordinateurs ». En entrant dans une grande base de données selon
son gré, l’utilisateur peut « accéder aux petits bouts en fonction de son intérêt326 ». Alors que les
statisticiens dressent des « tableaux de la société si désincarnés qu’ils n’attirent plus le
public327 », ces dispositifs se proposent de renouveler l’intérêt de ce dernier, qui s’approprierait
l’information, la retiendrait plus facilement, et découvrirait peut être des choses invisibles à la
vision macro du journaliste.
Cette vision reste cependant prisonnière du niveau local. La vigilance citoyenne ne se fait
plus à l’encontre des puissants, mais des acteurs du bas de l’échelle : les fonctionnaires, les
acteurs locaux, les voisins, etc. L’interprétation des données ne tente pas de « remonter la chaîne
des causes vers les effets structurels328 » d’une situation observée, mais se contente du prisme
ultra-local, sur des variables et des entités géographiques où les individus estiment avoir un
pouvoir d’action. Par cette analyse en « caméra subjective329 », il ne s’agit plus de rendre compte
fidèlement de la réalité sociale, mais de comparer des espaces géographiques proches, sur fond de
concurrence entre les territoires : « la régie municipale s’occupe mieux du quartier d’à côté », « la
criminalité devient trop importante passé telle rue », etc. S’installe ainsi un climat de rivalité, de
lutte entre les individus pour le lieu de résidence optimal, où sont naturellement favorisés ceux
qui ont les moyens de s’installer là où le cadre de vie apparaît être le meilleur. Les dispositifs de
la carte « zoomable » ne sont donc pas un outil d’aide à la décision pour tout le monde, mais
uniquement pour ceux qui ont un pouvoir d’action, renforçant ainsi les inégalités sociales330.
325 Entretien avec Daniel O’ Neil, co-fondateur de EveryBlock, cité dans : DAGIRAL, PARASIE, « Data-driven journalism and the public good », Art. cit., p. 23. 326 Entretien avec Caroline Goulard (annexe 1) 327 CARDON, Art. cit. 328 Ibid. 329 Ibid. 330 Cette observation relance le débat sur l’opportunité de publicisation de certaines données statistiques, en raison de leur performativité. Il est ainsi fréquent de voir que des phénomènes observés se renforcent lorsqu’ils sont rendus publics, les individus avec un pouvoir d’action suffisant « fuyant » les zones ou institutions les moins favorisées. Ce débat se pose régulièrement dans le champ journalistique, comme récemment entre Thomas Legrand (France Inter)

79
À travers le dispositif de la carte « zoomable », le data-journalisme actualise donc la
figure de l’individu rationnel, qui optimise ses choix en fonction des informations dont il dispose,
dans le but de maximiser ses intérêts. Contrairement au journaliste « assisté par ordinateur », qui
révélait des situations socialement inacceptables et poussait le politique à agir, ces dispositifs
n’ont pas pour objectif de participer au bien collectif. Dans ce cadre, le data-journalisme
s’éloigne donc sensiblement des mythes fondateurs du journalisme professionnel.
Cette divergence entre data-journalisme et imaginaires du journalisme s’observe
également dans la prétention du premier à changer en profondeur l’organisation des rédactions.
C. La « data », levier d’une organisation « décloisonnée » des médias
Omettre l’ambition de transformation des organisations médiatiques lorsque l’on étudie le
data-journalisme serait prendre ce dernier par « le petit bout de la lorgnette331 ». Ce projet
managérial propose de faire du journaliste un chef de projet web, discutant avec différentes
compétences (1). Il invite à repenser la place de l’internaute dans la production de l’information :
lorsque ce dernier est expert sur un domaine, il est ainsi encouragé à concurrencer le journaliste
(2). Ses fondements idéologiques – management par projet, « société en réseau » - questionnent
l’émergence d’un « nouvel esprit du journalisme », en symbiose avec le « nouvel esprit du
capitalisme » décrit par Luc Boltanski et Ève Chiapello (3).
1. Un journaliste chef de projet web
Les promoteurs du data-journalisme partagent un même constat : le cloisonnement du
journaliste professionnel dans la production de l’information. Ce dernier est dépeint comme un
et Eric Mettout (L’Express) sur le sujet du classement des lycées. Voir : METTOUT, Eric, « Pourquoi nous classons les lycées (réponse à Thomas Legrand) », L’Express, [disponible en ligne], 6 avril 2012. 331 Entretien avec Caroline Goulard (annexe 1)

80
travailleur « solitaire332 », « isolé333 », « qui bosse dans son coin334 » et « [écrit] trois ou quatre
articles par jour tout seul335 ». Le data-journalisme propose au contraire un fonctionnement
« hyper collaboratif336 », où le journaliste est amené à travailler avec d’autres compétences tout
au long du traitement et de la mise en forme des données. Designers comme développeurs
seraient associés dès l’amont de la réalisation, afin d’intégrer pleinement les dimensions
esthétiques et techniques au travail journalistique L’influence managériale de ces
recommandations est celle de la « gestion de projet web337 ». Une telle parenté suggère deux
évolutions pour le journaliste, l’une au niveau de ses compétences, l’autre de son statut.
Premièrement une relative maîtrise technique de la part du journaliste devient nécessaire.
Pour la plupart des promoteurs, cela ne signifie pas que « les rôles vont s’inverser338 » : le
journaliste ne devra pas apprendre toutes les ficelles du code mais simplement être capable parler
la même langue avec un développeur web. Ce degré de maîtrise « minimal » est cependant assez
élevé chez certains programmeurs, venus au journalisme par conviction mais également par défi
technique ; les échéances de court terme du monde de la presse nécessitant de coder vite et bien.
Il est ainsi fréquent d’entendre des personnes acquis à la cause du data-journalisme fustiger
le « journaliste qui ne sait pas calculer une moyenne339 » et réclamer « une approche de la techno
bien meilleure que nos journalistes littéraires340 ». Ces injonctions fréquentes, tendant parfois à
faire de la programmation « l’avenir du journalisme 341 », se nourrissent par ailleurs, la
prééminence d’une « nouvelle espèce hybride342 », journaliste et programmeur, tels d’Adrian
Holovaty (EveryBlock), Aaron Pilhofer (New York Times) ou Dan Nguyen (ProPublica). Elle fait
craindre aux journalistes une modification de la pratique de leur métier, à l’instar d’Owen
Youngman, fondateur et ancien directeur de la rédaction web du Chicago Tribune :
332 Ibid. 333 VALENCOT, Corentin, « Hack the Press #2 relance le data-journalisme en France », Horizons Médiatiques, [disponible en ligne], 13 janvier 2012. 334 Karen Bastien lors de l’atelier de la mission Etalab sur le data-journalisme, le 13 octobre 2011, Art. cit. 335 Entretien avec Caroline Goulard (annexe 1) 336 Entretien avec Karen Bastien (annexe 4) 337 Ibid. 338 ROMERA, Art. cit. 339 Entretien avec Pierre Romera (annexe 2) 340 Entretien avec Caroline Goulard (annexe 1) 341 MENTRÉ, Marc, « La programmation : l’avenir du journalisme ? », OWNI, [disponible en ligne], 30 juillet 2010. 342 BLANC, Sabine, « Journaliste-programmeur : le mutant parfait ? », OWNI, [disponible en ligne], 23 février 2010.

81
J’ai quitté la partie Internet et suis revenu au papier car je m’étais brouillé avec les gens qui y avaient été recrutés. Ils n’envisageaient pas le journalisme de la même façon que moi. C’était quelque chose de très différent, très centré sur la technologie343
En second lieu, les défenseurs du data-journalisme se donnent comme objectif, peut être
plus fondamental encore, de mettre fin à la « conscience de différenciation344 » des journalistes
professionnels. Ils désignent par là l’idée selon laquelle le journaliste est une figure qui
revendique, par la singularité de son travail, une autorité et un statut « à part ». Derrière l’idée de
collaboration, se trouve en effet la proposition d’un « journalisme en réseau345 », où le journaliste
ne serait qu’un des nombreux maillons de la production de l’information. Elle réactualise le
mythe saint-simonien d’une société en réseau346, où la « discussion horizontale347 » remplace les
« modèles verticaux347 », et qui érige l’union et la coopération entre les hommes comme idéal
égalitaire. D’abord opposée à une organisation hiérarchique du travail, cette vision proclame
également la supériorité de la rencontre et du dialogue sur l’isolement. Aussi le journaliste doit-il
s’appuyer sur d’autres, qu’ils soient journalistes, développeurs ou designers, pour produire de
l’information. Il devient « chef de projet348 », figure qui coordonne au moins autant qu’elle ne
conçoit, et entretient des relations horizontales avec ses collaborateurs.
Or le traitement de la donnée, par la mobilisation de différentes compétences, « [oblige]
vraiment à changer les pratiques349 » et représente donc un formidable levier de transformation
organisationnelle. Dès lors, l’organisation de l’entreprise médiatique ne doit plus « avoir une
vision centrée sur les articles (…) mais une vision centrée sur les données350 », c’est-à-dire être
principalement destinée à la production de données. Caroline Goulard cite l’exemple du New
York Times qui, en convertissant certains articles – politiques, sportifs, littéraires, économiques -
en données, a pu mettre en place des API351. D’abord destinées à l’interne pour faciliter la
343 Cité in : DAGIRAL, PARASIE, « Portrait d’un journaliste en programmeur », Art. cit., p. 150. 344 Entretien avec Caroline Goulard (annexe 1) 345 Nicolas Kayser-Brill, in : INIZAN, « L’open data appliqué au journalisme », Art. cit. 346 MUSSO, Pierre, Critique des réseaux, PUF, coll. « La politique éclatée », 2003, 374 p. 347 Séverin Naudet, lors de l’atelier de la mission Etalab sur le data-journalisme, le 13 octobre 2011, Art. cit. 348 Nicolas Kayser-Brill, in : INIZAN, « L’open data appliqué au journalisme », Art. cit. 349 Entretien avec Caroline Goulard (annexe 1) 350 Ibid. 351 Une API (Application Programing Interface) est une interface permettant la communication entre plusieurs programmes. Elle définit les fonctions / procédures qui peuvent être appelées, et avec quels arguments.

82
recherche d’information, ces API ont ensuite été ouvertes à l’externe, permettant à d’autres
personnes d’utiliser leurs données.
En somme, recentrer le travail journalistique sur le traitement de données permet d’obliger
la collaboration en interne, et de la favoriser en externe. Cette glorification du réseau et de
l’horizontalité pose la question de la place de l’internaute dans cette ambition de transformation
organisationnelle des rédactions.
2. L’internaute expert mobilisé
L’horizontalité égalitariste du réseau internet est souvent évoquée pour revendiquer la
participation du citoyen aux activités politiques, économiques, culturelles ou informationnelles352.
Le data-journalisme ne fait pas défaut à cette observation, certains érigeant le « crowdsourcing »
comme élément constitutif du journalisme de données353. Il semble pourtant que les exemples de
« participation » ne remettent pas en cause la nécessité d’une médiation professionnelle dans la
publication de l’information (cf. supra II. C.).
En effet, dans le cadre du data-journalisme le « crowdsourcing » consiste principalement
en une sollicitation d’une masse d’internaute sur des petites tâches, afin de démultiplier le
pouvoir d’action du journaliste. C’est le cas par exemple lorsqu’OWNI demande à ses lecteurs de
faire remonter des factures d’eau pour représenter sur une carte les différences de prix entre les
régions354. C’est également le cas pour l’enquête sur les notes des frais des parlementaires
britanniques, pourtant présentée comme un modèle « d’enquête participative355 ». Lorsque le
Guardian invite les internautes à indiquer les notes qui leur semblent suspectes, il s’agit
principalement de faire remonter l’information à un professionnel, qui pourra ensuite la traiter de
manière journalistique. Le « citoyen » n’est sollicité que dans une première étape afin d’assister
le journaliste dans le long et fastidieux travail sur archives. C’est le sens de la métaphore
employée par Pierre Romera :
352 REBILLARD, Op. cit. 353 Pierre Romera en entretien (cf. I. A. 1.) ; GOULARD, « Les quatre voies du data-journalisme », Art. cit. 354 KAYSER-BRIL, Nicolas, « Prix de l’eau : libérons nos données », OWNI, [disponible en ligne], 22 mars 2011. 355 METTOUT, Eric, « Les renforts du Guardian », L’Express, [disponible en ligne], 19 juin 2009.

83
On a un jeu de données qui est balancé comme un jardin avec plein de mauvaises herbes et on va couper les mauvaises herbes, tous ensemble. On peut utiliser une tondeuse à gazon si c’est possible, ou alors donner un ciseau à tout le monde et chacun coupe sa mauvaise herbe. Quand on fait du crowdsourcing, c’est que la tondeuse à gazon c’est pas possible donc on donne des ciseaux356.
L’idée de « journalisme citoyen », entendue comme la possibilité pour les amateurs de
publier des contenus au même titre que les professionnels, est donc assez lointaine. Les tenants
du data-journalisme jugent cette promesse du « tous journalistes », au mieux comme un « vœu
pieux357 », au pire comme une « catastrophe qui n’a pas du tout marché358 ».
La possibilité de solliciter l’internaute est cependant évoquée dans le cadre de la
proposition « journalisme en réseau ». Dans la théorie saint-simonienne, si le réseau est perçu
comme intrinsèquement supérieur à la verticalité et à l’isolement, c’est parce que ce dernier
multiplie les possibilités de dialogue et de rencontre. Dans cette conception, le journaliste est
encouragé à s’entourer du plus grand nombre de collaborateurs possibles, à l’intérieur de la
rédaction mais également à l’extérieur : « augmenté de ses pairs359 », « augmenté des autres
corps de métier359 », le journalisme doit aussi être « augmenté de l’audience359 ». Il ne s’agit pas
de faire la promotion naïve des contenus publiés par des profanes, mais de se servir des
internautes qui jouissent d’une expertise utile à la réalisation du journaliste. C’est ce qu’a fait le
Guardian à propos d’une carte sur les inégalités sociales en Angleterre. Après des commentaires
critiques sur le choix de couleurs, la rédaction s’est tournée vers « les internautes » pour recueillir
leurs perceptions 360 . En fait, seuls deux internautes ultra spécialisés – Gregor Aisch,
« visualization architect361 » et éditeur du site driven-by-data.net, ainsi que Moritz Stefaner,
« information vizualizer362 » et éditeur du site well-formed-data.net – ont été écoutés, par la
qualité de leurs explications et leur capacité de proposition. Cette ambition à mobiliser les
expertises internautes est développée, dans un registre injonctif, par Dominique Cardon :
Il n'y a pas de compétition entre les internautes et les professionnels de l'information, on est plutôt dans un travail d'hybridation, d'articulation entre des journalistes qui doivent transformer leur manière de travailler, notamment parce qu’ils sont de en plus en dialogue avec les internautes et notamment avec les
356 Entretien avec Pierre Romera (annexe 2) 357 Olivier Tesquet, in : INIZAN, « L’open data appliqué au journalisme », Art. cit. 358 Nicolas Kayser-Bril in : Ibid. 359 SCHERER, Eric, « Le journalisme augmenté en 10 points », OWNI, [disponible en ligne], 7 novembre 2010. 360 ROGERS, Simon, « How can we get our map colours right ? How open journalism helped us better », The Guardian, [disponible en ligne], 13 avril 2012. 361 Présentation sur le site http://driven-by-data.net (consulté le 31 août 2012) 362 Présentation sur le site http://well-formed-data.net (consulté le 31 août 2012)

84
internautes experts qui les renseignent, les corrigent et les contestent. De l’autre côté, les internautes doivent travailler avec les journalistes, les gens de l’information, du design et de la visualisation pour traiter ces grandes masses de données et ne pas faire des statistiques naïves363.
La description d’une « hybridation », où les internautes pourraient également s’appuyer
sur les professionnels de l’information pour produire leur propre contenu, tend néanmoins à
brouiller les pistes quant au rôle des internautes dans la publication d’informations. Ces tentations
« participatives » sont confirmées par un article de Simon Rogers intitulé « Anyone can do it.
Data journalism is the new punk364 ». Il démontre qu’à l’instar du mouvement punk, qui
promettait de monter un groupe instantanément en apprenant trois accords basiques, tout le
monde peut facilement avoir accès aux outils pour faire du data-journalisme. Il confesse
cependant, à contrecœur, que contrairement au punk, une certaine qualité est nécessaire dans le
cadre du data-journalisme365. Mais cela n’empêche pas ceux qui en ont les capacités, de s’auto-
former à l’analyse et la visualisation de données, à l’instar de certaines rédactions parties de rien.
Se dessine ainsi un journalisme qui ne se ferait pas uniquement par les journalistes mais
par n’importe quelle personne ayant les compétences et la volonté de le faire, dans le cadre d’une
« société en réseau ». Un « nouvel esprit du journalisme » ?
3. Un « nouvel esprit du journalisme » ?
Luc Boltanski et Ève Chiapello ont mis à jour les ressorts idéologiques de ce qu’ils ont
nommé le « nouvel esprit du capitalisme »366. La force de cet ensemble doctrinal tient dans la
prise en compte des critiques antérieures adressées au capitalisme.
Les auteurs identifient deux types de critiques du capitalisme : la critique sociale et la
critique artiste. La première dénonce les inégalités sociales et la pénibilité du travail engendrées
par le système capitalisme. Incarnée par les mouvements politiques – ouvriéristes, socialistes et
363 Dominique Cardon, in INIZAN, « L’open data appliqué au journalisme », Art. cit. 364 ROGERS, Simon, « Anyone can do it. Data journalism is the new Punk », The Guardian, [disponible en ligne], 24 mai 2012. 365 Il cite notamment Dan Sinker, figure du logiciel libre et de la mouvance punk : « While I agree with the premise - it's never been easier to do this stuff than it is right now - I think there are a few steps beyond just learning three chords when doing data journalism. For one, Legs [McNeil, who coined the word 'punk'] didn't really say a band needed to be *good* but I'd like to think we'd require that for data journalism » 366 BOLTANSKI, Luc et CHIAPELLO, Ève, Le nouvel esprit du capitalisme, Gallimard, 1999, 843 p.

85
communistes -, elle milite pour des contreparties à ces dérives, la sécurité sociale par exemple. La
critique artiste porte sur l’aliénation consumériste engendrée par le système capitaliste. Incarnée
par le mouvement étudiant de mai 68 ou la pensée existentialiste, elle propose de substituer à
« la situation d’un consommateur passif face à une offre standardisée367 » une reprise en main de
la production par les consommateurs. Antiautoritaire, plaidant une liberté de parole maximale,
c’est cette critique qui a inspiré les premières radios libres dans les années 1970, ainsi que les
discours d’escorte du web « 2.0 » dans les années 2000368.
Le « nouvel esprit du capitalisme » reprend en partie cette critique, en la travestissant à
des fins de productivité (flexibilité, coordination internationale, etc.). Il se fonde sur deux piliers :
le management par projet, présenté comme « gage d’autonomie accordé aux travailleurs369 », et
l’organisation en réseau, censée effacer l’existence de relations hiérarchiques. Dans cette « cité
connexionniste par projet370 », l’information pourrait enfin circuler librement, libre de tous les
filtres que représentaient la hiérarchie, et plus généralement les institutions. Comme le note
Franck Rebillard, la métaphore convoquée est celle du fluide vital, opposé à la solidité des
institutions sociales que sont l’Etat, l’entreprise, la famille, etc. Par cette métaphore organiciste,
censée épanouir les travailleurs, le néo-capitalisme gomme la violence de cette organisation du
travail (précarité, stress, nécessaire mobilité). Les publics les plus fragiles sont ainsi « sacrifiés »
sur l’autel de la réorganisation managériale
Cette mise en perspective réalisée, les liens entre les propositions du data-journalisme et
ce « nouvel esprit du capitalisme » apparaissent plus précisément. Militant pour faire du
journaliste un chef de projet, louant les vertus d’une société en réseau, et promettant à des non-
journalistes de faire un travail équivalent à celui des professionnels, il épouse presque point par
point ce nouveau corpus doctrinal. La seule divergence notable est que le data-journalisme ne
masque pas les déterminants sociaux-culturels nécessaires à une participation aux activités de
production, en occurrence l’information. Il ne promet pas que tout le monde pourra réaliser un
journalisme de qualité, mais invite les gens qui s’en sentent capables à venir concurrencer les
journalistes sur leur terrain. A l’instar des imaginaires du web 2.0, la proximité du data-
journalisme avec l’idéologie dominante permet d’expliquer le succès de ce néologisme. En
367 REBILLARD, Op. cit., p. 91. 368 Idem. 369 Ibid., p. 92. 370 Ibid. p. 93.

86
reconstituant l’histoire et les différents promoteurs du mouvement d’ « open data » en Grande-
Bretagne, Valérie Peugeot note ainsi que ce dernier épouse les intérêts de beaucoup d’acteurs
économiques, dont les médias ne sont qu’une « infime partie371 ».
Ces discours d’accompagnement sont en revanche moins compatibles avec les
imaginaires et repères du journalisme comme profession. Le data-journalisme plaide ainsi pour
une refonte des entreprises médiatiques, où la structure organisationnelle serait « fluidifiée », et
où le data-journalise / chef de projet, s’appuierait sur des compétences chaque fois différentes
pour produire de l’information. Dans le cadre de ce « journalisme en réseau », toutes les
personnes se sentant capables de tenir ce rôle peuvent en prendre l’initiative, affaiblissant ainsi la
singularité, voire la nécessité d’un journaliste professionnel.
Projet de rénovation porté par des positions idéologiques marquées, le data-journalisme
remet en cause les imaginaires du journalisme professionnel sur plusieurs points. Si des
convergences ont été trouvées dans la volonté d’enquêter sur les comportements amoraux des
puissants, l’érection d’une « transparence nue » en valeur cardinale questionne le rôle de mise en
perspective du journaliste. Appliqué à des données statistiques, cette exigence de transparence se
mue en outil de décision dans une compétition entre individus rationnels. Enfin, en promettant
une « fluidification » organisationnelle de l’entreprise médiatique, le data-journalisme se
rapproche du nouvel esprit capitalisme, où le modèle du journaliste n’est plus un bouclier de
protection de la démocratie mais un créatif indépendant, libéré de toute hiérarchie, puisant dans
son réseau pour proposer des contenus innovants.
Sur une échelle entre libéralisme et démocratie, ressort de ce portrait global un
déplacement du curseur du journalisme vers le premier élément. Ces deux pôles ne se rejoignent
que dans la surveillance démocratique des puissants, qui, sous couvert de libre circulation de
l’information, témoigne d’une grande méfiance envers les institutions politiques. Il semble
pourtant possible d’imaginer des applications davantage portées sur la compréhension des
phénomènes sociaux. C’est le sens des deux recommandations formulées en conclusion.
371 PEUGEOT, Valérie, « Les enjeux publics, économiques et citoyens de l’ouverture des données : l’expérience britannique », in Document numérique et société, [disponible en ligne], IEP d’Aix en Provence, Aix en Provence, 15-16 novembre 2010. Cité in : CARDON, Art. cit.

87
Conclusion
Rappelons une dernière fois le questionnement qui a guidé ce travail : comment les
promesses du data-journalisme s’articulent-elles avec les repères et imaginaires du journalisme
professionnel ? La première difficulté a été de rendre compte des différentes réalités décrites
lorsque les acteurs évoquent le data-journalisme. Sans parvenir à une définition atemporelle et
universelle, il a été possible de mettre à jour certains des discours d’escorte de l’expression. En
« réquisitionnant » cette nouvelle expression, différents acteurs – entrepreneurs web, hackers,
parfois journalistes – l’ont investie de valeurs. Parler aujourd’hui de « data-journalisme » revient
ainsi à promettre de découvrir des trésors dans un « déluge » de données, et à représenter ces
informations cachées dans des formats visuels qui se veulent esthétiquement aboutis, et
graphiquement novateurs. Qu’importe finalement si ces promesses ne sont que rarement
actualisées dans les réalisations, elles créent un imaginaire qui devient constitutif du data-
journalisme. Quant à la prétendue nouveauté, elle permet à ce mouvement social d’enjoindre les
rédactions à développer le journalisme de données, pour « ne pas être à la traîne ».
Les critiques les plus fréquentes laissaient craindre un objectivisme béat, une robotisation
de la production d’information ou la fin du récit journalistique. L’étude des discours et pratiques
des différents promoteurs du data-journalisme a permis d’affirmer que ces allégations étaient
pour la plupart infondées. La critique subjectiviste fut la plus difficile à repousser, en raison des
prétentions de certains acteurs à une « objectivité » des données. Mais cette revendication doit
plutôt s’entendre comme une foi dans les chiffres pour rendre compte de la réalité, aussi
longtemps que le journaliste fait preuve d’honnêteté intellectuelle et de sens critique dans la

88
production de l’information. Dans cette acception, le data-journaliste s’applique à mettre à
distance les faits, et à les restituer en choisissant un récit, un angle, propre au discours
journalistique. Seule différence : alors que le journaliste « traditionnel » protège ses sources, le
data-journaliste met un point d’honneur à les mettre à disposition du public. Cette actualisations
des deux premiers imaginaires professionnels – « ordre du discours » journalistique et pratique de
recueil des faits – explique le succès chez certains journalistes, qui s’approprient les promesses
du data-journalisme. À la suite des Etats-Unis, plusieurs pays institutionnalisent au sein des
rédactions ce qui est perçu comme un nouveau genre : Royaume-Uni (The Guardian), Espagne
(El País), Argentine (La Nación). Même en France, bien qu’encore en marge des rédactions, le
data-journalisme entrouvre progressivement la porte menant à une institutionnalisation, en
intégrant les formations de certaines écoles (ESJ Lille, CFPJ, IEP Paris).
Pourtant une étude attentionnée des valeurs du projet politique défendu par le data-
journalisme invite à affiner les relations entre promesses du data-journalisme et imaginaires du
journalisme professionnel. Certes, la transparence démocratique portée par certains projets
réactualise la figure bien installée du journaliste d’investigation, qui surveille le comportement
moral et légal des élites. Sa radicalité laisse cependant entrevoir une défiance a priori, portant
l’opprobre sur tous les puissants. Appliquée aux bases de données statistiques, cette radicalité
encourage exhaustivité et granularité, permettant aux individus de localiser les informations à
l’échelle de leur quartier, de leur bloc, de leur immeuble. Pensée comme un outil d’aide à la
décision, la transparence encourage alors la compétition entre individus rationnels pour le
meilleur cadre de vie. Le mythe du noble journaliste, intellectuel dédié à la défense de la
démocratie, s’éclipse sous cette figure d’intermédiaire au service de la maximisation des intérêts
particuliers. Est-il encore journaliste ? Sans doute mais il est concurrencé par d’autres acteurs. Le
projet politique du data-journalisme propose en effet un l’idéal de « journalisme en réseau », où
la collaboration prend le pas sur le « cloisonnement » des rédactions. Le journaliste devient chef
de projet, une figure parmi d’autres de la production de l’information, dont l’autorité est
contestée par des internautes experts. Finalement, si le journalisme n’est pas « sacrifié sur l’autel
de la donnée », il est fragilisé par ce projet politique. Ce dernier se rapproche plus des
imaginaires d’internet – transparence, libre circulation de l’information, horizontalité – que des
imaginaires du journalisme professionnel.

89
Ce travail, communicationnel, se borne cependant à l’étude des discours, des imaginaires,
des projets. Ses conclusions ne signifient pas que journalisme et data-journalisme soient
intrinsèquement irréconciliables – ce serait avoir une approche essentialiste, réfutée plus haut -,
ou pire que le data-journalisme ne s’imposera jamais en France, - ce serait se placer dans le
champ de la futurologie. C’est l’atout d’une approche constructiviste : penser les expressions
comme des objets culturels et sociaux, investis de connotations différentes selon les époques.
Peut être que demain des journalistes jouissant d’une grande légitimité dans la profession,
s’empareront de l’expression et l’investiront d’un sens plus favorable à la corporation
journalistique et à ses mythes démocratiques. Si c’était le cas, les deux recommandations qui
suivent permettraient sans doute d’aider le public à mieux appréhender l’information produite à
partir de données. Chacune dispose d’un corolaire qui tente de monter en généralité en dépassant
la problématique stricto sensu des réalisations de data-journalisme.
Recommandations
Ouvrir la boîte noire
Pour éviter l’ « effet de cliquet » mis à jour dans ce travail, les journalistes pourraient
mettre encore plus en évidence le processus de production des données. En rendant le contrat de
lecture plus complet – sur les choix effectués dans le recueil des données et leur traitement
statistique -, et plus humble – sur les prétentions à décrire le social -, les réalisations gagneraient
paradoxalement en force. Une référence peut être donnée dans l’application « Explorer le
discours » du Monde.fr372, qui proposait à l’orée du premier tour de la présidentielle française, de
comparer les discours des différents candidats. Chaque module de représentation graphique est
accompagné d’une icône « i », invitant l’internaute à prendre connaissance des règles de
traitement statistiques appliquées, et un lien est proposé vers une notice explicative complète de 372 Réalisée en partenariat avec Linkfluence et Jean Véronis Technologies : « Explorer les discours des candidats à la présidentielle », Le Monde, [disponible en ligne], 6 mars 2012.

90
l’application. Cette dernière présente ainsi les difficultés rencontrées par les journalistes – les
différences entre versions écrite et orale par exemple -, ainsi que les limites de la démarche,
lorsque les « petits » candidats ne publient pas leurs discours en ligne. Par ce faire, l’internaute
est invité à « mettre les mains » dans la méthodologie, et à affiner ses critiques.
Le corolaire de cette recommandation consiste à demander une formation aux statistiques
au sein de l’Éducation Nationale, en tant que matière académique propre. Aujourd’hui cette
science est uniquement enseignée au lycée en cours de mathématiques, alors qu’elle prétend
produire des explications sur les phénomènes sociaux, et dépasse donc largement le champ du
calcul, Cette dépendance disciplinaire est d’autant plus préjudiciable que la statistique est
considérée par les mathématiciens comme une discipline peu noble de la science mathématique,
ne demandant pas de s’y appesantir longtemps en classe. En dotant les élèves d’une connaissance
statistique solide à l’école, les chiffres mobilisés dans l’espace public seraient sans doute plus
systématiquement débattus.
Mettre l’égocentrisme au service du collectif
La carte « zoomable / dézoomable », et ses déclinaisons qui personnalisent une
représentation à partir de la situation de l’utilisateur, tirent leur force de l’égocentrisme de
beaucoup d’entre nous. Plutôt que de lutter contre, le journaliste de données pourrait s’appuyer
sur leur popularité, et inviter l’internaute à rentrer par une porte individuelle pour comprendre des
phénomènes d’intérêt général, qu’ils soient démocratiques, sociologiques, historiques, etc..
L’application « où habitez-vous vraiment », développée par Orange Labs et OWNI, répond de
cette ambition373. Après un questionnaire de dix items, l’internaute compare la perception qu’il a
de son territoire à la « réalité » des chiffres. Il est ensuite invité à comparer son lieu de vie à
d’autres, afin de le situer dans un cadre national. Le projet « How Jewish is my street », porté en
France par Nicolas Kayser-Bril en est une autre illustration : en localisant les Juifs de France
déportés pendant la Seconde guerre mondiale selon leur adresse, il invite l’internaute à
s’intéresser aux déportés de son quartier, et aiguise par là sa curiosité historique374. Citons encore
373 http://app.owni.fr/ou-habitez-vous-vraiment/ (consulté le 31 août 2012) 374 KAYSER-BRIL, Nicolas, « Le data-journalisme pour incarner l’histoire », OWNI, [disponible en ligne], 25 septembre 2009.

91
l’initiative de Slate, qui proposait à l’utilisateur de réaliser son propre découpage des
circonscriptions de l’étranger, pour se rendre compte du caractère très partisan de l’ exercice375.
Le corolaire consiste, à l’instar de ce dernier exemple, à dénaturaliser les catégories de
l’analyse sociale. Sans remettre en cause la nécessité d’une certaine stabilité, il doit être possible
de mettre en débat certains indicateurs. À ce titre, Alain Blum note justement que si les débats
entre historiens ou sociologues sont fréquents, il est bien plus rare, et c’est problématique,
d’assister à des affrontements entre statisticiens376. C’est la démarche qu’a adoptée récemment
l’INSEE, en proposant aux internautes de créer leur propre indice des prix, calculé en fonction de
leur consommation personnelle377. C’est aussi le parti-pris du site de Thomas Piketty, qui propose
aux internautes de simuler leur propre réforme fiscale, en faisant varier les taux des différents
impôts, taxes et contributions378.
Perspectives de recherche
Le modèle économique du data-journalisme
Ce travail a permis d’observer l’investissement massif d’acteurs économiques dans la
promotion du data-journalisme : EveryBlock aux Etats-Unis, Dataveyes ou Journalism++ en
France. Il ne s’est pourtant que très peu épanché sur le modèle de commercialisation et de
rentabilisation des dispositifs se réclamant du journalisme de données, alors que le prix de ces
réalisations est un des points les plus cités par les rédactions pour expliquer leur supposé
« retard » 379 . Un article d’InternetActu développe pourtant certaines pistes 380 . Alors que
l’information en ligne est marquée par une « circulation réticulaire381 », où les contenus d’une
375 GIRARD, Quentin, « Toi aussi, fais gagner trois députés au PS », Slate, [disponible en ligne], 3 juillet 2009. 376 MARTIN, Art. cit. 377 http://www.insee.fr/fr/themes/indicateur.asp?id=29&page=indic_sip.htm (consulté le 31 août 2012) 378 http://www.revolution-fiscale.fr/simulez-votre-propre-reforme-fiscale (consulté le 31 août 2012) 379 Voir par exemple l’entretien avec Johan Hufnagel (annexe 5) 380 GUILLARD, « Journaliste de données : data as stortytelling », Art. cit. 381 REBILLARD, Franck, « L’information journalistique sur l’internet, entre diffusion mass-médiatique et circulation réticulaire de l’actualité », in BROUDOUX, Evelyne et CHARTRON Ghilsaine (dir.), Document numérique et société – Actes du colloque DocSoc 06, ADBS Editions, 2006, pp. 213-226.

92
source – agence de presse en ligne, sites d’information, blogs, etc. - sont repris et réécrits, les
visualisations dites « interactives » sont plus difficilement duplicables. Elles rendent possible une
commercialisation « à l’unité », impossible pour un article écrit, immédiatement décliné sur des
dizaines de sites ou « portails ». Ces dispositifs se voulant également « immersifs », en captant
l’attention de l’utilisateur de manière durable, ils pourraient faciliter la diffusion des messages
publicitaire, et réactualisent la question de la relation entre contenus éditoriaux et commerciaux
dans le journalisme.
Un rapport ambigu à la temporalité
Deuxième piste de recherche, le rapport que le data-journalisme entretient à la
temporalité. Certains discours tendent à présenter le journalisme de données comme un gain de
temps – en évitant de réécrire une brève tous les mois lorsque les chiffres du chômage sont
publiés -, et par conséquent comme un moyen de réaliser un journalisme en « temps réel », en
actualisant immédiatement la base de données sur le chômage pour reprendre le même
exemple382. Parallèlement, les mêmes promoteurs présentent le data-journalisme comme un retour
d’un « temps long », celui de l’analyse et de la mise en perspective de données complexes,
forçant les rédactions à anticiper au moins « sur quelques semaines383 ». Les longues enquêtes de
certains data-journalistes états-uniens, à l’instar de celle sur la méthadone citée en introduction384,
plaident en ce sens. Un questionnement plus complet permettrait d’éclaircir cette ambivalence.
382 Caroline Goulard in : PORTE (DE LA), Xavier, Art. cit. 383 Entretien avec Caroline Goulard (annexe 1) 384 BERENS, Art. cit.

93
Bibliographie
Références universitaires
Ouvrages
ABLALI, Driss et DUCARD, Dominique, Vocabulaire des études sémiotiques et sémiologiques,
Honoré Champion, 2009.
ARQUEMBOURG-MOREAU, Jocelyne, Le temps des événements médiatiques, De Boeck,
2003, 116p.
BARTHES, Roland, Mythologies, Seuil, coll. « Points », 1970, 233 p.
BOLTANSKI, Luc, Les cadres. La formation d’un groupe social, Les Éditions de Minuit, coll.
« Le sens commun », 1982, 523p.
BOLTANSKI, Luc et CHIAPELLO, Ève, Le nouvel esprit du capitalisme, Gallimard, coll.
« NRF Essais », 1999, 843p.
BOUCHARD, Julie, Comment le retard vient aux Français. Analyse d’un discours sur la
recherche, l’innovation et la compétitivité 1940-1970, Septentrion, 2008, 328 p.
BRETON, Philippe, L’utopie de la communication : le mythe du “village planétaire”, La
Découverte, 2004, 171 p.
CHALABY, Jean, The invention of journalism, Palgrave Mc Millan, 1998, 224 p.
DELEUZE, Gilles, Nietzsche et la philosophie, 6e éd. PUF, 1983 (1962), 232 p.

94
DESROSIÈRES, Alain et THÉVENOT, Laurent, Les catégories socio-professionnelles, La
Découverte, coll. « Repères », 1998, 127 p.
FLICHY, Patrice, Les imaginaires d’internet, La Découverte, 2001, 272 p.
FOUCAULT, Michel, L’ordre du discours, Gallimard, 1971, 81 p.
FOUCAULT, Michel, Surveiller et punir, Gallimard, éd. 1998 (1975), 360 p.
GANASCIA, Jean-Gabriel, Voir et pouvoir, qui nous surveille ?, Le Pommier, coll. « Essais »,
2009, 255 p.
JEANNERET, Yves, Penser la trivialité. Volume 1 : La vie trivialise des êtres culturels,
Hermès-Lavoisier, coll. « Communication, médiation et construits sociaux », 2008, 266 p.
KAUFMANN, Jean-Claude, L’entretien compréhensif, Paris, Nathan, 1996, 127 p.
LE BOHEC, Jacques, 2000, Les mythes professionnels des journalistes, L’Harmattan, 395 p.
LIBAERT, Thierry, La transparence en trompe-l’œil, Descartes & Cie, coll. « Gouvernance et
démocratie », 2003, 166 p.
MANN, Patrice, L’action collective. Mobilisation et organisation des minorités actives, Armand
Colin, coll. « U Sociologie », 1991, 152 p.
MOLES, Abraham, Les sciences de l’imprécis, Seuil, 1990, 310 p.
MUCHIELLI, Laurent, Violences et insécurité. Fantasmes et réalités dans le débat français, La
Découverte, 2002, 158 p.
MUSSO, Pierre, Critique des réseaux, PUF, coll. « La politique éclatée », 2003, 374 p.
REBILLARD, Franck, Le web 2.0 en perspective, L’Harmattan, 2007, 158 p.
RUELLAN, Denis, Le professionnalisme du flou, PUG, 1993, 232p.
SAUSSURE (DE), Ferdinand, Cours de linguistique générale, Payot, éd. 1973 (1916), 510 p.
Articles
AÏM, Olivier, « Une télévision sous surveillance. Enjeux du panoptisme dans les « dispositifs »
de télé-réalité », Communication et langages, n° 141, 2004, pp. 49-59.
AÏM, Olivier, « La transparence rendue visible. Médiations informatiques de l’écriture »,
Communication et langages, n° 147, 2006, pp. 31-45.
BARTHES, Roland, « Rhétorique de l’image », Communications, Vol. 4/4, pp. 40-51

95
BOLKA, Laure et GANTIER, Samuel, « L’expérience immersive du web documentaire : études
de cas et pistes de réflexion », Les Cahiers du journalisme, n° 22/23 – automne 2011, pp.
118-133
BONGRAND, Philippe et LABORIER, Pascale, « L’entretien dans l’analyse des politiques
publiques : un impensé méthodologique ? », Revue française de science politique, Vol.
55, 2005, pp. 73-111
CABROLIÉ, Stéphane, « La recomposition d’une organisation de presse : le cas du Parisien.fr »,
Terrains & travaux, vol. 1, n°15, 2009, pp. 127-145.
CANDEL, Etienne, « Une ration quotidienne de statistiques. La pratique éditoriale du “chiffre du
jour” dans la presse écrite », Mediation Et Information, n° 28, 2008, pp. 37-52
CARDON, Dominique, « Zoomer ou dézoomer ? Les enjeux politiques des données ouvertes »,
OWNI, [disponible en ligne : http://owni.fr/2011/02/21/zoomer-ou-dezoomer-les-enjeux-
politiques-des-donnees-ouvertes/], publié le 21 février 2011, consulté le 31 août 2012385.
COHEN, Sarah, HAMILTON, James et TURNER, Fred, « Computational journalism »,
Communication of the ACM, Vol. 54, n° 10, pp. 66-71.
DAGIRAL, Eric et PARASIE, Sylvain, « Presse en ligne : où en est la recherche ? », Réseaux,
n°160-161, 2010/2, pp. 13-42
DAGIRAL, Eric et PARASIE, Sylvain, « Portrait du journaliste en programmeur : l’émergence
d’une figure de journaliste “hacker” », Les Cahiers du Journalisme, n° 22/23, 2011, pp.
144-155
DAGIRAL, Eric et PARASIE, Sylvain, « Data-driven journalism and the public good :
“Computer Assisted Reporters and “programmer-journalists” in Chicago », à paraître.
ESTIENNE, Yannick, « Evolution des pratiques journalistiques sur Internet : journalisme
“augmenté”, data journalism et journalisme hacker (entretien avec Jean-Marc Manach) »,
Les Cahiers du journalisme, Vol. 22/23, Automne 2011, pp. 134-143.
FESTINER, William L., « The emergence and transformation of disputes: Naming, Blaming,
Claiming”, Law and Society Review, Vol. 15, n° 3/4, 1980, pp. 631-654.
385 Bien que publié dans un média « grand public » - OWNI -, cet article a été placé dans la partie « références » en raison de son caractère universitaire. Ecrit par un chercheur, disposant d’une bibliographie, il a par ailleurs stimulé une bonne partie de notre réflexion théorique sur l’aspect politique du data-journalisme, et « mérite » donc sa place ici.

96
FRIENDLY, Michael, « The golden age of statistical graphics », Statistical Science, Vol. 23/4,
2008, pp. 502-535.
GAUDERAULT, André, MARION, Philippe, « Un média naît toujours deux fois ... », Sociétés et
représentations, n° 9, 2000, pp. 21-36.
GONTHIER, Frédéric, « Weber et la notion de « compréhension », Cahiers internationaux de
sociologie, n°116, 2004, pp. 35-54
JANOWITZ, Morris, « Professional Models in Journalism : The Gatekeeper and the Advocate. »,
Journalism Quarterly, Printemps 1975, pp. 618-626.
JEANNERET, Yves, « L’optique du sustainable : territoires médiatisés et savoirs visibles »,
Questions de communication, n°17, 2010, pp. 59-80
JEANNERET, Yves et SOUCHIER, Emmanuel, « Introduction. Internet vu du journalisme »,
Communication et langages, n° 129, 3e trimestre 2001, p. 36.
KNOX, John, « Visual-verbal communication on online newspaper home pages », Visual
communication, vol. 6(1), 2007, pp. 19-53
LABELLE, Sarah, « “La société de l’information” : Formule, récit et réquisition », in
CHOUTEAU, Marianne et NGUYEN, Céline (dir.), Mises en récit de la technique,
Éditions des Archives Contemporaines, 2011, pp. 33-44
LEMIEUX, Cyril, « La Révolution française et l’excellence journalistique au sens civique. Notes
de recherche », Politix, Vol. 5, n °19, 1992, pp. 31-36.
LEMIEUX, Cyril, « Les formats de l’égalitarisme : transformations et limites de la figure du
journalisme justicier dans la France contemporaine », Quaderni, n° 45, 2001, pp. 53-68
MARQUES de MELO (José), 2009, « Journalistic Thinking. Brasil’s Modern Tradition »,
Journalism, Vol 10/1, pp. 9-27.
NEVEU, Erik, « News without journalists : real threat or horror show », Brazilian Journalism
Research, Vol. 6/1, 2010, pp. 29-54.
PINSON, Gilles et SALA PALA, Valérie. « Peut-on vraiment se passer de l'entretien en
sociologie de l'action publique ? », Revue française de science politique, Vol. 57, 2007,
pp. 555-597.
QUANDT, Thorsten, « News, Tuning, and Content Management : An Observation Study of Old
and News Routines in German Online Newsroom », in PATERSON, David et

97
DOMINGO, Chris, Making online news. The ethnography of New Media Production,
2008, pp. 76-97.
QUÉRÉ, Louis, « Les boîtes noires de Bruno Latour ou le lien social dans la machine », Réseaux,
1989, Vol. 7, n°36, pp. 95-117.
RASTIER, François, « Le silence de Saussure ou l’ontologie refusée », in BOUQUET,
Simon, Saussure, L’Herne, 2003, pp. 23-51.
RASTIER, François, « Ontologie(s) », Revue des sciences et technologies de l’information,
Vol.18/1, 2004, pp. 15-40.
REBILLARD, Franck, « Le journalisme participatif : de l’idéologie à la pratique », Argumentum,
n° 6, 2006, pp. 11-23.
REBILLARD, Franck, « Du traitement de l’information à son retraitement. La publication de
l’information journalistique sur l’internet », Réseaux, n° 137, pp. 31-68.
ROSENTAL, Paul-André, « La nouveauté d’un genre ancien : Louis Henry et la fondation de la
démographie historique », Population, Vol. 58/1, 2003, pp. 103-136.
SINGER, Jane B., « Who are these guys ? The online challenge to the notion of journalistic
profesionalism », Journalism, Vol. 4/2, 2003, pp. 139-163
SOUCHIER, Emmanuel, « L’image du texte. Pour une théorie de l’énonciation éditoriale », Les
cahiers de la médiologie, n° 6, 1998, pp. 138-145
TREDAN, Olivier, « Le journalisme citoyen en ligne : un public réifié », Hermès, n° 47, 2007 pp.
115-122.
Thèse et mémoires
GOETA, Samuel, Open data : qu’ouvre-t-on avec les données publiques ?, Mémoire de master 2
en Sciences de l’Information et de la Communication, CELSA, 2011.
MITROPOULOU, Eléni, Médias, multimédia et interactivité : jeux de rôle et enjeux sémiotiques.
Thèse de doctorat en sémiotique, Université de Limoges, 2007.
QUINTARD, Marlène, Le datajournalisme, un nouveau genre journalistique. Ou comment
rendre accessible une base de données complexe, Mémoire de master 1 en Journalisme,
CELSA, 2012.

98
Orales
Actes de colloques
GARRISON, Bruce, « Newspaper size as a factor in use of computer-assisted reporting », in
Communication Technology and Policy Division of the Association for Education in
Journalisme and Mass Communication, [disponible en ligne :
http://com.miami.edu/car/baltimore1.htm], consulté le 31 août 2012, Baltimore, août
1998.
JEANNERET, Yves, « Autre chose qu’un discours, davantage qu’un accompagnement, mieux
qu’une résistance », in La communication entre libéralisme et démocratie, Terminal, n°
75, été 2011, L’Harmattan, pp. 107-117.
PEUGEOT, Valérie, « Les enjeux publics, économiques et citoyens de l’ouverture des données :
l’expérience britannique », in Document numérique et société, [disponible en
ligne :http://laborange.academia.edu/Val%C3%A9riePeugeot/Papers/343143/Les_enjeux_
publics_economiques_et_citoyens_de_louverture_des_donnees_lexperience_britannique],
consulté le 31 août 2012, IEP d’Aix en Provence, Aix en Provence, 15-16 novembre 2010
PROULX, Serge, « Les militants du code : la construction d’une culture technique alternative »,
in Le logiciel libre en tant que modèle d’innovation socio-technique. Pratique et
développement de coopération dans les communautés, [disponible en ligne :
http://www.psaume.infini.fr/IMG/pdf/les_militants_du_code_SProulx.pdf], consulté le 31
août 2012, Congrès de l’ACFAS, Université Mc Gill, Montréal, 16 mai 2006.
REBILLARD, Franck, « L’information journalistique sur l’internet, entre diffusion mass-‐
médiatique et circulation réticulaire de l’actualité », in BROUDOUX, Evelyne et
CHARTRON Ghilsaine (dir.), Document numérique et société – Actes du colloque
DocSoc 06, ADBS Editions, 2006, pp. 213-‐226.
TREDAN, Olivier, « Quand le journalisme se saisit du web : l’exemple du datajournalism », in 1e
colloque international – Les Mutations structurelles du journalisme, [disponible en ligne :
http://recherche.telecom-bretagne.eu/labo_communicant/surlejournalisme/wp-
content/uploads/2011/05/Datajournalism-Tr%C3%A9dan.pdf], consulté le 31 août 2012,
Organisé par l’Université de Brasilia, Brasilia, 25-28 avril 2011, p. 2.

99
Cours
AÏM, Olivier, « Introduction », in Les médias dans les sciences de l’information et de la
communication, organisé par CELSA, Département « Médias et Communication »,
Neuilly-sur-Seine, 21 septembre 2011.
CANDEL, Etienne, « Éléments de définition », in La « réalité » une approche
communicationnelle, organisé par CELSA, Master 2 « Médias Informatisés et Stratégies
de Communication », Neuilly-sur-Seine, 10 janvier 2012.
DENIS, Jérôme, « Les figures de l’usager », in Sociologie des usages, organisé par CELSA,
Master 2 Médias Informatisés et Stratégies de Communication, Neuilly-sur-Seine, 20
octobre 2011.
GOMEZ MEJIA, Gustavo, « La quête d’un point de vue communicationnel sur le web », in
Poétique et usages du web, organisé par CELSA, Master 2 « Médias Informatisés et
Stratégies de Communication », Neuilly-sur-Seine, 25 janvier 2012.
JEANNERET, Yves, « Figures politiques de la trivialité : le symbolique, le populaire, et le
public », in Économie politique de la trivialité, organisé par CELSA, Département
« Médias et Communication », Neuilly-sur-Seine, 11 octobre 2011
JEANNERET, Yves, « Entre héritages et ruptures, la dynamique de l’obsolescence», in
Économie politique de la trivialité, organisé par CELSA, Département « Médias et
Communication », Neuilly-sur-Seine, 8 novembre 2011
Vidéos
MARTIN, Olivier, « La vérité des chiffres : une illusion ?. Débat entre entre Alain Blum,
démographe, et Olivier Martin, sociologue. », La Vie des idées, [disponible en ligne :
http://www.laviedesidees.fr/La-verite-des-chiffres-une.html], publié le 12 novembre 2009,
consulté le 21 août 2012.

100
Corpus d’étude
Ouvrages
APPELBAUM, Richard P., CARR, Deborah, DUNEIER, Mitchell, et GIDDENS, Antony,
Essentials of sociology, 3e éd., W. W. Norton & Company, 2010, 499 p.
BOUNEGRU, Liliana, CHAMBERS, Lucy et GRAY, Jonathan, Data Journalism Handbook,
O’Reilly, juillet 2012, [disponible en ligne :
http://datajournalismhandbook.org/1.0/en/introduction_0.html], consulté le 31 août 2012.
CORTAZAR, Julio, Marelle, Gallimard, coll. « L’imaginaire », 1979, 570 p.
JOANNÈS, Alain, Data journalism. Bases de données et visualisation de l’information, Éditions
du CFPJ, Décembre 2010, 169 p.
LASCOUMES, Pierre (dir.), Favoritisme et corruption à la française. Petits arrangements avec
la probité, Presses de Sciences Po, 2010, 283 p.
MC CANDLESS, David, Information is beautiful, Collins, 2011, 256 p.
MEYER, Philip, The New Precision Journalism, 4e Éd (1973), Rowman & Littlefield
Publishers, 2002, 304 p.
MILLER, Merle, Plain speaking : an oral biography of Harry S. Truman, Berkeley Publishing
Corporation, 1974, 448 p.
RAISSON, Virginie, 2033, Atlas des futurs du monde, Robert Laffont, 2010, 204 p.
ROGERS, Simon, Facts are Sacred : The power of data, Guardian Books, 2001, 92 p.
ROSNAY (DE), Joël, La révolte du pronétariat. Des mass média aux média des masses, Fayard,
coll. « Transversales », 2006, 250 p.

101
Articles
Signés
ARTHUR, Charles, « Analysing data is the future, says Time Berners-Lee », The Guardian,
[disponible en ligne : http://www.guardian.co.uk/media/2010/nov/22/data-analysis-tim-
berners-lee], publié le 22 novembre 2010, consulté le 31 août 2012.
BADOUARD, Thibault, « Introduction au data-journalisme », Uppercult, [disponible en ligne :
http://uppercult.fr/2012/02/introduction-au-data-journalisme/], publié le 27 février 2012,
consulté le 31 août 2012.
BARRINGER, Matt, « Where do the world’s most entrepreunarial women live », CNN,
[disponible en ligne http://edition.cnn.com/interactive/2012/04/world/leading.women/],
publié en avril 2012, consulté le 31 août 2012.
BAYET, Antoine et DUCHAMP, Agathe, « Les nouveaux habits du journalisme dans le monde
du déluge des données », Regards Sur Le Numérique, [disponible en ligne :
http://www.rslnmag.fr/post/2011/3/10/les-nouveaux-habits-du-journalisme-dans-le-
monde-du-deluge-des-donnees.aspx], publié le 10 mars 2011, consulté le 31 août 2012.
BETANCOURT, Leah, « How Programmer-Journalists are changing the news », Mashable,
[disponible en ligne : http://mashable.com/2009/12/11/programmer-journalists/], publié le
11 décembre 2009, consulté le 31 août 2012.
BERENS, Michael. J., « How we linked methadone to powerty », The Seattle Times, [disponible
en ligne : http://seattletimes.nwsource.com/html/localnews/2016987143_silenthow.html],
publié le 10 décembre 2011, consulté le 31 août 2012.
BLANC, Sabine, « Journaliste-programmeur : le mutant parfait ? », OWNI, [disponible en ligne :
http://owni.fr/2010/02/23/journaliste-programmeur-le-mutant-parfait/], publié le 23
février 2010, consulté le 31 août 2012.
BOYER, Brian, DARDRICK, Hal, GERMUSKA, Joe et RYAN, Mark, « City Council’s $3,7
million allowance : how aldermen spent taxpayer money », The Chicago Tribune,
[disponible en ligne : http://councilexpenses.apps.chicagotribune.com/], publié le 7 avril
2010, consulté le 31 août 2012.

102
BRIN, David, « The transparent society », Wired, [disponible en ligne :
http://www.wired.com/wired/archive/4.12/fftransparent.html], publié le 4 décembre 1996,
consulté le 31 août 2012.
CASTELLI, Elodie, « Le data-journalisme peine à se développer en France », Journalismes,
[disponible en ligne : http://www.journalismes.info/Le-data-journalisme-peine-a-se-
developper-en-France_a2527.html], publié le 24 janvier 2010, consulté le 31 août 2012.
CHANTREL, Flavien, « Le data-journalisme, enjeux et perspectives : interview de Nicolas
Kayser-Bril », Le blog du modérateur, [disponible en ligne :
http://www.blogdumoderateur.com/le-datajournalisme-enjeux-et-perspectives-interview-
de-nicolas-kayser-bril/], publié le 18 mars 2011, consulté le 31 août 2012.
CHIGNARD, Simon, « En finir avec le mythe de la donnée brute », Données ouvertes,
[disponible en ligne : http://donneesouvertes.info/2012/06/01/en-finir-avec-le-mythe-de-
la-donnee-brute/], publié le 1e juin 2012, consulté le 31 août 2012.
DAUSSY, Laure, « Australie / passeports : homme, femme et “indéterminé” », Arrêt sur images,
[disponible en ligne : http://www.arretsurimages.net/vite.php?id=12032], publié le 15
septembre 2011, consulté le 31 août 2012.
DESAUTEZ, Ludovic, « “Data Tuesday”, c’est parti », Les Echos, [disponible en ligne :
http://blogs.lesechos.fr/echosopendata/data-tuesday-c-est-parti-a7392.html], publié le 6
novembre 2011, consulté le 31 août 2012.
DESAUTEZ, Ludovic, « Avec le 1e “data Tuesday”, la data se fait plus “sexy” », Les Echos,
[disponible en ligne : http://blogs.lesechos.fr/echosopendata/avec-le-1er-data-tuesday-la-
data-se-fait-sexy-a7558.html], publié le 17 novembre 2011, consulté le 31 août 2012.
EPELBOIN, Fabrice, « Le journalisme de données, les données ouvertes et la dictature de la
transparence », ReadWriteWeb, [disponible en ligne :
http://streisand.trollab.org/www.fr.readwriteweb.com/2009/10/19/a-la-une/data-
journalism-journalisme-de-donnee-ouvertes-dictature-transparence/index.html], publié le
19 octobre 2009, consulté le 31 août 2012.
FANEN, Sophian, « Les journalistes à data sur les données », Libération, [disponible en ligne :
http://www.liberation.fr/medias/01012380956-les-journalistes-a-data-sur-les-donnees],
publié le 3 janvier 2012, consulté le 31 août 2012.

103
FANEN, Sophian, « Les Américains défricheurs du déchiffrage », Ecrans, [disponible en ligne :
http://www.ecrans.fr/Les-Americains-defricheurs-du,13808.html], publié le 4 janvier
2012, consulté le 31 août 2012.
GIRARD, Quentin, « Toi aussi, fais gagner trois députés au PS », Slate, [disponible en ligne :
http://www.slate.fr/story/7581/toi-aussi-d%C3%A9coupe-tes-circonscriptions], publié le
3 juillet 2009, consulté le 31 août 2012.
GONTIER, Fabrice, « Database journalism : “un renversement de perspective” (itw) », Esprit
Blog, [disponible en ligne : http://www.espritblog.com/index.php/2009/07/04/database-
journalism-un-renversement-de-perspective-itw/], publié le 4 juillet 2009, consulté le 31
août 2012.
GOULARD, Caroline, « Le database journalism pour nous sauver du “frogboiling” », Database
journalism, [disponible en ligne : http://databasejournalism.wordpress.com/2009/11/10/le-
database-journalism-pour-nous-sauver-du-%C2%AB-frogboiling-%C2%BB/, publié le 10
novembre 2009, consulté le 31 août 2012.
GOULARD, Caroline, « Assez d’articles, on veut des contenus ! », OWNI, [disponible en ligne :
http://owni.fr/2009/11/17/assez-d%E2%80%99articles-on-veut-des-contenus/], publié le
17 novembre 2009, consulté le 31 août 2012.
GOULARD, Caroline, « Ce qu’aurait pu être le Sarkomètre du Nouvel Obs », OWNI, [disponible
en ligne : http://owni.fr/2010/02/10/ce-qu%E2%80%99aurait-pu-etre-le-sarkometre-du-
nouvel-obs/], publié le 10 février 2010, consulté le 31 août 2012.
GOULARD, Caroline, « Data journalism : pourquoi les médias français ne s’y mettent pas ? »,
OWNI, [disponible en ligne : http://owni.fr/2010/03/08/data-journalism-pourquoi-les-
medias-francais-ne-s’y-mettent-pas/], publié le 8 mars 2010, consulté le 31 août 2012.
GOULARD, Caroline, « La fabrique du data-journalisme », OWNI, [disponible en ligne :
http://owni.fr/2010/03/20/la-fabrique-du-datajournalism/], publié le 20 mars 2010,
consulté le 31 août 2012.
GOULARD, Caroline, « Les quatre voies du datajournalism », OWNI, [disponible en ligne :
http://owni.fr/2010/04/07/quatre-voies-du-datajournalism/], publié le 7 avril 2010,
consulté le 31 août 2012.

104
GRAY, Norman, « Data is a singular noun », [disponible en ligne :
http://nxg.me.uk/note/2005/singular-data/], publié le 2 janvier 2005, consulté le 31 août
2012.
GUILLAUD, Hubert, « Open data (1/4) : Où en est-on ? », InternetActu, [disponible en ligne :
http://www.internetactu.net/2012/05/30/open-data-14-ou-en-est-on/#commentaires],
publié le 30 mai 2011, consulté le 31 août 2012.
GUILLAUD, Hubert, « Les données pour comprendre le monde », InternetActu, [disponible en
ligne : http://www.internetactu.net/2011/07/19/les-donnees-pour-comprendre-le-monde/],
publié le 19 juillet 2011, consulté le 31 août 2012.
GUILLAUD, Hubert, « Big data : les progrès de l’analyse de données », InternetActu,
[disponible en ligne : http://internetactu.blog.lemonde.fr/2011/10/03/big-data-les-progres-
de-lanalyse-des-donnees/], publié le 3 octobre 2011, consulté le 31 août 2012.
HANNE, Isabelle, « “Internet reste un objet étrange dans les rédactions françaises”. Interview de
Bertrand Pecquerie », Libération, [disponible en ligne :
http://www.liberation.fr/medias/2012/05/29/internet-reste-un-objet-etrange-dans-les-
redactions-francaises_822274], publié le 29 mai 2012, consulté le 31 août 2012.
HAUSHALTER, Louis, « Le journalisme Excel », Medias[2], [disponible en ligne :
http://medias2.revue-medias.com/event/86/innovations/tr-nsitions/tr-nsitions--5--le-
journalisme-excel], consulté le 31 août 2012.
HOLOVATY, Adrian, « A fundamental way newspapers need to change », Holovaty.com,
[disponible en ligne : http://www.holovaty.com/writing/fundamental-change/], publié le 6
septembre 2006, consulté le 31 août 2012.
INIZAN, Maël, « Chicago : de la prohibition au data-journalisme », Sillicon Maniacs, [disponible
en ligne : http://www.siliconmaniacs.org/chicago-de-la-prohibition-au-data-journalisme/],
publié le 24 mars 2011, consulté le 31 août 2012.
INIZAN, Maël, « L’open data appliqué au journalisme », Sillicon Maniacs, [disponible en ligne :
http://www.siliconmaniacs.org/wikileaks-lopen-data-appliquee-au-journalisme/], publié le
23 octobre 2011, consulté le 31 août 2012.
JEANIARD, Lucille, « Grâce au journalisme de données, les professionnels de l’information
retrouvent leur rôle de médiateur », Horizons Médiatiques, [disponible en ligne :
http://horizonsmediatiques.wordpress.com/2012/04/05/grace-au-journalisme-de-donnees-

105
les-professionnels-de-linformation-retrouvent-un-role-de-mediateur/], publié le 5 avril
2012, consulté le 31 août 2012.
KALOUGUINE, Tatiana, « Les données ouvertes, nouvel eldorado du data-journalisme », La
voix du dodo, [disponible en ligne : http://www.lavoixdudodo.info/2010/02/05/les-
donnees-ouvertes-futur-eldorado-du-journalisme/], publié le 5 février 2010, consulté le 31
août 2012.
KAYSER-BRIL, Nicolas, « Le data-journalisme pour incarner l’histoire », OWNI, [disponible en
ligne : http://owni.fr/2009/09/25/le-datajournalism-pour-incarner-lhistoire/], publié le 25
septembre 2009, consulté le 31 août 2012.
KAYSER-BRIL, Nicolas, « On l’a pas en format ordinateur », ActuVisu, [disponible en ligne :
http://blog.actuvisu.fr/%C2%AB-on-l%E2%80%99a-pas-en-format-ordinateur-
%C2%BB/], publié le 15 décembre 2009, consulté le 31 août 2012.
KAYSER-BRIL, Nicolas, « La fabrique du data #2 », OWNI, [disponible en ligne :
http://owni.fr/2010/05/25/la-fabrique-du-data-2/], publié le 25 mai 2010, consulté le 31
août 2012.
KAYSER-BRIL, Nicolas, « Prix de l’eau : libérons nos données », OWNI, [disponible en ligne :
http://owni.fr/2011/03/22/prix-de-l-eau-crowdsourcing/], publié le 22 mars 2011, consulté
le 31 août 2012.
KAYSER-BRIL, Nicolas, « Le data-journalisme, vecteur de sens et de profit », OWNI,
[disponible en ligne : http://owni.fr/2011/04/17/le-datajournalisme-vecteur-de-sens-et-de-
profits/], publié le 17 avril 2011, consulté le 31 août 2012.
KELLER, Thiery, « La révolution hacker », OWNI, [disponible en ligne :
http://owni.fr/2012/04/17/enfin-une-revolution-cool/], publié le 17 avril 2012, consulté le
31 août 2012.
KIRKPATRICK, Marshall, « What can you do with Government data ? Bust politicans that’s
what », ReadWriteWeb, [disponible en ligne :
http://www.readwriteweb.com/archives/what_can_you_do_with_government_data.php],
publié le 12 juillet 2009, consulté le 31 août 2012.
LAPOIX, Sylvain, « Mon data-journalisme à l’heure Sarkozy », OWNI, [disponible en ligne :
http://owni.fr/2012/01/14/lapoix-data-journalisme-donnees-sarkozy/], publié le 14 janvier
2010, consulté le 31 août 2012.

106
LEDUC, Caroline, « Le data journalisme a désormais sa bible », Journalismes, [disponible en
ligne : http://www.journalismes.info/Le-Data-journalism-a-desormais-sa-
bible_a3082.html], publié le 5 décembre 2010, consulté le 31 août 2012.
LEON, Yann et ORMAN, Évelyne, « La ronde des chiffres du journalisme de données », La
Croix, [disponible en ligne : http://www.la-croix.com/Culture-
Loisirs/Culture/Actualite/La-ronde-des-chiffres-du-journalisme-de-donnees-_NG_-2010-
10-22-557596], publié le 22 octobre 2010, consulté le 31 août 2012.
LESSIG, Lawrence, « Against Transparency. The perils of openness in government », The New
Republic, [disponible en ligne : http://www.tnr.com/article/books-and-arts/against-
transparency], publié le 9 octobre 2009, consulté le 31 août 2012.
MENTRÉ, Marc, « La programmation : l’avenir du journalisme ? », OWNI, [disponible en ligne :
http://owni.fr/2010/07/30/la-programmation-lavenir-du-journalisme/], publié le 30 juillet
2010, consulté le 31 août 2012.
METTOUT, Eric, « Les renforts du Guardian », L’Express, [disponible en ligne :
http://blogs.lexpress.fr/nouvelleformule/2009/06/19/attention_sujet_complexe_sensi/],
publié le 19 juin 2009, consulté le 31 août 2012.
METTOUT, Eric, « Pourquoi le data-journalisme c’est l’avenir en marche », L’Express,
[disponible en ligne :
http://blogs.lexpress.fr/nouvelleformule/2010/04/07/elle_sappelle_caroline_goulard/],
publié le 7 avril 2010, consulté le 31 août 2012.
METTOUT, Eric, « Pourquoi nous classons les lycées (réponse à Thomas Legrand) », L’Express,
[disponible en ligne : http://blogs.lexpress.fr/nouvelleformule/2012/04/06/pourquoi-nous-
classons-les-lycees-reponse-a-thomas-legrand/], publié le 6 avril 2012, consulté le 31 août
2012.
PATTE, Nicolas, « Datagenèse », OWNI, [disponible en ligne :
http://datablog.owni.fr/2012/06/10/datagenese/], publié le 10 juin 2012, consulté le 31
août 2012.
PONCET, Guerric, « Le streaming écrase le peer-to-peer : Hadopi dépassée », Le Point,
[disponible en ligne : http://www.lepoint.fr/actualites-technologie-internet/2009-10-15/le-
streaming-ecrase-le-peer-to-peer-hadopi-depassee/1387/0/386175], publié le 15 octobre
2009, consulté le 31 août 2012.

107
RAPHAËL, Benoît, « Propublica : journalisme à (très) haut coût, financé par des dons », OWNI,
[disponible en ligne : http://owni.fr/2010/11/18/propublica-journalisme-a-tres-haut-cout-
finance-par-des-dons/], publié le 18 novembre 2010, consulté le 31 août 2012.
RENÉ-WORMS, Pablo, « Les coulisses du journalisme de données », Le Point, [disponible en
ligne : http://www.lepoint.fr/high-tech-internet/les-coulisses-du-journalisme-de-donnees-
01-12-2010-1269442_47.php], publié le 1e décembre 2010, consulté le 31 août 2012.
ROGERS, Simon, « Wikileaks’ Afghan war logs : how our datajournalism operation work », The
Guardian, [disponible en ligne :
http://www.guardian.co.uk/news/datablog/2010/jul/27/wikileaks-afghanistan-data-
datajournalism#_], publié le 27 juillet 2010, consulté le 31 août 2012.
ROGERS, Simon, « How can we get our map colours right ? How open journalism helped us
better », The Guardian, [disponible en ligne :
http://www.guardian.co.uk/news/datablog/2012/apr/13/mapping-colours-open-journalism-
storify], publié le 13 avril 2012, consulté le 31 août 2012.
ROGERS, Simon, « Anyone can do it. Data journalism is the new Punk », The Guardian,
[disponible en ligne : http://www.guardian.co.uk/news/datablog/2012/may/24/data-
journalism-punk], publié le 24 mai 2012, consulté le 31 août 2012.
ROMERA, Pierre, « Le data-journalism notre religion », OWNI, [disponible en ligne :
http://owni.fr/2011/08/30/le-datajournalisme-notre-religion/], publié le 30 août 2011,
consulté le 31 août 2012.
RICHÉ, Pascal, « OWNI se déchire (en deux) pour mieux redémarrer », Rue 89, [disponible en
ligne : http://www.rue89.com/2012/05/25/owni-se-dechire-en-deux-pour-mieux-
redemarrer-232480], publié le 25 mai 2012, consulté le 31 août 2012.
SALAUN, Jean-Michel, « Singulière data », [disponible en ligne :
http://blogues.ebsi.umontreal.ca/jms/index.php/post/2012/04/10/Singuli%C3%A8re-data],
publié le 10 avril 2012, consulté le 31 août 2012.
SCHERER, Eric, « Données publiques et journalisme : une mine de richesses ! », OWNI,
[disponible en ligne : http://owni.fr/2010/07/07/donnees-publiques-et-journalisme-une-
mine-de-richesses/], publié le 7 juillet 2010, consulté le 31 août 2012.

108
SCHERER, Eric, « Le journalisme augmenté en 10 points », OWNI, [disponible en ligne :
http://owni.fr/2010/11/07/le-%C2%AB-journalisme-augmente-%C2%BB-en-10-points/],
publié le 7 novembre 2010, consulté le 31 août 2012.
SÉNÉCHAL, Lorrain, « Le “fact checking” peine à s’imposer en France », OWNI, [disponible en
ligne : http://owni.fr/2010/11/18/le-fact-checking-peine-a-simposer-en-france/], publié le
18 novembre 2011, consulté le 31 août 2012.
SMITH, Evan, « Lessons for the Tribune’s First 6 Months », Texas Tribune, [disponible en ligne
: http://www.texastribune.org/texas-newspaper/texas-news/lessons-from-the-tribunes-
first-6-months/], publié le 10 mai 2010, consulté le 31 août 2012.
THIBAUT, Nirina, « Datajournalism : les chiffres nous parlent, écoutons les ! », YCAW,
[disponible en ligne : http://ygaw-bysiliconsentier.com/134-datajournalism-les-chiffres-
nous-parlent-ecoutons-les], publié le 6 juillet 2010, consulté le 31 août 2012.
TRAVIS, Alan et MULHOLLAND, Helen, « Online crime maps crash under weight of 18
million hits an hour », The Guardian, [disponible en ligne :
http://www.guardian.co.uk/uk/2011/feb/01/online-crime-maps-power-hands-people],
publié le 1e février 2011, consulté le 31 août 2012.
VALENCOT, Corentin, « Hack the Press #2 relance le data-journalisme en France », Horizons
Médiatiques, [disponible en ligne :
http://corentinvalencot.tumblr.com/post/15774554853/hack-the-press-2-relance-le-data-
journalisme-en-France], publié le 13 janvier 2012, consulté le 31 août 2012.
VAMBREMEERSH, Nicolas, « Pour un journalisme de données », Slate, [disponible en ligne :
http://www.slate.fr/story/8643/pour-un-journalisme-de-faits], publié le 30 juillet 2009,
consulté le 31 aout 2012.
VIDAL, Benoît, « Data, data, data », Database journalism, [disponible en ligne :
http://databasejournalism.wordpress.com/2010/01/24/data-data-data/], publié le 24 janvier
2010, consulté le 31 août 2012.

109
Non signés
« A lire ailleurs du 22 juin au 9 juillet », Internet Actu, [disponible en ligne :
http://www.internetactu.net/2009/07/10/a-lire-ailleurs-du-22-juin-au-9-
juillet/#commentaires], publié le 10 juillet 2009, consulté le 31 août 2012.
« Le discours de Séverin Naudet au congrès i-expo », Les Echos, [disponible en ligne :
http://blogs.lesechos.fr/echosopendata/document-le-discours-de-severin-a5830.html],
publié le 22 mai 2011, consulté le 31 août 2012.
« Explorer les discours des candidats à la présidentielle », Le Monde, [disponible en ligne :
http://www.lemonde.fr/election-presidentielle-2012/visuel/2012/03/06/explorez-les-
discours-des-candidats-a-la-presidentielle-2007_1652570_1471069.html], publié le 6
mars 2012, consulté le 31 août 2012.
« L’affaire de Tarnac : “La fabrication d’une menace”. Tchat avec Daniel Dufresne », Libération,
[disponible en ligne : http://www.liberation.fr/societe/1201605-les-peripeties-de-l-affaire-
de-tarnac], publié le 16 mars 2012, consulté le 31 août 2012.
« Sarkozy, roi du “bobaromètre” (épisode 6)», Libération, [disponible en ligne :
http://desintox.blogs.liberation.fr/blog/2012/03/sarkozy-bilan-bobarom%C3%A8tre.html],
publié le 22 mars 2012, consulté le 31 août 2012.
« Seattle Times methadone investigation wins Pulitzer Prize », The Seattle Times, [disponible en
ligne : http://seattletimes.nwsource.com/html/localnews/2017994882_pulitzer17m.html],
publié le 16 avril 2012, consulté le 31 août 2012.
« Les data en forme », OWNI, [disponible en ligne : http://owni.fr/2012/04/17/les-data-en-forme-
episode28/], publié le 17 avril 2012, consulté le 21 août 2012
« Le journalisme de données récompensé », Courrier International, [disponible en ligne :
http://www.courrierinternational.com/article/2012/06/28/le-journalisme-de-donnees-
recompense], publié le 28 juin 2012, consulté le 31 août 2012.
« Datajournalisme : des données pour s’informer », Etalab, [disponible en ligne :
http://www.data.gouv.fr/Articles/Datajournalisme-Des-donnees-pour-s-informer], publié
le 11 juillet 2012, consulté le 31 août 2012.

110
Audio et vidéo
CLARINI, Julie, « Le journalisme de données : nouveau journalisme ? », France Culture, Les
idées claires, [disponible en ligne : http://www.franceculture.fr/emission-les-idees-claires-
les-idees-claires-2011-02-10.html], diffusé le 10 février 2011, consulté le 31 août 2012.
PORTE (DE LA), Xavier, « Le “data-journalisme” ou comment faire du journalisme avec les
données », France Culture, Place de la Toile [disponible en ligne :
http://www.franceculture.fr/emission-place-de-la-toile-le-data-journalisme-ou-comment-
faire-du-journalisme-avec-les-donnees-2010], diffusée le 14 novembre 2010, consulté le
31 août 2012
MENARD, Robert, « L’avénement du data-journalisme signe-t-il un retour vers un besoin
d’objectivité ? », Medias[2], [disponible en ligne : http://medias2.revue-
medias.com/event/140/profession-journaliste/evolutions/l-avenement-du-datajournalisme-
signe-t-il-le-retour-vers-un-besoin-d-objectivite], publié en juillet 2012, consulté le 31
août 2012.
Mémoire
GOULARD, Caroline, Mutations des entreprises de presse liées au développement de leurs
activités numériques, Mémoire de master 1 en Management des organisations, Sciences
Po Rennes, 2009.
Pages internet
http://app.owni.fr/ou-habitez-vous-vraiment/ (consulté le 31 août 2012)
http://www.bnf.fr/fr/evenements_et_culture/anx_auditoriums/f.rencontres_labo.html?seance=122
3907481771 (consulté le 31 août 2012)
http://www.citypayments.org (consulté le 31 août 2012)
http://databasejournalism.wordpress.com/ (consulté le 31 août 2012)

111
http://datablog.blog.lemonde.fr/ (consulté le 31 août 2012),
http://datajournalismawards.org/ (consulté le 31 août 2012)
http://driven-by-data.net (consulté le 31 août 2012)
http://www.datamasher.org/ (consulté le 31 août 2012)
http://www.datavis.ca/milestones/ (consulté le 31 août 2012)
http://www.etalab.gouv.fr/pages/Atelier_de_travail_du_13_Octobre_2011_Datajournalisme-
5913723.html (consulté le 31 août 2012)
http://fr.slideshare.net/gaetangab/visualisation-de-donnes-les-leons-de-lhistoire-13139160
(consulté le 31 août 2012)
http://fr.wikipedia.org/wiki/Journalisme#Les_genres_journalistiques (consulté le 31 août 2012)
http://www.gapminder.org/ (consulté le 31 août 2012)
http://www.insee.fr/fr/themes/indicateur.asp?id=29&page=indic_sip.htm (consulté le 31
août 2012)
http://monecranradar.blogspot.fr/ (consulté le 31 août 2012)
http://www.nosdeputes.fr/ (consulté le 31 août 2012)
http://opendata.paris.fr/opendata/jsp/site/Portal.jsp?document_id=61&portlet_id=102 (consulté le
31 août 2012)
http://projects.washingtonpost.com/congress/112/ (consulté le 31 août 2012)
http://www.revolution-fiscale.fr/simulez-votre-propre-reforme-fiscale (consulté le 31 août 2012)
http://www.usatoday.com/news/911/plus_me/index.html, (consulté le 31 août 2012)
http://well-formed-data.net (consulté le 31 août 2012)
http://wikiproject.oii.ox.ac.uk/mapping_wikipedia/ (consulté le 31 août 2012)

112
Table des matières
REMERCIEMENTS .................................................................................................................................................. 2
INTRODUCTION ..................................................................................................................................................... 3 CONTEXTUALISATION ................................................................................................................................................................ 4 CONSTRUCTION DE L’OBJET DE RECHERCHE ......................................................................................................................... 5 La donnée comme production humaine ....................................................................................................................... 6 Pour une dé-‐ontologie du journalisme ......................................................................................................................... 7
PROBLEMATIQUE ........................................................................................................................................................................ 9 METHODOLOGIE ...................................................................................................................................................................... 11 L’analyse de discours ......................................................................................................................................................... 12 Une sémiologie graphique et linguistique ................................................................................................................ 12 Des entretiens semi-‐directifs dans une démarche compréhensive ................................................................ 13
HYPOTHESES ET ANNONCE DU PLAN ................................................................................................................................... 15
I. LE DATA-‐JOURNALISME COMME ACTION COLLECTIVE ..................................................................... 17 A. DES SIGNIFIES MULTIPLES : L’IMPOSSIBLE APPROCHE ESSENTIALISTE .................................................................... 18 1. Les approches « disciplinaires » ............................................................................................................................... 18 2. Les approches « culinaires » ...................................................................................................................................... 20 3. Des idéaux-‐types insatisfaisants .............................................................................................................................. 22
B. UNE EXPRESSION INVESTIE ET PROMUE PAR DES ACTEURS EXTERIEURS AU JOURNALISME ................................ 23 1. En France, une « réquisition » par des entrepreneurs web .......................................................................... 24 2. Une prétention abusive à la nouveauté ................................................................................................................ 26 3. Une injonction à agir .................................................................................................................................................... 28
C. UNE DE-‐ONTOLOGIE DU DATA-‐JOURNALISME : LES RICHES CONNOTATIONS DU MOT « DATA » ......................... 30 1. La « data » au cœur de la terminologie française ........................................................................................... 31 2. Un sentiment de multitude ......................................................................................................................................... 32 3. Le rattachement à une bannière « data » ............................................................................................................ 34
II. LE DATA-‐JOURNALISME COMME MEDIATION PROFESSIONNELLE .............................................. 37 A. UNE PRETENTION A L’IMPARTIALITE, DANS UN AMALGAME ENTRE « FAIT » ET « DONNEE » ............................ 38 1. Une sacralisation des faits .......................................................................................................................................... 38 2. L’ « évidence » du chiffre ............................................................................................................................................. 41

113
3. Le « fact-‐checking » comme aboutissement ....................................................................................................... 43 B. LA « DATA MODELEE » OU LE MYTHE DE LA DONNEE BRUTE .................................................................................... 46 1. La naturalisation des nomenclatures .................................................................................................................... 47 2. Le processus d’élaboration : une « boîte noire » éludée ................................................................................ 49 3. Une visualisation éditorialisée des données ....................................................................................................... 51
C. LE « DATA-‐JOURNALISTE » : UN PROFESSIONNEL DU TRAITEMENT DES DONNEES ............................................... 55 1. Une médiation nécessaire ........................................................................................................................................... 55 2. Un nouveau rapport aux médias informatisés .................................................................................................. 57 3. Des lignes de fractures entre promoteurs ........................................................................................................... 60
III. LE DATA-‐JOURNALISME COMME PROJET POLITIQUE DE « REINITIALISATION » DU
JOURNALISME ...................................................................................................................................................... 63 A. LA PROMESSE D’UNE TRANSPARENCE DEMOCRATIQUE RADICALE ........................................................................... 65 1. Une surveillance démocratique par les données .............................................................................................. 65 2. La réactualisation de la figure du « journaliste-‐justicier » .......................................................................... 67 3. La transparence « nue » en question ..................................................................................................................... 69
B. DES DISPOSITIFS PENSES POUR L’ACTION INDIVIDUELLE ............................................................................................ 72 1. La carte « zoomable » comme dispositif phare ................................................................................................. 72 2. Un travail de mise en perspective fragilisé ......................................................................................................... 75 3. Des outils d’aide à la décision rationnelle ........................................................................................................... 77
C. LA « DATA », LEVIER D’UNE ORGANISATION « DECLOISONNEE » DES MEDIAS ....................................................... 79 1. Un journaliste chef de projet web ........................................................................................................................... 79 2. L’internaute expert mobilisé ..................................................................................................................................... 82 3. Un « nouvel esprit du journalisme » ? .................................................................................................................... 84
CONCLUSION ........................................................................................................................................................ 87 RECOMMANDATIONS .............................................................................................................................................................. 89 Ouvrir la boîte noire ........................................................................................................................................................... 89 Mettre l’égocentrisme au service du collectif ......................................................................................................... 90
PERSPECTIVES DE RECHERCHE ............................................................................................................................................. 91 Le modèle économique du data-‐journalisme .......................................................................................................... 91 Un rapport ambigu à la temporalité .......................................................................................................................... 92
BIBLIOGRAPHIE .................................................................................................................................................. 93 REFERENCES UNIVERSITAIRES .............................................................................................................................................. 93 Ouvrages ................................................................................................................................................................................. 93

114
Articles ..................................................................................................................................................................................... 94 Thèse et mémoires .............................................................................................................................................................. 97 Orales ........................................................................................................................................................................................ 98
CORPUS D’ETUDE ................................................................................................................................................................... 100 Ouvrages ............................................................................................................................................................................... 100 Articles ................................................................................................................................................................................... 101 Audio et vidéo ..................................................................................................................................................................... 110 Mémoire ................................................................................................................................................................................ 110 Pages internet ..................................................................................................................................................................... 110
TABLE DES MATIERES .................................................................................................................................... 112
RESUME ET MOTS-‐CLES ................................................................................................................................. 115

115
Résumé et mots-clés
Résumé
Ce travail s’intéresse au phénomène émergent de « data-journalisme », ou « journalisme
de données », en interrogeant son articulation avec les repères et imaginaires du journalisme
professionnel. En prenant au sérieux les discours des principaux promoteurs, qui défendent la
richesse de données supposées « nouvelle génération », il est possible d’apporter des éléments de
réponse. Le data-journalisme revendique une figure de médiateur professionnel dans la mise en
perspective et le traitement de données statistiques, qui n’est pas sans rappeler le travail
journalistique. Tant et si bien que certains journalistes professionnels défendent le journalisme
de donnée comme un moyen de « réconcilier » la profession avec le web. L’étude des racines
idéologiques du data-journalisme laisse pourtant entrevoir des points de tension. Plus que les
imaginaires du journalisme professionnel, le data-journalisme semble se nourrir des imaginaires
constitutifs d’internet : transparence, société en réseau, horizontalité, liberté. En voulant les
importer dans les organisations médiatiques, il fragilise la figure d’un journaliste professionnel au
service de la démocratie, et jouissant d’un statut « à part ».
Mots-clés : cartographie, chiffre, data, démocratie, dispositif, données, entrepreneurs, gestion de
projet, graphique, interactivité, journalisme, fact-checking, fait, gisement, hackers, imaginaires,
internet, liberté, médias informatisés, médiation, mouvement social, objectivité, ouverture,
participation, personnalisation, professionnel, réseau, statistiques, surveillance, sousveillance,
transparence, trivialité, visualisation.