MéthodesTechniquesOutils_OlivierErtzscheld

download MéthodesTechniquesOutils_OlivierErtzscheld

of 3

Transcript of MéthodesTechniquesOutils_OlivierErtzscheld

  • 8/3/2019 MthodesTechniquesOutils_OlivierErtzscheld

    1/3

    Ertzscheid Olivier, Mthodes, techniques et outils. Quy aura-t-il demainsous nos moteurs ? in Documentaliste, sciences de linformation. Vol.48, n3, Octobre 2011, pp. 10-11.

    Quy aura-t-il demain sous nos moteurs ? Moteurs de recherche et rseaux sociauxoccupent une place chaque jour plus prpondrante dans nos accs l'information et laconnaissance. Ils suscitent galement de vives interrogations, notamment dans leur capacit rendre indexable des informations relevant indistinctement des sphres publiques, priveset intimes des contenus disponibles en ligne. Enfin, inaugurs par le like de Facebook,les systmes de recommandation se multiplient, venant concurrencer ou remplacerltablissement de liens hypertextes et suscitant de nouveaux usages, de nouvellesmtriques. Par ailleurs, la famille documentaire sest agrandie : les encyclopdies sontdevenus collaboratives, dimmenses silos documentaires sont apparus (Youtube, Flickr,etc.), les profils humains sont devenus des objets de collection .

    CE QUI A REELLEMENT CHANGE.

    Question dconomies. Dans le contexte dune abondance de contenus informationnels,prvaut une conomie de lattention hypothque par la capacit mettre en place uneconomie de la confiance (Trust economy) avec la foule comme support (crowdsourcing), lamodlisation de la confiance comme vecteur, et de nouvelles ingnieries relationnellescomme technologie.

    La force des mtadonnes. Pour les moteurs mais aussi pour rseaux sociaux, toutes lesdonnes sont ou peuvent devenir des mtadonnes, qui dessinent des comportements (pasuniquement documentaires) en mme temps quelles permettent de caractriser lamotivation de ces mmes comportements. Chaque clic, chaque requte, chaquecomportement connect fait fonction de mtadonne dans une sorte de panoptique global.

    Le web invisible ne lest plus vraiment.Le dfi technologique, aprs avoir t celui de lamasse des documents indexs, devient celui de la restitution en temps quasi-rel du rythmede publication propre au web ( world live web ). Pour accomplir ce miracle, il faut auxoutils de captation de notre attention que sont les moteurs et les rseaux sociaux, unearchitecture qui entretiennent dessein la confusion entre les sphres de publicationpubliques, intimes et prives.

    La naissance de lindustrie de la recommandation et des moteurs prescripteurs. Larecommandation existe de toute ternit numrique, mais elle est dsormais entre dansson re industrielle. Moteurs et rseaux sociaux fonctionnent comme autant deprescripteurs, soit en valorisant la capacit de prescription affinitaire des proches , des

    amis ou des collaborateurs de linternaute (boutons like et +1 ), soit en mettanten avant les comportements les plus rcurrents de lensemble de leurs utilisateurs.

    De nouvelles indexations. Aprs lindexation des mots-cls, des liens hypertextes, desimages, de la vido, des profils, il faut maintenant apprendre indexer, mettre en mmoire,la manire dont circule linformation, tre capable de rendre compte de cette dynamiquevirale, capable de prendre en compte la dissmination, lcho, leffet de buzz que produisentles innombrables boutons poussoir prsent sur chaque contenu informationnel pour luiassurer une dissmination optimale.

    Navigation virale ou promenade carcrale ? Lapproche ferme, propritaire,compartimente, concurrentielle, puisable de l'conomie du lien hypertexte que proposent

    les systmes de recommandation, ne peut mener qu' des systmes de natureconcentrationnaire. Des cosystmes de l'enfermement consenti, en parfaite contradictionavec la vision fondatrice de Vannevar Bush selon laquelle la parcours, le chemin ("trail")

    sic_00634397,

    version1

    21Oct2011

    Manuscrit auteur, publi dans "Documentaliste - Sciences de l'Information 48, 3 (2011) 10-11"

    http://hal.archives-ouvertes.fr/http://archivesic.ccsd.cnrs.fr/sic_00634397/fr/
  • 8/3/2019 MthodesTechniquesOutils_OlivierErtzscheld

    2/3

    importe au moins autant que le lien. Les ingnieries relationnelles des systmes derecommandationde celui dAmazon au Like de Facebook ressemblent davantage unepromenade carcrale qu' une navigation affranchie parce quelles amplifient jusqu ladmesure la mise en avant de certains contenus au dtriment de la mise au jour dune formede diversit.

    Un nouveau brassage. La recherche universelle, dsignant la capacit pour lutilisateur dechercher simultanment dans les diffrents index (et les diffrentes bases de donnes)proposs par les moteurs de recherche, ouvre un immense champ de possibles pour la miseen uvre dalgorithmes capables de prendre en charge les paramtres excessivementcomplexes de la personnalisation, de la gestion des historiques de recherche, de laspectrelationnel ou affinitaire qui relie un nombre de plus en plus grand ditems, ou encore dubrassage de ces gigantesques silos de donns. Un brassage totalement indit cettechelle.

    Le mirage des nuages. De rachats successifs en monopoles tablis, lextrme mouvementde concentration qui touche la mdiasphre internautique fait dbat. Dun immensecosystme ouvert, le web mute aujourdhui en une succession de ce que Tim Berners Lee

    nomme des walled gardens , des jardins ferms, reposant sur des donnes propritaireset alinant leurs usagers en leur interdisant toute forme de partage vers lextrieur. Lenjeunest alors plus simplement celui de louverture des donnes, mais celui de la mise en placedun mta-contrle, un contrle accru par la migration de lessentiel de nos donnes sur lesserveurs des socits htes, grce la banalisation du cloud computing : lessentiel dumatriau documentaire qui dfinit notre rapport linformation et la connaissance tant enpasse de se retrouver entre les mains de quelques socits marchandes

    Et tout a pour quoi ? Il sagit de porter visibilit gale des contenus jusquici sous-utilissou sous-exploits, pour augmenter leur potentiel marchand en dopant de la sorte lerendement des liens publicitaires affrents. Un objectif qui ne peut tre atteint sans laparticipation massive des internautes.

    Le web personnel. La pertinence et la hirarchisation dun ensemble de contenushtrognes na de sens quau regard des intrts exprims par chacun dans le cadre deses recherches prcdentes. La condition sine qua nonde la russite dune telle oprationest le passage au premier plan de la gestion de lhistorique des recherches individuelles .

    Algorithmie ambiante. A la manire de linformatique ambiante qui a vocation sediluer dans lenvironnement au travers dinterfaces prenant la forme dobjets quotidiens, sedessinent les contours dune algorithmie galement ambiante, cest dire mettant sous lacoupe de la puissance calculatoire des moteurs, la moindre de nos interactions en ligne.

    Marchands de documents. Derrire cette algorithmie ambiante on trouve la volont

    dtermine doptimiser encore davantage la marchandisation de toute unit documentairerecense, quelle que soit sa sphre dappartenance dorigine (publique, prive, intime), sanature mdiatique propre (image, son, vido, page web, chapitre de livre, etc...), sagranularit (un extrait de livre, un billet de blog, un extrait de vido ) et son taux de partagesur le rseau (usage personnel uniquement, usage partag entre proches , usagepartag avec lensemble des autres utilisateurs du service).

    La recherche prdictive. Les grands acteurs du web disposent aujourdhui dunegigantesque base de donne des intentions (concept forg par John Battelle), construite laide de nos comportements dachats, de lhistorique de nos requtes, de nosdplacements (golocalisation), de nos statuts (ce que nous faisons, nos centres dintrt),de nos amis (qui nous frquentons). Une base de donne des intentions qui va

    augmenter la prdictibilit des recherches. Et donc augmenter galement leur valeurtransactionnelle, leur valeur marchande.

    sic_00634397,

    version1

    21Oct2011

  • 8/3/2019 MthodesTechniquesOutils_OlivierErtzscheld

    3/3

    Recherche de proximit et moteurs de voisinage. A laide de moteurs commeIntelius.com ou Everyblock.com, il est possible de tout savoir de son voisin numrique,depuis son numro de scurit sociale jusqu la composition ethnique du quartier danslequel il vit, en passant par le montant du bien immobilier quil possde ou lhistorique de sesmariages et de ses divorces. Toutes ces informations sont aux Etats-Unis en tout cas disponibles gratuitement et lgalement. Ne reste plus qu les agrger et faire payerlaccs ces recoupements numriques dun nouveau genre. Surveillance et sous-veillancesaffirment comme les fondamentaux de cette nouvelle tendance du neighboring search .

    Pourquoi chercher encore ? Le nouvel horizon de la recherche dinformation pose troisquestions trs troitement lies. Demain. Chercherons-nous pour retrouver ce que nousou nos amis connaissent dj, permettant ainsi aux acteurs du secteur de vendre encoreplus de temps de cerveau disponible ? Chercherons-nous simplement pour acheter,pour consommer et pour affiner le modle de la base de donne des intentions ? Oupourrons-nous encore chercher pour dcouvrir ce que nous ne savons pas (au risquede lerreur, de linutile, du futile) ?

    Le web tait un village global. Son seul cadastre tait celui des liens hypertexte.

    Aujourdhui, les systmes de recommandation risquent de transformer le village global enquelques immeubles aux incessantes querelles de voisinage.

    Un web hypermnsique et des moteurs omniscients. Aujourdhui le processusdexternalisation de nos mmoires documentaires entam dans les annes 1980 aveclexplosion des mmoires optiques de stockage est totalement servicialise et industrialise.Ltape suivante pourrait ressembler lhypermnsie dont souffre le Funs de J.L. Borgs.cest lhypermnsie. Celle dont souffre Funs dans la nouvelle de Borges. Mais cettehypermnsie est aujourdhui calculatoire, algorithmique, ambiante. Elle est massivementdistribue, ce qui lui confre cette impression de dilution, de non-dangerosit. Mais quelquesacteurs disposent des moyens de lactiver et de tout rassembler. Pour linstant ce nest quepour nous vendre de la publicit, du temps de cerveau disponible. Mais que deviendrait cette

    arme hypermnsique entre les mains dtats ? Nous avons tendance oublier l'importancede se souvenir puisqu'il est devenu possible de tout se remmorer.

    Des enjeux de politique ... documentaire. La deuxime question cest celle delcosystme informationnel que nous souhaitons pour demain. Ne rien dire aujourdhui, cestconsentir. Il est aujourdhui absolument ncessaire douvrir un dbat autour de lcosystmenon plus simplement documentaire mais politique que les moteurs reprsentent, il est vitalde sinterroger sur la manire dont cet cosystme documentaire conditionne notre biotopepolitique et social Or toutes ces questions sont par essence documentaires, ce sont lesquestions que posent une macro-documentation du monde. Voil pourquoi le rle desprofessionnels de linformation est et sera absolument dterminant.

    sic_00634397,

    version1

    21Oct2011