Novembre 2008 i-mag

36
42 i-mag i-mag Magazine de l’AAE ENSIMAG Novembre 2008

Transcript of Novembre 2008 i-mag

Page 1: Novembre 2008 i-mag

42

i-magi-magMagazine de l’AAE ENSIMAG

Novembre 2008

Page 2: Novembre 2008 i-mag
Page 3: Novembre 2008 i-mag
Page 4: Novembre 2008 i-mag
Page 5: Novembre 2008 i-mag

Jean-Marc DarrigolEnsimag 1988

Directeur Ingenierie au sein de Yahoo

L es plus anciennes références aux interactions sociales quiseraient possibles avec un réseau d’ordinateurs datent de1962, et la première démonstration publique du réseau

ARPANET a eu lieu en 1972. Mais c’est le début des années 90, avecla création au CERN des standards à la base du web et l’apparitiondu navigateur Mosaic, qui marque le début d’Internet tel que legrand public le connaît. Web, courrier électronique et messagerieinstantanée ont explosé dans les deux dernières décennies et In-ternet est maintenant universel, omniprésent, global.

Impossible d’être exhaustifs devant un domaine aussi large, doncnous essayons seulement dans cette revue de donner au lecteurquelques pistes de réflexion.

Réflexion sur la taille tout d’abord. Avec une croissance expo-nentielle du nombre de systèmes connectés, Internet oblige à in-venter des moyens pour l’appréhender. C’est ce que Franck Ghi-talla nous explique dans son article sur la cartographie du web.Les méthodes de recherche doivent également être revues, les motsclés ne permettant qu’un accès partiel à la masse d’informationexistante. Gilles Vandelle nous explique ainsi comment les réseauxsémantiques sont une piste pour améliorer la pertinence des re-cherches en ligne. Côté infrastructures, les besoins sans cessecroissants rendent nécessaires la mise en place de technologies in-novantes, telles que le grid computing dont Rémy Amouroux nousexplique les principes.

Réflexion sur les services ensuite. Internet a révolutionné notrefaçon de vivre en créant de nouveaux services pour les utilisateursou en changeant des services existants. Nous avons sélectionnétrois exemples pour l’illustrer : le vote par Internet, qui entremaintenant dans une phase de maturité (Benoît Chenon), le créditde particulier à particulier, service qui est maintenant rendu pos-sible à grande échelle (Marc Duleba) et enfin l’accès aux informa-tions multi-sources (Pierre Chappaz). Trois gouttes d’eau dans unocéan de sites et de services évoluant sans cesse.

Pour compléter ces deux axes, Laurent Gatignol nous parle del’Internet sur mobile, qui participe à cette universalité de l’accèsau réseau. Enfin, le besoin d’évolution rapide des sites dans un en-vironnement technique complexe et l’impact direct des modifica-tions sur les utilisateurs obligent les équipes de développement àenvisager de nouveaux processus. Dans ce contexte, les méthodesdites Agile sont pertinentes et très utilisées par les sociétés Inter-net, comme nous l’explique Alexandre Boutin.

Au final, cette revue effleure à peine la surface de ce domaine,mais il faudrait une encyclopédie pour en faire le tour, et celle-ciserait obsolète à peine écrite. Des domaines entiers de l’économiesont seulement à l’aube d’une révolution dont on a du mal à me-surer les impacts. Je pense aux loisirs numériques et à l’accès auxproduits culturels par exemple. Nous sommes en présence d’unmédia et d’un pan d’économie qui croissent de façon exponentielleet évoluent sur des cycles d’une fréquence inconnue jusque là.Comment dans ce cas tirer des plans sur l’avenir ?

Je voudrais terminer en remerciant les auteurs qui m’ont faitl’amitié de participer à cette revue, et en vous souhaitant unebonne lecture. ❃

I-MAG - NOVEMBRE 2008 3

ééddiittoorriiaall

JJeeaann--MMaarrcc DDaarrrriiggooll

Ensimag 1988, est Directeur Ingenierie au sein de

Yahoo à Echirolles. Il commence sa carrière chez

Bull puis prend très tôt le virage de l’Internet. Il

rejoint Kelkoo en mars 2000 comme responsable

des sites de marque blanche, avant de prendre la

direction de la R&D en 2004.

Page 6: Novembre 2008 i-mag
Page 7: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 5

ssoommmmaaiirree

EDITEDITORIALORIALPar Jean-Marc Darrigol 3

La Naissance d’une géographiedu Web ? Par Franck Ghitalla 6

Utilisation des réseaux sémantiquesdans la recherche Web Par Gilles Vandelle 12

Web Services et Grid Computing :la nouvelle ère des systèmes distribuésPar Rémy Amouroux 14

Le vote par internet : quel avenir ?Par Benoît Chenon 18

Crédit de particulier à particulier.L’argent sans la banque ?Par Marc Duleba 20

Wikio, un portail d’information 2.0Par Pierre Chappaz 18

L’internet mobilePar Laurent Gatignol 26

L’agilité au Service du WebPar Alexandre Boutin 28

Vie de l'associationPar Mouna Beyk 31

Edition : i-mag est publié par l’Association des anciens élèves de l’ENSIMAG, 68, Bld de Port Royal 75005 Paris - Tél.06 28 50 08 85; site : www.aae-ensimag.com ; e-mail : [email protected] ; rédacteur en chef : Jean-Marc Darrigol. PUBLICITE : Editions 50, 87, route de Grigny, 91130 RisOrangis. CONCEPTION GRAPHIQUE ET MAQUETTE : tél. 04 42 99 38 31. IMPRESSION : Imprimerie de Montligeon, 61400 La Chapelle Montligeon.Dépôt légal : mai 2008 ; ISSN 1774-7104.

« A l’heure de l’internet global »

Photographie de couverture : © Nmedia - Fotolia.com

Page 8: Novembre 2008 i-mag
Page 9: Novembre 2008 i-mag

La naissance d’une géographie du web ?

I-MAG - NOVEMBRE 2008 7

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Si l’on quitte quelques instants notrenavigateur-web et que l’on oublie leslistes à plat que nous donnent lesmoteurs de recherche, alors s’ouvre ununivers où les documents web et leursliens sont inextricablement mêlés. Ilsforment un système complexe qui nesemble plus rien devoir à l'organisa-tion physique des réseaux, se déve-loppant de lui-même au niveau le plusabstrait de toute cette série de couchesde machines et de protocoles qui for-ment l'Internet. L’activité de nombreuxchercheurs et ingénieurs, dans le sec-teur de la recherche académiquecomme industrielle, est aujourd’huiconcentrée sur l’étude du web commearchitecture dont il s’agit de construireles modèles possibles en s’appuyantsur des données expérimentales oudes données indexées dans les grandesbases d’indexation des moteurs derecherche.A parcourir les publications issues duchamp des computer sciences et duweb-mining ces dernières années, onse rend compte combien les cher-cheurs et les ingénieurs contribuentpetit à petit à le dessiner comme unsystème topologique complexe, esquis-sant à différentes échelles et partouches successives son modèle à lafois graphique et logique. C’est là, dans

“Nous avons créé le Web, et nous avons pour devoir de lecomprendre ". Ainsi s’est exprimé Tim Berners-Lee le 10novembre 2006 en fondant le W.S.R.I. (Web Science Re-search Initiative). Cette initiative récente du M.I.T. et del’université de Southampton de promouvoir l’émergenced’une “science du web” montre, si besoin était, tout le che-min qu’il reste à parcourir pour comprendre ce réseaudont la raison nous échappe encore. Le web représente eneffet un « e-cosystem » (1) documentaire relativement in-édit. Certains principes de son organisation sont encoremal connus, même si depuis quelques années on com-mence à percevoir certaines propriétés génériques de cetespace hypertexte ouvert et dynamique.

Par Franck GhitallaMaître de Conférences en Sciences de l’Information - Président de l’association de recherche WebAtlas

FFrraanncckk GGhhiittaallllaa

Maître de Conférences en Sciences de l’Information à l’Université de Technologie de Compiègne depuis 1999.

Président de l’association de recherche loi-1901 WebAtlas - Consultant en management de l’information

TThhèèmmeess ddee rreecchheerrcchhee ::

technologies web, cartographies des systèmes d’information et des réseaux, théorie et expérimentation autour

des Network-Sciences.

Mène une réflexion théorique sur la « géographie de l’information » à l’heure des réseaux distribués comme le

web et des systèmes complexes. En particulier, il s’agit d’essayer de comprendre les principes de l’architecture

documentaire du web. Ce travail théorique s’accompagne du développement d’une ingénierie scientifique et donc

différents projets technologiques comme la société R.T.G.I. lauréate du concours OSEO-ANVAR en 2006, le portail

dédié à l’ingénierie web web-mining.fr ou les projets expérimentaux dirigés par l’association de recherche

WebAtlas dont il est le président. (1) The Laws of the Web, Patterns in the Eco-

logy of Information, B.A. Huberman, M.I.T.-

Press, 2001.

Page 10: Novembre 2008 i-mag
Page 11: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 9

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

cet exercice patient et minutieux de « tra-duction » des données statistiques, tech-niques et formelles en propriétés spa-tiales puis en modèle général que le webcommence à « prendre corps », comme(enfin) rendu visible et appréhendable.Dans ces tâches d'exploration degrandes BDD associées à des systèmesd'information, la construction demodèles théoriques du web peut s’ap-puyer sur des bases mathématiques etstatistiques mais aussi sur la théorie desgraphes qui représentent un puissantmoyen de réduction de la complexité decertains systèmes. Si les graphes peu-vent être mobilisés dans des tâches decalcul, ils peuvent aussi être visualisés,offrant alors des types particuliers de «vues cartographiques » représentativesde la distribution de l’information sur leweb, à grande échelle comme localement.

A la recherche de patterns

Les milliards de pages qui constituent leweb peuvent être indexées (décrites) etcomparées par leurs contenus ou lesliens hypertextes qu’elles distribuententre elles, formant de vastes systèmesque seule la théorie des graphes peutaider à réduire. C’est en projetant lespages (ou leur « contenu ») dans unespace théorique (à titre de noeuds) ainsique leurs liens réciproques (à titre d’arcsou de vecteurs) que l’on peut alors com-prendre les propriétés topo-logiques duweb comme système d’information. Lesdonnées extraites du web sont traitéessous forme de matrice de graphes, lais-sant ainsi apparaître aux chercheurs cer-taines propriétés de cet espace docu-mentaire inédit, propriétés que l’on peutaussi visualiser.Techniquement, les données traitéesdans cette ingénierie d’exploration desstructures du web sont constituées sur-tout par des indicateurs de contenu asso-ciés à des URL (quels sites parlent dequoi ?) et par la distribution entre cesdernières des liens hypertextes (les sitesqui parlent de la « même chose » sont-ilsreliés entre eux ?). Dans ce type d’ap-proche, un effort particulier porte doncsur l’étude conjointe des degrés de simi-larité de contenu entre plusieurs(dizaines) milliers de documents et leur

proximité topologique en termes de lienshypertextes. La production de « carto-graphies du web » suppose donc lafusion de plusieurs traditions scienti-fiques : celle de l’indexation des docu-ments et des moteurs de recherche, cellede la théorie des graphes (qui a com-mencé dès le XVIIIe siècle !) et celle,

enfin, des techniques d’InformationVizualisation (InfoViz) et des interfacesdestinées à mapper de grands ensemblescomplexes de données.La visualisation de grands graphes révèleainsi quelques propriétés structurellesdu web fascinantes. Certains patternsou schèmes organisationnels de ce sys-

A gauche, Etienne Louis Boullée, vue de la nouvelle salle projetée pour l’agrandissement de la Bi-bliothèque Nationale, 1791. A droite, près de 2.000 sites publiés sur le web européen et traitantdes problématiques « science dans la société » (WebAtlas). Le web ne ressemble pas à une biblio-thèque et la logique de distribution de l’information n’épouse pas la rigueur des arborescences oude hiérarchies encyclopédiques. Cette architecture distribuée n’est pourtant pas non plus gouver-née par le hasard et présente des « strong regularities » qu’il faut expérimentalement arriver àdécrire. L’étude des propriétés natives de ces territoires numériques peut permettre d’adapter lestechnologies de search existantes ou de comprendre la nature de certains phénomènes comme lapropagation d’une information ou la constitution de communautés sociales sur le réseau.

Dans certaines conditions, on peut apercevoir le regroupement de certains mots ou expressionsen projetant sous forme de graphe leurs relations statistiques d’occurrence (tel mot apparaît surle web plus souvent avec tel autre). Ici, ont été visualisées en trois dimensions les relations dehiérarchie (grosseur du nœud suivant l’importance du mot dans le corpus) et de proximité (oude « complémentarité » thématique) des expressions principales de près de 27.000 pages consa-crées aux cosmétiques :radicaux libres, principes actifs, cosmétiques naturels, produits cosmé-tiques, produits de soins, peaux sèches, produits de beauté, produits de soin, soins du visage…On peut tirer de là des indicateurs puissants sur la façon dont les internautes s’emparent de cer-taines thématiques, et comment ils le font.

Page 12: Novembre 2008 i-mag

I-MAG - NOVEMBRE 200810

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

tème distribué et ouvert sont aujourd’huiconnus et testés sur des jeux de don-nées variés, d’autres restent à découvrir.Les questions de « couches », de « hau-teur », voire de « profondeur » y tiennentune place déterminante mais aussi« d’orientation » et de « concentration »,comme dans une physique des phéno-mènes magnétiques. Les principes quipermettent de décrire les lois de cettearchitecture documentaire constituée dedizaines de milliards de pages commeceux qui président à la construction de« cartographies du web » reposent surun ensemble d’hypothèses issues de lacommunauté scientifique (essentielle-ment américaine) dès les années 1996-1997. Les notions de « distance », « cen-tralité », « éloignement », « proximité »,« voisinage », « concentration » ou de« couches » s’enracinent dans une sériede travaux orientés vers l’explorationsemi-automatique de l’architecture docu-mentaire du web. Dans ces contributionsrécentes se mêlent aussi bien des ques-tions d’algorithmes de traitement desdonnées que des méthodes d’extractionde l’information via des crawling-sys-tems ou bien encore d’optimisation deprocess déjà existants comme les grandssystèmes YAHOO!, Google ou le projetIBM-Webfountain. Cette lignée de contri-butions théoriques et de comptes-rendusd’expérimentations esquisse une pos-sible géographie générale du système.C’est le cas, en particulier, des travauxde J. Kleinberg sur l’organisation géné-rale des corpus de pages web distribuésen agrégats dotés de « cœurs » où sontconcentrés les meilleurs scores de

Hubs/Authorities. HITS (HypertextInduced Topic Search) a été conçu pourdétecter ces coeurs de ressources à partirde l’analyse de leurs liens réciproques àdes échelles réduites ou moyennes duweb (2). On parle ainsi maintenant cou-ramment « d’agrégats de documentsweb » pour qualifier ce processus deconcentration thématique et hypertex-tuelle à l’œuvre sur le web. Davison(IBM) développe le concept de « topicallocalities » dès 2000 (3) tandis que l’oncommence à explorer la morphologiegénérale du système en 1998 avec lapublication du fameux modèle du web« en nœud papillon » par A. Tomkins etal. (4).Ces premiers travaux pionniersont donné naissance à une famille d’al-gorithmes et de méthodes qui portent

aussi bien sur les techniques d’extrac-tion des données web (crawling systems)que sur leur description (indexation) oubien même leur visualisation (web infor-mation vizualisation).Les questions de topologie documentairesur le web (ou dans les grands systèmescomme certains intranets d’entreprise)occupent donc une place centrale depuislors en termes de recherche et dévelop-pement. La communauté des « explora-teurs du web » est actuellement concen-trée sur deux problématiques essentielles.Celle de la temporalité ou l’étude desphénomènes dynamiques sur le web, àlaquelle a grandement contribué V.-L.Barabasi et son équipe de l’Universitéde Notre-Dame en proposant desmodèles de scénarios évolutifs (5). Deson côté, D. Watts à l’Université deColumbia développe une série d’hypo-thèses sur les scénarios de propagationde l’information dans des grands sys-tèmes comme le web (peut-on modéliserla propagation des virus informatiques ?Celle d’une rumeur sur un réseau deblogs ? Quand et comment un systèmecomme le web vit-il certaines phases cri-tiques de mutation ?...) (6).

Enjeux d’une « géographie de l’information »Les méthodes et les outils de web-map-ping concentrent des enjeux importantsen termes de recherche et d’innovation.On peut les ranger parmi les technolo-gies de knowledge mapping et de know-ledge discovery et incarnent les effortsréalisés par les ingénieurs et les cher-cheurs pour comprendre les règles qui

Des dispositifs expérimentaux d’exploration dynamique de grandes masses de données existent aujourd’hui. Une interface de type cartographique per-met de jouer sur les niveaux de zoom, de visualiser différents niveaux et type de liens entre les documents et, aussi, de tracer l’évolution temporelledu système mappé (ajout/suppression de liens hypertextes parmi ces quelques 2.000 blogs, propagation d’une information via l’indexation des postset commentaires…) sans oublier l’accès direct aux URL. Ici, le site de veille des blogs dédiés aux élections américaines développé par la SAS compiè-gnoise R.T.G.I. (http://presidentialwatch08.com/)

(2) Jon M. Kleinberg, “Authoritative sources in a

hyperlinked environment”, Journal of the

ACM (JACM), Volume 46 , Issue 5 (Septem-

ber 1999)

(3) Brian D. Davison, “Topical locality in the

Web”, Proceedings of the 23rd Annual In-

ternational Conference on Research and De-

velopment in Information Retrieval, SIGIR

2000, ACM-Press.

(4) Ravi Kumar, Prabhakar Raghavan, Sridhar

Rajagopalan, D. Sivakumar, Andrew Tom-

kins, Eli Upfal, “Graph structure in the web:

experiments and models”,

http://www.almaden.ibm.com/webfoun-

tain/publications/../resources/TheWebasa-

Graph.pdf

(5) http://www.nd.edu/~alb/

(6) Duncan Watts, Six Degrees : The Science of

a Connected Age, W. W. Norton & Company;

1st edition (February 2003)

Page 13: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 11

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

gouvernent ce vaste système que l’ondécrivait jusqu’à présent comme com-posé de données « en grandes masses,dynamiques et peu structurées ». Leurpremière valeur est d’ordre expéri-mentale pour les chercheurs : les « vues» du web constituent des modèles desynthèse théorique et des instrumentsde concentration de l’expertise. Maisles cartographies ne sont jamaisstables, non seulement parce qu’ellesévoluent dans le temps, mais aussiparce qu’elles sont numériquementmanipulables. C’est en faisant varier,à partir d’un modèle de départ, les trai-tements sur les données et les typesde visualisation qu’apparaissent les

patterns les plus stables. Pour les scien-tifiques, produire des « formes »visuelles du web c’est donc entrer dansun dialogue intense entre modèlesthéoriques possibles et sessions expé-rimentales de relevé et de traitementdes données : projections graphiquesdes connaissances acquises elles sontaussi comme un concentré des pisteset des hypothèses encore à parcourir.Les cartographies de documents webpeuvent aussi préfigurer de nouvellesméthodes ou de nouveaux algorithmesqui viendront améliorer les systèmesd’information web comme les moteursde recherche. La manifestation visuellede propriétés statistiques de grandscorpus de pages ou de sites permet demettre à jour des contraintes aux-quelles seront confrontées les techno-

logies et les méthodes d’extractioncomme d’indexation de documentsqui se révèlent regroupés en agrégatsthématiques (donc éventuellementd’opinion, de communautés socialesou d’intérêts utilisant chacune leurpropre vocabulaire ou folksonomies…).Au-delà de ces « cœurs » thématiquespeuplés de mots et de liens hyper-textes, à moyenne échelle, les carto-graphies manifestent des lignes de frac-ture entre corpus (boundaries), desniveaux d’inclusion, de complémen-tarité ou de hiérarchie, laissant aper-cevoir les linéaments d’une géographiegénérale de l’information sur le web.En termes d’outils de recherche avan-cés pour l’utilisateur ou de servicespour des experts, elles laissent aussipréfigurer de nouvelles interfaces pourla recherche d’information. En retour,la recherche de patterns dans des don-nées indexées contribue souvent à lavalorisation du patrimoine informa-tionnel des entreprises puisqu’ellesrévèlent souvent des principes d’orga-nisation jusque là implicites, pour toutdire invisibles.Enfin, il paraît évident que les carto-graphies dynamiques de grandesmasses de données web contribuentà l’amélioration des systèmes de veillestratégique et constituent donc ausside puissants outils d’aide à la décision

La construction d’une cartographie ré-clame plusieurs étapes.1. Choix des URL et indexation de leurscontenus et de leurs liens hypertextes ré-ciproques2. Les données sont traitées sous forme dematrices de graphes (nœuds = sites, arcs= liens hypertextes)3. Le graphe est spatialisé dans le logicielGraphiltre. On applique une force auxnoeuds-sites pour qu'ils se repoussenttandis que les arcs-liens les retiennent : legraphe prend forme. 4. Mise en forme graphique : les sites lesplus connectés sont mis en hauteur et ren-dus plus gros. Des couleurs sont choisiespour les différents types de sites. Un anglede vue est choisi pour la « scène 3D ».5. Rendu : La scène contenant le graphe en3D est transformée en image avec Persis-tance of Vision. Les nœuds sont peintscomme des boules transparentes coloréeset les liens comme des rubans pointus.6. En indexant régulièrement les données,on peut ainsi mapper le réseau des adhé-rents à l’APRIL et comparer à différentesétapes l’organisation des données.

Résultats de la requête « abortion » surYAHOO ! spatialisés sous forme degraphes. Alors que dans l’interface du mo-teur les résultats sont affichés par défautsous forme de listes à plat, un graphe desliens hypertextes montre lui des affinitéscommunautaires évidentes : en bleu les «pro-choice » défenseurs du droit à l’avor-tement aux Etats-Unis et, d’un autre côté,les « pro-life » ardents défenseurs du droit« à la vie ». Cette cartographie montre àquel point les documents web sont orga-nisés en agrégats, parfois très compétitifs.

Page 14: Novembre 2008 i-mag

Utilisation des réseaux sémantiques

dans la recherche Web

I-MAG - NOVEMBRE 200812

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Les bases du Web Search

Cela fait plus de 10 ans que les grandsmoteurs de recherche sont apparus surle Web. Une grande partie des efforts aété consacrée à conserver une grandepertinence et fraîcheur des donnéesmalgré une croissance exponentielle desvolumes et l’explosion de la fraude. Mais,en fait, la recherche se fait toujours selonle même principe. On extrait tous lesdocuments qui contiennent les mots-clés de la requête (ou un grand nombrequand ceux-ci sont trop nombreux) eton applique une fonction de pertinenceou « ranking » à chacun d’eux de façon àpouvoir les ordonner. Pour ce faire, on

associe à chaque document un vecteurformé par ses termes pondérés par unevaleur. La formule la plus classique estappelée td.idf pour « term frequency xinverse document frequency »

On considère que plus un terme est fré-quent dans l’index moins il est impor-tant. A noter que cette pondération aété largement révisée car les spammeurscréaient des documents avec un nombreartificiellement élevé de termes de façonà augmenter le « tf » de leur document.Pour mesurer la similarité entre larequête et un document, on calcule lecosinus de l’angle formé par ces deuxvecteurs.

En fait, cette approche pose un pro-blème car deux mots différents sontconsidérés comme des dimensions dif-férentes du modèle et donc orthogo-nales. Par exemple, un document conte-nant UEFA mais pas football ne seradonc pas considéré comme un bonrésultat pour la requête « football ».

Introduction de la sémantique

Depuis plusieurs années les laboratoirestravaillent sur l’introduction d’un peu desémantique dans les moteurs derecherche. On peut distinguer deux typesd’approches : ascendantes et descen-dantes. La première part du documentd’origine et pousse à le compléter avecdes informations qui permettent demieux l’analyser et donc de mieux l’in-dexer. L’autre, à l’inverse, part de larequête en essayant de mieux la com-prendre afin de promouvoir des résul-tats plus pertinents.L’enrichissement des documents paraîten effet une bonne idée. Une proposi-tion appelée micro-formats propose aucréateurs de document HTML d’ajouterdes balises qui ne serviront pas cettefois-ci à modifier l’affichage mais àmieux qualifier le texte qu’elles délimi-tent. Génial ! Seulement voilà, avantd’avoir une couverture suffisante du web,cela va prendre longtemps, très long-temps. Des approches qui s’appuient surun enrichissement automatisé ducontenu semblent donc nécessaires sil’on veut arriver rapidement à unegrande couverture du Web.L’approche descendante qui essaie decomprendre la requête est complémen-taire de la précédente. Premièrement,on essaie de segmenter la requête. Parexemple la requête « restaurant chinoisgrenoble » pourra être découpée suivantle schéma « quoi / où », une fois identifié

Par Gilles VANDELLEDirigeant équipe Search Backend Platform dans le centre de R&D de Yahoo

GGiilllleess NNaaddeellllee dirige l’équipe Search Backend

Platform dans le centre de R&D de Yahoo basé à

Grenoble. Diplômé de l’Ecole Centrale de Paris en

82 il a participé à la création de startups en

France et en Californie. Il travaille dans le domaine

de l’internet depuis 1998 où il s’est spécialisé

sur les techniques de machine learning.

Page 15: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 13

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

que grenoble est bien une ville.Attention, toutefois aux faux amiscomme « crème chantilly».

Représentation des connaissances

Pour effectuer toutes ces analyses, ilest donc nécessaire de disposer devastes bases de connaissances sousforme d’ontologies. Plusieurs projetsexistent dans ce domaine comme, parexemple, le langage OWL du W3C oule projet dbpedia. Mais, la créationd’ontologies pose certains problèmes.Premièrement, le web est un mediavivant et il faut constamment faire desmises à jour. Deuxièmement, uneapproche trop théorique doit se plierà ce qui est communément admisdans la langue courante. Par exemple,une « machine à laver » est un « lavelinge » et non un « lave vaisselle ». Quand on dispose d’une telle base, onpeut améliorer notre système derecherche de documents. Pour chaquedocument, on sélectionne les conceptsqui le représentent le mieux. On fait,de même, avec la requête. Notre fonc-tion de similarité se voit donc enrichiede dimensions qui tiennent, cette fois-ci, compte de la sémantique.

Web mining ou commentapprendre à partir du web

Comme le coût de création et de miseà jour des bases de connaissancedevient vite prohibitif, on a pensé àautomatiser ce processus. De nouvellesapproches permettent de les fabriquerautomatiquement à partir de connais-sances présentes sur le web. Onappelle cela web-mining. C’est undomaine passionnant qui permet d’ex-traire de cette immense source nonstructurée qu’est le Web des donnéesutilisables pour l’analyse sémantique.L’enjeu est immense car il permettrad’appréhender non seulement ladimension multilingue et multicultu-relle du web mais aussi son évolutionrapide. De quoi s’agit-il ? Derrière lagrande idée « extraire des connais-sances du web », on peut différentier

deux familles. La première, extrait desinformations de la structure même de« la toile » en explorant les liens entreles pages et les sites, la seconde s’in-téressant plutôt aux concepts conte-nus dans ces pages.Les liens entre les pages d’un mêmesite et encore plus entre les pages desites différents nous apportent beau-coup d’informations. Le texte (href)porté par ces liens est largement uti-lisé par les moteurs de recherche pourpromouvoir une page lors de l’indexa-tion. Certains vont bien au delà en pro-posant des cartographies thématiquesdu web. Cela permet d’identifier lescourants de pensée, les vecteurs d’in-fluence et leurs évolutions. Il n’est pasétonnant de voir les spécialistes dumarketing se pencher de plus en plussur ces études pour analyser, parexemple, l’image portée par une marque.L’autre approche consiste à bâtir desréseaux de concepts. En premier, il fautassocier à chaque page un certainnombre de concepts représentatifs.Chaque concept est associé à une ouplusieurs listes de mots. Une fois ceciréalisé, on utilise les co-citations ou lescoréférences entre ces concepts pourconstruire le graphe. Le graphe ainsiobtenu porte souvent un grand nombrede défauts dus entre autre à l’ambi-guïté de la langue. Par exemple, « ParisHilton » et « Ville de Paris » risquentd’être reliés par le terme « Paris ». Desanalyses en composantes connexes etle clustering permettent d’éliminer unbon nombre de ces défauts.Les graphes ainsi construits ne sontpas aussi rigoureux que les ontologies

construites par des experts mais repré-sentent bien les relations entre lestermes. La Fig1 donne le graphe fabri-qué pour analyser la requête « UEFA ».

les réseaux sociaux

Certains prévoient déjà le coup suivant.A la base, un constat simple : ce quiest un bon résultat pour moi ne l’estpeut être pas pour quelqu’un d’autre. Ilfaut donc personnaliser les résultats.L’exploitation du profil des utilisateurssemble prometteur seulement voilà, laplupart d’entre nous rechigne àrépondre à des questionnaires plus aumoins longs sur leurs centres d’inté-rêts. Il faut donc trouver des sourcesmoins explicites. Une approche plussournoise consiste à stocker les « clics »et conserver la trace laissée par chacund’entre nous. Ce type d’approche estcontestable d’un point de vue éthiquesauf si l’on agrège les données indivi-duelles au niveau d’un groupe. Nousvoyons donc poindre de plus en plusde solutions basées sur des réseauxsociaux. Des solutions comme deli-cious.com permettent de partager sestags avec la communauté et de mettreen valeur les pages taguées par les per-sonnes de son réseau.Dans les années qui viennent, nousallons voir encore progresser ces tech-niques de recherche d’information nonseulement au niveau du web searchmais également dans les moteurs derecherche spécialisés dans les donnéesde l’entreprise.

fig.1

Page 16: Novembre 2008 i-mag

Web Services et Grid Computing : la nouvelle ère des systèmes distribués

I-MAG - NOVEMBRE 200814

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

S'affranchir du matériel

L'idée d'utiliser les ordinateurs alorsmême qu'ils réalisent déjà une tâcheplus ou moins gourmande et de regrou-per cette puissance grâce à Internet n’estpas nouvelle. Entre 1997 et 2000, lesprojets de calculs distribués Distributed.Net1

(répondre au concours lancé par lasociété RSA pour casser des clés de cryp-tage) ou Seti@Home2 (analyse dessignaux électromagnétiques pour décou-vrir ainsi de la vie extra-terrestre) ontdémontré que le concept était valide.Le rapport coût/puissance des ordina-teurs a continué à évoluer dans un senspositif ces dernières années. Le coûtprincipal des infrastructures n'est doncpas dans le matériel, mais dans tout cequi l'entoure : l'hébergement, le réseau,mais aussi tout ce qui va permettre lasurveillance et la réparation de cesmachines. Ces coûts évoluent en fonc-tion du nombre de machines installées.

Quelques soient les besoins (production,développement et tests, data-mining),les machines ne sont pas utilisées à leurpleine capacité : un site web n’utiliserala pleine puissance de ses serveurs quelors de pics de trafic, les machines dedéveloppement ne fonctionneront quependant les heures de travail ou pour denouvelles versions à tester. Cela pose leproblème de plus en plus sensible del'impact écologique et cela fait enragertout gérant de société voyant qu'unepartie de ses frais fixes ne servent enfait à rien du tout.Il est donc extrêmement important demettre en place des mécanismes per-mettant d'optimiser l'utilisation desmachines en tenant compte du tempsd'utilisation, en ayant la capacitéd'agrandir ou de réduire la voilure demanière souple et rapide.

La virtualisation mise à profit

Les progrès des systèmes de virtualisa-tion sont en partie à l'origine de lamontée en puissance des premièresoffres de Cloud Computing. Dans cedomaine, la technologie open-source Xenest utilisée pour répondre à ce besoinde flexibilité.La société Gandi, connue en tant queDomain Name Registrar, base son offred'hébergement sur cette technologie etles outils qu'elle a développés autour decelle-ci. Gandi vous propose3 de louerdes parts de serveurs puissants et vous

Par Rémy Amouroux,Ensimag 1992, TEOREM - co-fondateur de Kelkoo

Le Grid Computing ou Cloud Computing est le dernier abou-tissement d'une longue évolution d'un concept assez ancien: cela fait référence à l'utilisation de la mémoire et des ca-pacités de calcul des ordinateurs et des serveurs répartisdans le monde entier, et liés par un réseau, tel Internet. Lesutilisateurs de la grille ou du nuage pourraient ainsi dispo-ser d'une puissance informatique considérable et modu-lable.

RRéémmyy AAmmoouurroouuxx est un des co-fondateurs deKelkoo et l'inventeur de la technologie qui en apermis la création. Chez Kelkoo, il a dirigé etorienté le développement d'applications Internets'adressant aussi bien au public qu'à sesclients, jusqu'à l'acquisition de la société parYahoo en 2004. Il est devenu Chief Architectpour l'Europe chez Yahoo, supervisant le déve-loppement d'applications destinées à l'une desplus grosses audiences du Web. En 2008, il acréé Teorem, un cabinet de conseil, afin d'ai-der les entreprises à dépasser les obstaclestechniques empêchant leur croissance.

Page 17: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 15

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

permet de moduler, en fonction decontraintes horaires, le nombre de ser-veurs et le nombre de parts (donc lapuissance) effectivement loués, sansque cette montée en puissance néces-site de redémarrer les applications.L'autre point intéressant de cette offreest l'assurance qu'en cas de problèmesur la machine sur laquelle s'exécutentvos parts, ces dernières sont automa-tiquement transférées sur d'autresmachines avec le moins d'impact pos-sible pour les utilisateurs.Un autre utilisateur de la technologieXen est le système EC24 d'Amazon.L'offre vous permet de créer desimages de votre serveur contenant les

applications et les données qui sontnécessaires à son fonctionnement, touten paramétrant le processeur, lamémoire et le stockage qui leur per-mettront de s'exécuter de manièreoptimale. Une fois l'image créée, il estpossible de la démarrer et elle se com-porte comme un serveur réel. Amazonvous fera payer le temps d'exécution(l'unité étant l'heure) et les transfertsde données entrant et sortant duréseau d’Amazon. A cette modularitédes coûts qu'apprécieront les respon-sables financiers s'ajoutent trois fonc-tionnalités importantes qu'apprécie-ront les concepteurs d'applications.Pouvoir définir des images des serveurs

à l'avance permet de déployer trèsrapidement de nouvelles instances,mais facilite aussi grandement l'auto-matisation de tests. La gestion par webservices du déploiement des imagesrend possible l’automatisation de lataille de la plateforme en fonction desbesoins réels, comme le montre ScalR5.Le service d’Availability Zone, associéau service d'Elastic IP Address, permetde répondre aux besoins de haute dis-ponibilité.Les nombreux services fournis parAmazon sont une première base pours'affranchir des problèmes matérielsmais ils restent au niveau du serveur :le développeur doit toujours concevoirdes applications scalables, résilienteset dont l'architecture est évolutive etmodulaire pour en profiter.

Aller plus loin avec Hadoop6

En Juillet dernier, Yahoo, Hewlett-Packard et Intel ont annoncé l’initia-tive Cloud Computing Test Bed. Chacundes 6 centres de recherches associésau projet aura à sa disposition uneferme de 1000 à 4000 machines afinde procéder à des expériences deCloud Computing. Le matériel serad'origine HP et Intel. Yahoo apporterason savoir-faire autour du projetHadoop. Ce dernier est issu de la fon-dation apache ; il fut créé par DougCutting, le développeur à l'origine duprojet Lucene, pour supporter la dis-tribution dans le moteur de rechercheNutch. Il est composé d’un moteur audessus d’un système de stockage.HDFS (Hadoop Distributed File System)stocke les données sur lesquelles tra-vailleront les applications. Il assure leurdistribution sur plusieurs nœuds et leurhaute disponibilité. Les nœuds utilisentle réseau pour servir des blocs de don-nées et ils se parlent pour assurer unebonne distribution des blocs et assu-rer que leur réplication reste à un hautniveau. Le moteur est une implémen-tation du modèle de programmationMap/Reduce, que Google a présenté en2004 à la conférence OSDI7. C’est unframework, écrit en Java, permettantle traitement distribué de très gros jeux

LLLL EEEE MMMM OOOO TTTT EEEE UUUU RRRR MMMM AAAA PPPP //// RRRR EEEE DDDD UUUU CCCC EEEE

Le mécanisme Map/Reduce demandeaux développeurs de définir un certainnombre de fichiers comme input (ceux-ci étant stockés dans HDFS) et deuxfonctions, l’une pour la phase Map, etl’autre pour la phase Reduce.La phase d’Input du moteur se chargede séparer les fichiers en parts plus oumoins égales et de les affecter à destâches Map.La fonction définie en tant que Mapest exécutée durant cette phase pourtransformer une entrée considéréecomme un ensemble de paires clé-valeur en un autre ensemble de pairesclé-valeur. Par exemple, une ligne delog d’un site web sera considérée

come une seule paire et pourra être transformée en ses différents constituants : IP duclient, page accédée, code http, etc.La phase Shuffle (fournie par Hadoop) trie les paires clé-valeur et les redistribuent versles tâches Reduce. La fonction définie pour cette phase regroupe les paires ayant lamême clé pour en créer de nouvelles. Par exemple, c’est dans cette phase que l’onpourra compter le nombre de hits par seconde dans le cas de l’analyse des logs d’unsite web.La dernière phase est en charge de l’écriture de fichiers de sortie, en général versHDFS.Le moteur est en charge de créer et de distribuer les tâches sur le cluster utilisé. Pardéfaut, il crée autant de tâches Map qu’il y a de blocs HDFS à traiter, mais cela peut êtrecontrôlé si l’on définit la taille minimale de partition des fichiers. Le nombre de tâchesReduce dépend de la taille des données à traiter bien sûr, mais le moteur va essayerd’utiliser le plus possible de nœuds disponibles dans le cluster.

Page 18: Novembre 2008 i-mag

I-MAG - NOVEMBRE 200816

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

de données, vus comme des ensemblesde paires clé-valeur (voir l’encadré).Map/Reduce est un modèle de pro-grammation simple utilisé pour résoudrede nombreux problèmes. Le traitementde fichiers log de toutes sortes vientnaturellement à l’esprit, mais le projetNutch a démontré que ce modèle étaitaussi très utile dans le cadre d’un moteurde recherche. C’est aussi un modèle audessus duquel il est possible deconstruire des modèles plus complexes(voir l’encadré sur PIG). Bien qu’écrit

en Java, le framework permet d’utiliserdes logiciels externes au travers de sesAPIs dites de Streaming. L’un des avan-tages d’Hadoop est qu’il connaît l’em-placement des données dans HDFS eten tient compte dans la distribution destâches sur les machines. Il est aussicapable dans sa gestion des tâches deré-exécuter celles qui ont pu avoir unproblème. De plus, sachant que dans uncluster les machines ne sont jamais com-plètement homogènes, le framework vautiliser la puissance disponible pour exé-

cuter la même tâche plusieurs fois, etutiliser le résultat de celle qui se finit enpremier et interrompre les autres.

l’avenir est aux applicationsdistribuées

L’un des points forts de ce que TimO’Reilly a appelé le Web 2.0 est la pro-lifération des interfaces de programma-tions pour des services web. Ceux-ci ontmis à la disposition des développeursde nombreux services réutilisables, et

PPPP IIII GGGG :::: LLLL AAAA RRRR GGGG EEEE ---- SSSS CCCC AAAA LLLL EEEE DDDD AAAA TTTT AAAA AAAA NNNN AAAA LLLL YYYY SSSS IIII SSSS8888

Pig est un environnement de programmation four-nissant aux développeurs un langage de haut niveau(Pig Latin) pour exprimer des traitements de don-nées. Une fois un programme écrit, il peut être com-pilé et être exécuté sur un cluster Hadoop. Pig Latinest présenté comme étant à Hadoop ce que SQL estaux bases relationnelles. Un de ses points forts estque sa structure est très facilement parallélisable,tout en laissant cet aspect de la programmationcomplètement transparent pour le développeur. Ilsimplifie aussi la vie du développeur en lui permet-tant de définir en un seul programme ce qui cor-respond à plusieurs itérations map-reduce. Si l’on cherche, par exemple, à partir des deux tablesQuery Results et Pages (voir ci-dessus) quelles sontles requêtes pour lesquelles la page de plus hautPageRank n’apparaît pas dans les cinq premiersrésultats, le résultat Map-Reduce devra avoir deuxitérations (voir ci-dessous), ce qui implique au mini-mum quatre classes Java plus ou moins complexes,plus la coordination de l’exécution de ces deux ité-rations.Cela s’écrira en Pig Latin de la manière ci-après,sous une forme à la fois procédurale et déclarative.Nous avons là avant tout une suite de transforma-tions facilitées par les opérateurs et les fonctionsfournis par cet environnement.Il est à noter que le modèle de données est assezévolué (bien plus que de simples paires clé-valeur)et que les fonctions disponibles sont assez com-plètes (opérations mathématiques, mais aussisomme, moyenne, etc) et qu’il est possible d’insé-rer ses propres fonctions dans le système. Il est trèsintéressant de voir aussi que la traduction de requêteSQL en Pig Latin est somme toute assez facile.

Page 19: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 17

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

en conjonction avec les techniquesAJAX, nous avons vu l’apparition denombreux mash-up combinant ces dif-férents services pour en créer de nou-veaux. Il est maintenant inimaginabled’avoir son propre système de carto-graphie pour un site web : on utiliseranaturellement l’un des fournisseursexistants comme Mappy, Google ouYahoo, services dont l’intégration surun site est extrêmement aisée.Cette approche de la conception d’ap-plications Internet amène à la distri-bution sur plusieurs plateformes de cequi compose réellement le servicerendu à l’utilisateur final, celui-cin’ayant plus aucune notion de ce quiest exécuté sur sa propre machine, surles machines du site auquel il accèdeou sur les machines de fournisseurs decelui-ci.Les offres de Grid Computing associéesaux technologies permettant la distri-bution d’une application au traversd’Internet vont encore accentuer la

dématérialisation et la virtualisationde celle-ci. Elles vont abaisser encore labarrière à l’entrée pour tous les déve-loppeurs ayant des idées innovantes à

réaliser et à faire partager, ce quiouvrira une nouvelle ère d’opportunitéstrès intéressantes. ❃

INDEX1. Distributed.Net : projet de calcul distribué, http://www.distributed.net/2. Seti@Home : projet de calcul distribué,

http://setiathome.berkeley.edu/index.php3. Gandi Hébergement avec Xen : https://www.gandi.net/heberge-

ment/offre/xen/4. Amazon Elastic Compute Cloud : http://aws.amazon.com/ec2/5. Scalr : http://code.google.com/p/scalr/ et https://scalr.net6. Apache Hadoop : http://hadoop.apache.org/7. MapReduce: Simplified Data Processing on Large Clusters _par Jef-

frey Dean et Sanjay Ghemawat,http://labs.google.com/papers/mapreduce.html

8. Pig, a language for large data analysis,http://incubator.apache.org/pig/

Page 20: Novembre 2008 i-mag

Le vote par Internet : quel avenir ?

I-MAG - NOVEMBRE 200818

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Le vote par Internet

Pour voter, l’usage classique est de serendre dans l’école primaire la plusproche de son domicile, d’aller dans l’iso-loir, de mettre dans l’enveloppe le bul-

letin de son choix, puis de mettre le toutdans l’urne en plastique transparent,tout en ayant décliné son identité etsigné la liste d’émargement. Cette moda-lité de vote est nommée « vote physiqueà l’urne ».Maintenant, avec la dématérialisationde l’information, d’autres modalités exis-tent :• Le vote avec boîtier électronique (utilisépar exemple lors des dernières électionsmunicipales dans certaines communes)• Le vote par correspondance papier• Le vote par téléphone, avec l’usaged’un serveur vocal interactif• Et enfin, le vote par InternetDe plus, le vote par Internet est souventutilisé avec d’autres modalités de vote,notamment le vote par correspondance.Cette mixité des canaux permet d’aug-menter les taux de participation enréduisant toute discrimination sur l’usagede l’outil informatique.

Pour quelles élections ?

Le vote par internet s’adresse à une largevariété d’élections tel que par exemple :• L’élection de vos représentants aux

comités d’entreprises et vos déléguésdu personnel au sein de votre entreprise• La désignation des résolutions enassemblée générale• L’élection de vos représentants régio-nauxPar contre, le vote par Internet n’a pasvocation à gérer les votes politiques ense substituant au vote physique, car cer-taines obligations électorales (présencede l’isoloir, authentification forte del’électeur, …) ne peuvent être mises enœuvre dans un budget raisonnable.

Les technologies utilisées

Le vote par Internet met en jeu de nom-breuses technologies, qui impactent tousles niveaux d’architecture du systèmed’information, tant applicatif, que logicielou matériel.Les principales technologies utiliséessont :• Chiffrements pour la protection de la

confidentialité (RSA par exemple)• Empreinte de code et fonction de hash

(SHA-1)• Signature électronique et authentifi-

cation à base de certificat• Redondance matérielle pour la haute

disponibilité• Protocole de transport sécurisé (SSL

par exemple)•Cloisonnement applicatif et matérieldes données

...

Par Benoit ChenonEnsimag 1986 Co-fondateur de la Société Voxaly

Le vote électronique, les boîtiers électroniques, le vote parInternet : tout le monde en parle, chacun a son mot à dire.Mais précisément de quoi parle-t-on ? Quelles sont les élec-tions concernées ? Quelles sont les techniques utilisées etpourquoi ? Quels sont ses avantages ? Comment réussir ?

BBeennooiitt CChheennoonn, Ensimag 1986, fut Architecte senior chez Atos Originpuis Capgemini, sur de grands projets nationaux,spécialisé dans la sécurité des SI et les architec-tures SOA (Architecture Orientée Service). A ce titre,il participa à la mise en place des premières élec-tions par Internet en 2000 dans le monde bancaire.Co-fondateur de la société VOXALY en 2006, il estactuellement Directeur des Systèmes d’Informationset responsable du pôle recherche et développementchez VOXALY. Au sein de la Fédération Nationale desTiers de Confiance (FNTC), Il anime le groupe de tra-vail sur le vote électronique par Internet.

Page 21: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 19

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Des avantages certains

Le vote par Internet propose de nom-breux avantages :• simplifie la mise en place des élec-

tions pour l’organisateur en regrou-pant dans une unique urne virtuellel’ensemble des différents bureaux devote,

• est accessible de partout, et à toute heure,• accélère le dépouillement tout en

garantissant la parfaite exactitudedes résultats,

• apporte une grande souplesse sur ladurée du scrutin en permettant d’éta-ler des scrutins sur plusieurs semaines,voire plusieurs mois,

• réduit les coûts, tant au niveau del’organisation que sur les matièrespremières et l’affranchissement,

• et ainsi participe au développementdurable.

Par rapport au vote par téléphone, levote par Internet • apporte des niveaux de sécurité supé-

rieurs,• offre une ergonomie évoluée et plus

intuitive,

• et en contrepartie, nécessite un équi-pement plus coûteux et la maîtrise,même minime, d’un ordinateur.

Des freins pour le vote par Internet ?Oui, pour le moment le principal freinest la confiance à démontrer auprèsde l’électeur et des organisateurs.

Un avenir prometteur

La conception et la mise en place d’unsystème de vote par Internet est uneorganisation longue, onéreuse et com-plexe, faisant intervenir un grandnombre d’acteurs et de prestataires etmettant en jeu des technologies poin-tues. Par rapport à la « simple urne en plas-tique transparent», une telle complexitésoulève davantage de doute, et peutêtre le siège de failles potentielles, d’er-reurs ou de malversations. Comment alors garantir la sincérité desrésultats ?Heureusement pour l’électeur et l’or-ganisateur d’élection, il existe doréna-vant un cadre législatif qui détaille lesnombreuses exigences auxquelles doit

répondre un tel système de vote parInternet.De plus, la Commission NationaleInformatique et Liberté (CNIL) a émisde nombreuses recommandationsaussi bien au niveau organisationnelqu’au niveau applicatif et technique.Ainsi, le respect de ses différentesrecommandations, la définition pré-cise des rôles de chacun et une exper-tise du système de vote dans sonensemble (pas uniquement de la partieinformatique mais incluant aussi l’or-ganisation et les processus) par unorganisme tiers indépendant du pres-tataire permet d’atteindre un niveaude sécurité en conformité avec le codeélectoral et d’apporter la confiancenécessaire.Telles sont les conditions indispen-sables pour réussir une opération devote par Internet.Un prestataire répondant à tous cescritères est un Electionneur ®. Un tellabel garantit le succès des opérationsélectorales, dans une enveloppe bud-gétaire attractive.

Page 22: Novembre 2008 i-mag

Crédit de particulier à particulierL’argent sans la banque ?

20

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Quand les réseaux sociauxinvestissent la finance

l’Internaute veut ses finances enligne …Les services bancaires de base sontparmi les plus utilisés sur Internet. Au-jourd’hui, l’Internaute veut aller plusloin comme le montre le succès des de-mandes de crédit en ligne. Les établis-sements financiers s’adaptent à cettenouvelle demande mais peinent àprendre en compte un besoin plus hu-main d’implication que permettent lesplateformes de réseau social (Face-book). Le monde du financement de

projets personnels n’échappe pas à lavague.… Mais aussi s’impliquer dansles projetsLes investisseurs/prêteurs éprouvent lebesoin de donner un sens humain àleur investissement (fonds éthiques,écologiques). Cependant, les produitsproposés par les institutions finan-cières classiques répondent mal à unenouvelle demande: prêter à des per-sonnes réelles que l’on peut voir, donton peut suivre le projet… De nouveauxentrants du monde de la finance sur-fent sur cette tendance pour offrir desservices qui bousculent le monde ducrédit.

Principe du crédit entreparticuliers sur Internet

Le prêt réinventé ?Le crédit entre particuliers est une pra-tique vieille comme le monde. Prêts fa-miliaux, prêts au sein d’une commu-nauté, ce mode de financement estpratique mais n’offre pas le même ni-veau de sécurité que celui d’un prêtbancaire classique. Les services de cré-

par Marc DulebaEnsimag 1984 - Analyste ebusiness chez LCL

Le crédit P2P paraît anecdotique dans le contexte actuel.

Cette crise financière brutale révèle la fracture entre une

élite qui joue de mécanismes économiques sophistiqués et

une population désorientée devant leur complexité. Saurons

nous en tirer la leçon et construire un monde économique

viable et compréhensible de tout un chacun ?

Crédit P2P n’est pas micro financeLe crédit P2P diffère de la Micro Finance qui a une vocation plus sociale. Le créditP2P est un crédit classique pouvant financer n’importe quel type de projet (jusqu’àquelques milliers d’euros sur quelques années), alors que La micro finance estl'offre de services financiers basiques à des pauvres qui n'ont pas accès au sys-tème bancaire classique, leur permettant ainsi d'améliorer leurs conditions de vie :les prêts consentis sont de l’ordre de 10 euros sur 6 à 12 mois. (d’après www.baby-loan.org)

I-MAG - NOVEMBRE 2008

MMaarrcc DDuulleebbaa

Du développement de logiciels telecom au marketing

Internet en passant par la direction de projets, je suis

aujourd'hui analyste ebusiness chez LCL, en charge

de l'innovation et des nouveaux usages de la Banque sur

Internet. J'observe et analyse les innovations techno-

logiques et les tendances sociétales dans cet univers en

perpétuelle évolution. J'anime aussi un club de foot

pour les jeunes un samedi sur deux. « L'important

n'est pas d'être sur le palet mais là où le palet sera «

Proverbe de Hockey Suédois.

Page 23: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 21

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

dit P2P mettent en relation des em-prunteurs et des prêteurs via un siteweb spécialisé qui permet de :• Proposer des taux attractifs pour

l’emprunteur et le prêteur• Simplifier les formalités (mettre en

place le crédit, les prélèvements, lesremboursements)

• Limiter les intermédiaires et lesfrais (e.g. supprimer l’intermédiairede la banque)

Le montant et le taux du prêt est (oupeut être) déterminé par un systèmed’enchères. Le prêt est généralementétabli entre un emprunteur et un en-semble de prêteurs afin de minimiserle risque de non recouvrement. Leservice de crédit P2P se rémunère viaune commission sur les transactions(en pourcentage du montant em-prunté).Suivons le parcours de l’emprunteuret du prêteur sur une plateforme decrédit P2P.

Vous êtes emprunteur ? Décrivez votre projet

1. Vous, emprun-teur, décrivezvotre projet enprécisant l’objec-tif, le montantdemandé, le tauxd’intérêt maxi-mal que vous ac-ceptez de payer.Les informationscomplémentairessur vos revenus,votre anciennetésur le site ouvotre taux d’en-dettement per-mettront de ras-

surer un prêteur potentiel sur votrecapacité à rembourser cet emprunt. 2. La plate-forme analyse le marchédes prêts et détermine quels prêtssont les mieux adaptés à votre offred’emprunt. Si des prêts sont suscep-tibles de coïncider avec votre offred’emprunt, la plate forme vous pré-vient. 3. Vous choisissez quels prêts voussouhaitez prendre et envoyez uneconfirmation. Le prêteur est alorsprévenu et confirme ou non votreoffre. Une barre de progression vouspermet de visualiser l’état d’avance-ment du projet en fonction des pro-positions des prêteurs. Le projet estprésenté pour une durée limitée àquelques jours et peut déboucher ounon sur une offre de prêt. 4. Lorsque le montant des proposi-tions de prêt atteint la somme quevous demandez, le contrat de prêt estsigné, les paiements associés sontmis en place.

Vous êtes prêteur ? Choisissez votreinvestissementSur la plate forme,vous, prêteur/inves-tisseur, élisez vos pro-jets :1. Vous parcourez laliste des projets etvous choisissez ceuxdans lesquels vousvoulez investir en

fonction de la nature du projet, de lasituation financière des emprunteurs,du taux qu’ils souhaitent obtenir ainsique de leur score de crédit.2. Vous faites une offre, si vous pensezque l’emprunteur peut rembourser soncrédit. vous choisissez alors le mon-tant à prêter ainsi que le taux de rému-nération de votre placement. Ne soyezpas trop gourmand sinon votre offren’aboutira pas.3. Les offres de prêt qui proposent letaux le plus bas sont sélectionnées àla date de fin fixée pour le projet quidure de 5 à 10 jours. S’il n’y a pasassez d’offres pour couvrir le montantdu projet, le prêt ne se fera pas.4. Une fois votre argent ainsi placé,vous pouvez voir quelle somme vousprêtez et à qui, ainsi que la somme quireste à investir.Vous reversez une commissionannuelle de l’ordre de 1% du montantinvesti via le service P2P.

Pour mieux emprunter, groupez-vous !Certains services de crédit P2P per-mettent de définir des communautésd’emprunteurs (ex : étudiants asia-tiques de Californie ou les femmesentrepreneurs de Seattle) et ainsi defaire bénéficier leurs membres d’unemeilleure note de réputation qui estsynonyme de confiance accrue dansl’emprunteur et donc un taux plusavantageux pour ce dernier.Les facteurs déterminants pour la réus-site d’un projet de prêt sont, dansl’ordre décroissant (cf. [5]) : la note decrédit, les informations personnellesdétaillées (sources de revenus, budgetmensuel) l’explication claire du projetet enfin l’appartenance à un grouped’emprunteurs et la note de réputationassociée.

Mais comment gérer le risque ?Ces plates-formes sont séduisantespour les investisseurs (meilleure rému-nération) et les emprunteurs (meilleurtaux d’intérêt), cependant rien negarantit au prêteur qu’il sera entière-ment remboursé ! Le prêteur porte entièrement le risque.

Page 24: Novembre 2008 i-mag

I-MAG - NOVEMBRE 200822

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

La plate-forme n’est qu’un intermé-diaire. Pourtant le taux de défaillance(non paiement) est très faible.Pourquoi ? Les plates- formes nesont, contrairement à la légende, pasouvertes aux mauvais payeurs ! Ellessélectionnent les emprunteurs ayantun bon score FICO (obligatoire auxUSA). De plus, la pression des « pairs» (via les groupes entre autres) induitune plus grande responsabilisationde l’emprunteur.

Premier retour d’expérience

• …Où les banques s’invitentZOPA a démarré son service aux USAen s’alliant à 5 Credit Unions (banquemutualiste étasunienne) pour distri-buer leurs certificats de dépôt. En choi-sissant de se démarquer du modèleclassique du leader PROSPER, ZOPAUSA parie sur un modèle d’affaire hy-bride puisqu’il s’agit de proposer desproduits garantis mais en servant untaux de rémunération plus faible. Cettesymbiose entre banques tradition-nelles et nouveaux entrants introduitune déclinaison intéressante du mo-dèle. En Europe, ABN AMRO, une desprincipales banques des Pays Bas vientde proposer un service de crédit P2P(offline) à ses clients.• … Quelques ratés …Lending Club (USA) a arrêté temporai-rement ses activités après un an, fauted’être profitable. IOU Central (Canada)a du suspendre ses activités pour seconformer à la législation locale. Cestoussotements sont inévitables dans l’ex-ploration d’un nouveau marché. Mais,dans le même temps, ZOPA etPROSPER ont doublé le nombre deleurs abonnés avec, il est vrai, unemodeste croissance des prêts(+15%), car à peine 10% des pro-jets de prêt se concrétisent (cf. [8]).• … Mais une solidité du modèleL’épreuve de la crise des crédits hypo-thécaires (subprimes) a conduit lesbanques à resserrer leur offre decrédit et pourtant les plates-formesP2P n’ont pas connu de défaillancemajeure. Si la forme et les variantesdu modèle peuvent encore évoluer,

le cœur du principe semble solide.

Une offre très diversifiéeLes plates-formes de crédit P2P cou-vrent un spectre très large allant de laplate-forme à but non lucratif (projetshumanitaires de KIVA par exemple)aux plates-formes mercantiles commePROSPER ou ZOPA qui sont adossées àdes fonds de Capital Risque bienconnus. Leur management est issu dumonde de l’Internet et de la Finance.Certaines plates-formes favorisent lecontact entre leurs membres en les in-citant à créer une communauté, alorsque d’autres préfèrent se présentercomme un service neutre et anonymed’investissement et de prêt.

L’Europe et la France à l’abri? L’Europe commence à être investie :ZOPA est présent en Grande Bretagneet Italie, Boober aux Pays Bas. Mais lemarché français possède des spécifici-tés qui le rendront difficile à pénétrer :

1. La réglementation Française ac-tuelle est un obstacle : seuls desétablissements de crédit peuventeffectuer des opérations debanques à titre habituel (Code mo-nétaire et financier). Le prêt entreparticuliers est très encadré enFrance.2. Les Français sont peu endettéset peu appétant au crédit (2 foismoins que la moyenne Européenne)([2] et [3]).3. Le marché est très concurrentiel,les taux sont faibles (les taux d’in-térêt proposés aux USA par cer-

tains établissements de crédit sont in-imaginables en France : ils dépassentle taux de l’usure!).4. La notation systématique de l’em-prunteur (score FICO) n’a pas d’équi-valent en France où seuls les défauts decrédit sont notés. Or c’est un élémentdéterminant pour la plate-forme.Mais le contexte réglementaire Euro-péen est en pleine évolution et un telservice apparaîtra tôt ou tard en Franceen s’adaptant aux spécificités nationales.

Un marché naissant qui seconstruit

Plus de 20 services de crédit P2P sontopérationnels dans le monde en 2008et plusieurs lancements sont prévus pour2008/2009 (CommunityLend parexemple). PROSPER, le leader aux USAtraite $100 millions de prêts personnels.Selon le cabinet Celent cette forme decrédit devrait représenter 10% dumarché bancaire en 2010 : Un marché

prometteur mais encore naissant. Les opérateurs de crédit P2P consti-tuent-ils une menace pour lesbanques traditionnelles ? Oui, si lesbanques n’évoluent pas. Les plates-formes de crédit P2P vont proba-blement grignoter le marché des cré-dits de « petit » montant. Pour desinstitutions financières agiles, lecrédit P2P constitue une opportu-nité d’élargissement de services.Innovation de rupture, ces servicesde crédit P2P peuvent déplacer lesfrontières du marché du crédit enrééquilibrant le pouvoir en faveur du

Page 25: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 23

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

consommateur… Mais si des acteursindépendants prospèrent et prennentun poids significatif, cela ne risque-t-il pas de poser un problème de régu-lation ?

Références

[1] « Financial Services 2.0 », DeutscheBank Research, aout 2006

[2] « L’accès des ménages au créditen France «, Rapport du Sénat,Joël Bourdin, mars 2006

[3] « Le marché du crédit à la consom-mation en Europe », SOFINCO,Nicolas Pecourt, juillet 2007

[4] « Peer-to-peer lending, Crunchlesscredit » The Economist, Oct 25th2007

[5] « The democratization of perso-nal consumer loans ?.. »M.Herzenstein, R.L.Andrews,U.M.Dholakia, E.Lyandres,University of Delaware, Rice

TH È M E D U P RO C H A I N N U M É RO

Green ITRédacteur :

Georges Allemand, Ensimag 1986,

Directeur de projet, AtosOrigin

Page 26: Novembre 2008 i-mag

I-MAG - NOVEMBRE 200824

Wikio est un portail d'information de nouvelle génération, et unservice shopping associé. Basé sur la technologie RSS (Real Simple Syndication), et desalgorithmes sémantiques (analyse de texte par extraction deconcepts), Wikio facilite la navigation dans les informations pro-duites par les medias et les meilleurs blogs.Seuls les blogs de qualité sont indexés par Wikio, et la totalitédes médias. Le service s'adresse au grand public autant qu'auxinternautes avancés, gros consommateurs d'information.Grâce à sa technologie d'analyse sémantique et d'analyse desliens hypertextes, Wikio fait ressortir automatiquement les ten-dances des informations, des discussions blogosphèriques, ouencore les vidéos ou les produits les plus buzzés sur Internet.Wikio comporte aussi un moteur de recherche spécialisé pourla recherche d'informations dans les blogs, les medias, les vidéoset les produits. Pour les internautes désireux de publier un article directement(tout le monde n'a pas un blog), le site dispose aussi d'une pla-teforme de publication collective. Enfin, le classement des blogs les plus influents publié par Wikiofait référence dans la blogosphère (c'est un excellent moyen dedécouvrir le monde des blogs!).

Des technologies avancées ren-dues accessibles pour tous

Wikio, dont l'index est constitué par les flux RSS des medias etdes blogs référencés, propose un lecteur de flux RSS débarrasséde toute complexité technique: pour recevoir automatiquementle flux d'informations d'un media ou d'un blog, il suffit de cliquersur le lien 's'abonner' placé sous le titre de n'importe quel article.L’abonnement est gratuit bien sûr. De même, vous pouvez rece-voir toutes les informations publiées sur un sujet particulier quivous intéresse, (faites une recherche sur le mot clé correspon-

dant, puis cliquez sur le bouton “s'abonner”) Vous créez ainsides pages d'informations personnelles, pour suivre en perma-nence les sujets ou les sources qui vous intéressent. Cette notion de personnalisation de l'information va plus loin:des pages personnelles d'information plus sophistiquées peu-vent être crées sur n'importe quel sujet, avec l'assistance d'unsystème de suggestions dynamiques.

Shopping: agrégation de toutes lesinformations sur les produits

Les technologies développées pour l'analyse de l'informationpermettent aussi à Wikio d'offrir un service shopping très utilepour le consommateur, en agrégeant toutes les informations dis-ponibles sur le Net sur chaque produit: articles, tests, avis deconsommateurs, photos du produit, vidéos, et bien sûr offresdes marchands en ligne. Ce service shopping complète le modèleéconomique de Wikio. Une entreprise dans le secteur de l'infor-mation comme Wikio ne peut pas vivre que de l'information ...En effet, la publicité ne rapporte pas assez, car le service - entiè-rement gratuit, et produit en 5 langues - est coûteux à produire,avec une équipe de 35 personnes. Il faut des services associéscomme le shopping pour rentabiliser l'investissement.

Une ambition européenne, voiremondiale

A peine plus de deux ans après son lancement, Wikio est déjà uti-lisé par 3 millions de français (www.Wikio.fr) et le double d'eu-ropéens. Un site américain a également été lancé. Le Web 2.0permet à de jeunes entreprises Internet de se développer àl'échelle internationale, et le secteur de l'information qu'a choisiWikio est sans aucun doute l'un de ceux où il y a le plus à inven-ter.

S’il est un entrepreneur français symbole de l’internet, c’est bien Pierre Chappaz,cofondateur de Kelkoo et ardent défenseur du web 2.0 sur son blog, qui figure ré-gulièrement dans le top 20 français. Wikio, le service d’information qu’il a créé,est un exemple parfait d’application au quotidien des principes du web 2.0, quipeut être vu comme une plateforme informatique à part entière, fournissant desapplications web aux utilisateurs, à travers des technologies mûres que se sont ap-propriées les développeurs, en particulier de RSS. Dans ce court article, Pierrenous donne un peu plus de détails sur ce service. Jean-Marc Darrigol.

Wikio, un portail d'information 2.0par Pierre Chappaz, centralien, fondateur de Kelkoo puis de Wikio

Page 27: Novembre 2008 i-mag
Page 28: Novembre 2008 i-mag

L’Internet mobile

I-MAG - NOVEMBRE 200826

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Evolution technique de l’Internetmobile !

Il y a bientôt une dizaine d’années,malgré des terminaux monochromeset une navigation via des pages WAPformatées pour de tous petits écrans,nombreux étaient ceux qui pariaientsur un développement rapide et géné-ralisé de l’accès aux informations etaux sites mobiles depuis son télé-phone. Dans les faits, les limitations enperformance et les coûts ont généré denombreuses déceptions et une adop-tion plus lente et moins massive queprévue. On retiendra tout de même lesuccès de l’i-mode, extrêmement po-pulaire au japon et qui a trouvé son pu-blic également en Europe.Au fil des années, les paramètres del’internet mobile ont changé, et toutsemble maintenant réuni pour quel’adoption aille en s’accélérant. Pours’en rendre compte, un témoin emblé-matique de ce changement est apparu

en 2007, il s’agit de l’iPhone. Avec ceterminal et ses forfaits associés, Appleet les opérateurs n’ont pas inventé l’in-ternet mobile, mais cela a incarné etincontestablement accéléré le change-ment qui s’opérait dans ce domaine.Ainsi, la limitation liée au terminal lui-même est en train d’être réduite peu àpeu au fur et à mesure des progrès surles résolutions d’écran, sur l’interfaceutilisateur (via les écrans tactiles et cla-viers miniaturisés) et enfin sur laconsommation électrique. Les smart-phones, qui ont remplacé les PDA pourl’accès mobile à Internet, proposentdes écrans d’une dimension et d’unerésolution croissante. Des résolutionsde 320 x 240 pixels voire VGA (640 x480) ne sont plus rares. Il devient ainsipossible d’afficher à l’écran de manièrelisible une portion d’une page Internetstandard, voire une page complète.L’iPhone (résolution de 320 x 480) a luiproposé le premier navigateur embar-qué (Safari) qui soit capable d’afficher

Par Laurent GatignolEnsimag 1994 - Directeur exécutif de Kelkoo France

L’Internet mobile, à savoir l’accès au réseau Internet depuis un terminal autre qu’une ma-chine type PC et via une liaison non fixe, a fait naître à la fin des années 90 et au début desannées 2000 de grands espoirs puis des déceptions. Aujourd’hui, on est loin des prémisses etpromesses, les liaisons proposent un débit en constante augmentation et les terminaux sontde plus en plus sophistiqués, à l’image de l’iPhone d’Apple, emblème de cette évolution.En pa-rallèle, les services associés devront suivre l’évolution des terminaux et des débits et s’adap-ter à de nouveaux usages pour le mobile connecté.

LLaauurreenntt GGaattiiggnnoollPassionné de mobilité et éditeur de plusieurs blogset sites web dans le domaine, Laurent Gatignol, fraî-chement diplômé de l’Ensimag en 1994, débute sacarrière chez Microsoft France avant de rejoindrele département Télécom de Sema Group où il assurela direction de projets notamment pour FranceTélécom.Arrivé en 2000 chez Kelkoo France, il prend encharge la direction technique France, lance les sitesBelges, il travaille plus récemment à la stratégieeuropéenne des équipes de développements locales,lance le service Kelkoo mobile en 2007 en Francepuis en 2008 en Europe. Laurent est désormaisDirecteur Exécutif de Kelkoo France.

Page 29: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 27

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

une page web complète avec unecompatibilité HTML semblable à celled’un navigateur bureautique type In-ternet Explorer ou Firefox. Mieux en-core, il permet un zoom rapide surune portion de la page, nécessairepour la lisibilité sur un terminal detaille réduite et est compatible avecles technologies regroupées sous leterme Ajax, utilisées sur les sites webrécents (web 2.0). Cela permet l’utili-sation de Webapps, véritables appli-cations connectées, proposant uneinterface riche et ne nécessitant pasde recharger la page. D’autres naviga-teurs empruntent une voie semblableen terme de visualisation, citons no-tamment Opera mobile sous Win-dows Mobile et Nokia S60. Pour l’in-ternaute, c’est la garantie d’un accèsà l’ensemble des sites Internet. Pourles éditeurs de sites, cela signifie queleur site standard est lisible par desterminaux mobiles, là où auparavantune version dédiée devait être pré-vue, augmentant les coûts, les ver-sions et la maintenance.L’autre limitation concernait la fai-blesse des débits de données et doncle temps d’attente engendré pourl’utilisateur. Pour pouvoir afficher despages de sites standards, il est vital dedisposer d’un débit suffisant. Après leGPRS puis le Edge(2G), le lancementdes réseaux de troisième génération(3G /UMTSet 3G+/ HSPDA), capablesd’atteindre des débits de plusieursMbit/s, offrent désormais le cadretechnique suffisant pour un véritableconfort d’utilisation de l’Internet mo-bile. En parallèle, les terminaux sontde plus en plus équipés de la techno-logie sans-fil WiFi.Mais l’aspect technique n’est pas suf-fisant, restait en effet le paramètre ducoût de connexion. Pour faire uneanalogie avec l’Internet fixe : qui n’apas apprécié le passage d’un Internetpar liaison téléphonique RTC, facturésouvent à la minute de connexion, àl’ADSL ou la connexion devenait illi-mitée et permanente ? Le mêmechangement est en cours pour lesconnexions mobiles. Les forfaits pro-posant du ‘data illimité’, selon le jar-

gon des opérateurs, sont en train dese généraliser. En France, SFR avecles forfaits Illimythics, mais égale-ment Orange avec ses forfaits iPhone(qui a été l’un des premiers termi-naux commercialisé aux Etats-Unisavec un forfait données illimitées) of-frent la possibilité d’être connecté enpermanence à Internet via son télé-phone mobile, pour un surcoûtd’abonnement forfaitaire et non plusfacturé à la quantité de donnéeséchangées.

Mixez un débit conséquent, uneconnexion permanente et des termi-naux offrant un confort d’utilisationet de visualisation suffisant, et vousavez l’environnement parfait pourl’adoption croissante de l’Internetmobile. Reste à savoir ce que les utili-sateurs attendent et ce que les opéra-teurs et les éditeurs de sites peuventproposer

Usage de l’Internet mobile

IDC compte en 2008 pas moins de546 millions d’utilisateurs de mobilesconnectés à Internet, soit le doublede 2006. En 2012, le nombre de mo-biles connectés à Internet sera supé-rieur au nombre d’ordinateurs per-sonnels connectés. Il est alors légi-time de se poser la question de ceque font et feront les « mobinautes ».Les usages du mobile dans le grandpublic sont actuellement liés à la re-cherche d’information : actualité,sport, météo, bourse. On trouve doncdes moteurs spécialisés pour mobile,édités par les grands de la recherche

mondiale que sont Google (avec desversions mobiles de ses services) ,Ya-hoo ! (avec OneSearch) ou MSN. Laconsultation d’email et la messagerieinstantanée figurent également dansles usages les plus développés actuel-lement.Les tendances générales de l’Internet« classique » devraient égalementavoir leur équivalent sur le mobile.Ainsi, le « m-commerce », encore peudéveloppé faute de sites marchandscompatibles, devrait progresser,poussé par des terminaux perfor-mants permettant de surfer et d’ache-ter depuis son mobile mais égale-ment par le développement croissantdu nombre de sites marchands adap-tés à l’utilisation depuis un mobile.En 2007, ce sont plusieurs sites e-commerce français d’importance quiont lancé une déclinaison mobile deleur site : Voyages-sncf, Alapage, Fnacou encore Kelkoo.La dimension sociale du web actuel(web dit « 2.0 ») devrait trouver unprolongement naturel et même s’en-richir avec le mobile. Ainsi, tenir sonblog depuis son mobile, le «moblog-ging », faire du « microBlogging » (en-voi de textes courts vers son réseaud’amis avec des applications typeTwitter) voire du « photoblogging » enenvoyant directement ses clichés enligne, en temps réel et de manièregéo-localisée (grâce à la présenced’un GPS embarqué de plus en plusgénéralisé) sont des utilisations enplein essor. Bien entendu, l’outil mo-bile, porté sur soi et connecté en per-manence devrait ouvrir la voie à desservices liés à la géo-localisation telsle signalement de boutiques, restau-rants, centres d’intérêts mais aussirencontres liés au lieu où l’on setrouve. On peut anticiper également que lemobile, au delà du mail, servira à re-trouver sur son petit écran, où quel’on soit, l’ensemble de son universnumérique personnel. Celui-ci, stockésur des serveurs accessibles au choixdepuis son ordinateur de bureau oudepuis son mobile permettra aux do-cuments, photos, musique et vidéos

Page 30: Novembre 2008 i-mag

I-MAG - NOVEMBRE 200828

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

d’être accessibles en permanence. Enfin, selon IDC, dans les années à ve-nir, avec l’augmentation des débits etla réduction des coûts, la consomma-tion de contenu multimédia (musique,vidéos et sonneries), devrait-elle deve-nir prédominante depuis les mobiles.En attendant, les éditeurs de sites mo-biles doivent continuer à composeravec des débits variables et un parc determinaux hétérogènes. Tous les termi-naux en circulation ne proposant pasune navigation intuitive et à la compa-tibilité avancée, il est raisonnable dedéployer des sites dans un format li-sible par une majorité de mobiles. Unenorme basée sur XHTML (voire la ré-cente XHTMLBasic 1.1) permet de pro-poser un Internet mobile compatibleavec la plus grande variété de termi-naux. Il convient également de veiller àconserver un poids des pages le plusréduit possible, une taille et une quan-tité d’images réduites au strict néces-saire tout en travaillant à inventer desapplications mobiles connectées deplus en plus ambitieuses. Elles de-vraient pouvoir trouver un finance-ment avec la publicité, qui va bien en-tendu accompagner l’augmentation del’audience et des usages mobiles.

AAlleexxaannddrree BBoouuttiinnDiplômé de l'Ensimag en 1989, je travaille sur la région parisienne pendant 9 ans pour différentes entreprisesau développement de logiciels embarqués civils et militaires. Durant cette période, j'occupe les postes de déve-loppeur, chef de projet et chef de produit. En 1998, je rejoins une société de service en informatique Grenobloisepour devenir Directeur France des réalisations au forfait (avant-vente et réalisation - Département de 140 per-sonnes en 2003). Je contribue également à l'obtention de certifications ISO9001 et CMMi. Début 2004, jerejoins Yahoo pour manager les équipes de développement (70 personnes à Grenoble), implémenter des méthodeset outils pour les développeurs et unifier le processus de développement logiciel pour les équipes locales puis auniveau Européen. Enfin, en 2006, je suis muté dans l'équipe stratégie internationale pour définir et implémen-ter un processus de développement logiciel commun à l'Europe, l'Asie et l'Inde. Dès cette époque je commence àme documenter sur les méthodes agiles, me forme pour devenir "Scrum Practitioner", devient préconisateur etcoach agile en interne, tout en contribuant à la communauté Agile mondiale en présentant mon retour d'expériencelors des conférences de Londres (2007) et Toronto (2008).

L’Agilité au Service du Web

par Alexandre BoutinEnsimag 1989Agile Coach – Pratiquant Scrum Certifié – www.agilex.fr

Les approches dites ‘Agile’ ont vraiment le vent en poupeces dernières années car elles offrent une alternative réa-liste et plus efficace à l’approche basée sur des ‘Cycle en V’associée à un référentiel normatif plus ou moins complexe(ISO, CMMi …).Cet article vous éclairera sur les raisons qui font des entre-prises du Web les leaders mondiaux incontestés des pra-tiques Agile.

Page 31: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 29

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Les approches dites ‘Agile’

Les approches Agile sont toutes baséessur le « Manifeste Agile » qui définit lesprincipes de commun à toutes les mé-thodes de développement dites Agile(www.agilemanifesto.org). Les plusconnues et utilisées sont SCRUM et XP,mais d’autres méthodes telles queDSDM, RAD ou CRYSTAL ont égale-ment leur fervents supporters.Une façon simple, quoique restrictive,pour appréhender les approches Agileest d’analyser les valeurs partagées parces approches.

Les valeurs de l’agilité

L’agilité se reconnait dans les valeursde gauche (en vert) plutôt que les va-leurs de droite (en bleu). Cela ne veutpas dire que les valeurs de droite sontde mauvaises valeurs mais simplementque pour tirer le maximum de béné-fices de l’agilité, il faut faire des choixet donc accepter de sacrifier certainsavantages apportés par les valeurs dedroite pour en obtenir beaucoup plusdes valeurs de gauche.Personnes et InteractionsL’Agilité considère que le facteur hu-main est une plus grande source desuccès que les moyens matériels ou lesprocédures. Il est préférable d’avoirune équipe soudée, et qui commu-

nique beaucoup en toute confianceplutôt que des individualistes mêmebrillants Un processus détaillé ne garantit qu’unminimum (ce qui est décrit par le pro-cessus) qu’un groupe se limitera sou-vent à produire. A l’opposé, une équipeagile aura à cœur de dépasser les li-mites individuelles en s’entraidant et laperformance finale sera bien souventau-delà des espérances initiales.Logiciel qui fonctionneL’utilisateur final sera satisfait unique-ment si le produit qu’il utilise est fonc-tionnel, et il n’y a rien de mieux qued’avoir en permanence un produitfonctionnel pour s’assurer que le pro-duit final le sera également.Pour l’Agilité, l’effort doit être porté surle produit qui fonctionne plutôt que surles artefacts qui y sont associés (dont ladocumentation). Par exemple, il vautmieux commenter le code que de rédi-ger un document de conception dé-taillée très couteux à maintenir. Demême, la distribution des compé-tences au sein de l’équipe est lameilleure garantie de faire perdurer laconnaissance.Collaboration avec le clientLa contractualisation est liée à l’inquié-tude du client de ne pas recevoir unproduit conforme à ses attentes etdonc il définit le détail de ce qu’il at-tend au risque de ne plus pouvoir chan-

ger d’avis en fonction de l’évolution deson marché.Pour l’Agilité, le client doit être impli-qué dans le développement du produitafin que ses besoins, même ceux nonidentifiables au démarrage, soient sa-tisfaits. La notion de client et de four-nisseur s’estompe pour devenir unecollaboration basée sur un respect mu-tuel et une confiance réelle.Adaptation au changementLors de l’utilisation d’une première ver-sion d’un produit, nous fourmillonstous d’idées nouvelles ou de modifica-tions des besoins initiaux. Si telle est laréalité, pourquoi la nier ?Pour l’Agilité, le changement est nor-mal et bienvenu, car le suivi d’un planétabli à l’avance est moins efficace quela re-planification régulière en fonctiondes nouvelles informations dispo-nibles. Mais pour ce faire il est néces-saire que la structure du logiciel et laméthode de production de ce logicielsoient flexibles.

Le Web : Leader Agile

Les études actuelles faites par le cabi-net Forrester montrent que toutes lesgrandes sociétés du Web font partiedes leaders mondiaux de l’Agilité, encompagnie de grands groupes tels queBritish Telecom et Borland.Ce constat s’explique par l’aisance dessociétés du Web à implémenter plus ra-pidement et facilement les valeurs del’Agilité que d’autres entreprises.

Qui voudraitne pas êtreAgile ?

Personnes et InteractionsLe Web est un endroit idéal pour créerune nouvelle société car pour un inves-tissement raisonnable (des machines

Personnes et interactions

Logiciel qui fonctionne

Collaboration avec le client

Adaptation au changement

Processus et outils

Documentation

Négociation à partird’un contrat

Suivi d’un plan

MMMM AAAA NNNN IIII FFFF EEEE SSSS TTTT EEEE AAAA GGGG IIII LLLL EEEE :::: VVVV AAAA LLLL EEEE UUUU RRRR SSSS

>

>

>

>

Page 32: Novembre 2008 i-mag

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

et quelques concepteurs) vous pouvezaccéder à des millions de clients. Unestartup du Web met l’accent sur l’espritd’équipe et des personnes polyvalentesplutôt que sur des processus établis.Cette façon de faire est une valeurAgile qui reste profondément ancréedans les esprits, même lorsque la so-ciété est amenée à grandir du fait de saréussite. Logiciel qui fonctionneUne autre caractéristique des sociétésdu Web est leur maîtrise complète dudéploiement du produit final chez leclient qui paye lui-même la connexionpour y accéder. A l’opposé, un logicielde téléphone portable se déploie sur unmatériel physique et il faut avion pourembarquer un calculateur de vol avecson logiciel.Les sociétés du Web ont donc l’avan-tage de pouvoir vérifier plus facile-ment, tout au long du développement,le produit final. Pour ce qui est la documentation, et

sans affirmer qu’elle est inutile, je vousposerais simplement la question :Avez-vous vraiment lu le manuel utili-sateur pour lire les news sur Yahoo.frou acheter sur eBay ?Collaboration avec le clientL’accès direct à l’utilisateur est vrai-ment une grande force du Web. En ef-fet, nul besoin de déployer une nou-velle version sur un parc de machinesdans les locaux de vos clients, ce sontles clients qui viennent à vous pourvoir et utiliser les nouveaux produits.Le feedback client est obtenu directe-ment par les « avis utilisateurs » rédigéspar les utilisateurs eux-mêmes ou indi-rectement par l’analyse du taux de fré-quentation du site web avant et aprèsla mise en ligne de nouveaux produits. Adaptation au changementLe Web est très concurrentiel, certainsdiront plus qu’ailleurs, car il n’y a qu’àregarder la rapidité du succès de cer-tains produits comme Facebook, ou dese souvenir de quels produits Web

étaient utilisés il y a 10 ans (AltaVista)pour se rendre compte de la vitesse in-croyable de d’évolution du marché duWeb. Les entreprises du Web ont donc l’ab-solue nécessité d’être très réactives etde s’adapter sur des délais très courts.

Conclusion

La similitude des valeurs de l’Agilitéavec les valeurs des entreprises du Webexplique en grande partie les raisonsdu succès des méthodes Agile au seinde ces entreprises.Lorsque votre culture, votre indépen-dance, vos utilisateurs et votre marchévous poussent vers l’Agilité, l’appliquerdevient du bon sens plus que de la stra-tégie et en devenir les leaders semblenaturel, et si en bonus cela contribue àl’amélioration de votre image demarque, c’est parfait !

Le voyage d’étude est de retour dansla vie associative de l’Ensimag.Organisé en octobre par le BDE-Entreprise, il a permis à 21 étudiantsde partir à la découverte du Maroc.

Lorsque la semaine banalisée réservée auSéminaire Carrières, a été supprimée dansla nouvelle maquette pédagogique de l'école,le BDE-Entreprise a décidé de faire renaîtrele voyage d’étude - tradition perdue au milieudes années 90- et a choisi le Maroc commedestination.Ce pays, qui connaît un fort développementéconomique couplé à des plans ambitieuxdans de nombreux secteurs (transports, TIC,tourisme, etc.) a été choisi aussi pour sa stra-tégie visant au développement des activitésoffshore. Les partenariats (dont certains ont été éta-blis avec l'aide de l'AAE et de l'association

AMET) ont permis de visiter 5 sociétés : AtosOrigin (Centre de services de Casablanca) ;GFI Maroc ; Omnidata, (1ère SSII marocaine

créée en 1989 par Monsieur Khalid El Hariry,Ensimag 1987) ; S2M (Société Maghrébinede Monétique) et l'opérateur téléphoniqueWana. La semaine a comporté une ren-contre avec le Centre d’Investissement deTanger (visite du port Tanger-Méditerranée, investissement d'un milliard d'euros), ainsiqu'une réception au Ministère de l'Industrie,du Commerce, et des Nouvelles Technologies

(présentation du plan de développement desTIC " IMPACT 2013").Les étudiants ont présenté l'Ensimag aulycée Mohammed V de Casablanca, et ontremis les livres de prépa récoltés avant leurdépart à la bibliothèque du lycée. A l'EcoleNationale Supérieure d’Informatique etd’Analyse des Systèmes, ils ont posé lesbases d’un partenariat entre la Junior-Entreprise de l’Ensimag (NSIGMA) et la futureJunior-Entreprise de l’ENSIAS.Mais parce qu'un voyage d’étude ne serésume pas au mot "étude", le petit groupea pleinement profité de la richesse culturelledu Maroc, notamment dans les villes deMarrakech et de Rabat, et apprécié la gas-tronomie au travers de succulents et... inter-minables repas, dont un fameux partagéavec les anciens de Casablanca !L’équipe organisatrice du voyage d’étude

Jérôme Daydé et Aness Meski

Voyage d'études 2008 : destination Maroc

Page 33: Novembre 2008 i-mag

31I-MAG - NOVEMBRE 2008

Un nouveau site emploi pour 2009 !Vous êtes nombreux à être abonnés au site emploi del'AAE ENSIMAG, aujourd'hui géré par une liste de diffu-sion, et il nous semblait important de rendre ce site plusfonctionnel: capacités de recherche par région, mise enplace d'alertes automatiques, etc...Ainsi, dans le cadre des projets 2A (projets pour les étu-diants ENSIMAG 2ème année), l'AAE ENSIMAG a proposéun sujet de refonte du site d'offres d'emploi qui a suscitéun réel intérêt auprès des étudiants car huit d'entre euxont demandé à travailler dessus !Nous avons rédigé les spécifications du projet puis avecl'aide précieuse de Laurent Goujon (ENSIMAG 2003),nous avons suivi l'avancement du projet jusqu'aux soute-nances en juin. Les étudiants se sont répartis les rôles surle projet, ont planifié leur travail, développé le site et géréla QA. Au final, le projet est une réussite car ils ont pu livrer unsite fonctionnel qui est en bêta-test jusqu'à la fin de l'an-née 2008 pour une mise en production prévue pour dé-but 2009.Merci à Antoine UBERGER, Olivier BITTINGER, ChristianHUGUES, Damien BRUNEAU, Baptiste LEPERS, MaximOKOROKOV, Bogdan POPA et Ekaterina SHEVELEVApour leur travail, et à Yves Denneulin et Marie Laure Po-tet pour l'encadrement ! Vu les résultats obtenus, nous es-pérons continuer la collaboration avec les 2A sur d'autressujets: à discuter lors des réunions du groupe grenoblois !En tant que premiers utilisateurs, toutes vos remarquessur le nouveau site seront les bienvenues, n'hésitez pas ànous contacter (plus d'infos sur :

http://wiki.aae-ensimag.com/services).Laurent Testard (ENSIMAG 1993) & Fanny Strudel(ENSIMAG 1999)

XMP Business Angels : investisseur privé, fondd'investissement et formation XMP BUSINESS-ANGELS a pour vocation la mise en rela-tion entre des investisseurs privés personnes physiques(business angels) et des entrepreneurs à la recherche definancement. Les membres de cette association sont des ingénieurs di-plômés issus de l'Ecole Polytechnique, des Ecoles Natio-nales des Mines, de l'Ecole Nationale des Ponts et des

L’INRIA, partenaire de l’AAE EnsimagNous avons le plaisir et l’honneur de vous annoncer lepartenariat que nous venons de signer avec l’INRIA.

Les événements parisienspar Nadia Robinet, Ensimag 1990.

Cet automne à Paris, l’AAE ENSIMAG est co-organisatricede deux événements majeurs de l’institut G9+ dontnotre formation est membre actif :

La treizième rencontre annuelle de l’institut G9+abordera la période actuelle avec une doubleinterrogation :• Quel impact d'une période difficile sur l'écosystème

DSI / fournisseurs ?• Face aux nouveaux défis, quelles sont les opportunités

à saisir ?Une matinée d’exception le 23 octobre où nous compte-rons parmi les intervenants Ludovic Le Moan ENSIMAG88, serial entrepreneur et créateur de Goojet (prix de lameilleure start-up lors du WEB3 2007).Clôturée par Louis Schweitzer, président de la Halde etprésident du Conseil d’administration de Renault, la ma-nifestation va réunir à nouveau des intervenants de hautniveau, dans l’ambiance « zéro langue de bois » qui ex-plique son succès constant.Une conférence sur le thème des nouvelles stratégieséconomiques et commerciales Open Source des édi-teurs de logiciel. D’ores et déjà, réservez la soirée du2 décembre 2008 dans votre agenda.Nous sommes à la recherche de nouveaux sujets et in-tervenants pour les dîners-débats et nous cherchons tou-jours à enrichir l’offre destinée aux anciens élèves alorsn’hésitez pas à nous soumettre vos idées et pourquoi pas,vous impliquer dans l’association.Contact : [email protected] Groupe : [email protected]

llaa vviiee ddee ll’’aassssoocciiaattiioonn

Page 34: Novembre 2008 i-mag

llaa vviiee ddee ll’’aassssoocciiaattiioonn

autres Ecoles d’Application traditionnellement associées.A ce titre les ingénieurs ENSIMAG peuvent adhérer àcette association. Chaque adhérent moyennant une cotisation annuelle sevoit proposer au cours de l'année des opportunités d'in-vestissement dans de jeunes entreprises lancées et déve-loppées par des ingénieurs en majorité issus des écolescités ci dessus mais sans exclusive. L'investissement sefait à titre personnel ou par un groupe d'investisseurs viaun pacte d'actionnaires. Le processus de sélection des en-treprises est décrit sur le site de XMP Business Angels.Dans le cadre de la loi TEPA, XMP Business Angels a ou-vert en Juin 2008 pour ses adhérents un fond d'inves-tissement éligible à la déduction de l'ISF.Le fond investira dans les jeunes entreprises sélection-nées par les adhérents.Du fait de cette déductibilité de nombreux fonds se dé-veloppent rapidement et le nombre d'adhérents croit très

rapidement. Aujourd'hui les frais d'accès sont réduits.Cependant la gestion des fonds levés va demander del'intelligence et du temps. Les gestionnaires de fond vontêtre amenés prochainement à monter les cotisations et-ou créer un droit d'entrée. XMP est probablement un ex-cellent observatoire des créateurs d'entreprise et leurfond une opportunité plus un lieu d'échanges. L'association organise également en partenariat avecOSEO des journées de formation dont l'objectif est deprésenter les modes opératoires du Business Angel et decréer du lien entre les différents acteurs : investisseurs,réseaux, entrepreneurs.Pour mieux connaître XMP Business Angels, vous pouvezconsulter les informations sur leur site : http://xmp-ba.m4x.org/Etant adhérent de ce réseau vous pouvez aussi mecontacter : [email protected] Tariel (Ensimag 1974).

I-MAG - NOVEMBRE 200832

« Jean Pierre ANSART nous a quitté le 22 octobre 2008.

Ingénieur ENSIMAG 1972,

expert reconnu en télécommunications et intégration des

systèmes hétérogènes, il demeure une référence cumulant

plus de 30 ans d'expérience dans le domaine des systèmes

d'information ».

Jean Pierre Ansart démarre sa carrière en France au sein du

CNRS et d'IBM. En 1979, il rejoint MARBEN et créé la divi-

sion « Réseaux et Télécom ». En 1986, il crée MARBEN

PRODUCTS, société spécialisée dans les logiciels télécom

OSI et équipe la plupart des grands constructeurs mon-

diaux. Jean Pierre Ansart poursuit sa carrière chez ATOS en

tant que directeur des divisions Télécom, Produit et Tech-

nologie. En 1996, il développe le premier prototype du lo-

giciel SCORT et fonde la société avec ses partenaires. Il

continue à collaborer avec ATOS jusqu'en octobre 1999, en

qualité de Directeur Technique d'ATOS Intégration.

Depuis octobre 1999, Jean Pierre Ansart était président de

SCORT.

Nous nous associons à la peine de son épouse Salwa et de

ses deux filles pour saluer la mémoire d'un homme hors du

commun.»

Jean-Pierre Ansart

Page 35: Novembre 2008 i-mag
Page 36: Novembre 2008 i-mag