Flash informatique - Ecole Polytechnique de Lausanne

121
a s h i n f o r m a t i q u e ECOLE POLYTECHNIQUE FEDERALE DE LAUSANNE p/a EPFL - SERVICE INFORMATIQUE CENTRAL CP 121 CH 1015 LAUSANNE TEL. +41-21 693 2211 FAX +41-21 693 2220

Transcript of Flash informatique - Ecole Polytechnique de Lausanne

ECOLE POLYTECHNIQUE FEDERALE DE LAUSANNE

p/a

LEPF

sh aVIC SER

E

OR INF

TIQU MA

E CE

rmatique infoANN 15 LAUS CH 10 121 CP L NTRA

-21 693 2211 FAX +41-21 693 2220 E TEL. +41

AVANT-PROPOS

Non ! Non ! je ne veux pas dun lphant dans Dessine-moi un mouton. Le mouton que tu veux est dedans. Cest tout fait comme a que je le voulais ! Crois-tu quil faille beaucoup dherbe ce mouton ? Pour voir dans cette figure un cube ; il nous faudrait y voir dabord une figure plane, puis y ajouter une impression de profondeur. et lexacte reprsentation dune res, sappliquera en outre resnus quelle doit recouvrir. paire de chaussusembler aux pieds

un boa...

la mise jour, par soustraction, de la statue contenue dans le bloc de marbre. dabord ne conserver de la matire que son fantme... recoudre avec la ralit. Un bloc de marbre tait si beau Quun Statuaire en fit lemplette, Quen fera, dit-il, mon ciseau ? Sera-t-il dieu, table ou cuvette ?

A. de St-Exupry Le petit prince L.Wittgenstein Le cahier Bleu et le cahier Brun M.Foucault Ceci nest pas une pipe R. Magritte Modle-rouge Michel-Ange Lesclave des jardins Boboli IRE Cheval H.Bergson, Matire et mmoire Le Bernin Le rapt de Proserpine De La Fontaine Le Statuaire et la statue de Jupiter GA FI - 2

TABLE DES MATIRES

1 3 4 13 17 26 30 41 47 56 66 72 73 83 94 98 103

avant-propos par Georges Abou-Jaoud Editorial par Jacqueline Dousson Les enjeux du visible: perspective, pige, passage par Ren Berger En attendant Le Bernin par Georges Abou-Jaoud Vision et mesures stroscopiques par Otto Klbl Maquette, panorama et rendering par Ulrich Doepper Mon ordinateur voit double par Jean-Franois Rolle Serveur WEB dimages parallles pour le projet Visible Human par Samuel Vetsch, Vincent Messerli, Oscar Figueiredo, Benoit Gennart, Roger Hersch, Laurent Bovisi, Ronald Welz & Luc Bidaut Humains Virtuels sur le WEB par Christian Babski, Ronan Boulic Des avatars aux humains virtuels autonomes et perceptifs par Daniel Thalmann Outils de la photogrammtrie pour visualiser des projets par Matthias von Moos colophon Gnie rural & environnement: modlisation 3D et animation virtuelle par JeanFranois Monnet Construction de panoramas photographiques laide de plusieurs images par David Hasler Linstitut europen dtude, de recherche et dapplication du paysage alpin (IDERALPE) par Jacques Monnier-Raball & Michel Bcholey Techniques 3D pour le bureau dingnieurs par Mauro Pedretti

La perception du 3D

Les humains rels et virtuels

Le paysage

La modlisation 3D

La modlisation numrique du climat: un outil en pleine volution par Herv Le Treut 109 HAEDB: base de donnes de larothermodynamique hypersonique par Silvio Merazzi, Richard Schwane & Jan Vos versos Flip-book par Georges Abou-Jaoud FI - 3

EDITORIAL

Flatland [1]: un petit jeu desprit crit en 1844 par le Docteur Edwin Abbott ; dans ce monde, des tres intelligents (triangles, polygones, cercles) se meuvent sur une surface plane; ils ne prennent conscience de la 3me dimension que quand une sphre traversant leur espace les repousse au-del dun cercle de plus en plus grand, puis progressivement disparat. Dans ces 150 pages de pr-science-ction lauteur avait voulu montrer la difcult de percevoir une dimension nouvelle notre univers quotidien et ce thme fut repris au dbut du sicle pour aider le profane sentir ce qutait cette 4me dimension apparue dans les travaux des physiciens. Notre monde rel nest pas Flatland, il a de la profondeur, du volume, tout comme ce journal que vous tenez entre vos mains et que nous avons voulu particulirement volumique pour que son paisseur atomique fasse comme un contrepoids toute cette informatique impondrable. Lordinateur, qui a depuis quelques annes[rfrences en page 118]

dj dpass son rle de simple calculatrice gante est devenu un outil de cration de volumes : pour se rapprocher du rel, comme dans la synthse de paysages ou dhumains ; pour lanalyser comme dans le Visible Human ou comme avec lquipe de recherche dIBM qui a reconstitu sur 80 GB une piet de Michel-Ange dont le matre avait cass des membres an de connatre le mystre du geste de lartiste [2] et tenter de visualiser luvre telle quelle aurait pu tre ; pour simuler des phnomnes complexes comme la modlisation du climat ou les phnomnes arodynamiques. Les articles de ce journal traitent de tous ces aspects liant volumes et informatique, et abordent la problmatique qui va prendre de plus en plus dampleur dans les annes venir : comment lordinateur nous permet de crer un rl diffrent. Bonne lecture ! s

FI - 4

LES ENJEUX DU VISIBLE:PERSPECTIVE, PIGE, PASSAGERen Berger, professeur honoraire de lUniversit de Lausanne

La Flagellation (1455) Piero della Francesca Galerie nationale dUrbino

FI - 5

LES ENJEUX DU VISIBLE: PERSPECTIVE, PIGE, PASSAGE

La perspective nat de leffort conjugu dartistes, dingnieurs, de savants, de gomtres, de mathmaticiens souvent runis dans les mmes personnes : Alberti, Piero della Francesca, Brunelleschi (Lonard de Vinci reste le parangon lgendaire), qui appartiennent aux milieux en pleine effervescence intellectuelle quaniment les grands de lpoque, les Sforza Milan, les Mdicis Florence, les Montefeltre Urbin, les Gonzague Mantoue, les Urbain VIII et Lon X Rome, les Alde Manuce, les Francesco Colonna Venise. La perspective nest donc pas une invention isole ; elle est le fruit de rencontres et dchanges qui tmoignent de lmergence dune vision nouvelle du monde. Au sens technique, il sagit de mettre au point un systme de projection sur un plan bidimensionnel des objets trois dimensions ou, pour reprendre les termes mmes dAlberti : Le tableau est une intersection plane de la pyramide visuelle. Un tel dispositif tablit et valide le systme de reprsentation qui fait de lobjet reprsent lquivalent de lobjet peru, ou plutt lquivalent de lobjet conu. Ainsi que le souligne Erwin Panofsky dans son ouvrage intitul dessein La Perspective comme forme symbolique: Lespace homogne (celui de la perspective) nest donc jamais un[rfrences en page 118]

espace donn : cest un espace engendr par une construction. [1] Et le sens de cette construction est de substituer la conception religieuse du Moyen Age une conception humaniste. La symbolique de Dieu fait place une symbolique humaine qui toutes deux constituent leurs propres systmes. Ainsi la construction en 3 dimensions de la perspective tablit que : le tableau est constitu par lintersection du cne optique avec un plan vertical, ce que lon obtient empiriquement en traant sur une vitre le contour des objets quon peroit travers elle ; le tableau se divise ainsi en deux parties : en haut le ciel, en bas, la terre, lun et lautre spars par la ligne dhorizon qui est la hauteur de lil du spectateur ; les lignes horizontales des objets parallles au plan dintersection restent horizontales ; de mme les verticales restent verticales. En revanche les lignes qui ne sont pas parallles au plan dintersection se dirigent vers un mme point appel point de fuite ; do leur nom de lignes fuyantes ; FI - 6

LES ENJEUX DU VISIBLE: PERSPECTIVE, PIGE, PASSAGE

plus la distance des objets augmente, plus ils paraissent petits et indistincts, et inversement ; leur dimension est rgle par lchelle fuyante comme leur degr de nettet est rgl par lchelle arienne. Ds quon quitte les ides toutes faites, on se rend compte quel point lespace, en art, mais aussi bien dans notre existence quotidienne que dans nos conceptions intellectuelles, est chose arbitraire. Arbitraire ne signie nullement sans raison, mais quil est construit partir de conventions. De mme convention ne signie nullement fantaisiste ou gratuit, mais ce qui rsulte dun accord entre plusieurs personnes, un groupe ou une socit tout entire. Tout systme implique donc ladoption dun ensemble de rgles dont le fonctionnement tablit la correspondance entre le systme et limage ou lide de la ralit quil construit. En ce sens, on peut dire que les formes ont droit ce terme dans la mesure o elles sont compatibles avec le type despace choisi alors quelles apparaissent comme autant de dformations dans un espace qui leur est tranger. Quon se rappelle les cris quont soulevs les portraits de Picasso, atteintes sacrilges la tradition du portrait, alors que ses d-

formations prennent tout leur sens dans lespace cubiste. A la diffrence du Moyen Age et des civilisations orales qui ont prcd, la perspective invente la Renaissance inaugure avec lavnement de la troisime dimension le rgne de lil et, partant, la primaut du visuel. Elle se prolonge pendant quelque quatre sicles, avec de nombreux avatars dont tmoignent les expressions artistiques tels que le baroque, le rococo, le romantisme, le noclacissisme etc. Nanmoins, quels que soient les changements, la structure perspective en trois dimensions se maintient. Le dispositif a beau multiplier les transformations, anamorphoses et trompe-lil, il reste infod lordre du visible que les hommes de la Renaissance ont institu au seuil des temps modernes. PASSION OU IMPATIENCE ? Me tromp-je en risquant lhypothse quau 19e sicle le prestige de la perspective tend sessoufer et que, les inventions techniques aidant, une certaine impatience nat son gard ? Me tromp-je en conjecturant que la machine 3D va shybrider avec un engin qui, fruit de loptiFI - 7

LES ENJEUX DU VISIBLE: PERSPECTIVE, PIGE, PASSAGE

que et de lingniosit, va permettre dlargir encore notre vue ? Gardons-nous de croire un progrs purement linaire qui ferait de lappareil photographique le successeur dsign du peintre. Plus profondment, mais cest encore conjecture de ma part, je crois que le visible revendiqu par la perspective ne peut plus gure se contenter de la mise en uvre purement humaine quand lautomatisation permet dun seul coup de naturaliser limmensit du visible au moyen de la nouvelle technique. On comprend que la photographie dvore pays, villes, personnages, scnes tmoignages de tous genres, introduisant pour la premire fois, du moins un tel degr, ltendue squence par la somme des instantans. Entreprise prodigieuse qui pige toute la ralit dans les lets du Visible mcanis. Entreprise sans limite ? LES RUSES DU MOUVEMENT Non pas tout fait sans limite puisque limage en trois dimensions reste statique. Cest cette contrainte que vont sen prendre deux inventions, lune du 19e sicle, le cinma, lautre du 20e, la tlvision, si importantes quelles donnent ensemble leur marque notre poque. Lune et lautre

dotent en effet le visible du mouvement qui ajoute la vise raliste de la reprsentation. Dlant au rythme de 24 images par seconde pour le cinma et de 25 pour la tlvision, le spectacle reproduit laction dans son droulement mme. Le spectateur concidant avec laction par un mcanisme dhallucination gnrale et prolonge, toutes les ctions sont dsormais vraies et concrtement possibles. Jusqu CNN qui nous fait croire que les vnements du monde concident avec les informations que son rseau diffuse 24 heures sur 24. Le pige omniprsent capture en permanence tout de ce qui est susceptible dtre visibilis. Cette manire darraisonner le rel pour en faire des images-vnements en continu marque lune des limites extrmes de linstance visuelle, lhorizon au-del duquel il ny a vraisemblablement plus rien apprhender. La contingence elle-mme devient pr-visible. Elle se dbite en catgories que la technique se borne remplir : news, sports, business, entertainment. Les contenus sont variables, mais les structures contractent un formalisme qui, privant la communication de loxygne que constitue lchange, est menac dasphyxie, en tout cas de sclrose.

FI - 8

LES ENJEUX DU VISIBLE: PERSPECTIVE, PIGE, PASSAGE

DE LANALOGIQUE AU NUMRIQUE Mais voici quune invention nouvelle bouleverse la situation, mme si ses effets ne se font sentir que progressivement et, comme toujours en pareille occurrence, en entranant prjugs, malentendus et dviations. Cest ainsi que lordinateur est dabord tenu pour un supercalculateur, ce quil est dailleurs, mais ce quoi il ne se rduit pas. Cest ainsi que lordinateur est bientt considr comme un supergestionnaire, ce quil est, mais ce quoi il ne se rduit pas. Ni sa puissance de calcul, ni son aptitude grer stocks, actions, marchandises, donnes, jusquau mariage, et, pourquoi pas, jusquau bonheur (salut compris !) ne sufsent le dnir. Cest un changement beaucoup plus radical quil nous invite. Pour sen tenir au visuel, qui intresse plus particulirement notre propos, cest lavnement de lordre numrique la place de lordre optique qui constitue le fait majeur. Mutation quEdmond Couchot rsume en ces termes : Limage de synthse nest plus lempreinte dune gerbe de photons mis par l0bjet reprsenter qui sinscrit sur un support chimique ou magntique, cest une matrice de nombres calculs par lordinateur partir dinstructions programmes [2]. Ds lors, la simulation prend[rfrences en page 118]

le pas sur la reprsentation, le calcul sur le faisceau de lumire. Tout devient possible partir dune matrice de nombres. Lobjet peut tre vu sous tous les angles, dans toutes les positions, dans toutes les situations. Volumes et mouvements, couleurs et clairages sont affaire dalgorithmes. Le corps humain se dbite en tranches que lon peut mouvoir, agrandir, dformer en tous sens. The Visible Human consacre le triomphe du Visible modlis affect notre identit la plus profonde [3], comme le site de Microsoft qui prodigue ses 108 millions dimages de la terre coups de teraoctets [4]. Et surgit la question, inoue jusquici, inaudible aussi : sommes-nous prts nous identier avec lhomme visible, dont les dtails et les secrets peuvent tre multiplis linni, mais dont la condition est de ne pas franchir la limite du visible ? Autrement dit se pose, pour la premire fois sans doute, la question de la nature de lordre du visible. Et cest paradoxalement la suite des progrs de linformatique, en particulier de la simulation, que la question revt une telle urgence, une telle acuit. Tout se passe comme si Mphisto, fort dune technologie sans limite, pouvait jouer avec nous en simulant tous les aspects du visible dsirable pour nous traFI - 9

LES ENJEUX DU VISIBLE: PERSPECTIVE, PIGE, PASSAGE

quer dans laveu : Verweile doch, du bist so schn, qui signerait notre techno-damnation. Mme clones de Faust, nous ne cderons pas la tentation. Une mutation dcisive se prpare. Plus quun changement de paradigme, cest dun changement dordre de ralit quil sagit. FIN DUNE ILLUSION ? On peut en effet se demander si la troisime dimension amorce la Renaissance nest pas en train de spuiser, mme si elle a eu recours des rafnements aussi subtils que la photographie, le cinma, la tlvision, linformatique. Propos trange, sinon contradictoire. Jamais la production dimages na t aussi abondante, aussi varie. Aucune activit qui ny soit troitement associe. Mais l est peut-tre le signe comminatoire. Se pourrait-il donc quil y ait autre chose que le spectacle ? Linquitude quon peroit notre poque et dont tmoignent tant de pratiques religieuses ou semi-religieuses marque-t-elle un retour ? Ou serait-ce quun nouveau type de ralit se mette merger ? Se pourrait-il quau-del des dimensions qui constituent notre ralit visuelle depuis des sicles samorce une vision nou[rfrences en page 118]

velle par-del mme nos performances dmiurgiques, simulation, modlisation, ralit virtuelle, intelligence et vie articielles comprises ? LEIBNIZ VS. DESCARTES: LAVNEMENT DES INTERPLIS Puis-je avancer pour nir une hypothse dont je trouve les prmices chez Descartes et Leibniz, deux modles philosophiques fondamentaux dont la fortune a t trs ingale ? Le premier modle consiste croire que la distinction relle entre parties entranait la sparabilit...en posant des minima sparables, soit sous la forme de corps nis, soit linni sous la forme de points... [5]. Ainsi la rsolution des problmes qui se dcomposent en difcults toujours plus petites jusqu puisement et resommation selon les rgles que Descartes nonce dans le Discours de la mthode stablit sur une conception discrte du rel, qui aboutit lacceptation dun Rel calculable. A nen pas douter, cest de ce modle que sinspire lespace introduit par la perspective de la Renaissance et dans lequel les trois dimensions correspondent lide dune tendue la fois sommable et discontinue. A quoi soppose le modle FI - 10

LES ENJEUX DU VISIBLE: PERSPECTIVE, PIGE, PASSAGE

Dtail du manuscrit de Gottfried Wilhelm Leibniz dat du 15 mars 1679 Niederschsischen Landesbibliothek Hannover

FI - 11

LES ENJEUX DU VISIBLE: PERSPECTIVE, PIGE, PASSAGE

que Leibniz expose partir de la mtaphore du pli : La division du continu ne doit pas tre considre comme celle du sable en grains, mais comme celle dune feuille de papier ou dune tunique en plis, de telle faon quil puisse y avoir une innit de plis, les uns plus petits que les autres, sans que le corps se dissolve jamais en points ou minima. Contrairement au dcoupage cartsien, la conception leibnizienne du pli linni met laccent sur la continuit, non pas indistincte, mais module la manire dondes dont le mouvement intrieur chappe aussi bien la rupture qu lindtermination tale. Ecartant lobjectivation quantitative, elle prvient la sparation de lob-jet, (jet devant, donc spar) comme elle prvient la division du tout en parties discrtes. Le pli et le repli sont linterface mme du Sujet et de lObjet qui senlacent en une spirale indnie, rfractaire aux mesures granulaires de ltendue cartsienne. Ce quclairent leur manire dautres cultures. Ainsi la culture japonaise dont le MA est au cur de toutes les activits, posie, musique, thtre. Opposant larchitecture europenne qui met laccent sur les matriaux solides et durs comme la pierre et la brique qui ont t utiliss pour crer la sparation entre lintrieur et lextrieur des btiments, Akira Miyoshi souligne que dans[rfrences en page 118]

larchitecture japonnaise on trouve un lment appel vranda qui court le long du bord extrieur pour former une sorte de corridor dans toit. Cette vranda est donc lextrieur de la maison, mais comme simultanment elle nest spare de lintrieur que par une porte de verre, elle est aussi considre comme faisant partie de lintrieur de la maison [6]. Larchitecture chappe la structure pour se muer en rseau qui nous implique dans sa dynamique. La logique de la perspective, mme si elle sest prte dinnombrables variations au cours du temps, se heurte nalement sa propre limite : au-del de lordre de la reprsentation existent dautres ordres de ralit. A latome de Descartes, Leibniz substitue la monade, unit substantielle originale, sans tendue, sans divisibilit, un indcomposable dynamique, prcise Cassirer. Celle-ci ne se dnit pas par elle-mme par des proprits intrinsques, mais par ses rapports avec les autres monades. Au statut datome se substitue celui de situs, de site, comme si une logique sensible du relationnel animait lunivers divin. Chaque monade sans portes ni fentres exprime un point de vue qui sharmonise aux points de vue des autres monades. Sans forcer FI - 12

LES ENJEUX DU VISIBLE: PERSPECTIVE, PIGE, PASSAGE

lanalogie avec Leibniz, il me semble que notre ide de la ralit, longtemps domine par le modle cartsien, gagne, avec le dveloppement des rseaux, singulirement dInternet, une nature nouvelle, faite de ux sans cesse en mouvement. A la conception dun monde soumis au visible, et, par-del les dimensions qui le captait en objets, souvre le monde du mouvant qui, toutes dimensions dissoutes, sarticule en spirales des plis et des replis des rseaux en acte.

Et Mallarm den fournir lillustration ultime Je dis: une eur! et, hors de loubli o ma voix relgue aucun contour, en tant que quelque chose dautre que les calices sus, musicalement se lve, ide mme et suave, labsente de tous bouquets. La bance signie la limite intrinsque de toute langue rduite aux mots de la tribu, la limite intrinsque de toute formalisation qui se prend pour sa propre n labsente que la posie suggre rend plu sensible la prsence que ne le feraient les mots employs la dcrire, les images la reprsenter.s

FI - 13

EN ATTENDANT LE BERNINGeorges Abou-Jaoud, EPFL-DA-IRE, Chaire dinformatique, e-mail : Georges [email protected]

Vous mavez demand un article sur la 3D, jai compris dessine-moi un mouton. A chaque fois que jentends 3D, je comprends illusion de profondeur ; par ralit virtuelle, cest souvent de la stroscopie interactive et de quelques marionnettes aux celles lectroniques quil sagit ; quant au multimdia, jai peur de ne pas comprendre, dans la mesure o lintrt fondamental de lespace numrique lectronique rside en sa capacit tout rduire une criture monomdia. Face linformatique, et grce elle, deviennent encore plus fondamentales comprendre les questions de dimension, de virtualit et de notre rapport au monde ; en tous cas dun point de vue phnomnologique. Quatre sicles aprs la Renaissance et trois sicles aprs Descartes, la profondeur est toujours neuve, et elle exige quon la cherche, non pas une fois dans sa vie, mais toute une vie.Cest ainsi que Merleau-Ponti aborde[rfrences en page 118]

la question de la profondeur et de la troisime dimension pour nous amener lendroit o notre cerveau et lunivers se rejoignent [1] et carte ce qui se rapporte la recette ou lalgorithme qui fera illusion. Ne faisons pas de mme pour linstant et regardons de plus prs ce simulacre de profondeur, que lon se plat appeler simulation, pour tablir les bases de notre rexion. Pour commencer il sagit de ne conserver de la matire que son fantme [2] et construire dans lespace numrique lectronique, un modle gomtrique. A ce modle gomtrique, disons un cheval, nous allons attribuer une description de surface, images ou algorithmes, qui vont rgir sa manire de faire illusion de matire au contact de la lumire, algorithmique bien sr. Une fois dcrit, le modle de surface et de lumire, quil provienne dun enregistrement au moyen de capteurs simili ou ultra sensoriels, dune modlisation ou FI - 14

EN ATTENDANT LE BERNIN

dun processus, devient une criture binaire qui rside en mmoire, une mmoire capacitive ou magntique. Cette mmoire, limage de notre cerveau, sera le lieu unique qui contiendra tout aussi bien une image rtinienne quun son ou un texte. Se pose alors immdiatement la question du rapport entre matire et mmoire, pour tablir la relation entre lobjet matriel et son criture numrique. Lobjet numrique est dj une reprsentation du monde matriel ou idel et, en tant que reprsentation, tablit avec ses rfrences un rapport similaire celui qui lie le mot la chose. Ce nest pas une copie, mais une transsubstantiation qui porte les traces du moyen qui a permis de la construire et qui dnit sa similitude la matrialit de lobjet de rfrence. Le modle va donc dpendre de cette relation et, pour ce qui nous concerne, contrairement un modle de vrication de caractristiques physiques, le modle ne devra en tous cas pas tre une copie de la gomtrie constructive pour faire illusion de ralit dans le visible, au sens troit du terme. Cest le geste du peintre qui va extraire, gnrer lessence qui permettra de reprsenter. Contrairement lide dune informatique qui permet de rentrer les donnes sans concept de reprsentation a priori, chaque image,[rfrences en page 118]

chaque reprsentation, va ncessiter un autre modle, avant de sortir. Pour sortir, il faudra recoudre avec la ralit [2]. Un programme a rcupr votre geste la souris ou le signal dun capteur; ce signal est devenu signe ; un processus devra maintenant passer du signe au signal pour grer lun ou lautre robot qui va donner matrialit au fantme numrique. A titre dexemple, et puisque nous discutons de profondeur comme illusion optique, prenons la premire image, celle de lcran. Pour gnrer cette image, nous commenons par un calcul de perspective la Renaissance, une simulation de la camera obscura, et nous utiliserons lombre, la lumire, la profondeur de champ et tous les artices propres la perspectiva articialis. Toujours lcran, et puisque lhomme nest pas un cyclope lil xe, nous allons utiliser deux crans, ou un seul en alternant les images pour calculer deux images du mme modle. Une image pour lil droit, une autre pour lil gauche, et vous tes dedans, car ainsi la vision binoculaire et la stroscopie vous sont restitues. Rien de nouveau, dans notre laboratoire les outils stroscopiques contemporains cohabitent avec un appareil photographique de 1891 et un autre de 1940 FI - 15

EN ATTENDANT LE BERNIN

Si vous tes dus, croyant que la techniqui porte bien son nom, The Realist. Les que nest pas assez avance pour faire illuprospectus de Brewster ou de Kodak vension, je vous invite faire un petit voyage daient dj la stro comme ralit vir Rome pour toucher du regard le rapt de tuelle ; est-ce si diffrent des premiers desProserpine du Bernin. L, ce ne sont ni les sins de lhomme pour apprivoiser et sapcontraintes techniques, ni le matriau qui proprier le monde ? entravent la sensation de chaleur dans le Notre sicle ajoute linteractivit la marbre et ces traces lgres de la main que stroscopie. Plusieurs modles de capteurs Le Bernin imvont suivre vos prime dans la doumouvements la ceur des chairs, trace, reprer lensensuelles au sens droit o vous repropre du terme. gardez an de calReprenons culer une image notre modle nupour chaque il mrique du cheen temps rel, ce val, dont nous altemps de lillusion lons modier les de linstantan. donnes pour en Une autre faon faire une sculpture de recoudre avec et non une image nos sens grce picturale qui rapnos connaissances pelle une photoorganoleptiques, graphie dune llectronique et sculpture. La surlalgorithmique. face deviendra le Pour parfaire lille rapt de Proserpine Le Bernin volume quelle dlusion, je vous inlimite pour envite regarder suite produire les strates ncessaires une aussi un hologramme dans un laboratoire machine organe, un robot de dcoupe au doptique tout en lisant lhologramme de laser et de laminage. Strate aprs strate, Baudrillard dans Simulacre et Simulation. FI - 16

EN ATTENDANT LE BERNIN

dcoupes puis lamines, les feuilles de papier deviennent un objet que vous tenez au creux de votre main. Cest de nouveau un volume, disons un cube, qui contient la forme du cheval. Vous devrez enlever les rsidus de matire pour le dcouvrir, un moment magique qui nous rappelle Michel-Ange, pour qui la caractristique essentielle de la sculpture consiste la mise jour, par soustraction (per levare), de la statue contenue dans le bloc de marbre. Le mimtisme, sens/senseur, esprit/ processus, main/machine-outil, est facile tablir. Mais si lil est ce qui a t mu par un certain impact du monde et le restitue au visible par les traces de la main [1], notre chane lectromcanique manquera toujours une dimension, celle de lmotion. De dimension en dimension, il manquera inluctablement la suivante, celle qui sera dsir ou frustration. Entre science et art, dsir plutt que frustration, empirique plutt qualgorithmique, cest lartiste derrire la machine qui apportera cette dimension de lmotion indpendamment des prouesses techniques et de la sapience. Cest en ce sens, mme et surtout dans lespace numrique lectronique, que nous pouvons commencer un autre dbat, celui de la substitution du couple disjonctif ap[rfrences en page 118]

parence/essence par le couple conjonctif apparition/sens, dans une atmosphre radicalement nouvelle depuis Kant [3]. Sans prtendre dbattre de leffort de Kant pour distinguer la prsentation de la reprsentation, nous pouvons aller la qute dune nouvelle dimension, celle dun acte esthtique, propos par Leibniz comme quelque chose limage de Dieu mais en plus petit. Une qute qui pourrait commencer par dessine moi un mouton du Petit Prince ou un morceau de bois qui crie pas si fort matre Cerise avant de devenir le Pinocchio de Collodi. Si ces textes ne sont pas pour les grandes personnes, alors linformatique non plus, car Les enfants nont lme occupe que du continuel souci quon ne fche point leur poupe...[4] s

FI - 17

VISION ET MESURES STROSCOPIQUESOtto Klbl, EPFL-DGR-Institut de Photogrammtrie e-mail : [email protected]

LA VISION STROSCOPIQUE NATURELLE Lhomme dispose de deux yeux qui lui permettent de percevoir son environnement de deux points de vue lgrement diffrents. La fusion mentale de ces deux vues permet dengendrer une image spatiale de notre environnement, un processus purement psychologique. La perception spatiale reprsente une aptitude typique dun chasseur, dun carnivore. Par contre, les yeux des herbivores (cheval, bovids), sont dplacs latralement an de permettre un angle de vision beaucoup plus tendu, ce qui est notamment utile pour dtecter des prdateurs arrivant par derrire. Dans ce cas-l, le faible recouvrement des deux champs de vision ne permet gure la perception de la profondeur.

On se rend facilement compte de limportance de la vision spatiale si lon regarde avec un seul il. Dans ce cas, verser par exemple le contenu dune bouteille dans un verre cause des difcults relles, sauf si lon se sert de moyens auxiliaires comme par exemple le recouvrement des objets an dvaluer la distance entre la bouteille et le verre. La vision stroscopique est une aptitude naturelle chez lhomme et part de ses sens comme par exemple aussi le sens de palper qui permet galement de reconnatre lenvironnement de manire spatiale. Cependant, le faible cartement des yeux ne permet une vision spatiale que pour notre environnement proche moins quon essaie dagrandir cette base de manire articielle comme pour les jumelles ou les tlescopes dartillerie. FI - 18

VISION ET MESURES STROSCOPIQUES

g. 1: position des yeux des herbivores (latrale avec champ de vision de 360) et des carnivores (sur le front, avec cartement pour permettre la vision stroscopique)

VISION STROSCOPIQUE ARTIFICIELLE Une autre possibilit de voir stroscopiquement consiste prsenter aux deux yeux deux images prises de 2 points de vue

diffrents (dessins ou prises de vues photographiques de diffrents points de vue). Loctadre de la g. 3 a t dessin en perspective correcte partir 2 points de vue diffrents et peut tre observ stroscopiquement. Cependant, il faut veiller ce FI - 19

VISION ET MESURES STROSCOPIQUES

que limage gauche ne soit vue que de lil gauche et limage droite que de lil droit. Comme les deux gures sont espaces dune distance correspondant la base des yeux, il est important de les observer avec les axes oculaires parallles (!) et videmment dune distance assez courte, environ 25 cm. Du point de vue physiologique, la convergence des axes oculaires est cependant rigoureusement lie la distance de focalisation et contrer ce rexe exige un certain effort. Le moyen le plus simple de voir cette gure en relief est de sparer les deux images en mettant la main entre les deux yeux et de dcontracter les yeux an darriver un paralllisme des axes oculaires (cf. g. 2). On peut ainsi dnir quelques conditions pour la vision stroscopique articielle : Sparation des images homologues an que chaque il ne puisse observer quune des deux images (par sparation physique des images, par des couleurs selon le principe de lanaglyphe ou par polarisation) Arrangement des images an que la distance de focalisation et la convergence des yeux correspondent : superposition des images selon le principe de lanaglyphe ou selon le principe de polarisation

ou auxiliaire optique an de focaliser la vision vers linni et dplacement latral des images (stroscope). Dautre part, il convient de respecter les conditions suivantes : Une ventuelle diffrence dchelle entre les deux images ne devrait pas dpasser 10%. La parallaxe dans la direction de la base des yeux (diffrence gomtrique des images) ne devrait pas tre trop leve.

g. 2: prcaution pour sparer les champs de vue avec la main, an de faciliter la vision stroscopique de loctadre ci-dessous (cf. g. 3)

FI - 20

VISION ET MESURES STROSCOPIQUES

Pour des objets tendus, on devrait respecter un rapport base/distance de 1/5 1/20. Il sagit l de la relation entre la base des prises de vue (distance entre les deux positions de la camra) et la distance des camras lobjet. Les parallaxes perpendiculaires la base des yeux devraient tre faibles, lil tolrant difcilement de telles dviations (effet de strabisme). Les deux images devraient tre semblables en ce qui concerne la reproduction

de couleurs ou leur apparence; il est possible de fusionner deux images teintes lune en rouge et lautre en vert (anaglyphe), mais il nest pas possible de fusionner un ngatif et un positif. De la mme manire, il est difcile de fusionner une image dhiver avec une image dt. Le stroscope reprsente le dispositif optimal pour lobservation dimages photographiques (cf. g. 4). Au moyen de deux systmes optiques, on regarde les deux images en veillant que les yeux soient focaliss

g. 3: dessins dun octadre en perspective montrant deux vues diffrentes permettant une observation stroscopique

FI - 21

VISION ET MESURES STROSCOPIQUES

g. 4: stroscope miroirs permettant la vision de deux images photographiques jusqu la dimension 23 x 23 cm (format standard des photographies ariennes). Le systme optique permet dagrandir les images en focalisant linni ; il offre des conditions optimales pour la vision stroscopique des photos: bonne qualit optique, sparation complte des deux images partielles, bon confort pour lobservateur aprs une brve adaptation

linni. La base des yeux peut tre agrandie par des prismes ou des miroirs an de permettre aussi lobservation dimages de grand format. De bonnes images transparentes supportent un agrandissement optique jusqu 20 fois. Dautre part, un bon stroscope offre un champ de vision par exemple jusqu 7 cm et mme plus lors

dun agrandissement de 3 fois. Il est entendu que des images peuvent aussi tre afches sur un moniteur stro ; cependant, il faut dans ce cas-l compter avec une certaine rduction de qualit et il faut surtout veiller une large sparation optique des deux images homologues. FI - 22

VISION ET MESURES STROSCOPIQUES

g. 5: lordinateur analogique du restituteur photogrammtrique Kern PG2 (construit en 1960 environ 1000 exemplaires) permettant de suivre des lignes en stro sur deux photos homologues laide dune marque-repre et de dessiner ces lignes gomtriquement correctes pour llaboration dune carte topographique. La complexit rsulte de la ncessit de corriger, outre les dformations perspectives, dventuelles inclinaisons des photos

FI - 23

VISION ET MESURES STROSCOPIQUES

MESURES STROSCOPIQUES DOBJETS La reconstruction spatiale dun objet tridimensionnel laide de deux prises de vues photographiques permet aussi de prendre des prcautions pour effectuer des mesures. En principe, il suft dintroduire dans les images photographiques une marque de rfrence (marque-repre) et dobtenir concidence entre ce point articiel et le point de lobjet mesurer. Si les coordonnes de trois points dans lespace-objet sont connues, on peut dabord dterminer la position spatiale, y inclus les angles dorientation des prises de vues, laide dun simple relvement ; par la suite, on peut dterminer par intersection les coordonnes 3D des diffrents points de lobjet. En photogrammtrie, on utilise dj depuis le dbut du sicle des instruments permettant une restitution par lignes des images photographiques. La premire gnration dinstruments a rsolu lintersection laide de tiges mcaniques (cf. g. 5); lapplication principale tait surtout ltablissement de cartes topographiques partir de photographies ariennes ; venait ensuite llaboration de plans de faades pour larchitecture. Lindustrie suisse, avec sa

grande exprience en mcanique de haute prcision, a su conqurir une position dominante au niveau mondial dans la construction de ces instruments photogrammtriques. Dans les annes 70, on a commenc remplacer les ordinateurs analogiques par des composantes digitales mais on a continu mesurer sur limage originale, cest-dire que seule lopration de lintersection tait effectue par ordinateur, en prenant en considration linclinaison des images et leur distorsion. Ce nest que dans les annes 90 que les ordinateurs ont atteint une performance sufsante permettant dafcher les images stroscopiques sur un moniteur et de raliser des restitutions photogrammtriques (cf. g. 6 et 7). La transition vers le traitement numrique des images a permis aussi lautomatisation des diverses oprations de mesure, comme par exemple la combinaison de plusieurs images en un bloc qui, par la suite, peut tre orient de manire uniforme par rapport des points de rfrence terrestres. On a aussi commenc automatiser les mesures des distances dobjets laide de la corrlation dimages ou de la reconnaissance automatique dobjets. FI - 24

VISION ET MESURES STROSCOPIQUES

g. 6: restituteur digital dIntergraph (Etats-Unis) pour la production de cartes numriques partir de photographies en stro visualises sur cran dordinateur

g. 7: principe de la sparation des images avec les Liquid crystal eye shutters, un systme actif synchronisant les lunettes par un faisceau lumineux

FI - 25

VISION ET MESURES STROSCOPIQUES

APPLICATIONS ET PRCISION Comme on la dj laiss entendre, un large domaine de la photogrammtrie est consacr la restitution topographique et llaboration de cartes diffrentes chelles ainsi qu lacquisition de donnes de base pour diverses tches de planication. Dautre part, la photogrammtrie est utilise pour la surveillance de lenvironnement, jusqu la mesure de lpaisseur de neige sur les pentes davalanches. Dautres domaines dactivit importants sont reprsents par la robotique, les mesures industrielles et la mdecine. Dans ces domaines, la photogrammtrie se trouve en concurrence avec les mesures godsiques, les mesures de distance par laser ou aussi les procds de moir. En photogrammtrie arienne, on utilise des camras grand format de 23 x 23 cm avec lesquelles on obtient des prcisions de 3 10 m (1 m = 0,001 mm). Cela signie quavec des vues prises dune altitude de 1000 m sur sol on obtient une prcision au sol de 5 cm en planimtrie et de 10 cm en altimtrie (environ 1 :10000 de laltitude de vol).

PERSPECTIVES Les progrs en traitement numrique dimage ouvrent aussi de nombreuses nouvelles possibilits pour la saisie dobjets et leur reprsentation, notamment grce la ralit virtuelle. Dans ce cas, on modlise dabord le paysage et lon remplit les surfaces avec des textures appropries. Par la suite, on peut crer un y through. De telles squences vido sont utiles pour tudier par exemple limpact sur lenvironnement de nouvelles constructions ou de nouvelles voies de circulation mais aussi pour lanalyse de la scurit routire. Des lms impressionnants peuvent tre obtenus par combinaison de squences vido dobjets existants avec des objets en planication. De grandes nouveauts peuvent aussi tre obtenues par lutilisation de camscopes numriques et de vidos numriques pour la saisie de lobjet et en particulier en combinant divers capteurs comme des scanneurs lasers avec des systmes denregistrement dimage. s

FI - 26

MAQUETTE, PANORAMA ET RENDERINGUlrich Doepper, EPFL-DA-IRE, Chaire dinformatique, e-mail : [email protected]

La 3D passionne larchitecte, mais celui-ci continue sexprimer de prfrence au moyen de dessins en deux dimensions. Lobjet en 3D est une maquette numrique. Elle reprsente une sorte de matire brute, dont on pense pouvoir tirer les diffrentes reprsentations du projet, mais selon un mode qui nest pas encore rsolu de manire acceptable. Les architectes se sont intresss linformatique sur le tard. Dans leurs rangs se trouvent, ct du dernier carr dirrductibles, indiffrents, sceptiques et hostiles, de nombreux enthousiastes, parfois victimes de divers prjugs qui concernent linformatique. Lordinateur est objectif ; il ne ment pas. La rigueur du Nombre permet son usager de rester honnte. Il le soustrait la possibilit de tricher, puisque ce qui passe par lui, tant scientique, est tout fait reproductible, donc vriable.

Ainsi, un exercice dont lordinateur se charge trs bien, cest celui, routinier, du photomontage, impos par lorganisateur dun concours qui veut pouvoir comparer diffrents travaux, ou par lautorit soucieuse dvaluer limpact dune opration immobilire. Lordinateur est un outil de vrication. Lordinateur est magique. Ce qui sy passe est mystrieux, le rsultat chappe aux explications. La cotation des plans est automatique, lorthographe vrie sans savoir lire. Le dessinateur rentre le projet dans la machine, et celle-ci sort les plans. Les plans : tout est dit. Un plan est plat, 2D. Vitruve distinguait trois modes de reprsentation de larchitecture. Lichnographia, cest--dire le plan, lorthographia, le rabattement de llvation, et la scaenographia qui est la reprsentation de lobjet architectural depuis un point de vue dtermin. La strographie, comme on FI - 27

MAQUETTE, PANORAMA ET RENDERING

appelle lcriture des solides, est prcisment leur reprsentation, leur projection orthogonale sur un plan, elle ne se conoit quainsi. Lcriture est codie, rgie par une grammaire et sappuyant sur un vocabulaire reconnu de tous. La gomtrie, la matrialit, la spatialit du projet darchitecture sont reprsentes au moyen de codes graphiques soigneusement contrls et diffuss par les coles, les traits, la pratique professionnelle. Le concept prcde son expression, on le tient avant de passer lacte. Le dessin est lexpression du dessein. Cest ce titre que la 3D reprsente une rvolution, un chambardement vritable des conventions en matire de reprsentation. Entendons-nous : la moindre qualit de larchitecte nest pas de voir dans lespace ; tout est tridimensionnel, et si la reprsentation du projet ne lest pas, le but ultime de son travail, le chantier, lest nouveau. La reprsentation volumique dobjets architecturaux ne date bien sr pas de lre informatique. Le modle rduit, la maquette, existent depuis la nuit des temps comme objets symboliques, et leur usage reut les bases thoriques la Renaissance. La haute intelligibilit, la simplicit de lec[rfrences en page 118]

ture dune maquette en font un outil de communication et de sduction, de propagande et de vulgarisation ; sa nature volumique permet ltude daspects du projet que les plans ne montrent pas. MichelAnge expose au pape son projet de SaintPierre sous forme de maquette ; Massna, craignant de devoir livrer bataille en pleine montagne pour empcher la jonction de lennemi, confectionne, an de sy prparer, un plan-relief du massif du Susten. Alberti a dni ce double aspect de la maquette. Le btiment est dni par la lineamenta, qui est quelque chose comme la dnition, au sens premier de dlimitation gomtrique de lespace occup par la matire, la dnition stromtrique de ldice [1]. Elle permet dapprhender lobjet dans sa plastique totale, et surtout, elle constitue un outil de projet et non une n en soi, comme laurait t une sorte de modle rduit du chantier. Lexhortation dAlberti, de ne pas cder la tentation dune maquette trop dtaille, trop belle, dont la raison dtre nest que de sduire, illustre lenvi une proccupation qui est videmment la ntre aujourdhui. Si la maquette de Saint-Pierre tait accessible lintrieur, elle ne parvenait cependant pas tromper lobservateur et faire croire quil pt se trouver dans la vraie FI - 28

MAQUETTE, PANORAMA ET RENDERING

Roger de Piles. Illustration du principe de clair-obscur sur des cercles plats. Tir de: Cours de peinture par principes, 1708

glise. Mais le principe dimmersion dans un espace suggr na pas tard se dvelopper. Le XIXe sicle notamment a connu lessor dun type architectural populaire, de masse, le panorama [2]. Une iconographie touristique, historique, naturaliste et patriotique permettait de visiter des lieux inaccessibles ou de revivre des vnements passs. Ce principe illusionniste (qui fut[rfrences en page 118]

sur le point de mourir, lexemple du sauvetage in extremis du panorama des Bourbakis de Lucerne) trouve son prolongement dans le dveloppement de la vision stroscopique, panoramique et interactive daujourdhui. Le produit 3D pour architecte prvoit videmment la nalit du travail de celuici. Quelle que soit la philosophie du logiFI - 29

MAQUETTE, PANORAMA ET RENDERING

ciel, le rsultat sera bi-dimensionnel. Que lon raisonne en volumes, solides, primitives formes de botes ou de groupements de surfaces, les lments doivent tre qualis, possder une matrialit, leurs rapports respectifs doivent tre dnis : ils attendent dtre coups et projets. Cest une logique daspic, une logique de Visible Human Project. Lobjet est. Il prexiste sa reprsentation, et le problme de celleci reste entier. Linfographie 3D raisonne toujours dans les trois catgories de lantique Vitruve. La scaenographia dune cuisine IKEA, ralise lcran en temps rel sur la base de votre croquis et de votre budget, prtend et l est la navet de notre poque lobjectivit. Ds quelle fut dcouverte et thorise par un Brunelleschi, la loi de la perspective ne fut plus bonne qu tre enfreinte, nuance. On dut demble reconnatre que la perspective constitue toujours une rduction de la ralit. Ds la dcouverte de la photographie, le dbat autour de son statut dart tmoigne aussi de la relativit de cette notion objectivit, de linnocence du doigt qui a actionn lobturateur. Le concept mme de rendering engage lartiste qui restitue, reproduit, reprsente : le rendu est avant tout celui dune impres[rfrences en page 118]

sion. Trente ans aprs avoir t dmasque, la pratique Beaux-Arts du rendu pour le moins suspecte, refus dune reprsentation objective de lobjet, tromperie par la sduction cette logique du beau dessin nous revient (les deux vnements sont contemporains) par lobsession photoraliste de limage de synthse. En 1968, Arthur Appel avait dj formul lessentiel de ce qui est ncessaire pour dnir le rendering dun solide, et louvrage na pas quitt le mtier depuis. La course au rel et lhallucination raliste est sans issue car, quand lobjet est exactement semblable un autre, il ne lest pas exactement, il lest un peu plus. () Ce qui est exact est dj trop exact, seul est exact ce qui sapproche de la vrit sans y prtendre [3]. Limage de synthse qui tend vers le ralisme le photoralisme est condamne tre hyperraliste. Ce nest pas une fatalit : on a dit que Manet ne savait pas peindre un centimtre de peau () on oubliait seulement quavant de vouloir () peindre la chair, il voulait peindre des tableaux [4].s

FI - 30

MON ORDINATEUR VOIT DOUBLEJean-Franois Rolle, EPFL-GR-IGEO-Photogrammtrie www.wiesmann-rolle.com, [email protected]

AVANT PROPOS Par un phnomne de mode remarquablement orchestr, le consommateur de matriel informatique voit son vocabulaire technique irrmdiablement stoffer. Tout, du moniteur son jeu prfr, sans oublier les composantes principales de son systme, se voit dcrit et spci en termes plus ou moins neutres ou racoleurs tels que : tridimensionnel, stro-compatible, 3D ou Virtual Reality (VR). A la base de ce phnomne, on retrouve le principe de la vision stroscopique, tabli il y a plus de 150 ans dj. Il nous a sembl important de proter de cette dition spciale du Flash Informatique pour dresser un historique et une liste des solutions techniques retenues pour afcher sur un cran dordinateur plat, lillusion de la perception de la profondeur. La photogrammtrie, application de la strophotographie aux levs topographiques,[rfrences en page 119]

aux relevs des formes et des dimensions dobjets trs divers, est par dnition concerne par lapplication de ces techniques, au mme titre que des branches telles que limagerie spatiale, les systmes dinformation gographique, la DAO et CAO, la robotique, limagerie mdicale et les techniques danimation, de visualisation et de modlisation 3D. UN PEU DHISTOIRE [1] Recrer la perception visuelle de la profondeur a t le souci de chercheurs ds lapparition des premiers postes de tlvision. Des pionniers essayrent de visualiser des images stroscopiques sur ce nouveau mdia ds la n des annes 40. Il semble que la premire application commercialise soit apparue en 1950 ; elle consistait en un systme de deux crans conu sur le principe des anaglyphes FI - 31

MON ORDINATEUR VOIT DOUBLE

(Dumonts dual CRT system de Logie Baird). A la mme poque apparaissent des systmes dafchage dimages cte cte devant tre observes au travers de stroscopes binoculaires. Leur inventeur, James Buttereld, fut galement le premier utiliser des verres polariss pour observer des anaglyphes crs en plaant des polariseurs dichroques sur la face du CRT (cathode ray tube). Cette technique, en premier lieu applique grce la combinaison de deux crans, volua vers lutilisation dun seul cran en combinaison avec des images stroscopiques imbriques (interdigitated). Finalement, Shmakov dveloppa les bases thoriques des techniques Field sequential. Pour des raisons techniques (crans plats en particulier), le premier produit de ce type napparut quau dbut des annes 80. LA VISION STROSCOPIQUE

GENSE La vision stroscopique sest dveloppe chez les invertbrs, il y a plusieurs centaines de millions dannes, pour des raisons de survie. Des dmonstrations rcentes ont montr quun insecte, sur les[rfrences en page 119]

yeux duquel on a coll des prismes, manque sa proie pour une distance correspondant exactement la distance thorique calcule. Lacuit visuelle de ltre humain sest dgnre gntiquement et il est frquent de constater la perte de la perception stro. La grande majorit possde une bonne perception, mais des tests mettent en vidence de grandes disparits. La vision stroscopique, phnomne psychique, peut tre exerce. On constate alors de rapides progrs sous la forme dune fusion plus rapide et dun plus grand confort de vision. Il apparat quenviron 12% des individus sont incapables de percevoir un modle stro [1]. Il sagit dun manque de coordination dans le travail des yeux, cest--dire une vision binoculaire dfaillante (strabisme, amblyopie). Au contraire, 10% des tres humains prsentent des facults exceptionnelles pour la vision stro. Ces facults, fusion rapide, prolonge et confortable dimages, leur permettent de percevoir des scnes qui resteraient trs inconfortables, voire impossibles, pour un individu moyen. Des phnomnes de variation dus lge doivent encore tre pris en considration. FI - 32

MON ORDINATEUR VOIT DOUBLE

DFINITION DE LA PERCEPTION BINOCULAIREDE LA PROFONDEUR

tance, nomme parallaxe, produit la sensation de profondeur stroscopique. Les conditions de la vision stroscopique (g.1) sont successivement : une bonne vision binoculaire, les deux yeux fonctionnent en quipe, sans coup, prcisment et simultanment ; la vision stroscopique, le cerveau fusionne les deux images reues en une seule image tridimensionnelle ; la perception binoculaire de la profondeur, rsultat des tapes prcdentes, est la facult de percevoir visuellement lespace tridimensionnel.

PERCEPTION MONOCULAIRE DE LAPROFONDEUR

g. 1: principe de la vision stroscopique

Lorsque nous regardons un objet devant nous, nous le voyons naturellement en volume car les pupilles de nos yeux (espaces en moyenne de 64 mm) peroivent deux points de vue peine diffrents de lobjet. Le cerveau combine ces deux images en une seule. Le mme point, repr sur limage de gauche, subit un lger dplacement sur limage de droite. Cette dis-

La perception de la profondeur est avant tout le fait de notre anatomie. Mais il serait faux de ne considrer que ce seul lment. Un seul il reoit diffrents stimuli qui lui permettent dinterprter la profondeur dune scne. Une personne ne bnciant pas de la vision stroscopique dveloppe des processus cognitifs dinterprtation de ces diffrents stimuli. Cette interprtation lui permet dvoluer tant bien que mal dans lunivers 3D nous entourant. Les lments de la perception monoculaire sont : FI - 33

MON ORDINATEUR VOIT DOUBLE

lumire et ombrage

La texture, tant plus apparente au premier plan, provoque un sentiment de profondeur ;interposition

Un objet en cachant partiellement un autre est automatiquement interprt comme tant devant ; Une ombre permet de donner un volume lobjet et les surfaces claires semblent plus proches que les fonces ;taille relative

parallaxe du mouvement

Dans une voiture en mouvement, les poteaux tlphoniques se dplacent plus rapidement que les collines loignes ; Les objets apparaissent plus grands lorsquil sont prs et la mmoire permet de juger de la distance vers des objets familiers ;gradient de texture perspective

Ce stimuli est trs important car il permet de donner un facteur dchelle la perception binoculaire de la profondeur ; FI - 34

MON ORDINATEUR VOIT DOUBLE

la perspective est la relation entre le premier plan et larrire plan ;depth cuing

mesure sur le couple dimages, se transforme sur la rtine en une disparit qui produit le sentiment de profondeur. La parallaxe peut galement tre exprime sous forme angulaire en tenant compte de la distance lobservateur. Lappareil optique permettant de visualiser un couple dimages strophotographiques se nomme stroscope.

Rduction de lintensit dun objet en fonction de la distance lobservateur. Des images prsentant de nombreux lments de perception monoculaire de la profondeur, seront dautant plus faciles interprter en vision stroscopique. VISUALISATION DES IMAGES STROSCOPIQUES

LA MTHODE ANALOGIQUE Reproduire la perception de la profondeur est possible en forant lil gauche regarder une image et lil droit une autre, tout en prenant garde que ces deux images montrent des parallaxes sur les points de limage. La parallaxe, distance

TRANSPOSITION NUMRIQUE Le principe nonc ci-dessus ne peut se reproduire sur le moniteur dun ordinateur que par lmission simultane de deux images, lune destination de lil gauche et lautre de lil droit. De manire gnrale, en mettant en alternance les deux images (pour autant que le balayage soit sufsamment lev: >60Hz), il est possible de tromper notre cerveau en protant de notre aptitude visuelle relativement limite. Pour tre capable de recevoir correctement cette information sur la parallaxe, lobservateur doit encore tre muni dun obturateur (shutter), synchronis de manire cacher limage non dsire et/ ou au contraire permettre la visualisation de la bonne image par le bon il. Visualiser un couple dimages stroscopiques est galement possible en projetant linformation de parallaxe nonFI - 35

MON ORDINATEUR VOIT DOUBLE

plus sur un seul cran, mais sur deux. Ce principe est appliqu pour les casques de ralit virtuelle (HMD, Head Mounted Display). Ce priphrique se compose de deux petits moniteurs LCD monts en face des yeux. Chaque il reoit linformation ncessaire la fusion des deux images, ce qui permet linterprtation de la profondeur.

LES TYPES DE FORMATS [2, 3] Par dnition, un format electro-stroscopique est la mthode utilise pour dnir lappartenance des pixels limage de gauche ou droite, pour que le couple stro afch lcran apparaisse aux yeux de lobservateur selon le principe du stroscope binoculaire. On dnombre un certain nombre de solutions diffrentes, mais seules les plus courantes sont dcrites ici. Il nest pas fait cas de systmes tels que les anaglyphes ou lutilisation de stroscopes miroirs.Field sequential

Il faut que le balayage vido soit relativement lev (>100 Hz) pour reproduire de bonnes conditions dobservation. Lobservateur doit tre muni de lunettes pour interprter correctement le signal mis par lcran. On distingue deux techniques diffrentes, le mode actif et le mode passif. En mode actif, les lunettes se composent dun obturateur cristaux liquides command par un signal infrarouge de synchronisation avec lafchage altern du moniteur. Dans le cas du systme passif, on applique la surface du moniteur un modulateur cristaux liquides (obturateur segment de Byatt). Il suft lobservateur de se munir de lunettes verres polarisants (directions de polarisation diffrentes de 90) pour recevoir correctement linformation.

Cet afchage encode limage de droite puis celle de gauche en alternance dans les champs successifs de lafchage vido. Ce multiplexage temporel a pour avantage de ne demander que trs peu de modication du matriel ; ce dernier argument est la base du succs commercial de ce format.[rfrences en page 119]

systme passif (Z-Screen de StereoGraphics Corp.)

FI - 36

MON ORDINATEUR VOIT DOUBLE

On retrouve sur de nombreuses stations de travail graphiques (SGI, Sun, DEC, IBM et HP) une prise jack permettant de connecter lmetteur contrlant le signal vido et produisant le signal IR.

niteur pour entrelacer les deux images sur les lignes paires et impaires. Cette mthode permet dutiliser des priphriques dafchage traditionnels tels que tlviseur ou cran dordinateur. Dautre part, lquipement de multiplexage est simple et bon march.Above-and-Below

systme actif (CristalEyes de StereoGraphics Corp.) Interlaced stereo

Ce format utilise le balayage du mo-

Ce format a t conu pour permettre la visualisation stro sur des quipements standards (moniteur PC, tlvision ou vido). A chaque rafrachissement de lcran, le champ se compose des deux images disposes lune sous lautre, compresses dun facteur deux dans le sens de la hauteur. A un taux de rafrachissement de 60 Hz, il faut exactement 1/120 de seconde pour afcher une image. En utiliFI - 37

MON ORDINATEUR VOIT DOUBLE

sant un moniteur travaillant avec une frquence de 120 Hz, les deux images juxtaposes spatialement deviennent alors juxtaposes temporellement. En portant les lunettes obturatrices adquates, lobservateur reoit chaque seconde 60 champs dune image et 60 champs de lautre. Quand un il voit une image, lautre nen voit pas et vice versa. Cette mthode est encore applique pour les ordinateurs (PC), mais a disparu pour la vido. La vision est confortable pour peu que les images soient de rsolution sufsante (au minimum 300 350 lignes par champ). Dans le cas de la vido, le nombre de ligne est insufsant (480 divis par 2). Pour les PC (et les cartes graphiques travaillant des taux de rafrachissement de lordre de 60 Hz), il est ncessaire dutiliser un metteur (synch doubling emitter) dont le but est de crer un signal vido propre en ajoutant les pulsations de synchronisation manquantes (vertical blanking).Side-by-Side

gnes nest alors plus un problme. Sur une vido, le rafrachissement ntant que de 30 Hz, il est ncessaire de diffuser les images deux fois plus rapidement quelles nont t saisies.

White-Line-Code WLC

Ce format rsout le problme dcrit prcdemment appliqu la vido. En afchant les images non plus lune sous lautre mais cte cte, le nombre de li-

Ce format offre une solution bon march pour les PC. Il permet de se soustraire au taux de rafrachissement pour juxtaposer temporellement les images. Une ligne blanche est afche au bas de chacun des champs, linterprtation par les lunettes de cette ligne permet de savoir si ce champ est destin lil gauche ou droit. Cette mthode, par sa simplicit et son prix, est particulirement adapte pour le dveloppement de jeux. FI - 38

MON ORDINATEUR VOIT DOUBLE

passives (verres polarisants). Celles-ci ont laspect dune paire de lunettes de soleil traditionnelle. Dans les deux cas, ces lunettes permettent une vision normale de lenvironnement en dehors du champ de lcran. Ce nest pas tout fait le cas avec un systme simple comme les anaglyphes (lunettes avec ltres de couleur diffrents).

LES PROBLMESDiffrents problmes connus peuvent tre une source dentrave une bonne vision stroscopique en application avec les formats dcrits ci-dessus.FlickerWLC

LES LUNETTES (SHUTTERS) Lobservateur est contraint de porter des lunettes dont la fonction est de sparer les signaux reus de lcran vers chacun des yeux. En mode actif, les lunettes reoivent leurs ordres douverture et dobturation par un signal infrarouge qui doit tre mis proximit de lcran. Cet quipement est moins agrable porter que les lunettes

Le icker, ou scintillation, est le problme le plus contraignant pour une observation agrable en vision stroscopique. Les images reues donnent limpression de scintiller ou de trembloter. Ce problme, qui peut varier en fonction principalement de la brillance et de la taille de lcran, est frquemment rencontr sur des systmes ayant une frquence de balayage faible (60 Hz). Il faut distinguer deux types de scintillation, due soit lillumination ambiante (room icker) soit lafchage proprement FI - 39

MON ORDINATEUR VOIT DOUBLE

dit (image icker). On peut attnuer les effet de la premire en rduisant lillumination du local. Pour la deuxime, il faut intervenir au niveau des rglages de lafchage vido en contrlant les fonctions de brillance et de contraste de lcran. Son limination complte est ralisable en utilisant des frquences suprieures (120 Hz).Illumination asymtrique

Limage de droite est cense disparatre pour permettre lafchage du champ suivant. Dans les faits, elle ne sestompe pas compltement et persiste, cest particulirement vrai dans le cas du phosphore vert. Cette rmanence provoque en mode stro un effet de ghosting. Il peut tre mis en vidence en utilisant des images avec de trs grandes valeurs de parallaxes ou alors trs contrastes.Absorption du signal

Des diffrences dans lillumination des images stro transmises lobservateur augmentent leffet de icker. Mme faibles (de 3 6 dB), ces diffrences peuvent dj entraner une augmentation. Une diffrence de lordre de 3% dans lillumination des images transmises gauche et droite est dj trop importante pour garantir une vision confortable [1].Crosstalk (Ghosting)

Dans le cas de lafchage stro, on retrouve le phnomne du Crosstalk (interfrence entre deux signaux). Ce phnomne pourrait se retrouver soit au niveau de lobturation (les lunettes) soit lcran. Les techniques de fabrication des lunettes excluent cependant une obturation imparfaite. En pratique, cet effet est d la persistance du scintillement du phosphore.[rfrences en page 119]

Ce phnomne ne gne pas le confort de vision, mais altre les possibilits de mesures. La densit lumineuse de limage mise par lcran nest pas compltement transmise lil. Lobturateur cristaux liquides, comme tout lment plac entre lmission et la rception, absorbe une partie du signal. Cest particulirement ennuyeux pour le photogrammtre qui est amen effectuer des mesures en mode stro. PERSPECTIVE ET CONCLUSION Le format le plus utilis est le mode Field sequential. Par dnition, ce standard ncessite lutilisation dun priphrique de slection des images (lunettes). Il conserFI - 40

MON ORDINATEUR VOIT DOUBLE

vera trs certainement sa place de leader ces prochaines annes grce aux progrs combins des moniteurs et des cartes graphiques (rsolution et rafrachissement). Une avance technologique remarquable pourrait concerner les systmes passifs. Lintgration par les fabriquants de moniteurs LCD dune technologie nomme Pol (MicroPolarizer Array / Parsell Matrix) dveloppe par la rme VRex pour un prix infrieur 20$/pice permettrait de dmocratiser la visualisation stroscopique de trs bonne qualit (icker free)[4]. Les applications de la ralit virtuelle seront trs certainement le moteur de dveloppements nouveaux. Comme on peut dj en faire lexprience aujourdhui, les systmes de casques incluant la vision stroscopique et le positionnement ne pourront que se dmocratiser et proter davances technologiques. Des travaux sont mens pour obtenir une image stroscopique visible sans priphrique ( il nu). Ce systme, nomm afchage autostroscopique, bute actuellement sur le problme li la sparation des deux images. Dautre part, lobservateur serait contraint de se positionner trs prcisment devant lcran et ne pourrait pas bouger sa tte sans perdre la vision stroscopique.[rfrences en page 119]

Si les tendances exprimes ci-dessus laissent entrevoir une utilisation toujours plus efcace de la vision stroscopique, on peut dores et dj afrmer que la technologie actuellement disponible sur le march permet un trs bon confort de vision pour un investissement limit (de lordre de quelques centaines quelques milliers de francs). ORGANISMES ET SITES INTERNET Stereographics Corporation :www.stereographics.com

NuVision Technologies, Inc. :www.nuvision3d.com

Dimension 3 :www.3dcompany.com

VRex, Inc. :www.vrex.com

Divers : 3D Glasses :www.hut./Misc/Electronics/docs/pc/ 3dglass.html

la vision stro :www.vision3d.com s

FI - 41

SERVEUR WEB DIMAGES PARALLLES POUR LE PROJET VISIBLE HUMANSamuel Vetsch, Vincent Messerli, Oscar Figueiredo, Benoit Gennart, Roger Hersch, EPFL-DI-Laboratoire de Systmes priphriques, e-mail: [email protected], Laurent Bovisi, Ronald Welz, WDS Technologies SA, Genve & Luc Bidaut, Hpital Cantonal Universitaire, LFMI, Genve,

La visualisation dimages mdicales 3D obtenues par coupes cest--dire par lintersection dun volume 3D avec un plan dorientation et de position quelconques est un outil de choix pour la formation en anatomie et laide au diagnostic. Dans cet esprit, nous avons dvelopp, dans le cadre du projet Visible Human, un serveur de coupes offrant aux intervenants la possibilit de spcifier interactivement la position et lorientation de la coupe dsire et de lobtenir partir dun volume tomographique 3D, qui se compose dimages CT, IRM (imagerie par rsonance magntique) ou obtenues par cryosection (images numriques en couleur de sections du corps congel). Pour linteraction avec lutilisateur dans le but de spcifier la position et lorientation de[rfrences en page 119]

la coupe, nous utilisons une prsentation miniature 3D de limage complte. Accder et extraire des coupes depuis les images du Visible Human [1] exige un espace de stockage important (13Goctets pour le jeu de donnes de lhomme) et beaucoup de puissance de calcul. Nous avons donc dcid de construire un serveur sur la base de 5 PC Bi-Pentium Pro. Un PC Bi-Pentium II supplmentaire sert de serveur Web. Tous les PC sont interconnects travers un switch Fast Ethernet. Au total, 60 disques sont distribus entre les 5 PC. Le volume Visible Human est segment en volumes lmentaires de 32x32x17 (51 KB en couleurs) qui sont rpartis sur les diffrents disques associs aux PC. Lapplication Serveur de Coupes FI - 42

SERVEUR WEB DIMAGES PARALLLES POUR LE PROJET VISIBLE HUMAN

g. 1: spcification laide dune applet Java 1.1 du plan de coupe dans limage tomographique 3D miniaturise

FI - 43

SERVEUR WEB DIMAGES PARALLLES POUR LE PROJET VISIBLE HUMAN

Visible Human convertit une requte de coupe donne par sa position et son orientation en un ensemble de requtes daccs parallles aux sous-volumes qui intersectent la coupe dsire (sous-volumes distribus sur les disques) et de requtes dextraction et de projection de morceaux de coupes (g. 2). Les morceaux de coupes ainsi obtenus sont ensuite assembls pour former la coupe finale qui est compresse par le serveur Web et envoye au client Web. Le serveur dimages parallles utilise loutil de paralllisation CAP [2] et les composants pour systmes de fichiers parallles [3], ce qui nous a permis de construire des applications parallles combinant une performance de calcul leve ainsi quun grand nombre doprations dentresorties asynchrones.

Lapplication serveur dimages parallles se compose dune interface rsidant sur le PC serveur Web et de processus serveurs qui sexcutent sur le rseau des 5 PC. Linterface interprte les paramtres demplacement et dorientation de la coupe dfinis par lutilisateur et dtermine les lments dimages qui devront tre accds. Il envoie aux serveurs concerns (ceux dont les disques contiennent ces lments) les requtes de lecture de sous-volumes et dextraction de coupe. Ces serveurs excutent les requtes et transfrent linterface les morceaux de coupes rsultants. Linterface en fait lassemblage pour engendrer limage de la coupe finale (g. 3). Lapplication serveur dimages parallle est dcrite dans le diagramme de la g. 4 et par le programme de la g. 5. Le

Spcification du plan de coupe

Extraction d'une coupe du volume 3D

Assemblage des diffrents morceaux de coupe et projection Les diffrents dans la grille de morceaux de coupe visualisation

g. 2: extraction des morceaux de coupe dun volume 3D divis en extents[rfrences en page 119]

FI - 44

SERVEUR WEB DIMAGES PARALLLES POUR LE PROJET VISIBLE HUMAN

programme de la g. 5 dcrit lapplication parallle un niveau dabstraction lev selon le formalisme CAP (ComputerAided Parallelization). Ce programme est prcompil en code C++ qui est ensuite compil pour sexcuter sur les serveurs PC et sur le PC dinterface. La performance du serveur a t teste en distribuant le volume des donnes du Visible Human (jeu de donnes pour lhomme : 13Goctets) sur 1 5 PC BiPentium Pro et sur 1 12 disques par PC (maximum 60 disques). La figure 6 montre le nombre de coupes couleurs 512x512 extraites par seconde pour diffrentes conClient: Applet Java 1.1

figurations. Chaque accs une coupe est dcompos en 437 requtes daccs de sous-volumes (total : 22 Moctets de donnes pour les sous-volumes intersects). Le goulet dtranglement est toujours le dbit effectif dentre/sortie sur le disque (pour des blocs de 51KB: ~1.88 Moctets/s). Avec 4.8 images de coupes /seconde, le PC agissant comme serveur Web peut recevoir travers le Fast Ethernet 4.8 x 437 morceaux de coupes, chacun de taille 3.8 Koctets, ce qui donne 7.8 Moctets de donnes en provenance des 5 PC serveurs dimage. Pour engendrer un dbit de coupes correspondant 7.8 Moctets/s, 60 disquesServeurs PC SCSI-2

Serveur Web: Microsoft IIS 4.0

Requte dextraction dune coupe

Requtes de lecture dextents SCSI-2 Morceaux de coupe extraits et projets Intranet Fast Ethernet

Image de la coupe finale (JPEG)

Internet

g. 3: envoi des requtes de lecture dextents et rception des morceaux de coupe

FI - 45

SERVEUR WEB DIMAGES PARALLLES POUR LE PROJET VISIBLE HUMANt te n E x ve r [] Serlecture de l'extent du disque extent volumique

Cli

e nt

requte de lecture d'un extent

u te mp ] Co r ve r[ Seextraction du morceau de coupe de l'extent & projection dans la grille de visualisation

morceau de coupe extrait et projet

e Cli

nt

paramtres d'orientation du plan de coupe, descripteur de l'image tomographique 3D

g. 4: reprsentation graphique de lapplication parallle et pipeline dextraction et de visualisation de coupes1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 leaf operation Ps2ComputeServerT::ExtractAndProjectSlicePart in ExtentT* InputP out SlicePartT* OutputP { // C++ code } int SplitSliceRequest(SliceExtractionRequestT* FromP, ExtentReadingRequestT* &ThisP) { // C++ code } thread o MergeSlicePart void MergeSlicePart(SliceT* IntoP, SlicePartT* ThisP) est execute { // C++ code } operation Ps2ServerT::ExtractSlice fonction de subdivision fonction de rassemblage in SliceExtractionRequestT* InputP message de sortie de la out SliceT* OutputP construction CAP parallel while { parallel while (SplitSliceRequest, MergeSlicePart, Client, SliceT Output) ( ExtentServer[thisTokenP->ExtentServerIndex].ReadExtent >-> ComputeServer[thisTokenP->ComputeServerIndex].ExtractAndProjectSlicePart ); }

g. 5: spcification CAP de lapplication parallle et pipeline dextraction et de visualisation de coupes

calcul des extents touch s par le plan de coupe

assemblage des diff rents morceaux de coupe dans l'image finale

pointeur sur la coupe extraite

en Cli

t

visualisation de la coupe extraite

requte de lecture d'un extent

t te n E x ve r [ ] S erlecture de l'extent du disque

u te mp ] Co r ve r[ Seextent volumique extraction du morceau de coupe de l'extent & projection dans la grille de visualisation

morceau de coupe extrait et projet

FI - 46

SERVEUR WEB DIMAGES PARALLLES POUR LE PROJET VISIBLE HUMAN

sont lus un dbit de 105.6 Moctets/s (4.8 x 22Moctets). Les performances sont proches de celles offertes par le matriel, le systme dexploitation (Windows NT) et les protocoles rseau (TCP/IP). Loutil daide la paralllisation CAP simplifie la cration des applications parallles mmoire distribue. Les programmeurs crent sparment les parties squentielles du programme et expriment le comportement parallle du programme laide de CAP. La partie parallle du programme peut tre facilement modifie en changeant la squence des oprations lintrieur dune structure de contrle paral5 4.5coupes extraites/seconde

lle, en enchanant les structures de contrle les unes aprs les autres ou en utilisant des structures de contrle parallles imbriques. Pour interfacer larchitecture parallle du serveur avec le serveur WEB nous avons utilis le protocole ISAPI de Microsoft. Une applet Java tourne sur les clients Web et permet aux utilisateurs de spcifier la position et lorientation de la coupe et donc dengendrer les requtes daccs. Les rponses du serveur Web sont compresses (standard JPEG) et renvoyes aux clients Web pour laffichage. Linterface Web est oprationnelle ladresse :http://visiblehuman.epfl.ch/ s

4 3.5 3 2.5 2 1.5 1 0.5 0 0 1

1 PC serveur 2 PC serveurs 3 PC serveurs 4 PC serveurs 5 PC serveurs

2

3

4 5 6 7 8 Nombre de disques par PC serveur

9

10

11

12

g. 6: performances de lapplication dextraction et de visualisation de coupes selon diffrentes configurations du serveur, avec cache des disques dsactivs

FI - 47

HUMAINS VIRTUELS SUR LE WEBChristian Babski, EPFL-DI, e-mail: [email protected] & Ronan Boulic, EPFL-DI, e-mail:[email protected]

INTRODUCTION De la mme manire que le langage HTML sest impos pour la reprsentation des pages WEB, VRML (Virtual Reality Modeling Language) [http:// www.vrml. org/]est devenu un standard pour reprsenter des donnes 3D sur le WEB. Dans un premier temps, ce langage fut cr et soutenu par Silicon Graphics. Lunique manire de profiter de ce langage tait de possder une machine onreuse bnficiant dacclrateurs hardware pour traiter la troisime dimension. A linverse, la seconde mouture de ce langage fut mise au point par un ensemble de constructeurs, plutt que par un seul, ce qui permit VRML de passer dun statut de produit celui de standard support par un consortium de constructeurs/dveloppeurs. Ceci permit de voir apparatre les outils ncessaires la visualisation des fichiers VRML sur la majorit des plates-formes disponibles sur le march. La diffusion auprs du

grand public de VRML fut dautant plus facilite que le dveloppement des jeux sur PC amenrent les constructeurs intgrer des cartes acclratrices 3D dont bnficirent les applications utilisant VRML (principalement des plug-ins pour Netscape ou Internet Explorer comme CosmoPlayer de Silicon Graphics, [http://cosmosoftware. com/ ], mais galement des applications indpendantes comme Community Place [http://sonypic.com/]). Afin daugmenter la portabilit des mondes VRML sur le WEB, un ensemble de groupes de travail apparut, afin de standardiser la manire de reprsenter certaines donnes lintrieur des mondes VRML. L o certains groupes de travail tudient la mise au point dune version binaire de VRML ou une manire gnrique dutiliser VRML afin de raliser des mondes 3D partags par un ensemble de participants, un groupe de travail (HANIM [http://ece.uwaterloo.ca:80/~hanim/]) a dfini une manire gnrique de FI - 48

HUMAINS VIRTUELS SUR LE WEB

reprsenter des humains virtuels avec VRML. La premire version fut partiellement base sur un modle dhumain synthtique mis au point lEPFL au laboratoire dinfographie (LIG) dirig par Daniel Thalmann [http://ligwww.epfl.ch/] et sur un autre modle dvelopp au Etats Unis par Norman Badler. Une nouvelle version est en passe de voir le jour, rsultat de discussions faites travers des groupes de discussions via e-mail, o toute personne peut apporter sa contribution. PRSENTATION DE LA STRUCTURE DE LHUMAIN VIRTUEL La dfinition dun humain virtuel passe par 2 tapes principales : mise en place dune hirarchie : ceci correspond lossature de lhumain. Cette hirarchie est aussi proche que possible du vritable squelette humain afin de sassurer, par la suite, des comportements ralistes du corps modlis. dfinition dune enveloppe corporelle (la peau) qui suivra les mouvements du squelette prcdemment dfini. Cette enveloppe peut tre subdivise en plusieurs parties (correspondant aux diffrentes parties du corps : bras, avant-bras,

cuisse, mollet, etc.) ou tre forme dune seule et mme partie qui sera dforme dynamiquement en temps rel conformment la position du squelette sousjacent.

DFINITION DE LA HIRARCHIE Cest sur cette partie trs importante que porte le travail de standardisation de la reprsentation dhumains dans les mondes VRML. Nous avons dfini une liste exhaustive des articulations dignes dintrts en fonction de la prcision dsire des animations (g. 1). A chaque articulation, un ensemble de degrs de mobilit est dfini allant de un jusqu trois degrs de libert (uniquement des rotations, les translations, quand elles sont prsentes au niveau dune articulation, sont toujours de faibles amplitudes et donc, ngligeables). Cette hirarchie reste un sous-ensemble de la hirarchie complte adopte par le groupe de standardisation. Cette dernire inclut un modle anatomique complet de la colonne vertbrale. Une telle hirarchie reprsente lensemble maximal de degrs de libert support par le standard. Toute hirarchie possdant un sous-ensemble de ces points darticulation est valide. Loin de limiter les possibilits, la dfinition dun tel standard va permettre la comFI - 49

HUMAINS VIRTUELS SUR LE WEB

head_top head r_scapula(2) vt6(3) r_shoulder(3) r_elbow(2) r_clavicle(2) r_wrist(2) r_hand_center vc8(3) vc7(3) l_scapula(2) l_shoulder(3) l_elbow(2) l_wrist(2) l_clavicle(2) vt5(2) vt4(3) pelvis (3); vl1 (1) r_hip(3) vl3(2) vl2(2) l_hip(3) Joint(nb dof) Functional location (not a joint) l_hand_center

r_knee(2)

l_knee(2)

r_ankle(1) r_subtalar(1) r_mid_foot(1) r_toe(1)

l_ankle(1) l_subtalar(1) l_mid_foot(1) l_toe(1)

g. 1: le squelette humain dfini au LIG

FI - 50

HUMAINS VIRTUELS SUR LE WEB

patibilit des humains virtuels travers les mondes VRML. Comme nous allons le voir dans la section suivante, cela permettra principalement danimer un humain virtuel avec une animation qui aura pu tre produite ailleurs mais qui suivra les spcifications du standard.

modeleurs 3D qui lexporteront vers VRML. De notre ct, la gnration de cette enveloppe est automatise, via la dfinition dun ensemble de couches qui vont sadditionner sur le squelette afin dobtenir lenveloppe finale (g. 2).

DFINITION DE LENVELOPPE

g. 2: Gnration automatique de lenveloppe corporelle [http://ligwww.epfl.ch/~shen/ bb.html ]

Cette enveloppe peut videmment tre gnre manuellement en utilisant des

g. 3: le squelette nu (gauche) permettant de visualiser les articulations et le mme squelette (droite) , mais habill par un ensemble de segments rigides [http:// ligwww.epfl.ch/~babski/StandardBody/]

FI - 51

HUMAINS VIRTUELS SUR LE WEB

Une premire couche compose dun ensemble de metaballs (sorte de sphres dformables) modlisant les muscles vient sadditionner au squelette de dpart. Ces primitives possdent des caractristiques qui dfinissent leurs comportements (dformation) lorsque le squelette va bouger. Lenveloppe est alors gnre partir de ces primitives pour obtenir le rsultat nal. De mme quune seule surface couvrant la totalit du corps, un ensemble de surfa-

ces statiques peuvent tre calcules pour chaque segment. Cette solution visuellement moins agrable, permet de dcharger la machine du calcul de la dformation lors de lanimation. ANIMATION DHUMAINS VIRTUELS Toujours en exploitant les possibilits lies VRML, il est possible de grer des animations afin de donner un peu de vie

g. 4: humains virtuels en VRML mis en situation

FI - 52

HUMAINS VIRTUELS SUR LE WEB

ce qui fut longtemps un simple format supplmentaire pour donnes 3D. Evidemment, VRML peut tre utilis comme tel, mais sa spcificit apparat dans sa capacit grer des vnements (qui peuvent sapparenter aux vnements XWindow par exemple) et intgrer du code (compil ou non) afin de piloter les mondes VRML depuis un vritable programme. Simplement en dclarant une dpendance entre un vnement et un autre (horloge et tableau dinterpolation par exemple), il est possible de crer des animations sans faire appel aucune programmation.

Nous avons dvelopp un ensemble doutils qui permettent de bnficier en VRML des capacits dont nous disposons dj pour contrler un humain virtuel. Il est ainsi possible dappliquer des animations bases sur la technique des temps cl (on dfinit seulement la position du corps certains moments, les positions intermdiaires tant calcules automatiquement) ou des animations issues dune capture en temps rel des mouvements dune vritable personne (g. 5). La standardisation permet dappliquer une animation sur nimporte quel humain virtuel suivant les

g. 5 : un humain virtuel et son squelette anim via une animation capture en temps rel [http://ligwww.epfl.ch/~babski/StandardBody/]

FI - 53

HUMAINS VIRTUELS SUR LE WEB

spcifications. Avec laide du systme de prototypes de VRML, lapplication dune animation ralise par une compagnie sur un humanode tranger peut se faire de manire compltement transparente, quelle que soit la diffrence entre le nombre darticulations prsentes dans lanimation et le nombre darticulations incluses au niveau du squelette (g. 6).

APPLICATION DES HUMAINS VIRTUELS SUR LE WEB La troisime dimension devenant aussi vidente intgrer dans une page WEB que la 2D (hypertexte HTML), cela devient un outil qui peut aider rendre plus intuitif des interfaces qui ne le sont pas du tout pour des personnes trangres au monde de linformatique : il est possible de dfinir sa propre interface 3D pour la navigation (ajout dun plan affichant la position actuelle de lutilisateur, interface dinteraction avec les acteurs de synthses, etc.). Dautre part, la nouvelle dimension peut permettre certaines choses qui ntaient pas ralisables auparavant. A partir de donnes de la premire tranche de construction de lEPFL, nous avons obtenu un modle partiel de lEPFL en VRML. Cette simple conversion de format 3D en VRML peut permettre des personnes planifiant de venir lEPFL de pouvoir sy balader virtuellement et reprer les lieux depuis leur PC, via laccs une page WEB donne. Mais la visite peut encore tre plus attrayante si lon y ajoute quelques guides. Nous avons trs logiquement peupl cette EPFL virtuelle de quelques humanodes ayant chacun une tche prcise. Un premier ensemble dhumanoFI - 54

g. 6: une mme animation impliquant les doigts applique un humain virtuel incluant les doigts dans sa hirarchie et une souris ne possdant que des mains statiques [http:// ligwww.epfl.ch/~babski/StandardBody/ Animation.html]

HUMAINS VIRTUELS SUR LE WEB

des est charg de montrer les diffrentes voies de circulation ; lutilisateur peut les suivre afin de mmoriser un ventuel parcours pour se rendre dans un laboratoire donn (Fig. 7). De plus ces acteurs peuvent tre dous de parole. Ajout un ensemble doutils permettant danalyser les demandes de lutilisateur, lacteur peut alors rpondre et

se mouvoir en accord avec la dernire requte du visiteur. Avec ce principe, lacteur de synthse en VRML peut se transformer en secrtaire virtuel (Fig. 8) donnant des renseignements administratifs ou mme enregistrant les nouveaux tudiants dans un service acadmique virtuel. VRML possde galement la capacit dtablir un lien avec une application JAVA

g. 7: un plan classique, comme nous pouvons le trouver actuellement sur les pages WEB de lEPFL et une visite guide travers les coursives de lEPFL comme elle est actuellement ralisable avec les acteurs de synthses

FI - 55

HUMAINS VIRTUELS SUR LE WEB

g. 8: simulation dun service acadmique virtuel. Les diffrents documents prsents sur le comptoir font lobjets dune prsentation de la part de lhumain virtuel

externe. Il est alors possible de contrler le monde VRML depuis JAVA. Cette passerelle ouvre la porte au langage compil quest JAVA, les langages de programmation script interprts tant dune puissance et dune rapidit limite. Cette solution ferme cependant certaines portes, la liaison JAVA/VRML ntant pas implmente par tous les navigateurs VRML. CONCLUSION VRML est dsormais totalement intgr au WEB. Malgr certaines petites imperfections rsiduelles comme le volume

des fichiers VRML par exemple, qui reste un obstacle face la saturation des rseaux classiques (malgr lutilisation doutils de compression de fichiers classique) et grce laugmentation de la puissance des machines grand public dans le domaine de la 3D, VRML peut devenir un complment pour les pages WEB classiques. Le dveloppement de standard pour la reprsentation de certaines donnes en VRML peut permettre de donner une nouvelle dimension la diffusion de rsultats de recherche en 3D en saffranchissant de la dpendance du matriel qui tait omniprsente auparavant. s FI - 56

DES AVATARS AUX HUMAINS VIRTUELS AUTONOMES ET PERCEPTIFSDaniel THALMANN, EPFL-DI-Laboratoire dInfographie, e-mail: [email protected], www:http://ligwww.ep.ch

La Tlprsence est lavenir des systmes multimdia et elle permettra des participants de partager des expriences prives et professionnelles telles que des runions, des jeux, des TV shows, des parties. Les humains virtuels ou acteurs de synthse ont un rle cl jouer dans ces Environnements Virtuels partags et une interaction relle avec eux est un grand d. INTRODUCTION Les nouvelles technologies nous ont permis depuis quelques annes de crer des tres virtuels et de les animer. Plus rcemment, la Ralit Virtuelle nous a amen la possibilit de simmerger dans les mondes virtuels et dy rencontrer des tres virtuels. Enn grce aux recherches en intelligence articielle et en vie articielle, les tres virtuels sont capables dune certaine autonomie. Dans cet article, nous essayons dex[rfrences en pages 119 et 120]

pliquer o en sont les recherches actuelles dans le domaine des humains virtuels, et en particulier au Laboratoire dInfographie (LIG). Le LIG a t un des pionniers dans ce domaine qui est rest longtemps le thme de recherche dune poigne de laboratoires. Aujourdhui, le domaine a pris une grande importance, comme en tmoignent les lms, les jeux, les efforts de standardisation des Humains Virtuels dans MPEG4 et VRML, efforts auxquels le LIG participe activement, et le prochain programme cadre de lUnion Europenne [1] qui sy intresse aussi fortement. Pour expliquer les diffrents types dhumains virtuels et leur volution, nous allons nous servir de la nouvelle classication [2] des humains virtuels que nous avons propose avec quatre types : les avatars les acteurs guids les acteurs autonomes les acteurs perceptifs interactifs FI - 57

DES AVATARS AUX HUMAINS VIRTUELS AUTONOMES ET PERCEPTIFS

LES AVATARS Dans notre terminologie, les avatars correspondent des reprsentations dles de lusager. La technique consiste enregistrer directement les mouvements de lusager et les transposer sur un humain virtuel qui devrait avoir aussi son apparence. Pour implanter de tels avatars, il est ncessaire davoir des sries de capteurs comme les Flock of Birds. LES ACTEURS GUIDS Les acteurs guids sont des acteurs qui sont conduits par lutilisateur mais sans que leurs mouvements ne correspondent directement ceux de lutilisateur. Ils sont bass sur le concept de la mtaphore directe temps rel [3]. Pour comprendre le concept, prenons un exemple de mtaphore traditionnelle : le contrle dune marionnette. Une marionnette peut tre dnie comme une poupe avec des membres dplacs par des ls ou des celles. Les doigts humains sont employs pour diriger le mouvement de la marionnette. En Ralit Virtuelle, le meilleur exemple de guidage dacteurs est la navigation ralise dans les systmes dEnvironnements Distribus[rfrences en page 120]

(voir plus loin : les humains virtuels dans les environnements virtuels distribus). LES ACTEURS AUTONOMES Leur rle est de reprsenter un service ou un programme comme par exemple pour naviguer. Comme ces acteurs virtuels ne sont pas guids par les utilisateurs, ils doivent avoir des comportements leur permettant dagir de manire autonome pour accomplir leurs tches. Cela requiert de btir des comportements pour le mouvement, ainsi que des mcanismes appropris pour linteraction. Ce domaine est celui o la recherche de pointe se fait. A titre dexemple, nous allons prendre le cas de lvitement dobstacles, un problme que chacun dentre nous rsout chaque jour un trs grand nombre de fois. Les roboticiens ont introduit des techniques mathmatiques qui permettent dvaluer, partir dune conguration donne le ou les chemins possibles, pour aller dun point un autre en vitant les obstacles. Cette dmarche trs valable pour un bras de robot se dplaant mcaniquement dans un environnement connu et statique, est peu applicable au comportement dun humain dans un environnement souvent mal FI - 58

DES AVATARS AUX HUMAINS VIRTUELS AUTONOMES ET PERCEPTIFS

connu et parfois dynamique. Lorsquon se dplace sur un trottoir, il ne faut pas seulement viter de se cogner aux parcomtres, mais surtout viter le piton qui vient en face ; sans ou