La problématique scientifique du traitement de l’informationphysiques ou chimiques, leurs...

24
La problématique scientifique du traitement de l’information Didier Dubois et Henri Prade Institut de Recherche en Informatique de Toulouse, I.R.I.T.- C.N.R.S. Université Paul Sabatier, 118 Route de Narbonne 31062 Toulouse Cedex 4, France. E-mail: {dubois, prade}@irit.fr Résumé. Le traitement intelligent de l'information en interaction avec des experts ou des utilisateurs pose des problèmes scientifiques originaux au-delà de l'informatique symbolique ou numérique classique. Les sciences du traitement de l'information, tout en bénéficiant de la puissance de calcul des machines informatiques, concernent la manipulation d'un "matériau" dont la spécificité et l'importance se sont affirmées depuis un demi-siècle : l'information. Cet article propose un panorama structuré des principaux paradigmes du traitement de l'information, des problèmes de formalisation qu'ils posent, des outils que leur solution requiert, et des questions liées à l'évaluation des traitements proposés. L'article est ainsi centré sur les questions théoriques à la base de la thématique, plutôt que sur les aspects technologiques ou les champs d’application concernés. Quatre grandes classes de problématiques sont mises en évidence : i) la mise en forme de l'information sous un format utile à l'utilisateur ou à son traitement ultérieur ; ii) la recherche et l'explicitation de l'information recherchée ; iii) l'exploitation de l'information en vue de l'évaluation de situations, de la résolution de problèmes et l’aide à la décision ; iv) l'interaction homme-machines et ses problèmes spécifiques. Les informations sont susceptibles d'être incomplètes, imprécises, incertaines, partiellement incohérentes. Leur traitement nécessite des outils qui relèvent notamment de la logique et de la théorie des probabilités, mais aussi d'autres modélisations de l'incertain plus qualitatives, ou facilitant l'interfaçage de données numériques avec les catégories utilisées par

Transcript of La problématique scientifique du traitement de l’informationphysiques ou chimiques, leurs...

La problématique scientifique du traitement del’information

Didier Dubois et Henri Prade

Institut de Recherche en Informatique de Toulouse, I.R.I.T.- C.N.R.S.Université Paul Sabatier,118 Route de Narbonne

31062 Toulouse Cedex 4, France.E-mail: {dubois, prade}@irit.fr

Résumé.Le traitement intelligent de l'information en interaction avec des experts oudes utilisateurs pose des problèmes scientifiques originaux au-delà del'informatique symbolique ou numérique classique. Les sciences dutraitement de l'information, tout en bénéficiant de la puissance de calcul desmachines informatiques, concernent la manipulation d'un "matériau" dont laspécificité et l'importance se sont affirmées depuis un demi-siècle :l'information. Cet article propose un panorama structuré des principaux paradigmes dutraitement de l'information, des problèmes de formalisation qu'ils posent,des outils que leur solution requiert, et des questions liées à l'évaluation destraitements proposés. L'article est ainsi centré sur les questions théoriques àla base de la thématique, plutôt que sur les aspects technologiques ou leschamps d’application concernés.Quatre grandes classes de problématiques sont mises en évidence : i) lamise en forme de l'information sous un format utile à l'utilisateur ou à sontraitement ultérieur ; ii) la recherche et l'explicitation de l'informationrecherchée ; iii) l'exploitation de l'information en vue de l'évaluation desituations, de la résolution de problèmes et l’aide à la décision ; iv)l'interaction homme-machines et ses problèmes spécifiques.Les informations sont susceptibles d'être incomplètes, imprécises,incertaines, partiellement incohérentes. Leur traitement nécessite des outilsqui relèvent notamment de la logique et de la théorie des probabilités, maisaussi d'autres modélisations de l'incertain plus qualitatives, ou facilitantl'interfaçage de données numériques avec les catégories utilisées par

Equipe SIG
Information-Interaction-Intelligence, Volume 1, n° 2
Equipe SIG
© Cépaduès-Edition 2001

l'humain. De plus, l’accent est mis sur l’étude et la mise en œuvre dereprésentations structurées de l'information.Un défi majeur est constitué par le besoin de développer des systèmescapables de traiter de grandes masses de données et de mettre les résultatsdu traitement sous des formes aisément compréhensibles pour l'utilisateur.Inversement les informations détenues par l'homme doivent pouvoir êtrereprésentées et exploitées facilement par l'ordinateur.Cet article voudrait contribuer à affirmer l'unité, l'ambition scientifique etles enjeux méthodologiques des sciences du traitement de l'informationaujourd'hui. Il s'agit cependant d'un travail préliminaire, car les sciences dutraitement de l'information se sont développées depuis cinquante ans demanière éclatée, motivées par des classes d'applications distinctes, etbeaucoup d'efforts seront sans doute encore nécessaires pour en articulerune image pleinement structurée et féconde.

Abstract.An extended abstract is provided at the end of the paper.

1 INTRODUCTION

La science a pour ambition la compréhension du réel, c’est-à-dire desphénomènes observables, afin de pouvoir expliquer, prédire, mieuxmaîtriser ces phénomènes. On trouve ainsi commode de distinguer, à grandstraits, selon la nature des phénomènes étudiés, les sciences de la matière,physiques ou chimiques, leurs applications aux sciences de l’univers et auxsciences de la terre, les sciences du vivant, biologiques ou médicales, lessciences de l’homme et de la société, ce qui n’exclut pas des interactionsentre ces grands champs de la connaissance.

Dans cette perspective, la place de l’informatique, discipline évidemmentplus récente, fait l’objet de débats, certains voulant quelquefois la lier auxsciences physiques, tandis que d’autres insistent sur son rapport auxmathématiques. Ce qui tend quelquefois à lui nier une réelle spécificitéscientifique, et ce d’autant plus que souvent seuls des aspects purementtechnologiques, à l'évidence spectaculaires, sont mis en avant.

Certes, l’informatique en tant que science du calcul sur machines entretientdes rapports privilégiés avec la physique d’une part, puisque le codage del’information requiert un support matériel et qu’un processus mécanique,électronique, …, doit permettre de donner corps à la manipulation des“bits”, et peut-être demain de “q-bits” si la technologie rend possible lamaîtrise des “états quantiques”. En dehors d'une orientation purement

calcul, sous ses aspects algorithmiques, logiciels et matériels, ledéveloppement de l'informatique est étroitement lié à la possibilitéd'échanger rapidement de grandes masses d'information à travers desréseaux, grâce notamment au développement conjoint destélécommunications.

En tant que science du calcul1, ou de la computation1 (pour reprendre unautre mot, longtemps disparu du français et réintroduit via l’anglais),l’informatique s'intéresse à tout ce qui concerne la mise en œuvre deprocédures de calcul, depuis l’algorithmique jusqu'aux langages deprogrammation, à l’architecture des calculateurs, et aux réseaux, sansoublier les problèmes de sécurité informatique. Ces calculs peuventconcerner des problèmes numériques, ou manipuler essentiellement desdonnées “symboliques” (c.-à-d. non-numériques). Clairement les calculsinformatisés peuvent s’appliquer à tous les domaines scientifiques et àtoutes les sciences appliquées de l’ingénieur, depuis le calcul d’écoulementsaérodynamiques, ou de structures soumises à des efforts mécaniques,jusqu'à la vérification formelle de circuits ou de logiciels par exemple.

Le mot “informatique”, création originale en français, tout en signifiantessentiellement le domaine couvert par ce que l’anglais nomme “computersciences” (sciences de l’ordinateur), est dérivé du mot “information” ; et defait, l’âge de l’informatique est non seulement marqué par l’apparition demoyens de calculs toujours plus performants, mais aussi par un intérêtgrandissant pour le traitement de l’information. Ici le mot “information” faitmoins référence à son codage qu’à son contenu.

Le présent article doit être compris comme un plaidoyer pour les sciencesdu traitement de l’information en tant que discipline scientifique originale,centrée sur un “matériau” particulier, l’information, et sur les opérations quisont susceptibles de lui être appliquées afin de l’utiliser. Cet article, tout ens'en tenant aux grandes lignes du sujet, reprend et développe la matière d'unexposé effectué aux Assises Nationales du Groupement de Recherche

1 Étymologiquement, ces deux mots, issus respectivement du bas latin“calculare” et du latin “computare”, sont attachés à l’idée d’un codagematériel de l’information puisque “calculus” en latin classique est uncaillou, un jeton, tandis que “computatio” a semble-t-il trait à quelque chosede déjà plus symbolique, puisque “computation” au XVième et XVIièmesiècles concernait spécifiquement un compte bien particulier, celui del’évaluation du temps et de l’établissement du calendrier des fêtes mobiles(d’après A. Rey, Dictionnaire Historique de la Langue Française, LeRobert).

"Information, Interaction, Intelligence" à Lyon en juin 1998 (Dubois etPrade, 1998).

Historiquement, et si l’on excepte la statistique, les différentes disciplinesqui participent du traitement de l’information se sont développées durant lamême période que l’informatique, c’est-à-dire, grosso modo, pendant les 50dernières années. Ce sont principalement la classification et lareconnaissance des formes, la cybernétique puis l’intelligence artificielle,les bases de données, la communication homme-machine, la recherchedocumentaire, mais aussi l’analyse de données, l’automatique et la théoriedes systèmes dynamiques, la recherche opérationnelle, la théorie del’information et le traitement du signal, dans des registres différents.L’apparition quasi-simultanée de ces diverses spécialités n’est pas fortuite,et va de pair avec les capacités de calcul toujours accrues des machines,chacune d’elles faisant écho à de nouveaux besoins industriels oustratégiques. Pour ce qui est de la statistique, dont les premiers travauxremontent à la fin du XVIIIème siècle, elle est aujourd’hui rattachée auxmathématiques. Néanmoins, on peut aussi la considérer comme une partiedu paysage brossé ici, dédiée à un type particulier d’information sous deshypothèses spécifiques. En témoignent les liens de plus en plus étroitsexistant entre statistique et apprentissage en Intelligence Artificielle, etl’essor des réseaux bayésiens pour le raisonnement dans l’incertain.

À côté de ces disciplines, il existe aussi des thématiques de recherchetransversales, centrées sur le type d'information considéré, comme letraitement d'images et la vision par ordinateur, ou comme le traitement dulangage naturel, et la linguistique computationnelle. D’autres thématiquestransversales comme la robotique peuvent conjuguer des problématiquesrelevant de plusieurs de ces disciplines tout en ayant leur spécificité propre.

Comme l’informatique, toutes ces disciplines utilisent largement lesmathématiques, avec souvent des besoins nouveaux, par exemple dans lesmathématiques du discret, sans pour autant pouvoir être rangées dans lesmathématiques (ni même dans ce que l’on appelle traditionnellement lesmathématiques appliquées). En effet, on ne s’intéresse pas ici à l’étude destructures abstraites pour elles-mêmes, mais on les utilise (et au besoin onles conçoit) seulement dans la mesure où elles paraissent appropriées pourmodéliser les problèmes de traitement de l’information considérés.

Soulignons aussi que la problématique du traitement de l'information est enpleine évolution avec les quantités accrues d'informations à manipuler, àexploiter, à synthétiser, et le nombre croissant des usagers (et des usages)des systèmes de traitement de l'information, ce qui pose aussi des questions

de sécurité, de prise en compte du contexte de l'usager, voire des questionsd’éthique.

L'article est organisé comme suit. On discute tout d'abord de différents typesd'informations et de leurs imperfections possibles, puis on énumère lesdifférentes opérations qu'on peut souhaiter faire sur de l'information, ainsique les tâches d'un système d'information. Les problèmes en traitement del'information sont regroupés ensuite en quatre grandes classes quiconcernent respectivement, i) la mise en forme de l'information, ii) lestockage, la recherche et l'explicitation de l'information, iii) l'exploitation del'information, et iv) la communication de l'information. Pour finir, onillustrera le besoin de nouveaux outils de formalisation pour lareprésentation et le traitement de l'information, et l’on posera la question del'évaluation scientifique des travaux en sciences du traitement del'information.

2 NATURE DE L'INFORMATION

Le Larousse décrit le sens technique du mot 'information' comme un"élément de connaissance susceptible d'être codé pour être conservé, traitéou communiqué". On voit que l'information peut porter aussi bien sur desmondes "réels", que virtuels (comme les préférences d'un agent parexemple). Dans cet article, le mot 'information' est utilisé de manièregénérique ; il peut recouvrir aussi bien des 'connaissances' qui par natures'appliquent à des classes d'objets, que des 'données' qui se rapportent à descas, des faits, des objets particuliers.

L'information se présente souvent sous des formes complexes, résultatsd'enregistrements ou de synthèses, telles que tableaux de données, textes,images, documents audio, vidéos, multimédia, ... Encore ces termesrecouvrent-ils des classes d'objets très variés. Il existe une grande diversitéde formes, de langues parmi les textes, qui peuvent obéir à des contrainteset des objectifs très différents. Il en va de même des images. Qu'y a-t-il decommun par exemple, entre une radiographie, la photo d'un paysage, uneimage de synthèse telle qu'une affiche, ou encore un graphique, un schéma?L'information peut provenir de capteurs, de caméras, ou encorecorrespondre à des documents plus ou moins structurés.

Les informations peuvent provenir de sources multiples (ayant des niveauxde fiabilité différents), être exprimées dans des formats hétérogènes. Onpeut considérer comme objectives celles qui proviennent de capteursphysiques. Néanmoins, en Intelligence Artificielle, on cherche également à

traiter des informations fournies par l’homme, subjectives donc, et souventlinguistiques. Les outils développés doivent donc s’appliquer aussi bien àdes informations symboliques que numériques. Par ailleurs, les informationspeuvent être exploitées par un agent, ou collectivement par plusieurs agents.

Types d'information élémentaire :Soit qu'elle soit extraite de formes plus complexes, ou qu'elle soitdirectement disponible, l'information peut aussi s'exprimer par des énoncésplus élémentaires concernant des propriétés ou des valeurs. Ces énoncéspeuvent se rapporter à l'état du monde réel perçu, ou encore à l'expressionde souhaits, d’obligations, etc. L'information peut s'appliquer à- une situation particulière, déterminée ; on parle alors de données, de faits ;ils indiquent une propriété, la valeur (numérique ou non) d'un paramètre,d'un attribut descriptif pour l'objet, la situation considérés (par exemple,"Pierre a 25 ans", "le ciel est nuageux") ;- une situation indéterminée dont on affirme l'existence ou à propos delaquelle on énonce une propriété (par exemple, "il existe des personnes deplus de 100 ans") ;- des situations particulières ; il peut s'agir de données statistiques,collections d'exemples, de cas répertoriés, de contre-exemples, deprototypes, ... ;- des classes de situations ; il s'agit alors de contraintes, de lois, de règlesgénériques, qui régissent le monde considéré. Ces règles peuvent être sansexception, ou au contraire en présenter. On parle alors souvent deconnaissances.

Imperfections de l'information :L'information disponible peut être imparfaite de bien des manières ; ellepeut être :- ambiguë, si on ne sait pas de manière sûre à quoi elle se rapporte.- bruitée, si elle est soumise à une erreur aléatoire.- biaisée, si elle est sujette à une erreur systématique.- incomplète, s’il en manque une partie nécessaire pour caractérisercorrectement une situation.- imprécise, si son contenu ne correspond pas au standard de précisionattendue ; elle peut aussi être graduelle (floue) si l'ensemble des valeursauxquelles elle renvoie n'a pas de contour tranché.- incertaine, si on n'a qu'une confiance partielle dans la vérité del'information.- incohérente (ou conflictuelle), si elle contredit une ou plusieurs autresinformations.- redondante, si elle est disponible sous plusieurs formes. La redondancen'est cependant pas toujours un défaut quand elle peut contribuer à rendrel'information plus explicite.

Par ailleurs, l'information peut souvent avoir un caractère évolutif, si ellepeut être remise en cause, ou si elle porte sur un monde dynamique.

3 TACHES D'UN SYSTÈME D'INFORMATION

Un système d'information est un système, de plus en plus souventinformatique, qui acquiert, reçoit de l'information, ou après traitement enrestitue auprès d'agents humains ou artificiels, en référence à un "mondeextérieur" auquel s'intéressent les agents. Ce monde extérieur peut être réelou virtuel. Les agents peuvent éventuellement agir sur lui et le transformerou seulement s'informer à son propos. Ces agents peuvent interférer avec unsystème d'information en tant qu'utilisateurs qui récupèrent de l'information,ou en tant qu'"experts" qui apportent de l'information. Les agents sontéventuellement susceptibles de modifier ou de reconfigurer ce système.

Les tâches d'un système d'information, dans l'acception très générale qu'onvient d'essayer de délimiter, sont variées et ne sont pas toutes les mêmesd'un système à l'autre. Sans nécessairement prétendre à l'exhaustivité, lesprincipales tâches d'un système d'information consistent à- stocker l'information sous une forme suffisamment accessible et compacte;- retrouver une information stockée, sur demande ;- rechercher des informations sur un sujet donné, en écartant l’informationnon-pertinente ;- répondre à des questions spécifiques sur des situations particulières ougénériques, ce qui requiert des capacités d'inférence ;- évaluer une situation, par rapport à une ou plusieurs échelles, par rapport àun ensemble de classes possibles ;- rendre l’information intelligible à l'usager ; pour ce faire, la structurer, lasynthétiser, la résumer ;- expliquer une conclusion obtenue par le système d'information ;- extraire des informations significatives pour l'usager ;- acquérir de l'information sur le "monde extérieur", un usager, les usagers,par apprentissage ; s'adapter à un environnement évolutif ;- intégrer de nouvelles informations ; mettre à jour l'information ;- exploiter l'information pour proposer une décision, proposer une solution,planifier en prenant en compte des préférences, des buts, des objectifs ;- négocier, coopérer avec des agents.

Ainsi, très schématiquement, on peut distinguer trois grandes familles detraitements qu'on peut souhaiter faire sur l'information (Dubois et al.,1996) :

i) ceux ayant pour but de l'élaborer, de l’interpréter, c.-à.-d. de la mettredans un certain cadre réprésentationnel afin de pouvoir la communiquer,soit à un usager, soit à un nouveau module de traitement ; cela peutnécessiter de structurer, de résumer, de fusionner l'information, de laprésenter sous forme synthétique ou encore de la "banaliser" si on doitprotéger l'anonymat de personnes auxquelles elle se réfère;

- ii) ceux ayant pour fonction de la stocker, de la mettre à jour, de laretrouver, de la rechercher, de l'extraire, de l'expliciter, mais aussi depouvoir produire de nouvelles conclusions à partir des informationsdisponibles, et de les expliquer ; ceci suppose de concevoir des interfacessatisfaisantes pour les usagers. Il convient également de sécuriserl'information et d'en réglementer l'accès ;

- iii) enfin les traitements visant à exploiter l’information dans desenvironnements statiques ou dynamiques, en général dans une perspectivede décision et d'action ; il est alors question de trouver des solutions,éventuellement optimales, à des problèmes exprimés sous forme decontraintes, d'évaluer des situations selon de multiples critères, de proposerdes décisions en prenant en compte l'incertitude sur leurs résultats, depiloter automatiquement des systèmes dynamiques, de prédire lecomportement de systèmes, d'évaluer leur fiabilité.

A ces trois familles de traitements, s'ajoute une quatrième problématique,celle de la communication de l'information et de la prise en compte ducontexte de l'usager.

4 QUATRE GRANDES CLASSES DEPROBLÉMATIQUES

Les grandes classes de tâches qui viennent d'être dégagées pour letraitement de l'information (élaboration et production de l'information,stockage et recherche de l'information, exploitation de l'information, sansoublier la communication de l'information à son usager) posent un grandnombre de problèmes qu'on va essayer maintenant de passer en revue,même si c'est de manière succincte.

4.1. Mettre l'information sous une forme utile

Il s'agit de passer d'informations ou de données jugées "brutes" à unereprésentation qui soit exploitable par une chaîne de traitement ultérieur, oupar un opérateur humain. Cela peut recouvrir des problématiques depréparation et d'amélioration de l'information, d'analyse ou de synthèse detoute forme d'information, ou plus simplement d'élicitation de l'information,d'acquisition d'informations ou de connaissances, dans des cadres plus oumoins structurés.

Préparer, améliorer l'information peut signifier notamment la débruiter,l'épurer en la débarrassant de ses biais ou de ses redondances par exemple.Il peut encore s'agir de lisser des données, ou de les compléter parinterpolation et approximation. La fusion d'informations provenant dedifférentes sources qui peuvent être hétérogènes ou partiellementincohérentes procède aussi d'un souci d'amélioration ou de présentationsynthétique de l'information. La validation de bases de connaissances(vérification ou rétablissement de la cohérence, élimination deredondances,...) en offre un autre exemple.

Analyser l'information est nécessaire pour l'interpréter, mettre en évidencedes éléments utiles, utilisables ou intelligibles. Il s'agit par exemple dupassage d'un texte en langue naturelle à une représentation formalisée dansun langage artificiel. Il est alors question de manière générale, d'extraction,d'identification d'éléments, de traits caractéristiques, de classification, ouencore d'indexation par mots clés. Plus généralement, des techniquesd'annotations, peuvent permettre d'enrichir les descriptions de documents,ce qui facilitera la recherche des informations. Analyser l'information peutaussi correspondre à un problème de classification, de création detypologie. Les problématiques de découverte de connaissances ou de fouillede données cherchent à découvrir des règles génériques cachéessusceptibles d'intéresser l'utilisateur, ou à identifier par regroupement despopulations de données ciblées.

La synthèse d'information consiste souvent à construire une descriptionapprochée, simplifiée, ou structurée de l'information disponible. Il s'agit derésumer l'information. On procède alors à un changement de niveau degranularité des représentations et/ou à une structuration de l'ensemble desdonnées ou des informations. Ou encore, on doit sélectionner, oudéterminer, des paramètres pertinents en apprentissage, ou pour ladescription de grands systèmes. L'idée de synthèse de l'information peutaussi renvoyer à l'expression et à la mise en forme d'un contenuinformationnel sous une forme requise (texte, image, parole, vidéo, ...).

4.2. Stocker, retrouver, expliciter l'information

Tout d'abord, dans la mesure où on doit stocker ou transférer de largesvolumes de données, des techniques de compression d'information peuvents'avérer nécessaires. De plus, la nécessité de faire vivre le systèmed’informations conduit à en ajouter de nouvelles où à vouloir en retirer. Larévision des informations contenues dans un répertoire est uneproblématique récente et importante. Il s’agit en effet d’éviter l’apparitionde contradictions, tout en préservant le contenu de la base d’informations.En particulier, la révision des bases de connaissances déductives est unproblème que les logiciens traditionnels n’avaient jamais étudié. Parailleurs, les données stockées peuvent se rapporter à un monde évoluantdynamiquement, ce qui pose des problèmes spécifiques de mise à jour et demaintien de la cohérence.

À la différence des problématiques examinées dans la section précédente, iln'y a en général pas de changement du niveau de représentation lors de larecherche d'information ou son explicitation par inférence à partir desinformations stockées. L'interrogation de bases de données, de bases deconnaissances, de bases documentaires, de bases textuelles (éventuellementmultilingues), de bases d'images, etc. pose des problèmes de filtraged'information, de langages d'interrogation, d'évaluation de requêtes et deleur optimisation. Notons que la recherche par le contenu et/ou la structuredans des bases de données multimédias, semi-structurées, oumultidimensionnelles, contenant de grandes quantités de données à structurecomplexe ou inconnue, des données hétérogènes, renouvelle laproblématique traditionnelle à l'œuvre dans les Systèmes de Gestion deBases de Données (on va bien au-delà des requêtes précises sur des donnéesexactes). En particulier, un intérêt grandissant se fait jour pour permettredes requêtes flexibles susceptibles de refléter les préférences de l'utilisateuret d'être plus robustes au plan des réponses.

En dehors de la simple recherche d’informations stockées dans une base, ilest parfois nécessaire d’expliciter l'information en dotant le système decapacités d'inférence ou de calcul. Il peut s'agir de raisonner sur l'état dumonde à propos duquel la base stocke des informations. L'informationdisponible peut être incomplète, voire incohérente, ce qui nécessite alors lerecours à des figures de raisonnement qui vont au-delà de la déductionclassique, et qui sont capables de produire des conclusions plausibles quandl’information est incomplète. C’est le cas dans des problèmes où desconnaissances expertes sont appliquées à des situations particulièresincomplètement décrites, à des fins de prédiction, de diagnostic parexemple. Dans ce type d'applications, il peut être important que lessystèmes soient capables d'expliquer, de justifier leurs résultats àl'utilisateur. Par ailleurs, des capacités d'inférence peuvent être aussi utilesdans la mise en œuvre de politiques d'accès sélectif à l'information.

4.3. Exploiter l'information pour décider et agir

Une classe importante de systèmes d'information (au sens génériqueemployé dans cet article) est spécialisée dans la résolution de problèmes oùl'information disponible délimite un espace de recherche (ou au moins aideun usager dans cette résolution). La recherche de solution(s) à desproblèmes de satisfaction de contraintes (éventuellement flexibles),l'optimisation (multi-critère) sous contraintes sont au centre de cetteproblématique. La conception assistée par ordinateur, l'ordonnancementd'activités, la gestion de production, les problèmes de recherche deconfiguration, la création de documents multimédias, d'univers de réalitévirtuelle en fournissent des exemples.

Les questions d'aide à la décision ou de planification, prenant en compte laconnaissance disponible, les préférences des agents, exprimées de manièrequantitative ou qualitative (décision multi-critère et évaluation subjective desituations ou d'objets, décision dans l'incertain, décision de groupe etcoopération multi-agents, ...), rentrent dans ce cadre. De plus, lesenvironnements dynamiques peuvent poser des problèmes de réparation desolutions à l'arrivée d'informations entraînant une modification du contexte.

Les problèmes de commande de systèmes dynamiques peuvent aussi êtrerattachés à ce cadre, puisqu'il s'agit du calcul en temps réel de lois decommande satisfaisant des objectifs, la commande étant dans ce casdirectement appliquée à un processus physique ou chimique (en généralavec peu, ou sans, interaction humaine avec le système). La spécificité del’automatique est l’exploitation de l’information en boucle fermée, afin de

modifier artificiellement les propriétés d’un système physique (stabilisation,par exemple). La supervision des procédés concerne les tâches de suivi etde surveillance, sur un plan essentiellement informationnel. Elle pose leproblème général d'interfacer de manière cohérente les informations de basniveau fournies par les capteurs au travers d’une modélisation fine dusystème supervisé, avec des descriptions de haut niveau ne procurant quel'information utile à l'opérateur.

Notons enfin que les problématiques de résolution de problèmes ne serésument pas uniquement à des questions de satisfaction de contraintes oud'optimisation, elles peuvent aussi mettre en jeu du raisonnement paranalogie si un répertoire de problèmes déjà résolus est disponible. Desoutils d'aide à la créativité, par exemple, peuvent s'appuyer sur les deuxtypes de problématiques (exploiter des contraintes et raisonner paranalogie).

4.4. Communiquer l'information

Les informations manipulées ou produites dans les différentes tâches qu'onvient de passer en revue sont faites pour être communiquées,éventuellement dans des cadres interactifs. Les problèmes decommunication homme-machine concernent aussi bien l’acquisition deconnaissances fournies par l’homme au système d’informations que larestitution d’informations ou de décisions à un utilisateur. Outre desproblèmes liés au type de communication utilisé (parole, texte en languenaturelles, etc.), des questions spécifiques à l'interaction, au dialogue entreagents se posent. Il s'agit de modéliser et de prendre en compte enpermanence les savoirs, les croyances mutuelles, les intentions, les buts, lespréférences des agents. La problématique du dialogue recouvre aussi laquestion de la construction d'arguments (cohérents) en faveur d'uneconclusion, d'une thèse, ou de son contraire.

La visualisation de l'information doit jouer aussi un grand rôle dans lesprocessus interactifs pour fournir à l'agent humain une vue synthétique qu'ilserait difficile de lui communiquer autrement de manière résumée. C'estdéjà le cas dans les systèmes d'informations géographiques par exemple. Lavisualisation structurée d'ensembles de données est devenue uneproblématique importante. De plus les interfaces homme-machine soulèventdiverses questions d'ergonomie.

5 OUTILS DE FORMALISATION

Le besoin d'appréhender et de manipuler de manière formelle cette nouvelleentité qu'est l'information dans ses différents aspects a nécessité le recours àcertains outils de modélisation mathématique, ainsi qu'à des outils desimulation, conduisant quelquefois à de nouveaux usages de notionsanciennes, voire au développement, souvent d'abord empirique, denouveaux outils de formalisation. Une part importante des préoccupationsest tournée vers le traitement symbolique, ou qualitatif, de l'informationpour faciliter l'intelligibilité des manipulations.

5.1. Outils de représentation

Ainsi, la formalisation des nouveaux problèmes suscités par les différentesfacettes du traitement de l'information ont conduit au développement denouveaux cadres de représentation, faisant appel notamment à la logique,aux mathématiques des structures discrètes (automates, langages formelsintroduits par l'informatique, algèbres exotiques où les opérations maximumou minimum remplacent la somme ou le produit de l'algèbre linéaire, ...).De façon générale, de nombreuses classes d'opérateurs de combinaisontiennent une place importante dans le traitement de l'information et lesprocessus d'évaluation (fusion d'informations incertaines, agrégation depréférences,...). Les modèles à base du calcul des relations, lesreprésentations structurées par graphes (comme les arbres de classification,les réseaux de neurones formels en apprentissage, les réseaux sémantiquespour figurer les relations entre les mots ou les concepts, les réseaux de Pétripour modéliser de manière discrète des processus séquentiels asynchrones,les réseaux bayésiens et leurs généralisations en traitement de l'incertitudenon-probabiliste, ...) sont également très employées.

Quand on aborde le traitement de l’information dans le cadre desreprésentations cognitives liées au langage naturel et des modes deraisonnements humains, les approches basées sur la logique classique, lathéorie des probabilités, la géométrie euclidienne s’avèrent insuffisantes, carmal adaptées à la façon dont l’homme procède pour se représenter le réelqui l’entoure, et pour raisonner à son propos. Quand on le situe dans uneperspective cognitive, le traitement des informations temporelles, spatiales,spatio-temporelles, du raisonnement sur l'action, de la représentation dumouvement pose des problèmes spécifiques et originaux de représentation(p-intervalles temporels, méréologies spatiales,...). Ils ont conduit au

développement de logiques spécialisées, en particulier modales. D'autreslogiques modales (épistémique, intentionnelle, déontique,...) permettentd'exprimer ce que les agents savent, croient, quelles sont leurs intentions,obligations, etc.

Les différents types de contenus informationnels, les modalités qui peuventêtre attachées à l'information, les imperfections de l'information posent ungrand nombre de problèmes de représentation, au-delà de la représentationde données et de connaissances sous forme de tables, d'arbres, ou defonctions, etc. A côté des probabilités et des statistiques, de nouveauxcadres de modélisation de l'incertitude sont apparus, telles les fonctions decroyance (qui entretiennent des relations avec les ensembles aléatoires), oula théorie des fonctions de possibilité et de nécessité, qui, utilisant lesopérations maximum et minimum, est plus qualitative. Les relations deconséquence non monotones proposent un traitement complètementqualitatif du raisonnement à partir de règles pouvant présenter desexceptions. Ces différents cadres de traitement de l'incertitude, utilisés enformalisation du raisonnement et de la décision, peuvent être transposéspour représenter des processus d'agrégation de préférences multi-critères,l'importance des critères jouant le rôle de l'incertitude. De façon générale,incertitude et préférence peuvent être représentées de manière absolue (entermes de degrés) ou, qualitativement de manière:relative (en termes derelations). Par ailleurs, l'existence de différents cadres représentationnels del'incertitude, permettant notamment de distinguer entre les situationsaléatoires et les situations d'ignorance, a conduit à proposer d'autresmesures d’information à côté de l'entropie.

Les ensembles flous (qui modélisent des propriétés graduelles et des classesaux frontières non-tranchées, où l’on peut passer progressivement del'appartenance à la non-appartenance) sont aptes à représenter des idées desimilarité (comme dans le cas des règles floues utilisées en raisonnementinterpolatif), des préférences (par exemple dans des contraintes flexibles),ou encore de l'incertitude (en relation avec la théorie des possibilités). Lesensembles flous offrent un outil pour interfacer des données numériquesavec un nombre fini de catégories linguistiques tout en préservant unecertaine continuité à leur frontière. Par ailleurs, l'utilisation des ensemblesapproximatifs ('rough sets') est motivée par les problèmes posés par leschangements de granularité entre représentations de niveaux différents, etest pertinente en apprentissage notamment.

Les questions de formalisation du sens en linguistique computationnelle, enintelligence artificielle, en recherche d'informations notamment ont, à côtéd'approches statistiques, aussi suscité le développement de nombreux outils

de représentation structurée, ayant ou non des capacités d'inférence, commeles thesaurus de mots clés, les 'frames' regroupant des assemblages d'objetsassociés à un contexte, les scripts décrivant des séquences d'événements, lesréseaux sémantiques, les graphes conceptuels, les logiques terminologiques,les ontologies délimitant des univers conceptuels, ... Notons aussi que lareprésentation formalisée de contenus émotionnel ou esthétique commenceà faire l'objet de travaux.

5.2. Outils de manipulation

Les raisonnements, de sens commun, que l’homme effectue au quotidiensur l'information dont il dispose, s’accommodent d’informationsincomplètes, incertaines, voire incohérentes. Ils lui permettent aussi derapprocher des situations et de transposer des solutions, de tirer parti à lafois de faits généraux et d’exemples, ou encore d'appréhender de manièrequalitative des informations de nature quantitative. De tels processus deraisonnement excèdent les capacités de représentation et d’inférence de lalogique classique, développée à l'origine en relation avec la question desfondements des mathématiques, (et de la théorie des probabilités en ce quiconcerne certains aspects de l'incertitude).

C'est pourquoi diverses extensions ou affaiblissements du raisonnementdéductif ont été formalisés en l’intelligence artificielle, que cela soit pourpropager l’incertitude (probabiliste ou non) associée à des informations, oupour pouvoir produire des conclusions plausibles, en cas d’informationincomplète. Ces conclusions plausibles pouvant être révisées à l’arrivéed'une nouvelle information. De fait, les règles “ si … alors… ”, quiconstituent un format commode pour exprimer des connaissancesgénériques, ne spécifient pas toujours explicitement toutes les exceptionsdes règles, qui sinon seraient trop lourdes et requerraient souvent plusd’informations qu’il n’en est de disponibles, pour être appliquées à dessituations ou des contextes particuliers. La mise à jour en environnementdynamique pose des problèmes d'économie d'expression dans lareprésentation du changement pour ne pas avoir à expliciter tout ce qui nechange pas. Cela est relié à la formalisation de notions d'indépendance (etde dépendance), question qui se rencontre aussi dans d'autres problèmescomme en raisonnement avec des règles pouvant présenter des exceptions.

Un autre dépassement de la déduction classique s’appuie sur l'idée deproximité (une conclusion, fausse à strictement parler, mais proche d’uneautre conclusion, avérée quant à elle, sera considérée comme presquevraie), et permet alors d’obtenir davantage de conclusions par interpolation

entre conclusions avérées. Ainsi le raisonnement ou la décision à partir decas permet, en se référant à un répertoire de cas observés, d’extrapoler uneconclusion plausible pour une situation rencontrée présentant des similaritésavec ces cas connus. Le raisonnement qualitatif permet lui un raisonnementdéductif sur des ordres de grandeur qui doit rester cohérent avec ladescription numérique d'un système statique ou dynamique.

La formalisation de processus d'apprentissage a conduit au développementde nombreuses méthodes numériques ou symboliques : méthodesstatistiques, apprentissage par renforcement, réseaux bayésiens, réseaux deneurones, programmation logique inductive (qui renverse le processushabituel de déduction), ...

Le traitement de l'information nécessite non seulement des outilsmathématico-logiques de représentation éventuellement nouveaux, maisaussi à l'évidence des outils algorithmiques efficaces d'autant plus que lesquantités de données ou d'informations à traiter sont souvent trèsimportantes. On dispose ainsi de méthodes universelles de rechercheheuristique ordonnée, de la programmation dynamique, de méta-heuristiques (recuit simulé, algorithmes génétiques, ...) pour résoudredifférents problèmes d'optimisation. Les méthodes pour résoudre lesproblèmes de satisfaction de contraintes génériques ou spécialisées(contraintes temporelles ou spatiales par exemple) ont fait l'objet denombreux développements. Par ailleurs, la popularité actuelle des réseauxbayésiens et des processus markoviens pour le traitement de l'incertain, aconduit à un important renouveau des préoccupations algorithmiques dansle domaine des probabilités et des statistiques. Il en est de même en ce quiconcerne les méthodes automatiques de preuve en logiques classique ounon-classiques.

6 ÉVALUATION SCIENTIFIQUE

Dans tout domaine scientifique, il importe de se préoccuper de l'évaluabilitéscientifique des résultats obtenus. Cette question ne se pose cependant pasexactement pour les sciences du traitement de l'information comme ensciences physiques, en sciences de la vie ou en sciences humaines, oùl'observation expérimentale de la réalité peut invalider un modèle théoriquequi ne rendrait pas compte de cette réalité dans tous les aspects censéscouverts par la théorie. Les sciences du traitement de l'informationcontribuent à la conception et à la réalisation de systèmes artificiels quipermettent à des usagers de se représenter, de comprendre, d'intervenir surune certaine réalité, ou au moins les y aident. La question de l'évaluationscientifique se pose donc alors à la fois sous les angles de la rationalitéformelle des théories élaborées, de l'expérimentation, de la validationempirique auprès d'experts ou d'usagers, sans oublier l'évaluation de lacomplexité calculatoire.

Pour ce qui est de la rationalité, les outils algorithmiques développésdevraient s’appuyer sur des modèles mathématico-logiques résultant del'application d'approches formalisées en termes d'axiomes ou de postulats.Dans ce cas, il est possible de s'assurer d'une part de la cohérence formelleinterne des approches, et éventuellement d'en évaluer la pertinencepsychologique d'autre part. On peut par exemple tester dans des contextesdonnés, si l'humain se comporte comme le prescrit telle théorie normativede la décision, ou du raisonnement plausible. De manière générale, le faitque les systèmes de traitement de l'information sont interfacés avec desusagers, ou des experts doit conduire à vérifier la plausibilité psychologiqueet plus largement cognitive des modèles de représentation et demanipulation des connaissances utilisés. Ces modèles sont souvent en partieinspirés d'observations sur la façon dont l'humain, voire le vivant,appréhende et manipule l'information.

Les outils informatiques développés ne résultent pas toujours, en particulierdans un premier stade de conception, d'approches pleinement formalisées.On peut alors seulement envisager une validation empirique. Ainsi lesperformances d'un système expert de diagnostic peuvent être comparées auxdiagnostics établis par des experts humains en face des mêmes informations,et aux diagnostics réels quand ils sont connus. Des idées d'améliorationd'algorithmes, par exemple, peuvent d'abord être testés expérimentalement,avant qu'on puisse vraiment comprendre dans quel contexte et pourquoielles sont efficaces. Les protocoles expérimentaux doivent alors êtrestatistiquement validés.

Enfin les outils informatiques pour le traitement de l’information doiventégalement satisfaire à des exigences en termes de complexité algorithmique(temps de calcul, espace mémoire), voire de temps réel. Cette complexitépeut être évaluée de manière théorique, ou expérimentale.

7 CONCLUSION

Nul doute que les technologies de l'information contribuent actuellement àune révolution rapide et profonde dans les moyens d'accès à l'information,en particulier au plan du stockage, de la recherche, du transfert, et del'affichage de l'information.

À côté des problèmes de société et des questions éthiques soulevés par ladiffusion large et multimédia de l'information, le traitement avancé del'information pose aussi des problèmes scientifiques originaux qu'il esturgent de reconnaître en tant que tels. La science du traitement(informatique) de l'information est encore largement méconnue dans lacommunauté scientifique, et a fortiori dans le monde des dirigeants ou dansle grand public. Cet état de choses est à la fois dû au caractère relativementparcellaire et éclaté des recherches menées en sciences de l'information, et àune certaine prééminence des aspects purement technologiques dans lesmédias. C'est pourquoi un cadre conceptuel et méthodologique unifiéapparaît aujourd'hui nécessaire.

Le traitement avancé, intelligent et interactif, de l'information requiert descapacités d'au moins quatre ordres (en restant volontairement trèsschématique) :- La mise d'informations ou de données "brutes" sous une forme susceptibled'être ensuite plus facilement exploitée, ou communiquée à un utilisateur ;ce qui requiert des opérations de débruitage, de filtrage, de lissage, destructuration, d'approximation, d'extraction ou de résumé d'informations, ...- À un niveau de représentation donné, se posent les problèmes de stockage,d'indexation et de mise à jour de l'information. La récupération etl'exploitation de l'information nécessitent l'évaluation de requêtes de plus enplus complexes, et des capacités de raisonnements déductifs ou simplementplausibles, éventuellement aptes à pallier le caractère incertain et incompletde l'information disponible.- L'information ne doit pas seulement être communiquée à l'utilisateur, ilfaut également l'aider à l'exploiter dans des perspectives d'optimisation, deprévision, de supervision, de décision, de plans d'actions, ou decoopération, notamment.

- La communication de l'information doit de plus en plus prendre en compteles spécificités (savoirs, croyances, intentions, ...) de l'utilisateur, et aussi lesproblèmes posés par la communication partagée.

Ces questions nécessitent pour les aborder des cadres de formalisation trèsvariés, allant de la logique à des modèles numériques venant en particulierde l'analyse mathématique ou des statistiques. Les différents traitementsnécessités par l'information numérique, comme par l'information plusqualitative, ont déjà suscité le développement de nombreux outils originauxpropres à la problématique du traitement de l'information. Depuis cinquanteans, de nombreuses disciplines des sciences pour l'ingénieur, qui se sontdéveloppées en relation avec les nouveaux problèmes qui apparaissaient, sesont focalisées sur divers aspects du traitement de l'information :l'automatique, la recherche opérationnelle, l'analyse des données, lareconnaissance des formes, l'intelligence artificielle, les bases de données,la communication homme-machine, etc... Ces diverses discipliness'intéressent au traitement du matériau "information" sous différents pointsde vue, et à différents niveaux, en parallèle avec l'essor de la science ducalcul sur machine qu'est l'informatique. Il apparait donc opportun et utilede renforcer les synergies entre ces composantes des sciences du traitementde l'information.

Il semble temps de reconnaître que les sciences de l'information définissentun champ spécifique, au même titre que les sciences de la matière, ou lessciences de la vie, ou les sciences de la société, avec lesquelles descoopérations pluridisciplinaires se développent, et avec lesquelles elles sontd'ailleurs en interaction au travers des sciences de la cognition et de lacommunication. Cela est nécessaire si on veut promouvoir undéveloppement plus raisonné et plus unifié de la problématique dutraitement de l'information.

REMERCIEMENTS

Cet article a bénéficié de la relecture et des commentaires de Mario Borillo,Anne Doucet, et Catherine Garbay. Qu'ils en soient ici remerciés de toutcœur.

REFERENCES

N.B. La bibliographie se trouve être succincte, car volontairement réduite àdes articles et ouvrages récents envisageant le traitement de l'informationdans son ensemble et non de manière spécialisée.

Mario Borillo. Pensée et machine. Nouvelles hypothèses et nouvellesrecherches sur la nature de l'esprit, au carrefour des sciences de la cognitionet des sciences de la computation. In Les Idées Contemporaines, (A.Gérard, ed.), GREP Midi-Pyrénées, 45-63, 2000.

Malik Ghallab. Enjeux et impact des STI. Ruptures technologiques pour le21ème siècle, Casablanca, Maroc, Février 1997. http://www.asti.asso.fr/pages/presentation.html

Didier Dubois, Henri Prade, Ronald R. Yager. Information Engineering andFuzzy Logic, Proc. of the 5th IEEE International Conference on FuzzySystems, New Orleans, Louisiana, September 8-11, 1996, vol.3, 1525-1531.

Didier Dubois, Henri Prade. Grands paradigmes du traitement intelligent etinteractif de l’information, Actes des Assises Nationales du GDR-PRC I3,INSA de Lyon, 24-26 Juin 1998, 43-44. http://www.timc.imag.fr/I3

Jean-Gabriel Ganascia. Le Petit Trésor. Dictionnaire de l’Informatique etdes Sciences de l’Information,, Flammarion, 1998.

René Jacquart, (Ed.) N° spécial: Informatiques, enjeux, tendances etévolutions, Technique et Science Informatiques, Hermès Sciences, 19,2000.

Jacques Le Maitre, Jean Charlet, Catherine Garbay (eds.)Le DocumentMultimedia en Sciences du Traitement de l'Information. Cépaduès-Editions,2000.

Henri Prade, Robert Jeansoulin, Catherine Garbay (eds.) Le Temps,l'Espace et l'Evolutif en Sciences du Traitement de l'Information.Cépaduès-Editions, 2000.

English synopsis:

Beside its potentially enormous economical, industrial and social impact,information has become a matter of scientific investigation of its own,standing apart from other older established fields such as physics,mathematics, etc. This interest is in part strongly motivated by theconfluence of computer and communication technologies which allow forthe collection and storage of large amounts of information and itssubsequent dissemination in a very efficient way. In several recentpublications, we have tried to promote a unified view of informationsciences and engineering that transcends boundaries existing betweensubfields that sometimes quarrel with one another, sometimes ignore oneanother, while having in common the purpose of processing some kind ofinformation in some way. Moreover some newly emerged key-words suchas Soft Computing, Computational Intelligence and the like are oftenmisunderstood as to their actual potential and novelty. It is very importantto organize research about information in order to achieve its recognition asa new scientific discipline with specific needs in terms of basic research,especially particular mathematical and logical tools, and a specifictechnology.The following definition of information has been proposed: any collectionof symbols or signs, produced either by the observation of natural orartificial phenomena, or by the cognitive activity of human beings or robots,which can be used to understand the world around us, help in decisionmaking or in mutual communication. The concept of informationengineering is an attempt to bring together under one umbrella manyscientific investigations which have developed along with the emergence ofthe computer technology and have to do with information. Informally, wecan tentatively see information science and engineering as concerned withthree main tasks: namely clarifying, storing/retrieving, and exploitinginformation. These three tasks are completed by a fourth one pertaining toman-machine interaction issues (maintenance of a model of the user, sharingof the information between several agents, ...).

1. Clarifying informationBy clarifying information we mean the process of elaborating raw data intomore useful and comprehensible forms. This task ranges from enhancinginformation via smoothing or eliminating redundant or erroneous data,completing information via interpolation, to higher cognitive activities suchas abstracting and modeling. Some clarification tasks can be performed atthe level of a sensor itself. A particularly extensive family of clarificationmethods is the gamut of techniques used in computer vision, whosepurposes are the reduction of uncertainty, the recognition of relevant

patterns and the labelling of scenes. In addition many of the operations usedin data fusion for synthesizing and combining pieces of data fall in thecategory of clarification methods, since more often than not, information issupplied by several, possibly conflicting sources and not in an homogeneousformat. Clarification appears as a transformation process that turns raw datainto more structured information, that is more understandable and useful.There is also an effort to go from information about particular cases (what isoften called data) to more generic forms of information pertaining to apopulation of items (what is often called knowledge). In some cases,especially when abstracting is in order, it necessitates the use of linguisticlabels to communicate the main features of the information. Alternatively,clarification may also come down to a kind of data compression by layingbare an underlying mathematical model. Clarified information then can beappropriately stored and be further exploited in reasoning and decisionprocesses.Typical of clarification are techniques such as clustering, filtering, otherdata analysis methods such as regression, identification, inductive learningand more generally any method aimed at abstracting and structuringinformation.

2. Storing/Retrieving informationRetrieving information means to extract, based on certain requirements andspecifications, already existing, possibly hidden, pieces of information. Thiscomponent of information engineering includes many of the methodologiesused in databases, information retrieval and the new emerging field ofmulti-media. It is strongly dependent on the storage technology and theknowledge representation framework used.In its most elementary form, which we may call querying, the retrievalprocess does not involve a modification of existing information, as in theclarifying task. A large body of information is stored in some format and aquery is entered. As a result of a query matching process a class of objectssatisfying the query are provided. An important objective in theconstruction of these types of systems with respect to the querying task isthe facilitation, for the user, of the expression of their goals regarding theinformation to be retrieved. This objective requires that rather sophisticatedforms of queries be allowed. It is also worth noting that a basic distinctionbetween the database and information retrieval technologies is related to theuse in information retrieval of intermediary descriptions of the informationin terms of keywords, whereas in databases information is described directlyin terms of attributes values. The handling of multimedia databases requiresthe joint use of the two approaches.Some modes of storing information do not allow the retrieval process to bereduced to one of simply locating items in a file. For instance in deductivedatabases, information is encoded in a declarative way via some kind of

logic-based language. The retrieval process requires that the informationsystem be equipped with inferential power. In this environment retrievinginformation involves a reasoning task, whereby hidden information is madeexplicit for the user. Sometimes the information held for sure is too poorand one may wish to exhibit plausible information, possibly revised in afurther step. It requires the use of some form of default inference. This typeof concern is present in so-called intelligent information systems, which lieat the boundary between database research and artificial intelligence.

3. Exploiting informationExploiting information component encompasses a wide range of activitiesincluding decision-making, optimization, design, and control. Generally insuch tasks, information plays a supportive role to some sort of paradigm ormodel. In order to make the best use of the knowledge embedded in themodel, the ability to represent and manipulate different types of informationbecomes very important here. The development of technologies that allowus to combine numerical, logical, linguistic and visual information is animportant part of the agenda of this aspect of information engineering. Allpieces of information are used in the problem-solving task, whose solutionis presented to the users in order to guide their course of action. Severalprototypical situations can be distinguished:-) problems where the number of potential solutions is very small but thechoice is made difficult due to many conflicting goals and/or the presenceseveral of decision-makers. This is the realm of decision support systemsfor strategic decision-making ;-) problems where the computation of a solution is a highly combinatorialtask but the local preference modeling is made very clear and simple. Thisis typically the case of optimization problems that occur in engineeringdesign or large-scale systems where the difficulty lies in the intricacy of alarge number of local constraints and decision variables ;-) problems where the solution is a complex entity that is built in severalsteps because time is involved in the picture. This is the case forplanification problems in robotics or manufacturing ;-) lastly, problems where information must be exploited in a dynamicenvironment and reactivity is the key issue. Decision is then made in realtime by exploiting some feedback. This is the realm of control problems.

In each of the above three components of information engineering that wehave touched upon (clarifying, storing/retrieving and exploitinginformation), we want to emphasize the importance of two aspects: therepresentation of information and the communication of informationbetween man and machine. Knowledge representation has become a centraltopic for basic research in Artificial Intelligence due to the necessity for acommunication language between man and computers. This communication

goes in both directions: information generated by the machine should be ina form easily comprehensible by human beings while information providedby human beings should be in a format exploitable by the computer. Logichas become the natural framework for the formalization of reasoningtechniques. However classical logic is alone unable to face the majorchallenge of accounting for the various forms of human reasoning,necessary to clarify, retrieve and exploit information in an automated, yethuman-friendly way. Moreover a great amount of information comes in theform of numerical data, as opposed to human knowledge. Data processingmethods and symbolic knowledge representation and reasoning tools mustthus be used conjointly, on the basis of their complementarity, and not beopposed as exclusive approaches to information engineering. Thispresupposes that the dogma of the monopoly of symbolic representations inAI be given up, and that data-driven schools of information processing opento logical approaches, in the scope of developing software systems that notonly efficiently solve problems but are capable of explaining the obtainedsolutions to users.