Rapport Ontologie

download Rapport Ontologie

of 40

Transcript of Rapport Ontologie

LOntologie (Informatique)Ralis par : ASKANE Younes EL-OUCHI Younes EL MESSBAHI Salima EL JADIDI ALAOUI Sadik Encadr par : Prof. ALI Younes Prof. Mouna HAMDANE

Anne Universitaire 2009/2010

LOntologie (Informatique)

SommaireIntroduction .......................................................................................................................................... 3 1. Historique et Dfinition dontologie .......................................................................................... 5 1.1 1.2 1.3 2. La Notion dOntologie ........................................................................................................ 5 Historique de LOntologie (informatique) ........................................................................ 7 Lobjectif dontologie......................................................................................................... 7

Web Smantique ......................................................................................................................... 9 2.1 2.2 A. B. C. 2.4 A. Dfinition et historique : ..................................................................................................... 9 Principe gnral de web smantique : ............................................................................. 10 Le RDF ............................................................................................................................... 11 OWL................................................................................................................................... 12 Logique .............................................................................................................................. 13 Exemples pratique ............................................................................................................ 15 Manipulation OWL .......................................................................................................... 15

Dfinition d'un individu............................................................................................................... 21 Les proprits ............................................................................................................................. 22 Caractristiques des proprieties ................................................................................................. 25 Exemple d'ontologie OWL DL - description d'une population .................................................... 26 Prsentation de la population sur laquelle porte l'ontologie.................................................... 26 Ecriture des classes ..................................................................................................................... 28 Ecriture des proprieties............................................................................................................... 29 Assertion de faits caractristisant la population ....................................................................... 32 B. Protege ............................................................................................................................... 35

Conclusion........................................................................................................................................... 40

LP AAE

Page 2

LOntologie (Informatique)Introduction

Introduction

Depuis environ une quinzaine dannes maintenant, le concept dontologie imprgne les discussions et les pratiques dans les domaines de linformatique et de lingnierie des connaissances (IC). Les pratiques, disons-nous, car on ne se limite plus parler de lontologie mais dontologies, dsignant par cette double nuance grammaticale des artefacts concrets en lieu et place dune composante essentielle et millnaire (en dpit dune appellation tardive) de la philosophie. A linstar de tout objet technique, ceux-ci remplissent des usages privilgis. En loccurrence la reprsentation des connaissances, proches en cela de la dmarche philosophique en ce quils oprent, leur tour, un inventaire des diffrentes dimensions de la ralit en mobilisant pour ce faire des formalismes issus des langages informatiques (le Web smantique sappuie en particulier sur le langage OWL Web Ontology Language - lui-mme driv de la logique des descriptions). Paralllement, on observe la poursuite du projet initi par lintelligence artificielle (AI) doprationnaliser le raisonnement humain en ajointant les

modlisations des rgions de la connaissance des logiciels effectuant des raisonnements infrentiels ceci prs, toutefois, que lintelligence, notamment dans la perspective du Web smantique, se situe dsormais davantage dans les donnes ellesmmes que dans les moteurs dinfrences. Do, prcisment, la vigueur actuelle des problmatiques ontologiques : si lintelligence imprgne les donnes, encore faut-il les mettre en forme de manire idoine ; telle est la tche qui attend lingnierie des connaissances en ce dbut de XXIe sicle. La tche de la philosophie, quant elle, outre de contribuer leffort de clarification ncessaire au recensement et la cartographie des rgions du ce quil y a , sera dapprcier dans quelle mesure, son projet essentiel dsormais porte par ces dmarches nouvelles, celles-ci interrogent en retour les conditions de son exercice.

LP AAE

Page 3

LOntologie (Informatique)

LP AAE

Page 4

LOntologie (Informatique)1. Historique et Dfinition dontologie 1.1 La Notion dOntologieEn philosophie, l'ontologie (du grec , , participe prsent du verbe tre) est l'tude de l'tre en tant qu'tre, c'est--dire l'tude des proprits gnrales de ce qui existe. LOntologie est une branche fondamentale de la Mtaphysique qui s'intresse la notion d'existence, aux catgories fondamentales de l'existant et tudie les proprits les plus gnrales de l'tre. L'Ontologie a donc un rapport direct avec notre conception de la ralit. L'ontologie qui interroge nos conceptualisations du monde et l'ingnieur qui conoit ses reprsentations logicielles ne sont-ils pas plus proches qu'il n'y semblait initialement? Par analogie, le terme est repris en informatique et en science de l'information, o une ontologie est l'ensemble structur des termes et concepts reprsentant le sens d'un champ d'informations, que ce soit par les mtadonnes d'un espace de noms, ou les lments d'un domaine de connaissances. L'ontologie constitue en soi un modle de donnes reprsentatif d'un ensemble de concepts dans un domaine, ainsi que les relations entre ces concepts. Elle est employe pour raisonner propos des objets du domaine concern. Les concepts sont organiss dans un graphe dont les relations peuvent tre :

des relations smantiques, des relations de subsomption (inclusion). Si la notion d'ontologie informatique et l'exemple de la programmation oriente objets ont cette ressemblance, c'est qu'ils ont un anctre commun: les systmes de

l'intelligence artificielle symbolique. Les dbuts de cette branche de l'intelligence artificielle se confondent avec les dbuts de l'informatique car ds ses prmices, d'automate de simuler et dpasser l'intelligence

l'informatique a perptu le rve humaine avec des systmes artificiels.

LP AAE

Page 5

LOntologie (Informatique)Si la branche de l'intelligence artificielle laquelle nous nous intressons ici est qualifie de symbolique c'est parce qu'elle repose sur des reprsentations formelles des

connaissances sous la forme de symboles que le systme peut stocker et manipuler (ex: langages et opration logiques, structures et oprations de graphes). Contrairement d'autres approches, ces reprsentations sont la fois comprhensibles par les humains et manipulables par les systmes en appliquant des rgles de manipulations dfinies sur les symboles de ces reprsentations et dont l'interprtation simule, par exemple, un raisonnement.

LP AAE

Page 6

LOntologie (Informatique)1.2 Historique de LOntologie (informatique)"Ontologie" est un mot que l'informatique a emprunt la philosophie au dbut des annes 90.

Depuis la Cration du Web en 1990, par Tim Berners Lee,Il tait exclusivement destin partager des informations sous forme de pages html, affichables par un logiciel navigateur web, et gnralement destines tre lues par un utilisateur humain. Ainsi L'arrive de XML en 1998, a donn un cadre la structuration des connaissances, rendant ainsi possible la cration de nouveaux langages web destins non plus un rendu graphique l'cran pour un utilisateur humain, mais un rel partage et une manipulation des savoirs. En 2004 W3C publie RDF et OWL deux technologies cls du Web smantique :Ces deux technologies RDF et OWL, fournissent un cadre de travail pour la gestion des ressources, l'intgration, le partage et la rutilisation des donnes sur le Web.

1.3

Lobjectif dontologieL'objectif premier d'une ontologie est de modliser un ensemble de connaissances dans un domaine donn, qui peut tre rel ou imaginaire. Les ontologies sont employes dans l'intelligence artificielle, le Web smantique, le gnie logiciel, l'informatique biomdicale et l'architecture de l'information comme une formeLP AAE Page 7

LOntologie (Informatique)de reprsentation de la connaissance au sujet d'un monde ou d'une certaine partie de ce monde. Les ontologies dcrivent gnralement :

Individus : les objets de base, Classes : ensembles, collections, ou types d'objets, Attributs : proprits, fonctionnalits, caractristiques ou paramtres que les objets peuvent possder et partager,

Relations : les liens que les objets peuvent avoir entre eux, vnements : changements subis par des attributs ou des relations. EN gnral le but des ontologies serait : l'intelligence artificielle ( des machines comprennent des humains ), l'interoprabilit ( des machines comprennent des machines ), de faire sens pour l'usager ( des humains comprennent des humains via des machines ).

LP AAE

Page 8

LOntologie (Informatique)2. Web Smantique 2.1 Dfinition et historique :Le Web smantique dsigne un ensemble de technologies visant rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grce un systme de mtadonnes formelles, utilisant notamment la famille de langages dvelopps par le W3C.

La notion de mtadonnes utilisables par les machines fut propose assez tt dans l'histoire du Web, ds 1994 par son inventeur Tim Berners-Lee, lors de la confrence WWW 94 o fut annonce la cration du W3C. Ces mtadonnes formelles sont alors prsentes comme une ncessaire reprsentation utilisable par les machines de l'information contenue dans les documents, par exemple le fait qu'une personne X est employe par une organisation Y. Le dveloppement de cette ide aboutit la publication en 1999 de la premire version de RDF (Resource Description Framework), langage qui dfinit un cadre gnral pour la standardisation des mtadonnes des ressources Web. Sur la base de RDF se sont ensuite dvelopps des vocabulaires spcifiques destins des applications particulires, comme FOAF destin dcrire les relations entre personnes, puis des langages destins structurer ces vocabulaires, comme RDFS et le langage d'ontologie OWL, publis dans leur forme finale en fvrier 2004. Au cours de cette volution, la notion de ressource s'tend de son sens original de document publi sur le Web des sens plus gnraux et plus abstraits. Dans les langages d'ontologie ou le langage SKOS, en cours de dveloppement, les ressources dcrites sont des concepts comme des classes, des proprits, ou des concepts utiliss pour l'indexation. ce titre, les langages et technologies du Web smantique sont parfois prsents comme des outils de reprsentation des connaissances adapts l'environnement Web, permettant de transformer automatiquement les donnes en information, et les informations en savoir.

LP AAE

Page 9

LOntologie (Informatique)

2.2

Principe gnral de web smantique :Le Web smantique est entirement fond sur le Web et ne remet pas en cause ce dernier. Le Web smantique s'appuie donc sur la fonction primaire du Web classique : un moyen de publier et consulter des documents. Mais les documents traits par le Web smantique contiennent non pas des textes en langage naturel (franais, espagnol, chinois, etc.) mais des informations formalises pour tre traites automatiquement. Ces documents sont gnrs, traits, changs par des logiciels. Ces logiciels permettent souvent, sans connaissance informatique, de :

gnrer des donnes smantiques partir de la saisie d'information par les utilisateurs ; agrger des donnes smantiques afin d'tre publies ou traites ; publier des donnes smantiques avec une mise en forme personnalise ou spcialise ; changer automatiquement des donnes en fonction de leurs relations smantiques ; gnrer des donnes smantiques automatiquement, sans saisie humaine, partir de rgles d'infrences.

2.3

Introduction aux technologies du web smantiqueLe partage de la connaissance reste toujours un problme important traiter dans les organisations. Des tudes en Web smantique et les interfaces homme machine fournissent quelques techniques pour guider l'accs l'information, ces techniques ne sont pas suffisantes pour donner un accs contextuel aux besoins de l'utilisateur. En fait, avec les techniques du Web smantiques [Berners-Lee, et al, 01] l'accs l'information par lutilisateur est guid par l'ontologie du domaine. Cependant ce type d'ontologie est tabli comme une dfinition consensuelle de concepts du domaine qui peut tre considr comme une rfrence des concepts utiliss dans un domaine donn. Gnralement l'utilisateur a sa propre reprsentation du domaine qui est plus au moins proche de l'ontologie dfinie. Notons galement, que la structure de cette ontologie est gnralement dcrite par un ingnieur de connaissance qui introduit des biais dinterprtation.

LP AAE

Page 10

LOntologie (Informatique)L'activit de l'utilisateur change travers le temps ainsi que ses besoins daccs linformation. Plusieurs travaux en interface homme machine [Jing et autres, 02] tudient des techniques pour capturer l'activit de l'utilisateur afin d'offrir une recherche dinformation contextuelle. Des tudes en ergonomie montrent que nous avons besoin de connatre les objectifs de lactivit et son environnement avant d'observer cette activit, ce qui nest pas facile si la traabilit des informations est ralise dune faon gnrique indpendamment de la tche de lutilisateur. La recherche dinformation peut tre base sur les relations entre ces concepts, qui peuvent offrir un accs contextuel l'information. Nous exploitons les graphes conceptuels pour reprsenter le rseau smantique et nous utilisons le moteur de recherche dinformation Corese [Corby et al, 02] qui se base sur des fonctions de spcialisation, de gnralisation et de projection pour offrir une recherche dinformation en profondeur. On prsentera donc, dans une premire partie, les langages XML et RDF, ainsi que les principes fondamentaux du Web smantique. La deuxime partie, qui constitue l'introduction OWL proprement dite, s'appuie largement sur les Recommandations du W3C. Enfin, une dernire partie propose quelques exemples de logiciels en lien direct avec OWL et le Web smantique.

A. Le RDFRDF (Resources Description Framework) est un langage servant dcrire des ressources. Son lment constitutif de base est la formulation dun triplet se composant dune entit (appele ressource en terminologie web), dune proprit et dune valeur (qui peut tre une autre ressource). La formulation) est essentiellement la dfinition dun fait P (a,b) o P est une proprit binaire, et (a,b) sont des ressources. Dans la perspective du web smantique, RDF dfinit une couche situe au-dessus de XML. De ce fait, RDF a t dot dune syntaxe XML. RDF est indpendant du domaine, en dautres mots, il ne pose aucun prsuppos quant un domaine spcifique. Cest donc lutilisateur que revient le rle de dfinir sa propre terminologie dans un langage schma appel RDF Schema (RDFS). Constitutivement,LP AAE Page 11

LOntologie (Informatique)RDFS est un langage dontologies primitif (ou naturel) proposant les caractristiques suivantes: Organisation des objets en classes (professeur, membre du personnel, tudiant, cours, cours pour tudiants) et proprits binaires (enseigne, tudie, travaille). Sous-classes (tous les professeurs sont des membres du personnel) et relations des sousproprits (tout chef de dpartement fait partie de ce dpartement). Restrictions de domaine (seul le personnel acadmique peut enseigner) et dtendue (une personne ne peut quenseigner) au niveau des proprits. RDF et RDFS fournissent les langages de base pour le web smantique.

B. OWLLa puissance dexpression de RDF et de RDFS est volontairement trs limite: RDF est (en gros) limit des attributs binaires et RDFS est (toujours en gros) limit aux hirarchies de sous-classes et de sous-proprits, avec restrictions de domaine et dentendue des proprits. Il existe cependant plusieurs cas particuliers dutilisation du web smantique qui ncessitent une plus grande expressivit. Ce type dextensions comprend: la disjonction (par ex. une personne ne peut tre la fois professeur et membre du personnel administratif). les combinaisons boolennes des classes (par ex. le personnel est lensemble du corps acadmique, du personnel administratif et du personnel dassistance technique). les restrictions de cardinalit (par ex. un service ne peut avoir quun seul chef). les caractristiques spciales des proprits (par ex. suprieur de est transitif, enseigne et reoit des cours de sont des proprits inverses) ltendue locale des proprits (range) dfinit la porte dune proprit, par exemple mange pour toutes les classes. Dans certains cas, on peut souhaiter rduire la porte en fonction de la classe. Par exemple, les vaches ne mangent que de lherbe tandis que dautres animaux mangent galement de la viande.

OWL a t labor comme nouveau langage dontologies standard pour le web. Il repose sur RDFS et tente de trouver un quilibre entre puissance dexpression et supportLP AAE Page 12

LOntologie (Informatique)logique efficace. La logique (le raisonnement) est un facteur important parce quelle permet de

A. vrifier la cohrence dune ontologie et des connaissances, B. vrifier la prsence de relations non voulues entre classes C. classer automatiquement les instances en classes.

C. LogiqueLa cration formelle du langage OWL est une partie de la reprsentation et du raisonnement des connaissances appele logique descriptive. Cette cration est riche de promesses; lapproche est diffrente pour la reprsentation et le raisonnement sur la base de rgles. Ses principaux avantages sont:

Les moteurs de rgles existent et sont trs puissants. Les rgles sont bien connues et sutilisent en informatique gnrale. Elles sont faciles apprendre.

Les systmes de rgles peuvent tre envisags comme une extension ou une alternative OWL. La premire ide est de poursuivre les recherches actuelles en visant intgrer les rgles et la logique descriptive tout en maintenant un support logique assez efficace. Une ide plus rcente tudie lutilisation de RDF/S conjointement aux rgles comme base dun autre langage ontologique web. Outre les systmes classiques base de rgles, il est intressant danalyser ceux capables de prendre en compte des conclusions contradictoires. Ces systmes sont utiles pour la modlisation des donnes ayant hrits de dfauts et des rgles comportant des exceptions. Ils sont aussi trs pratiques pour lintgration des connaissances o des incohrences peuvent videmment se produire lorsquon assemble des connaissances de sources diffrentes.

LP AAE

Page 13

LOntologie (Informatique)Une ontologie dcrit les concepts et les rapports qui sont importants dans un domaine particulier, fournissant un vocabulaire pour ce domaine aussi bien que des spcifications automatises de la signification des termes utiliss dans le vocabulaire. Les Ontologies traitent de taxonomies et de classifications, schmas de base de donnes, et de thories entirement axiomatises. Ces dernires annes, des ontologies ont t introduites dans beaucoup de communauts scientifiques de manire partager, rutiliser et traiter la connaissance dun domaine spcifique. Les Ontologies sont devenues vitales pour beaucoup dapplications telles que des portails de la connaissance scientifique, des systmes de gestion dinformation et dintgration, du commerce lectronique, et de services de Web smantique. Labsence dune vritable solution gnrique au niveau de la norme MPEG 7 de lISO constitu un handicap majeur! Cerise sur le gteau, les scientifiques de certaines universits ont dvelopp des technologies nouvelles qui sont de vritables moteurs dontologie qui vont grandement simplifier la vie de tous ceux qui rvent de produire des outils en OWL, RDF, Un moteur dontologies est un processus applicatif qui possde une dimension smantique (dfinition et mise en relation de concepts); une dimension logique (validation de la cration de relations entre concepts ou dduction de relations non explicites entre concepts) et enfin une dimension usage avec la construction dun vocabulaire (outil, utilisateur, traitement), la construction dune syntaxe (sujet, verbe, complment) et dune grammaire: lutilisateur accorde loutil pour raliser un traitement .

La finalit du moteur dontologie est de: rduire la distance entre le langage de la machine (logique) et le langage de lutilisateur (lisible) en intercalant entre lune et lautre un langage comprhensible par lun et lautre; rduire la distance entre des langages pratiqus dans diffrentes cultures (mtier, rgion, temps, etc.) en intercalant entre lune et lautre un langage interprtable par lun et lautre; amliorer la qualit, lefficacit et lefficience des changes entre les acteurs dun projet via un socle smantique commun;

Un moteur dontologies est un processus applicatif qui possde:

LP AAE

Page 14

LOntologie (Informatique)Une dimension smantique: Dfinir des concepts Mettre en relation des concepts Une dimension logique: Valider la cration de relations entre concepts Dduire des relations non explicites entre concepts Une dimension usage: Construction dun vocabulaire (outil, utilisateur, traitement) Construction dune syntaxe (sujet, verbe, complment) Construction dune grammaire: lutilisateur accorde loutil pour raliser un traitement.

2.4 Exemples pratique A. Manipulation OWLLa structure d'une ontologie OWL. Cette partie indique les principaux ontology OWL. Avant

lments

constituant

une

de poursuivre, il est bien

ncessaire de

comprendre qu'OWL n'a pas t conu dans un esprit ferm permettant de borner les frontires d'une ontologie. Au contraire, la conception d'OWL a pris en compte la nature distribue du web smantique et, de ce fait, a intgr la possibilit d'tendre des ontologies existantes, ou d'employer diverses ontologies existantes pour complter la dfinition d'une nouvelle ontologie.

Espaces de nommage Afin de pouvoir employer des termes dans une ontologie, il est ncessaire d'indiquer avec prcision de quels vocabulaires ces termes proviennent. C'est la raison pour laquelle, comme tout autre document XML, une ontologie commence par une dclaration d'espace de nom (parfois appele de nommage ) contenue dans une balise rdf:RDF. Supposons que nous souhaitons crire une ontologie sur une population de personnes ou, d'une manire plus gnrale, sur l'humanite. Voici la dclaration d'espace de nom qui pourrait tre employe :

Les deux premires dcalarations identifient l'espace de nommage propre l'ontologie que nous sommes en train d'crire. La premire dclaration d'espace de nom indique quelle ontologie se rapporter en cas d'utilisation de noms sans prfixe dans la suite de l'ontologie. La troisime dclaration identifie l'URI de base de l'ontologie courante. La quatrime dclaration signifie simplement que, au cours de la rdaction de l'ontologie humanit, on va employer des concepts dvelopps dans une ontologie vivant, qui dcrit ce qu'est un tre vivant. Les quatre dernires dclaration introduisent le vocabulaire d'OWL et les objets dfinis dans l'espace de nommage de RDF, du schma RDF et des types de donnes du Schma XML. Afin de simplifier l'criture des URI dans la dclaration d'espace de nom et, surtout, dans les valeurs des attributs de l'ontologie, il est conseill de dfinir des abbrviations au moyen d'entits de type de document :

]>

Ainsi, la dclaration d'espace de nom initiale devient :

En-ttes d'une ontologie Tout comme il existe une section d'en-tte .. en haut de tout document XHTML bien form, on peut crire, la suite de la dclaration d'espaces de nom, un en-tte dcrivant le contenu de

l'ontologie courante. C'est la balise owl:Ontology qui permet d'indiquer ces informations :

Ontologie dcrivant l'humanit Ontologie sur l'humanit ...

Le contenu et la signification des diffrents lments de cette section d'en-tte sont parfaitement dcrits dans OWL Web Ontology Language Reference [W3C 2004k], et il est recommand de s'y reporter pour plus de dtails.

Elments du langage Cette partie ne va pas reprendre toutes les finesses de OWL Lite, OWL DL et OWL Full, mais uniquement les plus importantes. Pour des

LP AAE

Page 17

LOntologie (Informatique)explications exhaustives du rle de chacun des lments composant le vocabulaire d'OWL, il est recommand de se reporter la Recommandation du W3C OWL Web Ontology Language Reference [W3C 2004k]. Les classes Une classe dfinit un groupe d'individus qui sont runis parce qu'ils ont des caractristiques similaires. L'ensemble des individus d'une classe est dsign par le terme extension de classe , chacun de ces individus tant alors une instance de la classe. Les trois versions d'OWL comportent les mmes mcanismes de classe, ceci prs que OWL FULL est la seule version permettre qu'une classe soit l'instance d'une autre classe (d'une mtaclasse). A l'inverse, OWL Lite et OWL DL n'autorisent pas qu'une instance de classe soit elle-mme une classe. Dclaration de classe La dclaration d'une classe se fait par le biais du mcanisme de description de classe , qui se prsente sous diverses formes. Une classe peut ainsi se dclarer de six manires diffrentes :

l'indicateur de classe : La description de la classe se fait, dans ce

cas, directement par le nommage de cette classe. Une classe humain se dclare de la manire suivante :

Il est noter que ce type de description de classe est le seul qui permette de nommer une classe. Dans les cinq autres cas, la description reprsente une classe dite anonyme , cre en plaant des contraintes sur son extension.

l'numration des individus composant la classe :

Ce type de descrition se fait en numrant les instances de laLP AAE Page 18

LOntologie (Informatique)classe, l'aide de la proprit owl:oneOf :

Si ce mcanisme est utilisable avec OWL DL et OWL FULL, il ne fait cependant pas partie de OWL Lite.

La restriction de proprits :

La description par restriction de proprit permet de dfinir une classe anonyme compose de toutes les instances de owl:Thing qui

satisfont une ou plusieurs proprits. Ces contraintes peuvent tre de deux types : contrainte de valeur ou contrainte de cardinalit. Une contrainte de valeur s'exerce sur la valeur d'une certaine proprit de l'individu (par exemple, pour un individu de la classe Humain, sexe =Homme), tandis qu'une contrainte de cardinalit porte sur le nombre de

valeurs que peut prendre une proprit (par exemple, pour un individu de la classe Humain, aPourFrere est une proprit qui peut ne pas avoir de valeur, ou avoir plusieurs valeurs, suivant le nombre de frres de l'individu. La contrainte de cardinalit portant sur aPourFrere restreindra donc la classe dcrite aux individus pour lesquels la proprit aPourFrere apparat un certain nombre de fois). Il existe naturellement diffrents oprateurs de comparaison

pour tablir les contraintes. Pour plus de dtails, se reporter OWL Web Ontology Language Reference [W3C 2004k].LP AAE Page 19

LOntologie (Informatique)

Enfin, les descriptions par intersection, union ou complmentaire

permettent de dcrire une classe par, comme leur nom l'indique, l'intersection, l'union ou le complmentaire d'autres classes dj dfinies, ou dont la dfinition se fait au sein mme de la dfition de la classe courante :

Personnes ayant deux frres Etudiants de l'ENST Etudiants de l'ENST ayant deux frres

Hritage Il existe dans toute ontologie OWL une superclasse, nomme Thing, dont toutes les autres classes ammne directement au sont des sous-classes. Ceci nous

concept

d'hritage, disponible l'aide de la

proprit subClassOf :

LP AAE Page 20

LOntologie (Informatique)

Enfin, il existe galement une classe nomme noThing, qui est sousclasse de toutes les classes OWL. Cette classe ne peut avoir aucune instance.

Les instances de classe Dfinition d'un individu La dfinition d'un individu consiste noncer un fait , encore appel axiome d'individu . On peut distinguer deux types de faits :

les faits concernant l'appartenance une classe La plupart des faits

concerne gnralement la dclaration de l'appartenance une classe d'in individu et les valeurs de proprit de cet individu. Un fait s'exprime de la manire suivante :

Le fait crit dans cet exemple exprime l'existence d'un Humain nomm Pierre dont le pre s'appelle Jacques , et qu'il a un frre nomm Paul . On peut galement instancier un individu anonyme en omettant son

identifiant :

LP AAE Page 21

LOntologie (Informatique)

Ce fait dcrit, dans ce cas, l'existence d'un Humain dont le pre se nomme Jacques et qui a un frre nomm Paul .

les faits concernant l'identit des individus difficult qui peut ventuellement apparatre dans le

Une

nommage des individus concerne la non-unicit ventuelle des noms attribus aux individus. Par exemple, un mme individu pourrait tre dsign de plusieurs faons diffrentes. C'est la raison pour laquelle OWL propose l'aide un des mcanisme proprits

permettant de lever cette ambiguit,owl:sameAs, owl:diffrentFrom

et owl:allDifferent. L'exemple suivant permet

de dclarer que les noms Louis_XIV et Le_Roi_Soleil dsignent la mme personne :

Affecter une proprit un individu Une fois que l'on sait crire une classe en OWL, la cration d'une ontologie se fait par l'criture d'instances de ces objets, et la description des relations qui lient ces instances.

Les proprits Maintenant que l'on sait crire des classes OWL, il ne manque plus que la capacit exprimer des faits au sujet de ces classes et de leurs instances. C'est ce que permettent de faire les proprits OWL. OWL fait la distinction entre deux types de proprits :

LP AAE

Page 22

LOntologie (Informatique)

les proprits d'objet permettent de relier des instances d'autres instances les proprits de type de donne permettent de relier des

individus des valeurs de donnes. Une proprit d'objet est une instance de la classe owl:ObjectProperty, une proprit de type de donne tant une instance de la classeowl:DatatypeProperty. Ces deux classes sont elles-mme sous-classes de la

classe RDF rdf:Property. La dfinition des caractristiques d'une proprit se fait l'aide d'un axiome de proprit qui, dans sa forme minimale, ne fait qu'affirmer l'existence de la proprit :

Cependant, il est possible de dfinir beaucoup d'autres caractristiques d'une proprit dans un axiome de proprit.

Dfinition d'une proprit Afin de spcifier une proprit, il existe diffrentes manires de restreindre la relation qu'elle symbolise. Par exemple, si on considre que l'existence d'une proprit pour un individu donn de l'ontologie constitue une fonction faisant correspondre cet individu un autre individu ou une valeur de donne, alors on peut prciser le domaine et l'image de la proprit. Une proprit peut galement tre dfinie comme la spcialisation d'une autre proprit.

LP AAE

Page 23

LOntologie (Informatique)Dans l'exemple ci-dessus, on apprend que la proprit habite a pour domaine la classe Humain et pour image la classe Pays : elle relie des instances de la classe Humain des instances de la classe Pays. Dans le cas d'une proprit de type de donne, l'image de la proprit peut tre un type de donne, comme dfini dans le Schma XML. Par exemple, on peut dfinir la proprit de type de donnes anneeDeNaissance :

Dans ce cas, anneDeNaissance fait correspondre aux instances de la classe dedateDeNaissance des entiers positifs.

On peut galement employer un mcanisme de hirarchie entre les proprits, exactement comme il existe un mcanisme d'hritage sur les classes :

... LP AAE Page 24

LOntologie (Informatique)

La proprit aPourFrere est une sous-proprit de estDeLaFamilleDe, ce qui signifie que toute entit ayant une proprit aPourFrere d'une certaine valeur a aussi une proprit estDeLaFamilleDe de mme valeur. Caractristiques des proprieties En plus de ce mcanisme d'hritage et de restriction du domaine et de l'image d'une proprit, il existe divers moyens d'attacher des caractristiques aux proprits, ce qui permet d'affiner grandement la qualit des raisonnements lis cette proprit. Parmi les caractristiques de proprits principales, on trouve la transitivit, la symtrie, la fonctionnalit, l'inverse, etc. L'ajout d'une caractristique une proprit de l'ontologie se fait par l'emploi de la balise OWL type :

Proprit non symtrique

Proprit symtrique

L'Humain Pierre a pour frre Paul, de mme que (symtrie) l'Humain

LP AAE

Page 25

LOntologie (Informatique)Paul a pour frre Pierre. Par contre, si Pierre a pour pre Jacques, l'inverse

n'est pas vrai (aPourPere n'est pas symtrique). Exemple d'ontologie OWL DL - description d'une population L'ontologie OWL prsente dans ce paragraphe dcrit un groupe de personnes et leurs relations de parent, ainsi que leur lieu d'habitation. Cette ontologie ne fera pas l'objet de manipulations (dition, validation, raisonnement automatique, etc.) dans cette partie. Pour cela, il est prfrable de se rfrer au chapitre Outils disponibles .

Prsentation de la population sur laquelle porte l'ontologie Le diagramme de classes UML de la figure Classes composant la population dcrire indique les classes qui composent la population dont on souhaite crire une ontologie OWL :

LP AAE

Page 26

LOntologie (Informatique)

La population que l'on souhaite dcrire est compose d'humains, diviss en deux sous-classes Homme et Femme, et habitant dans une certaine ville. Un humain peut avoir un lien de fraternit avec un autre humain. Un homme peut tre pre d'un autre humain, et un homme et une femme peuvent tre maris. Le schma suivant indique plus prcismment les individus qui existent dans l'ontologie que nous allons crire : Le monde que l'on va dcrire comporte trois instances de la classe Homme (en vert), une instance de la classe Femme (en rouge), ainsi

que deux instances de Ville (en bleu) et de Pays (en mauve).

LP AAE

Page 27

LOntologie (Informatique)Ecriture des classes La premire tape de l'criture de l'ontologie OWL reprsentant cette population consiste crire les classes du monde. Il est possible de dfinir avec plus ou moins de prcision la nature des lments qui composent le monde que l'on dcrit, en crant plus ou moins de classes. Par exemple, il serait possible d'crire une classe date dont seraient instances toutes les dates de l'ontologie. Cela pourrait avoir un intert dans le cadre d'une population plus vaste, pour rechercher, par exemple, les personnes nes un mme jour. On peut se poser la question du type de dclaration de classe utiliser : par indicateur de classe ou par numration ? L'numration comporte, dans le cas de cette ontologie, l'inconvnient de brider l'extensibilit du monde. En consquence, on choisit de dclarer Humain par le biais d'un indicateur de classe :

Cette premire dfinition des classes de l'ontologie est satisfaisante, mais elle est nanmoins perfectible. En effet, on peut ajouter des contraintes, notamment sur les classes Humain et Ville :

un humain a toujours un pre.Page 28

LP AAE

LOntologie (Informatique)

Une ville se trouve forcment dans un pays. D'autres contraintes

sont imaginables, notamment les contraintes d'unicit des noms, dates de naissance, etc. Ces contraintes sont consultables dans le code complet de l'ontologie OWL, consultable en Annexe de ce document. Voici la nouvelle criture, plus dtaille, des deux classes Humain et Ville :

1

1

Ecriture des proprieties L'criture des proprits est l'tape qui va permettre de dtailler la population que l'on veut dcrire. proprits d'objet : habiteA, Ecrivons tout d'abord les

aPourPere, aUnLienDeFraternite,

LP AAE

Page 29

LOntologie (Informatique)estMarieA et seTrouveEn :

LP AAE

Page 30

LOntologie (Informatique)Les proprits aUnLienDeFraternite et estMarieA sont dfinies comme des proprits symtriques : si une telle relation lie un individu A un individu B, alors la mme relation lie galement l'individu B l'individu A. Passons maintenant aux proprits de type de donne. Ce sont ces proprits qui, concrtement, permettent d'affecter des proprits

quantifies aux instances des classes (par exemple, un nom, un prnom, une date de naissance, etc.) :

LP AAE Page 31

LOntologie (Informatique)

L'image de ces proprits est dfinie selon XML Schema (auquel fait rfrence la chaine &xsd; ), ce qui permet de donner un type aux proprits.

Assertion de faits caractristisant la population La dernire tape concerne l'assertion des faits caractrisant la population, prsents sur la figure Individus de la population dcrire . Il s'agit donc non seulement de l'instanciation des individus de la population, mais galement de leur description par l'nonciation de leurs proprits :

Dupond Pierre 1978-08-18 LP AAE Page 32

LOntologie (Informatique)

Dupond Paul 1976-05-26

Dupond Jacques 1946-12-25 Dupond Marie 1976-12-17 Martin

Allemagne

LP AAE

Page 33

LOntologie (Informatique)France

Paris

Ulm

On peut observer l'existence d'un individu unknown , dont la prsence est ncessite par la contrainte de parent qui caractrise un humain. Sans cet individu, Jacques et Marie , dont le pre n'apparait pas dans la population dcrire, poseraient un problme d'inconsistance vis--vis de la dfinition de la classe Humain . Cette ontologie exemple est maintenant crite. La partie suivante, qui traite des outils existants, utilisera cette ontologie comme rfrence.

LP AAE

Page 34

LOntologie (Informatique)B. ProtegeProtege est une plate-forme ouverte dveloppe par luniversit de Stanford et qui fournit une communaut dutilisateur une srie doutils logiciels pour construire des modles de domaine et des applications bases sur la connaissance des ontologies. En son sein, Protege met en application un ensemble riche de structures de connaissance-modlisation et actions qui soutiennent la cration, la visualisation, et la manipulation des ontologies dans divers formats de reprsentation. Protege peut tre adapt aux besoins dun client pour fournir lappui logistique la cration de modles de la connaissance de saisie de donnes. Protege, bas sur Java, est extensible, et fournit un environnement prt lemploi qui en fait une base flexible pour le prototypage et le dveloppement dapplications rapides. De plus, Protege peut tre utilis en mode Plugin avec une interface de programmation API pour construire des outils bass sur la connaissance et le dveloppement dapplications. La plate-forme Protg propose deux manires principales de modeler des ontologies: Lditeur Protege - Frames permet des utilisateurs dtablir et populer des ontologies bases sur le protocole ouvert de connectivit de base de connaissance (OKBC). Dans ce modle, une ontologie se compose dun ensemble de classes organises dans une hirarchie pour reprsenter les concepts fondateurs dun domaine, un ensemble de connecteurs associs aux classes pour dcrire leurs proprits et rapports, et un ensemble dexemples de ces classes diffrents exemplaires des concepts qui tiennent des valeurs spcifiques pour leurs proprits. Lditeur de Protege-OWL permet des utilisateurs dtablir des ontologies pour le Web smantique, en particulier dans la spcification du W3C (OWL).

LP AAE

Page 35

LOntologie (Informatique)Dfinition des classes et des proprits

L'interface de Protg est assez simple, l'ensemble des fonctionnalits de l'diteur tant regroup en cinq onglets. Le premier onglet prsente les classes de l'ontologie. Il est possible de crer, modifier, supprimer une classe, et de lui attacher des proprits. Ces proprits peuvent ellesmme tre caractrises. La capture d'cran de la figure 8 : Capture de l'cran principal de Protg, onglet classes montre l'exemple de l'ontologie dveloppe dans la partie prcdente. Cette ontologie, crite la main, a t importe dans Protg l'aide de son plugin OWL, et peut maintenant tre modifie de faon bien plus confortable. Gestion des instances de classe et de leurs proprits L'onglet Instances permet de crer des instances et de leur affecter des proprits, conformment la dfinition des classes et des proprits effectue dans l'onglet Classes :

LP AAE

Page 36

LOntologie (Informatique)

Sur l'cran prsent, il est par exemple possible d'diter les informations concernant l'individu Paul . Il est important de comprendre que, dans l'Instance Browser, un individu est dsign par son identifiant (son rdf:ID ), et non par son prnom. En ce sens, le nommage des individus de l'ontologie crite en exemple est sans doute un peu ambigu, bien que tout fait correct. Pour des raisons pdagogiques, il aurait t plus indiqu de nommer ces instances homme1 , homme2 , etc. Flexibilit de l'interface Un des atouts majeurs de Protg est la flexibilit des formulaires de saisie de l'onglet Instances . En effet, ce formulaire dynamique s'adapte en fonction des classes dcrites dans le premier onglet du logiciel. Par ailleurs, l'onglet Forms permet de modifier l'organisation des formulaires d'instances, par un simple Drag and Drop :

LP AAE

Page 37

LOntologie (Informatique)

Possibilit d'effectuer des requtes Enfin, une fonctionnalit intressante de Protg concerne la possibilit d'effectuer des requtes sur l'ontologie en cours d'dition. La capture d'cran de la figure Illustration 11 : Gestionnaire de requtes de Protg prsente une requte. En l'occurence, il s'agit de chercher toutes les instances de la classe Humain dont le prenom commence par P. Le rsultat de cette requte est videmment l'ensemble {Pierre, Paul}. Le gestionnaire de requtes de Protg, bien que pratique, reste cependant limit en fonctionnalits.

LP AAE

Page 38

LOntologie (Informatique)

LP AAE

Page 39

LOntologie (Informatique)Conclusion

Conclusion

Le Web semble enfin comprendre son objectif initial : le partage rapide de savoirs prcis. Pas uniquement leur prsentation anarchique mais, plutt, leur mise disposition dans un format non ambigu, comprhensible par tous et extensible. Crs dans un objectif de partage des connaissances en rseau, les dernires langages du Web smantique que sont RDF et OWL sont en vrit les premires pierres d'une nouvelle forme de Web : le Web smantique, le Web de la connaissance. Facilitant l'appropriation des savoirs en les librant de la couche prsentationnelle qui les enfermait jusqu'alors, le Web smantique contribue, en ce sens, rejoindre les objectifs initiaux de Tim Berners Lee. Malgr leur jeunesse relative, RDF et OWL sont dj source d'un rel enthousiasme. Naturellement objet de l'attention des universitaires, RDF, OWL, et les autres dveloppements du Web smantique semblent galement convaincre certaines grosses entreprises. L'exemple de Jena, soutenu par Hewlett Packard, est flagrant. D'une manire plus gnrale, la richesse logicielle qui entoure les deux dernires crations du W3C ne trompe pas : le Web de demain sera smantique.

LP AAE

Page 40