Ontologies et thésaurus en médecine -...
Transcript of Ontologies et thésaurus en médecine -...
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Ontologies et thésaurus en médecine
Jean Charlet1,2
1 INSERM, UMRS_729 ; 2AP-HP
(Avec la collaboration de P. Zweigenbaum ; CNRS, Limsi ; Inalco, CRIM)
22 janvier 2007CNAM – Paris
1 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
1 Un domaine riche en terminologiesCIM-10MeSH
SNOMED2 Des ontologies...
DéfinitionsExemples : MENELAS
... pour le Web sémantique3 Construire des ontologies médicales4 Application de ressources termino-ontologiques médicales
Enregistrement d’informations cliniquesIndexation contrôlée pour la recherche d’informationIndexation « médicale » pour la recherche d’information
5 DiscussionThésaurus vs ontologieAligner des RTO en médecineConclusion 2 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
CIM-10MeSH
SNOMED
1 Un domaine riche en terminologiesCIM-10MeSH
SNOMED2 Des ontologies...
DéfinitionsExemples : MENELAS
... pour le Web sémantique3 Construire des ontologies médicales4 Application de ressources termino-ontologiques médicales
Enregistrement d’informations cliniquesIndexation contrôlée pour la recherche d’informationIndexation « médicale » pour la recherche d’information
5 DiscussionThésaurus vs ontologieAligner des RTO en médecineConclusion 3 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
CIM-10MeSH
SNOMED
Un domaine riche en terminologies
Domaines différents
Maladies
Actes
Anatomie
Usages différents
Études statistiques :classifications
Indexation contrôlée :thésaurus
Données cliniques :nomenclatures
Structurations différentes
Monoaxial vs multiaxial
Hiérarchie unique vsmultiple
Précoordonné vspostcoordonné
4 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
CIM-10MeSH
SNOMED
Un domaine riche en terminologies
Domaines différents
Maladies
Actes
Anatomie
Usages différents
Études statistiques :classifications
Indexation contrôlée :thésaurus
Données cliniques :nomenclatures
Structurations différentes
Monoaxial vs multiaxial
Hiérarchie unique vsmultiple
Précoordonné vspostcoordonné
4 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
CIM-10MeSH
SNOMED
Un domaine riche en terminologies
Domaines différents
Maladies
Actes
Anatomie
Usages différents
Études statistiques :classifications
Indexation contrôlée :thésaurus
Données cliniques :nomenclatures
Structurations différentes
Monoaxial vs multiaxial
Hiérarchie unique vsmultiple
Précoordonné vspostcoordonné
4 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
CIM-10MeSH
SNOMED
La classification internationale des maladies
Classification statistique internationale des maladies et desproblèmes de santé connexes (OMS 93)
10e révision (1993) : « CIM-10 »
Contenu
diagnostics (actes)11 000 classes (rubriques)code, libellé ; termes inclusexiste en de nombreuses langues (dont le français)
Accès
http://www.who.ch/hst/icd-10/icd-10.htmhttp://mor.nlm.nih.gov:8000/cimnav/
5 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
CIM-10MeSH
SNOMED
CIM-10 : structure
Hiérarchie (encodée dans les caractères du code)
Classification unique (cf. exclusions)
Classification monoaxiale
code libelléI21 Infarctus aigu du myocardeI21.0 Infarctus transmural (aigu du myocarde, de la paroi) antérieureI21.1 Infarctus transmural (aigu du myocarde, de la paroi) inférieureI21.2 Infarctus transmural (aigu du myocarde) d’autres localisationsI21.3 Infarctus transmural (aigu du myocarde), de localisation non
préciséeI21.4 Infarctus sous-endocardique (aigu) du myocardeI21.9 Infarctus (aigu) du myocarde, sans précision
6 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
CIM-10MeSH
SNOMED
CIM-10 : structure
Hiérarchie (encodée dans les caractères du code)
Classification unique (cf. exclusions)
Classification monoaxiale
code libelléI21 Infarctus aigu du myocardeI21.0 Infarctus transmural (aigu du myocarde, de la paroi) antérieureI21.1 Infarctus transmural (aigu du myocarde, de la paroi) inférieureI21.2 Infarctus transmural (aigu du myocarde) d’autres localisationsI21.3 Infarctus transmural (aigu du myocarde), de localisation non
préciséeI21.4 Infarctus sous-endocardique (aigu) du myocardeI21.9 Infarctus (aigu) du myocarde, sans précision
6 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
CIM-10MeSH
SNOMED
Le thésaurus MeSH
Medical Subject Headings (National Library of Medicine)
Thésaurus pour l’indexation de la littérature biomédicale
Articles scientifiques dans la base Medline (PubMed)
Plus de 4800 revuesPlus de 14 millions de citations (2006)
Documents du web francophone médical (catalogueCISMeF)
Points d’accès
http://www.nlm.nih.gov/mesh/http://ist.inserm.fr/basismesh/mesh.htmlhttp://www.chu-rouen.fr/terminologiecismef/
7 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
CIM-10MeSH
SNOMED
MeSH : composition
Descripteur, terme vedette, synonymes (entry terms)
Version originale en anglais23 616 descripteurs et termes vedettes, 27 804 synonymes(2005)Définitions (scope notes)Traduction française par le DISC de l’Inserm (depuis 1986)
12 185 synonymes en 2004, 30 832 en 2006
8 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
CIM-10MeSH
SNOMED
MeSH : hiérarchie multiple
identifiant code hiérarchique termeC01 maladies bactériennes et mycosesC01.539 infectionsC01.539.830 suppurationC01.539.830.025 abcèsC01.539.830.025.160 abcès cerveauC01.539.830.025.325 abcès péridural
D008169 C01.539.830.025.490 abcès poumon[...]C08 maladies de l’appareil respiratoireC08.381 poumon, maladiesC08.381.125 dysplasie bronchopulmonaire[...]C08.381.348 hémoptysie
D008169 C08.381.449 abcès poumonC08.730 appareil respiratoire, infectionC08.730.099 bronchite
D008169 C08.730.407 abcès poumon9 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
CIM-10MeSH
SNOMED
La nomenclature SNOMED
Nomenclature systématique de la médecine (Côté et al. 93)
CompositionVersion originale en anglaisConcept, terme, synonymes112 471 concepts, 163 775 termes + synonymes (V3.5,1996–)Traduction française quasiment terminée (SFINM)Évolutions : SNOMED RT, CT (366 000 concepts)
Documentationhttp://www.snomed.org/ (CAP)http://www.sfinm.org/sfinm/Projets/la_snomed.html (SFINM)
Accès : version anglophone (et hispanophone)http://umlsks.nlm.nih.gov/ (NLM, licence gratuite)
10 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
CIM-10MeSH
SNOMED
SNOMED : structure
Nomenclature multiaxiale (8 axes orthogonaux)
Post-coordination : possibilité de composer plusieurs axespour décrire une observation
plaie ouverte (du) genou
M-14010 T-D9200
inflammation, SAI appendice vermiculaire, SAI
M-40000 T-59200
11 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
CIM-10MeSH
SNOMED
SNOMED : axes
Axe Nom de l’axe Termes Concepts
T topographie 13528 10278M morphologie 6171 3007F [dys]fonctions 20687 12647A artefacts, activités physiques 1686 1346L êtres vivants 26325 17678C produits chimiques 15940 12529J métiers 2303 1921S contexte social 1110 858D diagnostics 42492 25193P actes 31980 22156G qualificatifs et termes relationnels 1595 1048X 363 363total 164180 109024
selon l’UMLS 2006AA
12 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
DéfinitionsExemples : M ENELAS
... pour le Web sémantique
1 Un domaine riche en terminologiesCIM-10MeSH
SNOMED2 Des ontologies...
DéfinitionsExemples : MENELAS
... pour le Web sémantique3 Construire des ontologies médicales4 Application de ressources termino-ontologiques médicales
Enregistrement d’informations cliniquesIndexation contrôlée pour la recherche d’informationIndexation « médicale » pour la recherche d’information
5 DiscussionThésaurus vs ontologieAligner des RTO en médecineConclusion 13 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
DéfinitionsExemples : M ENELAS
... pour le Web sémantique
Définitions
Ontologie PHILO. Partie de la métaphysique qui s’applique àl’être en tant qu’être, indépendamment de sesdéterminations particulières (Le Petit Robert).
Taxinomie 1.DIDACT. Étude théorique des bases, lois, règles,principes, d’une classification. 2. Classificationd’éléments (Le Petit Robert).➠ Taxinomies en sciences naturelles
Ontologie INGÉNIERIE DES CONNAISSANCES. Une ontologie estune spécification rendant compte (on espère defaçon générique) d’une conceptualisation (Gruber,1990).
14 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
DéfinitionsExemples : M ENELAS
... pour le Web sémantique
Utilité attendue
Approches pragmatiques pour les SBC et le WSCréer et conserver des bases de connaissancesréutilisablesInteropérabilité entre différents SBCVocabulaire conceptuel (référentiel) du systèmed’informationVocabulaire conceptuel pour étiqueter ou indexer desdocumentsIntégration semi-automatique d’informations entreagents logiciels
15 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
DéfinitionsExemples : M ENELAS
... pour le Web sémantique
Les 2 rôles d’une ontologie
Définir / fournir une sémantique formelle pourl’information permettant son exploitation par unordinateurDéfinir / fournir une sémantique interprétative d’undomaine du monde réel fondée sur un consensus etpermettant de lier le contenu exploitable par lamachine à sa signification pour les humains
Un modèle du monde ou un modèle de connaissancessur le monde ?
16 / 59
Ontologie de MENELAS : « mental_change_action »
http://estime.spim.jussieu.fr/Menelas/Ontologie
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
DéfinitionsExemples : M ENELAS
... pour le Web sémantique
MENELAS – Hiérarchies
Hiérarchie de types de concepts : subsomption, opposition
artery > coronary_artery.coronary_artery > bisecting_artery.coronary_artery > circumflex_coronary_artery.coronary_artery > diagonalis_artery.coronary_artery > interventricular_artery.
interventricular_artery > interventricular_anterior_artery.interventricular_artery > interventricular_posterior_artery.
Hiérarchie de relations : subsomption, opposition
sub_functional_object >> loc.loc >> loc_above.loc >> loc_after.loc >> loc_at.loc >> loc_before.
18 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
DéfinitionsExemples : M ENELAS
... pour le Web sémantique
MENELAS – Hiérarchies
Hiérarchie de types de concepts : subsomption, opposition
artery > coronary_artery.coronary_artery > bisecting_artery.coronary_artery > circumflex_coronary_artery.coronary_artery > diagonalis_artery.coronary_artery > interventricular_artery.
interventricular_artery > interventricular_anterior_artery.interventricular_artery > interventricular_posterior_artery.
Hiérarchie de relations : subsomption, opposition
sub_functional_object >> loc.loc >> loc_above.loc >> loc_after.loc >> loc_at.loc >> loc_before.
18 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
DéfinitionsExemples : M ENELAS
... pour le Web sémantique
MENELAS – signatures
Contraintes sémantiques minimales
Positive_catalog_R_AB agt is[intentional_change]--(agt)->[human_being].
Positive_catalog_R_AB begin_at is[temporal_interval]--(begin_at)->[date_time_stamp].
19 / 59
MENELAS – modèles de référence
Model admission(_x) is [admission: _x]-(pat)-->[human_being:_pat](agt)-->[human_being:_doc]-
(state_of)<--[knowledge_state:_ks](state_of)<--[want_state:_ws] %
(motive)-->[knowledge_state:_ks]-(content)-->[out_hospital]-
(state_of)-->[human_being:_pat](motivated_by)-->[state_of_physical_object:_path]-
(state_of)-->[human_being:_pat](result)-->[in_hospital:_ih](performative_goal)-->[intentional_change]-
(purported_obj)-->[human_being:_pat](descriptive_goal)-->[state_of_physical_object:_ps]-
(intentional)(state_of)-->[human_being:_pat]-
(defines_area)-->[spatial_object:_sp3](loc)-->[spatial_object:_sp3]<--(defines_area)-
[ward:_w](consists_loc)-->[spatial_object:_sp3]%
(reason)-->[want_state:_ws]-->(content)-->[in_hospital:_ih]--(state_of)-->[human_being:_p]
(descriptive_result)-->[state_of_physical_object:_t]<--(real)(attr)-->[admission_performance_attr]-
(val_qual)-->[admission_performance_val] %
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
DéfinitionsExemples : M ENELAS
... pour le Web sémantique
MENELAS– Représentation d’une phrase
Patient âgé de 62 ans, hospitalisé pour un angor spontané et àrépétition.
[Admission]-(past)(pat)-->
[Human_Being]-(defines_cultural_function)-->
[Medical_Subfunction]-(cultural_role)->[Patient:I63]
(attr)->[Age]--(val_quant)-->[Quantitative_Val:62]-
(reference_unit)-->[Year_Duration] %(motivated_by)->[Angina_Syndrome:I77]--(timed_during)-->
[Temporal_Interval]-(temporal_role)-->[Spontaneous](temporal_role)-->[Recurrent]% %
21 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
DéfinitionsExemples : M ENELAS
... pour le Web sémantique
La vision du Web sémantique
Le Web de demain : Un immense espace d’échanges de ressourcesentre machines permettant à des utilisateurs d’accéder à de grandsvolumes d’informations et à des services variés [Tim Berners-Lee(W3C)]
Différents langages pour décrire, exploiter et raisonner sur lescontenus des ressources
Des connaissances qui s’appuient sur des ontologies
Utilisation de métadonnées
Intégration automatique d’informations provenant de sourceshétérogènes
Utilisation et combinaison automatique de services Web
Personnalisation et adaptation
Vers des réponses plus pertinentesVers l’intégration de données et de services hétérogènes 22 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
DéfinitionsExemples : M ENELAS
... pour le Web sémantique
Le « cake »
23 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
DéfinitionsExemples : M ENELAS
... pour le Web sémantique
Typed resources by (Koivunen & Miller, 2001)
The today Web The semantic Web
24 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
DéfinitionsExemples : M ENELAS
... pour le Web sémantique
Conclusion sur les ontologies
Formaliser les inscriptions pour permettre leurtraitement par un ordinateurLes ontologies pour les SBC : fournir unereprésentation formelle sur laquelle on peut effectuerdes inférencesDans le paradigme de l’Intelligence artificielle(inférences)Toujours en respectant des normes
25 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
1 Un domaine riche en terminologiesCIM-10MeSH
SNOMED2 Des ontologies...
DéfinitionsExemples : MENELAS
... pour le Web sémantique3 Construire des ontologies médicales4 Application de ressources termino-ontologiques médicales
Enregistrement d’informations cliniquesIndexation contrôlée pour la recherche d’informationIndexation « médicale » pour la recherche d’information
5 DiscussionThésaurus vs ontologieAligner des RTO en médecineConclusion 26 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Construire des ontologies médicales
En réutilisant des ontologies ou parties d’ontologies déjàfaitesEn explicitant les conceptualisations sous-jacentes dansdes formulairesEn analysant des corpus textuels générés durant l’activitéà conceptualiserEn combinant ces approches selon les cas
Mais. . .
Quelle organisation conceptuelle ?Quelle granularité ?Concepts primitifs versus définis ?Quid de la réutilisation et des « top-ontologies » ?
27 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Construire des ontologies médicales
En réutilisant des ontologies ou parties d’ontologies déjàfaitesEn explicitant les conceptualisations sous-jacentes dansdes formulairesEn analysant des corpus textuels générés durant l’activitéà conceptualiserEn combinant ces approches selon les cas
Mais. . .
Quelle organisation conceptuelle ?Quelle granularité ?Concepts primitifs versus définis ?Quid de la réutilisation et des « top-ontologies » ?
27 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Le sexe est-il un attribut ?
Patient
Patient
Patient
Patient
Patient attr
attr
Male
Male
Female
3
2
1
Sex
Sex
val
val
{
{
{
Female
chrc
chrc
Female-patient
28 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
« Méthodologie » Bachimont/TIA
Analyse de corpus
Normalisation sémantique
Engagement ontologique
Opérationnalisation
29 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
① Hypothèse
Des domaines se formalisant a priori peu ou pas et dont lemode d’accès aux informations et connaissances se faitessentiellement par le vecteur de la langue naturelleLa médecine : une science pour ses principesbiochimiques, physiques et ses protocoles d’étudesépidémiologiques ; une pratique quotidienne où lesinformations se consignent dans des « dossiers »,regroupements cohérents de documents essentiellementtextuels
→ Accès à des corpus (livres de cours, comptes rendus,etc.)
30 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
① La primauté du corpus
Une expression des connaissances à travers unelangue de spécialité, avec un vocabulaire, uneterminologie et une sémantique spécifiquesUtiliser une démarche, de corpus, et des outilsterminologiques (SYNTEX, UPERY, YAKWA,CAMELEON, . . . ) pour analyser puis modéliser ledomaineDescription de l’utilisation de ces outils au sein d’unedémarche méthodologique claire précisant à quelstade du processus et selon quelles modalités ilconvient de les utiliser
31 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
② Langue naturelle vs langage formel
Langue naturelle Pas deprimitives, des définitionscirculaires, des énoncésimprécis, contextuels,des objets « instables »
Langage formel Des expres-sions logiques construitesavec des primitives, desconnecteurs, des quantifica-teurs. . .
Choisir un contexte deréférence des objets dont onparle pour fixer et stabiliserleur interprétation ➠ stabilitéréférentielle et stabilitérelationnelle
Structurer et organiser lesconcepts ainsi créés
32 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
② Engagement sémantique
Ces primitives n’existent pas a priori
Repartir des corpus textuels du domaine
Dégager un ensemble de termes en construisant unsystème de différences entre ces termes (structured’arbre)
« Normalisation sémantique » suivant un point de vueparticulier – ex : un médicament défini suivant son principeactif (pharmacologue), ou de sa fonction (clinicien) :contexte fixé par la normalisation
Construction de l’ontologie régionale qui n’est valable quelocalement, qui comporte un contexte privilégié pourdéterminer des significations adaptées à une tâche.
33 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
② La normalisation sémantique
Normalisation sémantique .Selon le contexte et la tâche ➠ arbre de concepts
artificial_object
commercial_drug
lasilix
physical_role_function
biochemical_function
diuretic_function
natural_object
biochemical_molecule
furosemide
inanimate
molecule
34 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
③ Engagement ontologique (1)
Maintenant, les primitives existent...
les concepts formels vérifient les relations d’identité etd’inclusion unissant les concepts sémantiques
ils ne vérifient pas les relations d’exclusion car onconsidère maintenant les extensions des objets
un treillis (structure algébrique des ensembles)
Construction de l’ontologie formelle ou référentielle qui n’est(toujours) valable que localement
35 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
③ Engagement ontologique (2)
Des concepts définis...
urinary_function
artificial_object
commercial_drugphysical_role_function
biochemical_function
natural_object
biochemical_molecule
inanimate
molecule
made_of
physical_role
furosemide diuretic_functionlasilix
define_physical_function
36 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
③ Engagement ontologique (3)
...qui peuvent hériterdes attributs de leurspères et des valeursde ceux-ci.
À manier avecparcimonie...
artificial_object
commercial_drug
physical_role_function
biochemical_function
natural_object
biochemical_molecule
inanimate
molecule
furosemidediuretic_function
lasilix
diuretic_drug
37 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
④ Opérationnalisation (4)
Opérationnalisation dans un langage de représentation desconnaissances – e.g. les graphes conceptuels ou les logiquesde description (OWL)➠ treillis computationnel
[commercial_drug :_x]–
(made_of)→[biochemical_molecule :_bm]
(defines_physical_function)→[physical_system_function]–(physical_role)→[biochemical_function]
38 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Retour sur les étapes
➊ Analyse de corpus. (Choix et) description linguistique ducorpus caractérisant le domaine ; reflète les normessociales, techniques, pratiques. . .
Corpus→ Signifié
➋ Normalisation sémantique du signifié linguistique pourdégager les objets du domaine et leur type
Signifié→ Signifié normé (ou Concept linguistique)
➌ Engagement ontologiqueConcept linguistique→ Concept formel
➍ Opérationnalisation dans un langage de représentationdes connaissances
39 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Indexation contrôlée pour la recherche d’informationIndexation « médicale » pour la recherche d’information
1 Un domaine riche en terminologiesCIM-10MeSH
SNOMED2 Des ontologies...
DéfinitionsExemples : MENELAS
... pour le Web sémantique3 Construire des ontologies médicales4 Application de ressources termino-ontologiques médicales
Enregistrement d’informations cliniquesIndexation contrôlée pour la recherche d’informationIndexation « médicale » pour la recherche d’information
5 DiscussionThésaurus vs ontologieAligner des RTO en médecineConclusion 40 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Indexation contrôlée pour la recherche d’informationIndexation « médicale » pour la recherche d’information
Le thésaurus MeSH pour la recherche dans MEDLINE
Base MEDLINE, accès gratuit PUBMED
http://www.ncbi.nlm.nih.gov/entrez/
Indexation contrôlée, manuelle
Indexation assistée
Recherche par descripteurs
Indexation contrôlée→ robustesseHiérarchie→ « explosion »(subsomption)
Repli sur une recherche textuelledans les notices bibliographiques
Titre, résumé, auteurs, année...41 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Indexation contrôlée pour la recherche d’informationIndexation « médicale » pour la recherche d’information
Le thésaurus MeSH pour la recherche dans CISMeF
Catalogue et index des sites médicaux francophones
http://www.chu-rouen.fr/cismef/
Extensions au MeSH
MétatermesTypes de ressources
Recherche par descripteurs
Repli sur texte des notices
Repli sur texte des documentsprimaires
42 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Indexation contrôlée pour la recherche d’informationIndexation « médicale » pour la recherche d’information
MedOC – Motivations et matériel
Analyser les comptes rendus d’hospitalisation pourproposer
un codage PMSIindexer le dossier médical pour faire de la recherched’information ou pour des recherches épidémiologiques
Permettre aux médecins d’interagir avec les termes de leurpratiques, le thésaurus
Domaine : pneumologieLe thésaurus de la Société de Pneumologie de LangueFrançaise (SPLF) fondé sur la CIM-10Une ontologie de la pneumologieReprésenter les termes du thésaurus avec les concepts deontologie
43 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Indexation contrôlée pour la recherche d’informationIndexation « médicale » pour la recherche d’information
MedOC – Motivations et matériel
Analyser les comptes rendus d’hospitalisation pourproposer
un codage PMSIindexer le dossier médical pour faire de la recherched’information ou pour des recherches épidémiologiques
Permettre aux médecins d’interagir avec les termes de leurpratiques, le thésaurus
Domaine : pneumologieLe thésaurus de la Société de Pneumologie de LangueFrançaise (SPLF) fondé sur la CIM-10Une ontologie de la pneumologieReprésenter les termes du thésaurus avec les concepts deontologie
43 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Indexation contrôlée pour la recherche d’informationIndexation « médicale » pour la recherche d’information
MedOC – Représenter le thésaurus
44 / 59
MedOC – l’ontologie
MedOC – l’interface
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
1 Un domaine riche en terminologiesCIM-10MeSH
SNOMED2 Des ontologies...
DéfinitionsExemples : MENELAS
... pour le Web sémantique3 Construire des ontologies médicales4 Application de ressources termino-ontologiques médicales
Enregistrement d’informations cliniquesIndexation contrôlée pour la recherche d’informationIndexation « médicale » pour la recherche d’information
5 DiscussionThésaurus vs ontologieAligner des RTO en médecineConclusion 47 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
Descripteur vs concept en recherche documentaire
Granularité de MeSH
Un thésaurus formé de descripteurs
Nez : D009666
Descripteur MeSH = agglomérat deconcepts
Différents points de vue regroupéspour l’indexation
48 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
Thésaurus versus ontologie formelle : l’exemple duMeSH
Many individuals have to tried to use MeSH as a conceptrepresentation language with only modest succes. That therelationships in the MeSH tree structure were designed with a differentview, and with a different (an not formal) meaning of “broader-than”,has frustated their efforts. The MeSH hierarchical structure wasdesigned to reflect a view of the literature for a user.[. . . ] The treesthus indicate what appears to be a useful set of relationships, basedon the perceveid needs of searchers (Nelson, 2001)
49 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
Thésaurus versus ontologie formelle☞ Thésaurus
Contenu :Descripteurs, mots-clésRelations : « is_a », « synonyme » (terme préférentiel), «voir_aussi »
Utilisé par un agent humain (documentaliste, spécialiste) pour indexerdes documents ou comme vocabulaire contrôlé
☞ Ontologie formelle
Contenu :Une taxinomie de concepts, une taxinomie de relationsDes « rôles »
Décrite dans un langage de représentation des connaissances etexploitée par un système informatique
Possibilité de comparer et de classer des conceptsCapacité générativeInférences
50 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
Un besoin d’interopérabilité : UMLS
Objectif
Faciliter la recherche et l’intégration d’informations provenantdes multiples sources d’information biomédicales électroniques
Méthode : fournir un pont entre les multiples terminologiesbiomédicales existantes
UMLS (National Library of Medicine)
Système d’unification de terminologies médicales
Ressource distribuée gratuitement (mais respect des droits)http://www.nlm.nih.gov/research/umls/
https://umlsks.nlm.nih.gov/
51 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
Un besoin d’interopérabilité : UMLS
Objectif
Faciliter la recherche et l’intégration d’informations provenantdes multiples sources d’information biomédicales électroniques
Méthode : fournir un pont entre les multiples terminologiesbiomédicales existantes
UMLS (National Library of Medicine)
Système d’unification de terminologies médicales
Ressource distribuée gratuitement (mais respect des droits)http://www.nlm.nih.gov/research/umls/
https://umlsks.nlm.nih.gov/
51 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
Un besoin d’interopérabilité : UMLS
Objectif
Faciliter la recherche et l’intégration d’informations provenantdes multiples sources d’information biomédicales électroniques
Méthode : fournir un pont entre les multiples terminologiesbiomédicales existantes
UMLS (National Library of Medicine)
Système d’unification de terminologies médicales
Ressource distribuée gratuitement (mais respect des droits)http://www.nlm.nih.gov/research/umls/
https://umlsks.nlm.nih.gov/
51 / 59
UMLS : système d’unification de terminologiesmédicales
Lexique Spécialiste
Rés
eau
sém
antiq
ueM
état
hesa
urus
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
Approche ascendante : le « Metathesaurus »
Le Metathesaurus
Union raisonnée d’une centaine de terminologies biomédicales
Régime de l’inventaire
Point de départ =produits terminologiquesdivers
Identification desconcepts communs
Partage des relations
Risques (avérés)d’incohérence
MeSH SNOMED
Met
athé
saur
us
CIM
2006AD : 1,3 millions de concepts,6,4 millions de chaînes différentes
53 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
Fusion de concepts dans le Metathesaurus
Libellé SOURCE
Myocardial Infarction MSH2002 (D009203), MTH
MYOCARDIAL INFARCTION CCPSS99, COS89, CST95,
WHO97
Myocardial infarction AIR93, MDR40, MDR40, RCD99, SNM2
myocardial infarction AOD99, BI98, CSP2001
Myocardial Infarctions MSH2002, MTH, PSY2001
Infarctions (Myocardial) PSY2001
Infarctions, Myocardial MSH2002
Infarction, myocardial ICPC2P
Infarction ;myocardial ICPC2P
Infarction, Myocardial MSH2002
Myocardial infarction, NOS SNMI98 (D3-15000)
Heart attack, NOS SNMI98 (D3-15000)
HEART ATTACK CST95, DXP94, WHO97
Heart Attacks PSY2001
Heart attack MDR40, RCD99
heart attack AOD99, CSP2001
ATTACK HEART (NOS) CST95
Attack heart (NOS) MDR40
Infarction of heart, NOS SNMI98 (D3-15000)
HEART INFARCTION DXP94
Infarction, heart ICPC2P
Infarction ;heart ICPC2P
Cardiac infarction, NOS SNMI98 (D3-15000)
Libellé SOURCE
Myocardial Infarct MSH2002 (D009203)
MYOCARDIAL INFARCT CST95
Myocardial infarct MDR40, RCD99, SNM2
Myocardial Infarcts MSH2002
Infarct, Myocardial MSH2002
Infarcts, Myocardial MSH2002
INFARCT MYOCARDIAL CST95
Infarct myocardial MDR40
Myocardial necrosis MDR40, RCD99
Attack coronary MDR40
ATTACK CORONARY CST95
Myocardial infarction syndrome SNM2
Necrosis myocardium MDR40
NECROSIS MYOCARDIUM CST95
Myocardial necrosis syndrome SNM2
CT - Coronary thrombosis RCD99
MI - Myocardial infarction RCD99
mi <1> MTH (U006521)
MI CSP2001 (1393-3417), MDR40 (10027524)
mi BI98 (BI00102)
AMI <3> MTH
AMI AOD99
Cardiopathy necrotic MDR40
54 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
Difficultés
Sémantique formelle versus interprétative
Une ontologie pour un SBC, c’est beaucoup plus qu’unehiérarchies (des hiérarchies, propriétés, modèles, . . . )
Concepts primitifs versus définis
De nombreux choix peu outillés
Quels langages pour les ontologies ? OWL estopérationnel pour la construction et la gestion, les BDseraient plus opérationnelles mais. . . Les archetypespermettent de représenter des ontologies mais. . .
55 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
Propositions
Impossibilité de construire une ontologie de la médecinetenant compte de tous les points de vues des spécialisteset de la granularité (1,3 M de concepts dans leMetathesaurus)
Construire une ontologie formelle c’est décontextualiser undomaine de connaissance (un unique contexte parconcept)
Des ontologies de domaine construites à partir de corpusmais possibilités d’accord de la médecine occidentale surune « top ontologie » et sur les relations ?
Une démarche constructiviste au sein des sciences del’artificiel (H. Simon)
56 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
Développements
Construire des ontologiesÀ partir de corpus (outils de TAL), dans des domaines s’yprêtant bien...mais aussi de données structurées disponibles(formulaires/questionnaires)À la recherche d’une certaine réutilisabilité ou généricité(ou un large consensus ?)
Gérer l’évolution, la fusion des ontologies
Assurer l’interopérabilité syntaxique
Gérer l’accès aux ontologiesEn liant ontologie et thésaurus (du plan conceptuel au plande la désignation)
Assurer l’interopérabilité sémantique (le but du Web sémantiquemais dans un domaine de pratiques normées)
57 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
Une ontologie : un objet formel
Ontologie NON-HÉRÉTIQUE INGÉNIERIE DES CONNAISSANCES. Uneontologie implique ou comprend une certaine vue du mondepar rapport à un domaine donné.Cette vue est souvent conçue comme un ensemble deconcepts – e.g. entités, attributs, processus –, leursdéfinitions et leurs interrelations. On appelle cela uneconceptualisation.Une ontologie peut prendre différentes formes mais elleincluera nécessairement un vocabulaire de termes et unespécification de leur signification.Une ontologie est une spécification rendant partiellementcompte d’une conceptualisation.
Ontologie HÉRÉTIQUE INGÉNIERIE DES CONNAISSANCES. Ensembledes objets reconnus comme existant dans le domaine.Construire une ontologie c’est aussi décider de la manièred’être et d’exister des objets.
58 / 59
Un domaine riche en terminologiesDes ontologies...
Construire des ontologies médicalesApplication de ressources termino-ontologiques médicales
Discussion
Thésaurus vs ontologieAligner des RTO en médecineConclusion
Liens
http://www.biomath.jussieu.fr/Hospitexehttp://www.spim.jussieu.fr/pertomedhttp://estime.stim.jussieu.fr/Menelas/Ontologie
http://www.opengalen.org/http://rtp-doc.enssib.fr/websemantique/http://doccismef.chu-rouen.fr/
http://www.irit.fr/GRACQ/http://rtp-doc.enssib.fr/http://www.edisante.org/
59 / 59