Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des...

35
Indexation de documents AV : ontologies, patrons de conception et d’utilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont Philippe Laublet

Transcript of Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des...

Page 1: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

Indexation de documents AV : ontologies, patrons

de conception et d’utilisation

Ingénierie des Connaissances – 3 juin 2005

Antoine Isaac

Bruno Bachimont

Philippe Laublet

Page 2: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 2

Plan

Les besoins de l’indexation pour les documents AV

Apports et problèmes des solutions ontologiques

Patrons d’indexation et utilisation d’un système d’information ontologique

Patrons d’indexation et patrons de conception ontologiques

Conclusion

Page 3: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 3

Accéder au contenu des docs AV

La recherche et l’exploitation des documents AV se font suivant leur contenu

Ce contenu doit être lu, interprété• Une interprétation qui dépend du contexte applicatif• Il n’y a pas de système conventionnel de signification

• Pas de fonction d’assignation de sens aux éléments de contenu

• Pas d'unités signifiantes par défaut

• Besoin d’une reformulation dans une forme documentaire : un indexpar exemple sous forme linguistique : texte, mots-clés

Les index sont exploités pendant la rechercheUn document est pertinent si son index répond à une requête

Page 4: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 4

Contrôler l’indexation

Besoin : l'index doit prescrire une interprétation précise du document• Compréhension partagée indexeur/recherchiste• Rapprochement efficace index/requêteContinuité sémantique

Une solution traditionnelle : le thesaurus• Intérêts : compréhension, contrôle d’interprétation,

exploitation automatique • Problèmes :

• Flou de la relation hiérarchique (subsomption ? partie-tout ?)• Relations transversales limitées (association, synonymie)• Expressivité restreinte : pas de relations dans les index

Page 5: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 5

Structurer l’indexation

Exemple de description de document :

Une émission contient une séquence où un professeur témoigne sur la maladie bleue [une maladie cardio-vasculaire], et où une animation explique ce qu’est une sténose, et comment le fonctionnement [anormal] du cœur est la cause de la maladie bleue

Index : { émission, séquence, professeur, témoignage, maladie CV, animation, sténose, fonctionnement } ?

Besoin : créer des relations entre les éléments des index

Solutions classiques : formulaires, facettes• Trop figées• Pas de vraies relations liées à des domaines applicatifs

Page 6: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 6

Plan

Les besoins de l’indexation pour les documents AV

Apports et problèmes des solutions ontologiques

Patrons d’indexation et utilisation d’un système d’information ontologique

Patrons d’indexation et patrons de conception ontologiques

Conclusion

Page 7: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 7

Ontologies et indexation

Primitives d’un langage de RC applicable à l’indexation :Concepts et relations sont les ressources pour construire les index

Fonctionnalités autorisées• Expressivité : relations propres aux domaines applicatifs• Contrôle (continuité sémantique)

• Sémantique formelle : langage formel de RCSignification précise (définitions, contraintes) et exploitable

automatiquement pour validation

• Sémantique interprétative naturelle [Bachimont] :Signification accessible dans un domaine applicatif

• Exploitation du raisonnement pour assister la recherche d’indexDans un cadre logique, on augmente ce qui est impliqué logiquement

par un index

Page 8: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 8

Ontologies

<owl:Class rdf:ID="DialogSequence"> <rdfs:subClassOf rdf:resource="#SpokenSequence"/> <rdfs:subClassOf> <owl:Restriction> <owl:onProperty> <owl:ObjectProperty rdf:about="#hasParticipant"/> </owl:onProperty> <owl:minCardinality rdf:datatype="&xsd;int">2</owl:minCardinality> </owl:Restriction> </rdfs:subClassOf> </owl:Class>

Page 9: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 9

Un index conceptuel

évoque

Maladie CV :maladieBleue

contient Interview : *

cause

DessinAnimé : *aPourTrait

Saillant

aPourParticipant

Professeur :prof_1

Emission :emission_decrite

explique

Fonctionnement : *

objet Coeur : *

représente

Sténose : *

locSpatiale

[formalisme des graphes conceptuels]

Page 10: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 10

Raisonnement

Page 11: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 11

Raisonnement : exemple On peut répondre aux requêtes :

« Recherche d’un témoignage d’expert » • Généralisation de Professeur en Expert • Application de la définition de TémoignageExpert par condition

suffisante : un témoignage auquel participe un expert est un témoignage d’expert

« Recherche d’une séquence qui explique le fonctionnement du cœur »

• Généralisation de Témoignage en Séquence • Application de la règle de composition des relations

aPourTraitSaillant et explique

Conséquence : recherche plus robuste• Economie d'indexation• Economie de recherche (reformulations de requêtes)

Page 12: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 12

Plan

Les besoins de l’indexation pour les documents AV

Apports et problèmes des solutions ontologiques

Patrons d’indexation et utilisation d’un système d’information ontologique

Patrons d’indexation et patrons de conception ontologiques

Conclusion

Page 13: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 13

Besoins des utilisateurs

L’indexation est plus complexe et assez longue à prendre en main

Il faut faciliter la tâche des utilisateurs• Déterminer des structures récurrentes pour l’usage

informationnel visé• Les proposer à l’indexeur en tant que point de départ

pour l’indexation

Prescrire une forme d’index pertinente par rapport à l’application

Page 14: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 14

Patrons d’indexation ontologiques

Les solutions existantes (grilles, formulaires) peuvent être adaptées au cas ontologiqueManque de souplesse et de richesse

Proposition de véritables patrons d’indexation• Des constructions relationnelles adaptables correspondant à

des contextes d'indexation typiques• Contenant les concepts et relations qui structurent les

connaissances et les pratiques d'une application

Page 15: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 15

Patrons d’indexation : exemple (1)

Expérimentations du projet OPALES (RIAM, 2001-2003)• Point de vue « Petite Enfance »

• Graphes conceptuels

Page 16: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 16

Page 17: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 17

Patrons d’indexation : exemple (3)

Page 18: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 18

Patrons et raisonnement

Objectif : le rapprochement entre index et requêtes• Patron considéré implicitement comme une structure pivot• Point de comparaison entre index et requêtes

Dérivation de connaissances à partir de la structure patron

Dérivation de connaissances vers la structure patron

Activité localisationObjet/Lieu

pratiquéEntité

localisation

pratiqué Activité

localisation

LieuEntitélocalisation

Page 19: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 19

Bilan

Le patron est lié à la pertinence dans l’application• Structure de référence• Connaissances de raisonnement autour du patron

L’utilisation des patrons permet au système ontologique de répondre à des questions de compétence• Que décrire, comment le décrire ?• Comment utiliser les descriptions pour répondre aux demandes

d’informations ?

Economie cognitive• les connaissances de raisonnement comme moyen de gérer des

variations autour des patrons

Page 20: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 20

Plan

Les besoins de l’indexation pour les documents AV

Apports et problèmes des solutions ontologiques

Patrons d’indexation et utilisation d’un système d’information ontologique

Patrons d’indexation et patrons de conception ontologiques

Conclusion

Page 21: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 21

Besoins des concepteurs

Conception difficile pour des ontologies riches et formalisées

Il faut faciliter la tâche des concepteurs• Cibler la connaissance utile, les inférences pertinentes • Voir ce qui est réutilisable dans d'autres conceptualisations

Vers une insertion explicite des patrons d’indexation dans le processus de construction d’ontologies• Ce sont des patrons d’utilisation de l’ontologie• Ils permettent de focaliser l’effort sur la construction des

connaissances centrales pour l’application

Page 22: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 22

Ontologies de haut niveau et patrons de conception

Proposition des concepts et des relations génériques, à spécialiser pour des domaines• Des conceptualisations et axiomatisations qui cherchent le

consensus • Qui facilitent la réutilisation de connaissances

Proposition de patrons de conception ontologiques qui articulent les notions introduites

Exemple• Ontologie de haut niveau DOLCE (LOA)• Patron “Descriptions & Situations”

Page 23: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 23

Descriptions & Situations [Gangemi]

Adapté à un usage (la description)

Mais générique (abstrait des domaines)

Page 24: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 24

D&S dans un domaine [Gangemi]

Page 25: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 25

Cas pratique : Ontologie de l'AV Conceptualisation des objets AV :

• Distinction séquence/programme• Décomposition et qualification de ces objets

Activités qui constituent le contexte des documents (rôles des personnes, manières de produire et diffuser)

• Liens vers des thèmes et entités du "monde extérieur"  Description du contenu thématique

Un patron d'utilisation sous-jacent pour les catégories AV

Page 26: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 26

Transposition de D&S dans l'AV (1)Patron de conception

Parameter Role Course of Events

Region Endurant Perdurant

valuedBy playedBy sequences

modalityfor

has forrequisite

has forrequisite

participant in

location

location

[vue simplifiée de D&S]

Page 27: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 27

Transposition de D&S dans l'AV (2)Patron d'utilisation de haut niveau

AVParameter AVRole AVCourseOfEvents

BroadcastTime,Audience

Broadcaster, Channel,BroadcastedProgram,

Receiver

Broadcast-Process

Date, RateOrganization,

Person,AVDocument

Emission,Reception

Region Endurant AVAction

valuedBy playedBy sequences

modalityfor

has forrequisite

has forrequisite

participant in

location

location

Page 28: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 28

Patrons de conception vs patrons d’utilisation de haut niveau

Problème : les choix fondés sur des considérations plutôt théoriques satisfont-ils les besoins réels d’utilisation ?• Notions trop abstaites• Chemins relationnels trop longs

Les descriptions suivant ce patron risquent d’être éloignées des préoccupations applicatives

Il faut adapter les notions du noyau du domaine aux besoins observés

Page 29: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 29

Articulation avec les besoins applicatifs

Proposition d’une étape supplémentaire : les patrons d'indexation comme patrons d’utilisation applicatifs

PATRON D'UTILISATION APPLICATIF

PATRON D'UTILISATION NOYAU

PATRON DE CONCEPTION

AVParameter AVRole AVCourseOfEvents

Region Endurant AVAction

Parameter Role Course of Events

Region Endurant Perdurant

Theme-relatedEntities

Channel, Live,Daily...

Program

SequenceProductor,

Zoom...

Page 30: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 30

Articulation avec les besoins applicatifs (2)

L’objectif concret : Articulation des patrons d'utilisation de haut niveau avec les patrons

d'utilisation de l'application

Le moyen :Utilisation des connaissances de raisonnement lier les deux points

de vue sur le domaine

Un SBC peut gérer les deux vues simultanémentLe raisonnement indique comment on passe automatiquement d’une

structure de connaissance à l’autre

Page 31: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 31

Raccourci relationnel : exemple

Information de diffusion accessible sous les deux formes dans la base

Remarque : une correspondance parfaite n'est pas forcément atteignable

BroadcastTime BroadcastedProgramBroadcastCourseOfEvents

Date AVDocument

valuedBy plays

modalityfor

has forrequisite

wasBroadcastedAt

Page 32: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 32

Bénéfices de cette articulation

Double légitimité• Théorie : le haut niveau est vu comme une source de

consensus par rapport à laquelle on situe son engagement ontologique

• Usage : les connaissance fournies dans l'ontologie sont adaptées à l'application

• Raisonnement pertinent• Prescription d'une description adaptée aux préoccupations

Compromis entre utilisation et réutilisation

Page 33: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 33

Plan

Les besoins de l’indexation pour les documents AV

Apports et problèmes des solutions ontologiques

Patrons d’indexation et utilisation d’un système d’information ontologique

Patrons d’indexation et patrons de conception ontologiques

Conclusion

Page 34: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 34

Conclusion (1)

Un problème délicat :L’indexation des documents audiovisuels

Des solutions ontologiques puissantes mais difficiles à appliquer

Proposition : introduire des patrons d’utilisation• Pour l’indexation• Mais aussi pour la conception

Page 35: Indexation de documents AV : ontologies, patrons de conception et dutilisation Ingénierie des Connaissances – 3 juin 2005 Antoine Isaac Bruno Bachimont.

3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 35

Conclusion (2)

L’emploi des ontologies est légitimé et facilité• Assistance à l’indexation et à la recherche• Conception articulant connaissances de haut niveau et

pertinence par rapport à l’application

Des difficultés inhérentes à l’approche ontologique demeurent• Effort de modélisation• Expressivité autorisée par les langages de représentation de

connaissances• Performances des outils de raisonnement disponibles