Post on 04-Apr-2015
Indexation de documents AV : ontologies, patrons
de conception et d’utilisation
Ingénierie des Connaissances – 3 juin 2005
Antoine Isaac
Bruno Bachimont
Philippe Laublet
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 2
Plan
Les besoins de l’indexation pour les documents AV
Apports et problèmes des solutions ontologiques
Patrons d’indexation et utilisation d’un système d’information ontologique
Patrons d’indexation et patrons de conception ontologiques
Conclusion
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 3
Accéder au contenu des docs AV
La recherche et l’exploitation des documents AV se font suivant leur contenu
Ce contenu doit être lu, interprété• Une interprétation qui dépend du contexte applicatif• Il n’y a pas de système conventionnel de signification
• Pas de fonction d’assignation de sens aux éléments de contenu
• Pas d'unités signifiantes par défaut
• Besoin d’une reformulation dans une forme documentaire : un indexpar exemple sous forme linguistique : texte, mots-clés
Les index sont exploités pendant la rechercheUn document est pertinent si son index répond à une requête
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 4
Contrôler l’indexation
Besoin : l'index doit prescrire une interprétation précise du document• Compréhension partagée indexeur/recherchiste• Rapprochement efficace index/requêteContinuité sémantique
Une solution traditionnelle : le thesaurus• Intérêts : compréhension, contrôle d’interprétation,
exploitation automatique • Problèmes :
• Flou de la relation hiérarchique (subsomption ? partie-tout ?)• Relations transversales limitées (association, synonymie)• Expressivité restreinte : pas de relations dans les index
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 5
Structurer l’indexation
Exemple de description de document :
Une émission contient une séquence où un professeur témoigne sur la maladie bleue [une maladie cardio-vasculaire], et où une animation explique ce qu’est une sténose, et comment le fonctionnement [anormal] du cœur est la cause de la maladie bleue
Index : { émission, séquence, professeur, témoignage, maladie CV, animation, sténose, fonctionnement } ?
Besoin : créer des relations entre les éléments des index
Solutions classiques : formulaires, facettes• Trop figées• Pas de vraies relations liées à des domaines applicatifs
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 6
Plan
Les besoins de l’indexation pour les documents AV
Apports et problèmes des solutions ontologiques
Patrons d’indexation et utilisation d’un système d’information ontologique
Patrons d’indexation et patrons de conception ontologiques
Conclusion
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 7
Ontologies et indexation
Primitives d’un langage de RC applicable à l’indexation :Concepts et relations sont les ressources pour construire les index
Fonctionnalités autorisées• Expressivité : relations propres aux domaines applicatifs• Contrôle (continuité sémantique)
• Sémantique formelle : langage formel de RCSignification précise (définitions, contraintes) et exploitable
automatiquement pour validation
• Sémantique interprétative naturelle [Bachimont] :Signification accessible dans un domaine applicatif
• Exploitation du raisonnement pour assister la recherche d’indexDans un cadre logique, on augmente ce qui est impliqué logiquement
par un index
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 8
Ontologies
<owl:Class rdf:ID="DialogSequence"> <rdfs:subClassOf rdf:resource="#SpokenSequence"/> <rdfs:subClassOf> <owl:Restriction> <owl:onProperty> <owl:ObjectProperty rdf:about="#hasParticipant"/> </owl:onProperty> <owl:minCardinality rdf:datatype="&xsd;int">2</owl:minCardinality> </owl:Restriction> </rdfs:subClassOf> </owl:Class>
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 9
Un index conceptuel
évoque
Maladie CV :maladieBleue
contient Interview : *
cause
DessinAnimé : *aPourTrait
Saillant
aPourParticipant
Professeur :prof_1
Emission :emission_decrite
explique
Fonctionnement : *
objet Coeur : *
représente
Sténose : *
locSpatiale
[formalisme des graphes conceptuels]
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 10
Raisonnement
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 11
Raisonnement : exemple On peut répondre aux requêtes :
« Recherche d’un témoignage d’expert » • Généralisation de Professeur en Expert • Application de la définition de TémoignageExpert par condition
suffisante : un témoignage auquel participe un expert est un témoignage d’expert
« Recherche d’une séquence qui explique le fonctionnement du cœur »
• Généralisation de Témoignage en Séquence • Application de la règle de composition des relations
aPourTraitSaillant et explique
Conséquence : recherche plus robuste• Economie d'indexation• Economie de recherche (reformulations de requêtes)
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 12
Plan
Les besoins de l’indexation pour les documents AV
Apports et problèmes des solutions ontologiques
Patrons d’indexation et utilisation d’un système d’information ontologique
Patrons d’indexation et patrons de conception ontologiques
Conclusion
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 13
Besoins des utilisateurs
L’indexation est plus complexe et assez longue à prendre en main
Il faut faciliter la tâche des utilisateurs• Déterminer des structures récurrentes pour l’usage
informationnel visé• Les proposer à l’indexeur en tant que point de départ
pour l’indexation
Prescrire une forme d’index pertinente par rapport à l’application
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 14
Patrons d’indexation ontologiques
Les solutions existantes (grilles, formulaires) peuvent être adaptées au cas ontologiqueManque de souplesse et de richesse
Proposition de véritables patrons d’indexation• Des constructions relationnelles adaptables correspondant à
des contextes d'indexation typiques• Contenant les concepts et relations qui structurent les
connaissances et les pratiques d'une application
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 15
Patrons d’indexation : exemple (1)
Expérimentations du projet OPALES (RIAM, 2001-2003)• Point de vue « Petite Enfance »
• Graphes conceptuels
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 16
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 17
Patrons d’indexation : exemple (3)
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 18
Patrons et raisonnement
Objectif : le rapprochement entre index et requêtes• Patron considéré implicitement comme une structure pivot• Point de comparaison entre index et requêtes
Dérivation de connaissances à partir de la structure patron
Dérivation de connaissances vers la structure patron
Activité localisationObjet/Lieu
pratiquéEntité
localisation
pratiqué Activité
localisation
LieuEntitélocalisation
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 19
Bilan
Le patron est lié à la pertinence dans l’application• Structure de référence• Connaissances de raisonnement autour du patron
L’utilisation des patrons permet au système ontologique de répondre à des questions de compétence• Que décrire, comment le décrire ?• Comment utiliser les descriptions pour répondre aux demandes
d’informations ?
Economie cognitive• les connaissances de raisonnement comme moyen de gérer des
variations autour des patrons
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 20
Plan
Les besoins de l’indexation pour les documents AV
Apports et problèmes des solutions ontologiques
Patrons d’indexation et utilisation d’un système d’information ontologique
Patrons d’indexation et patrons de conception ontologiques
Conclusion
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 21
Besoins des concepteurs
Conception difficile pour des ontologies riches et formalisées
Il faut faciliter la tâche des concepteurs• Cibler la connaissance utile, les inférences pertinentes • Voir ce qui est réutilisable dans d'autres conceptualisations
Vers une insertion explicite des patrons d’indexation dans le processus de construction d’ontologies• Ce sont des patrons d’utilisation de l’ontologie• Ils permettent de focaliser l’effort sur la construction des
connaissances centrales pour l’application
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 22
Ontologies de haut niveau et patrons de conception
Proposition des concepts et des relations génériques, à spécialiser pour des domaines• Des conceptualisations et axiomatisations qui cherchent le
consensus • Qui facilitent la réutilisation de connaissances
Proposition de patrons de conception ontologiques qui articulent les notions introduites
Exemple• Ontologie de haut niveau DOLCE (LOA)• Patron “Descriptions & Situations”
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 23
Descriptions & Situations [Gangemi]
Adapté à un usage (la description)
Mais générique (abstrait des domaines)
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 24
D&S dans un domaine [Gangemi]
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 25
Cas pratique : Ontologie de l'AV Conceptualisation des objets AV :
• Distinction séquence/programme• Décomposition et qualification de ces objets
Activités qui constituent le contexte des documents (rôles des personnes, manières de produire et diffuser)
• Liens vers des thèmes et entités du "monde extérieur" Description du contenu thématique
Un patron d'utilisation sous-jacent pour les catégories AV
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 26
Transposition de D&S dans l'AV (1)Patron de conception
Parameter Role Course of Events
Region Endurant Perdurant
valuedBy playedBy sequences
modalityfor
has forrequisite
has forrequisite
participant in
location
location
[vue simplifiée de D&S]
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 27
Transposition de D&S dans l'AV (2)Patron d'utilisation de haut niveau
AVParameter AVRole AVCourseOfEvents
BroadcastTime,Audience
Broadcaster, Channel,BroadcastedProgram,
Receiver
Broadcast-Process
Date, RateOrganization,
Person,AVDocument
Emission,Reception
Region Endurant AVAction
valuedBy playedBy sequences
modalityfor
has forrequisite
has forrequisite
participant in
location
location
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 28
Patrons de conception vs patrons d’utilisation de haut niveau
Problème : les choix fondés sur des considérations plutôt théoriques satisfont-ils les besoins réels d’utilisation ?• Notions trop abstaites• Chemins relationnels trop longs
Les descriptions suivant ce patron risquent d’être éloignées des préoccupations applicatives
Il faut adapter les notions du noyau du domaine aux besoins observés
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 29
Articulation avec les besoins applicatifs
Proposition d’une étape supplémentaire : les patrons d'indexation comme patrons d’utilisation applicatifs
PATRON D'UTILISATION APPLICATIF
PATRON D'UTILISATION NOYAU
PATRON DE CONCEPTION
AVParameter AVRole AVCourseOfEvents
Region Endurant AVAction
Parameter Role Course of Events
Region Endurant Perdurant
Theme-relatedEntities
Channel, Live,Daily...
Program
SequenceProductor,
Zoom...
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 30
Articulation avec les besoins applicatifs (2)
L’objectif concret : Articulation des patrons d'utilisation de haut niveau avec les patrons
d'utilisation de l'application
Le moyen :Utilisation des connaissances de raisonnement lier les deux points
de vue sur le domaine
Un SBC peut gérer les deux vues simultanémentLe raisonnement indique comment on passe automatiquement d’une
structure de connaissance à l’autre
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 31
Raccourci relationnel : exemple
Information de diffusion accessible sous les deux formes dans la base
Remarque : une correspondance parfaite n'est pas forcément atteignable
BroadcastTime BroadcastedProgramBroadcastCourseOfEvents
Date AVDocument
valuedBy plays
modalityfor
has forrequisite
wasBroadcastedAt
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 32
Bénéfices de cette articulation
Double légitimité• Théorie : le haut niveau est vu comme une source de
consensus par rapport à laquelle on situe son engagement ontologique
• Usage : les connaissance fournies dans l'ontologie sont adaptées à l'application
• Raisonnement pertinent• Prescription d'une description adaptée aux préoccupations
Compromis entre utilisation et réutilisation
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 33
Plan
Les besoins de l’indexation pour les documents AV
Apports et problèmes des solutions ontologiques
Patrons d’indexation et utilisation d’un système d’information ontologique
Patrons d’indexation et patrons de conception ontologiques
Conclusion
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 34
Conclusion (1)
Un problème délicat :L’indexation des documents audiovisuels
Des solutions ontologiques puissantes mais difficiles à appliquer
Proposition : introduire des patrons d’utilisation• Pour l’indexation• Mais aussi pour la conception
3 juin 2005 Antoine Isaac, Bruno Bachimont, Philippe Laublet – IC 2005 35
Conclusion (2)
L’emploi des ontologies est légitimé et facilité• Assistance à l’indexation et à la recherche• Conception articulant connaissances de haut niveau et
pertinence par rapport à l’application
Des difficultés inhérentes à l’approche ontologique demeurent• Effort de modélisation• Expressivité autorisée par les langages de représentation de
connaissances• Performances des outils de raisonnement disponibles