Conception d'un modèle conceptuel de données et d'un thésaurus ...
09/04/2001Travaux de recherche Guiraude LAME Thésaurus juridique, catégorisation de textes Travaux...
-
Upload
barthomieu-sabatier -
Category
Documents
-
view
105 -
download
1
Transcript of 09/04/2001Travaux de recherche Guiraude LAME Thésaurus juridique, catégorisation de textes Travaux...
09/04/2001 Travaux de recherche Guiraude LAME
Thésaurus juridique, catégorisation de textes
Travaux de recherches
Guiraude LAME
Centre de recherche en informatique
Ecole nationale supérieure des mines de Paris
09/04/2001 Travaux de recherche Guiraude LAME
Thésaurus juridique
• Aide à la navigation dans les documents juridiques
• Thésaurus : outil documentaire– termes du domaine– liens entre termes (hyperonymie, hyponymie,
synonymie, association …)
• Ontologie : outil cognitif– conceptualisation du domaine
09/04/2001 Travaux de recherche Guiraude LAME
responsabilité pour faute
concurrence déloyale
parasitisme désorganisation espionnage économique et agissements parasitaires scientifique
débauche de personnel
dénigrement dénigrement par omissionpublicité comparative illiciteatteinte à l ’image de marque
usurpation de notoriété / réputation / renommée
imitation de marquede publicité
de la présentation du produit
Extrait de thésaurus
09/04/2001 Travaux de recherche Guiraude LAME
knowledge categories in the functional ontology of law (VALENTE, BREUKER) : commanding norms
normative knowledge empowering normsderogative norms
responsability (causal)knowledge legal responsability
causal responsability
ontology of law world knowledge definitional knowledgesituational knowledge
reactive knowledge
positional knowledge
creative knowledge
Une ontologie du droit
09/04/2001 Travaux de recherche Guiraude LAME
Création automatique d’un thésaurus
• Extraire les termes du domaine
• Identifier les liens entre les termes
09/04/2001 Travaux de recherche Guiraude LAME
Extraction des termes du domaine
• Corpus de référence– J.O.
– Codes
• Extracteur de syntagmes nominaux (Lexter)– Analyse syntaxique
• Sélection des candidats-termes– Mots vides
• 332 175 candidats-termes pour 26 codes
09/04/2001 Travaux de recherche Guiraude LAME
Création automatique d’un thésaurus
• Extraire les termes du domaine
• Identifier les liens entre les termes
09/04/2001 Travaux de recherche Guiraude LAME
Etiquetage des liens entre les termes
• Différentes techniques :
– Syntaxe
– Statistique• Contexte
• Cooccurrence
– Analyse morphologique
09/04/2001 Travaux de recherche Guiraude LAME
09/04/2001 Travaux de recherche Guiraude LAME
09/04/2001 Travaux de recherche Guiraude LAME
Réactualisation du thésaurus / catégorisation de textes
• Nouveaux termes
• Catégorisation des documents du J.O.
– Catégories : titres des codes– {(terme, occurrence), …}– Mesure de similarité
• Indice Dice
09/04/2001 Travaux de recherche Guiraude LAME
09/04/2001 Travaux de recherche Guiraude LAME
09/04/2001 Travaux de recherche Guiraude LAME
09/04/2001 Travaux de recherche Guiraude LAME