UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06...

download UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de.

of 23

  • date post

    03-Apr-2015
  • Category

    Documents

  • view

    104
  • download

    1

Embed Size (px)

Transcript of UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06...

  • Page 1
  • UE303.c : cours n6 Conception de systme dinformation multimdia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Universit Nancy 2 Equipe de recherche SITE LORIA sahbi.sidhom@loria.fr Conception de thsaurus : Terme - Concept - Relations smantiques
  • Page 2
  • M2 IST-IEthsaurus : n 62 Thsaurus : dfinitions (Michel Hudon, 1995) une liste de mots simples ou dexpression ayant une valeur de terme dans un domaine limit de connaissance, le terme ayant dfinit comme la reprsentation linguistique (symbolique) dun concept unique . (Van Slype, 1987) une liste structure de concepts, destine reprsenter dune manire univoque le contenu des documents et des questions dans un systme documentaire dtermin, et assister lutilisateur dans lindexation des document et des questions . (AFNOR, 1981) une liste dautorit organise de descripteurs et de non descripteurs obissant des rgles terminologiques propres et relis entre eux par des relations smantiques (hirarchiques, associatives, ou dquivalence). Cette liste sert traduire en un langage artificiel dpourvu dambigut des notion exprim en langage naturel .
  • Page 3
  • M2 IST-IEthsaurus : n 63 Composants dun thsaurus Un lexique (ou vocabulaires dentre, ensemble de mots dune langue) descripteurs et non descripteurs Un sous ensemble de dfinitions et de notes dapplication Notes historiques et notes dapplication pratique Une structure classificatoire exprime par des relations smantiques entre les termes du lexique, et parfois traduits par une notation symboliques relation dquivalence intra linguistique relation dquivalence inter linguistique relation hirarchique relation dassociation
  • Page 4
  • M2 IST-IEthsaurus : n 64 Rle et fonction dun thsaurus Faciliter la recherche documentaire et den augmenter lefficacit Permettre un reprage exhaustif en liant les concepts et les termes proches Rduire limpact des problmes causs par la synonymie prsente dans le langage naturel
  • Page 5
  • M2 IST-IEthsaurus : n 65 Thsaurus et autre sources terminologiques Thsaurus de description et dictionnaire diffrence dacception: concepts / Mots Thsaurus de description et thsaurus littraire diffrence dans le rle: dfinition / rfrence Thsaurus de description et banque terminologique diffrence dinterprtation: relations smantiques Thsaurus de description et vedette-matire diffrence dorganisation: structure / hirarchie
  • Page 6
  • M2 IST-IEthsaurus : n 66 La structure smantique dun thsaurus Relation dquivalence intra-linguistique entre des synonymes qui expriment la mme ide, on distingue le mono- quivalent et le pluri-quivalent. On utilise la notation EM et le EP Relation hirarchique relation dinclusion et de supriorit, on distingue entre terme spcifique et terme gnrique. On utilise la notation TS/ TG Relation dassociation analogie et lien de signification entre descripteurs. Moins dfinit et subjective. On utilise la notation TA Relation inter-linguistique relation symtrique entre deux descripteurs de deux ou plusieurs langues. on distingue entre quivalence complte et quivalence partielle. On utilise le notation An/ FR/ ES
  • Page 7
  • M2 IST-IEthsaurus : n 67 Cration dun nouveau thsaurus Pour crer un nouveau thsaurus, il faut une: valuation des vocabulaires disponibles Analyse des besoins particuliers lenvironnement Domaine couvrir, type et nombre de documents traiter, besoin des usagers, valuation des ressources Slection des caractristiques essentielles du thsaurus Profondeur et structure du thsaurus,
  • Page 8
  • M2 IST-IEthsaurus : n 68 Processus de construction dun thsaurus : la collecte du vocabulaire Diverses sources terminologiques peuvent contribuer lexploitation : Un langage documentaire existant Un thsaurus extrieur au service Une Banque de donnes terminologiques Une indexation intellectuelle Une indexation automatique
  • Page 9
  • M2 IST-IEthsaurus : n 69 Processus de construction dun thsaurus : listage des micro-disciplines tablir une liste provisoire des grands thmes. Le nombre de groupes retenir est fonction du volume thsaurial la liste de micro-disciplines a pour objet de faciliter la manipulation et la prise de dcision le groupement se fait par thme ou par facette
  • Page 10
  • M2 IST-IEthsaurus : n 610 Processus de construction dun thsaurus : rduction du langage documentaire Cette phase comporte les tapes suivantes tablissement de la structure dquivalence smantique tablissement de la structure hirarchique traitement des doubles emplois recherche des quivalents inter-linguistiques tablissement des relations associatives laboration de la structure dquivalence smantique tablir la liste des termes synonymes ou quasi-synonymes Choisir dans chaque liste les termes qui auront le statut de non descripteur et les rattacher au descripteur/ on choisi le plus neutre, le plus utilis dans la profession
  • Page 11
  • M2 IST-IEthsaurus : n 611 synonymie vritable La forme complte dun nom et son abrviation Ex: IMA (institut de monde Arabe) Le nom populaire et le nom scientifique Ex: Vitamine C (Acide Ascorbique) Le nom scientifique et le nom commercial Ex: Acide Actylsalicylique (Asprine) Les variantes orthographiques dun mme mot Ex: clef (cl) Lappellation ancienne et lappellation moderne dun mme concept Ex: pays sous dvelopp (pays en dveloppement) Les termes dorigine linguistique diffrents Ex: Marketing (mercatique) Les termes dorigine culturelle diffrents Ex : Parking (stationnement)
  • Page 12
  • M2 IST-IEthsaurus : n 612 laboration de la structure hirarchique Construire des chanes hirarchiques par micro-discipline. Toutes les hirarchies ne possdent pas un nombre gal de niveaux. Mais il y a une logique comparable entre concepts quil faut respecter. On identifie les relations hirarchiques par plusieurs moyens comme lemploie des noncs suivants: Certain A sont des B. Tous les B sont A (relation dinclusion). Ex: animaux / Rongeurs # animaux familiers / Rongeurs X (spcifique) est toujours et ncessairement un Y (gnrique) Ex: la discrimination religieuse est toujours et ncessairement un type de discrimination (TG)
  • Page 13
  • M2 IST-IEthsaurus : n 613 Traitement des doubles emplois Traitement de la poly-hirarchies: le mme concepts exprims dans deux ou plusieurs micro-thsaurus Traitement des anomalies Descripteurs identiques dsignant des concepts diffrents: ajouter un qualificateurs Non descripteurs identiques lis des descripteurs diffrents: Ajouter un qualificateur Termes retenus la fois comme descripteurs dans un champs et non descripteurs dans un autre: limination dans lun ou lautre champs Relation hirarchique entre descripteurs et non descripteurs : exclure
  • Page 14
  • M2 IST-IEthsaurus : n 614 Recherche des quivalents inter-linguistiques La recherche des quivalents linguistiques ne peut se faire qu partir du moment o le contenu smantique des descripteurs de la langue de base est fix, grce des relations dappartenance et dquivalence. on trouve les situations suivantes: quivalence certaine. Ex: route / Road Lger dcalage de sens. Ex: services de documentation/ special library Pas dquivalence de tout. Utilisation dune priphrase ou adoption de terme trangers
  • Page 15
  • M2 IST-IEthsaurus : n 615 tablissement des relations associatives Seuls les termes qui ont t choisis comme descripteurs peuvent tre associs. Lassociation se fait un niveau inter-hirarchique Plusieurs types dassociation possibles : la cause et leffet: ex: infection et Maladie le tout et sa partie ex: livre et reliure laction et son agent. Ex: conomie et conomiste laction et le lieu daction. Ex: enseignement et cole la science et son objet. EX: documentation et document lobjet et sa proprit. Ex : Poison et Toxicit lobjet et son application. Ex : Ordinateur et traitement de donnes
  • Page 16
  • M2 IST-IEthsaurus : n 616 Derniers tapes de construction Ralisation de ldition exprimentale Formation des indexeurs Tester le thsaurus ajout de descripteurs modification des structures explication des descripteurs (encore ambigus) Rvision finale et ralisation de ldition oprationnelle
  • Page 17
  • M2 IST-IEthsaurus : n 617 Liens utiles http://fr.thesaurus.gc.ca/intro_f.html
  • Page 18
  • M2 IST-IEthsaurus : n 618 INAthque : thsaurus Descripteurs: Collge de France; science; chercheur (scientifique); recherche scientifique; socit; culture-savoir Descripteurs secondaires : sciences humaines; enseignement
  • Page 19
  • M2 IST-IEthsaurus : n 619 Explications : relations
  • Page 20
  • M2 IST-IEthsaurus : n 620 Relations dquivalence : EM, EP (limine la synonymie) EM : Employer Df. : non DES ----------- DES Ex. : Calculateur ------------ Ordinateur EP : Employer Pour Df. : DES ----------- non DES Ex. : Ecologie ------------ tude du milieu/ environnement A B EM EP
  • Page 21
  • M2 IST-IEthsaurus : n 621 Relations hirarchiques : TS, TG (rapports de supriorit / subordination) TS : (terme spcifique) Df. : relation qui va du gnrique au spcifique Ex. : Oiseau ------------- Rapace ------------- Aigle TG : (terme gnrique) Df. : relation qui va du spcifique au gnrique Ex. : Aigle ------------- Rapace diurne Chouette ------------- Rapace nocturne A B TS TG
  • Page 22
  • M2 IST-IEthsaurus : n 622 Relations associatives : TA (pour exprimer des analogie de significations) 1.Antonymie (sens contraire) Ex. : impermabilit ------------- permabilit 2. Cause et effet Ex. : enseignement ------------- instruction 3. Rapport ins