L’extraction terminologique et l’extraction d’hyperonymes

83
Faculteit Letteren & Wijsbegeerte Annelies Depoorter L’extraction terminologique et l’extraction d’hyperonymes à l’aide d’un corpus parallèle Masterproef voorgedragen tot het behalen van de graad van Master in het Vertalen 2016 Promotor Prof. Dr. Lefever Vakgroep Vertalen Tolken Communicatie

Transcript of L’extraction terminologique et l’extraction d’hyperonymes

Page 1: L’extraction terminologique et l’extraction d’hyperonymes

Faculteit Letteren & Wijsbegeerte

Annelies Depoorter

L’extraction terminologique et

l’extraction d’hyperonymes

à l’aide d’un corpus parallèle

Masterproef voorgedragen tot het behalen van de graad van

Master in het Vertalen

2016

Promotor Prof. Dr. Lefever

Vakgroep Vertalen Tolken Communicatie

Page 2: L’extraction terminologique et l’extraction d’hyperonymes

2

Page 3: L’extraction terminologique et l’extraction d’hyperonymes

3

Remerciements

Nous voudrions exprimer toute notre reconnaissance envers notre directrice de mémoire,

Madame Els Lefever, qui nous a aidée à réaliser ce mémoire avec ses conseils et

commentaires pertinents. Nous voudrions la remercier pour le temps et la patience qu’elle

nous a consacrés.

Nous tenons également à remercier nos parents, notre sœur, Cedric et toute notre famille qui

n’ont jamais cessé de nous soutenir tout au long de la rédaction de ce mémoire. Un grand

merci aussi à Laurens qui a révisé soigneusement les chapitres du présent mémoire. Enfin,

nous voudrions remercier nos amies Jennifer, Felien, Gave, Elise, Ellen, Tjapke et Nele qui

ont partagé nos joies et nos peines tout au long de notre formation.

Page 4: L’extraction terminologique et l’extraction d’hyperonymes

4

Table des matières

Remerciements ........................................................................................................................... 3

1. Introduction ........................................................................................................................ 6

2. Cadre théorique .................................................................................................................. 8

2.1. Notions de base ............................................................................................................ 8

2.1.1. Terminologie et terme .............................................................................................. 8

2.1.2. Hyperonyme et hyponyme ..................................................................................... 10

2.1.3. Corpus parallèle (aligné) ........................................................................................ 11

2.2. Traitement automatique de la terminologie .................................................................. 12

2.2.1. Extraction terminologique automatique ................................................................. 12

2.2.2. Détection d’hyperonymes ...................................................................................... 15

2.2.3. Les mesures du bruit et du silence : la précision, le rappel et la F-mesure ............ 18

2.3. Utilité de la détection des relations sémantiques .......................................................... 19

3. Méthodologie ................................................................................................................... 21

3.1. Méthode de travail ......................................................................................................... 21

3.2. Construction du corpus .................................................................................................. 22

3.3. Élaboration du corpus d’analyse (Gold Standard) ........................................................ 22

3.4. Problèmes rencontrés lors de l’annotation .................................................................... 24

4. Partie expérimentale ......................................................................................................... 26

4.1. Évaluation de l’extraction avec TExSIS et analyse des résultats .................................. 26

4.2. Analyse des relations d’hyperonymie dans le Gold Standard ....................................... 33

4.3. Projection des relations d’hyperonymie ........................................................................ 36

5. Conclusion ........................................................................................................................ 40

Bibliographie ............................................................................................................................ 44

Annexes .................................................................................................................................... 48

A. Listes des paires d’hyperonymes anglaises ..................................................................... 48

B. Listes des paires d’hyperonymes françaises .................................................................... 54

Page 5: L’extraction terminologique et l’extraction d’hyperonymes

5

C. Liste bilingue extraite par TExSIS .................................................................................. 60

D. Liste des paires correctes extraites par TExSIS .............................................................. 76

Page 6: L’extraction terminologique et l’extraction d’hyperonymes

6

1. Introduction

Le présent mémoire se veut une étude approfondie de l’extraction terminologique

(« automatic term extraction » en anglais) et de la détection des relations d’hyperonymie

(« hypernym detection » en anglais) à partir d’un corpus parallèle aligné. La motivation pour

laquelle nous prenons ces éléments comme l’objet d’étude de ce mémoire est la suivante.

À cause de la globalisation de notre monde et l’explosion de la quantité d’informations

textuelles, la communication internationale et la gestion des termes doivent être plus

efficaces. Tout le monde doit comprendre sur le coup ce que l’interlocuteur veut dire. Voilà

pourquoi, par exemple au sein d’une entreprise, tous les employés doivent utiliser la même

terminologie d’une manière consistante (Vanopstal et al., 2014, p. 179). En outre, l’évolution

rapide de la technologie fait évoluer la langue. Quand un concept disparaît, le terme disparaît,

et inversement, quand de nouveaux concepts ou objets sont inventés (p.ex. l’invention du

portable), il faut créer de nouveaux termes. La gestion de la terminologie est donc très

importante de nos jours.

Or, établir des listes terminologiques s’avère une activité chère qui prend beaucoup de temps

et d’efforts et mêmes les ressources disponibles, par exemple des banques terminologiques, ne

suivent plus l’évolution rapide des sciences. Les bases de données lexicales WordNet1 et

EuroWordNet2 montrent les relations sémantiques entre concepts, mais sont très limitées

puisqu’elles contiennent plutôt du vocabulaire général et non spécifique à un domaine. De

plus, ces bases de données sont construites à main, ce qui requiert beaucoup de temps

d’élaboration (Schropp et al., 2013, p. 593). EuroTermBank3 et IATE

4, par contre,

contiennent plus de vocabulaire spécialisé, mais ces bases ne peuvent plus suivre l’évolution

continue des domaines (Lefever et al., 2014b, p. 251). Voilà pourquoi il faut vraiment

rechercher des méthodes afin de pouvoir extraire automatiquement les termes et les relations

sémantiques d’un domaine particulier.

L’automatisation du repérage de termes et de relations entre ces termes, qui constitue l’objet

d’étude de notre mémoire, entraîne un gain de temps pour les entreprises, les spécialistes et

les traducteurs qui font une recherche systématique. Ainsi, l’automatisation offre une vue

d’ensemble d’un domaine de spécialité. En effet, les simples listes terminologiques peuvent

être étendues en reliant les termes entre eux, c’est-à-dire en identifiant des relations

sémantiques entre les termes, afin de créer un thésaurus ou une ontologie qui présente la

1 http://wordnet.princeton.edu

2 http://www.illc.uva.nl/EuroWordNet

3 http://www.eurotermbank.com

4 http://iate.europa.eu

Page 7: L’extraction terminologique et l’extraction d’hyperonymes

7

structure d’un domaine particulier. Pourtant, pour effectivement gagner du temps il faut que

les systèmes automatiques produisent des listes de haute qualité, de sorte que la validation

manuelle soit minimisée. En effet, la discipline qui s’occupe de l’extraction terminologique et

de la détection des hyperonymes est toujours en train d’optimiser les systèmes.

En faisant abstraction de la gestion des termes, nous focaliserons sur deux tâches

terminologiques spécifiques, à savoir l’extraction terminologique bilingue et la détection des

relations d’hyperonymes. En effet, nous nous occuperons de la première phase cruciale dans

le processus terminographique, c’est-à-dire, le repérage des paires de termes et des paires

d’hyp(er)onymes. Nous verrons que tant de chercheurs ont commencé à trouver des méthodes

afin d’obtenir automatiquement les relations d’hyperonymie dans un corpus de textes

spécialisés.

En nous appuyant sur un corpus de textes techniques anglais/français que nous allons annoter

manuellement, nous espérons en gros trouver une réponse aux questions suivantes. Qu’est-ce

que c’est qu’un terme ? Qu’est-ce que c’est qu’un hyp(er)onyme ? Comment fonctionnent

l’extraction terminologique bilingue et la détection d’hyp(er)onymes ? Est-ce que l’extraction

terminologique bilingue automatique pourrait aider à améliorer la détection d’hyperonymes ?

Quelles sont les lacunes de ces systèmes automatiques et comment pourrions-nous les

combler ?

Le présent mémoire est structuré comme suit : le deuxième chapitre rend compte de quelques

définitions des notions pertinentes pour notre recherche, le troisième chapitre porte sur notre

méthodologie (méthode de travail), le but de notre recherche, la constitution du corpus,

l’élaboration du corpus d’analyse (Gold Standard) et sur les problèmes que nous avons

rencontrés lors de l’annotation. Dans le quatrième chapitre nous esquisserons les résultats de

notre recherche expérimentale. Le cinquième chapitre résume les conclusions et détermine les

directions de recherches futures.

Page 8: L’extraction terminologique et l’extraction d’hyperonymes

8

2. Cadre théorique

Pour que nous puissions annoter manuellement les termes et les hyp(er)onymes de notre

corpus, nous devons d’abord bien cerner les notions de terme et d’hyp(er)onyme ainsi que

nous interroger sur les critères qui ont été proposés pour la sélection des termes. De plus, nous

devons bien comprendre comment fonctionnent l’extraction terminologique ainsi que la

détection d’hyperonymes. Le présent chapitre propose donc les notions principales utilisées

dans la suite du présent mémoire, leur définition et la description de leurs généralités, ainsi

qu’une série d’études pertinentes qui ont été réalisées à propos de l’extraction terminologique

et de la détection d’hyperonymes.

2.1. Notions de base

2.1.1. Terminologie et terme

Comme nous l’avons déjà effleuré dans notre introduction, la terminologie vise à rendre plus

efficace la communication internationale, en éliminant synonymes et ambiguïtés. Pourtant le

mot terminologie lui-même est polysémique : il désigne notamment la théorie de la

terminologie, une science interdisciplinaire fondée par Eugen Wüster ; les « activités

d’acquisition, de compilation et de gestion des termes » (L’Homme, 2004, p. 15) ; et tout le

vocabulaire d’un domaine de spécialité (p.ex. la terminologie de la médecine). Il est clair que

les questions que se pose la terminologie relèvent surtout de la pratique (L’Homme, 2004,

ib.). Le troisième sens renvoie d’ailleurs au résultat de cette terminographie, ce qui souligne

que c’est une démarche onomasiologique, ou autrement dit une démarche qui part des

concepts d’un certain domaine, c’est-à-dire des représentations mentales d’objets. Le travail

du terminographe consiste en effet à repérer les concepts dans un texte spécialisé, à décrire

ces concepts, à choisir un terme de préférence et parfois à créer des néologismes. Il faut donc

partir du signifié (concept) qui est indépendant de la langue pour arriver au signifiant (terme)

qui est dépendant de la langue. Le résultat de ce travail est réalisé dans les produits

terminographiques comme des dictionnaires spécialisés, des banques de terminologie, des

listes de termes, des thésauri et des glossaires qui servent aux traducteurs, interprètes,

spécialistes, etc.5

Regardons maintenant de plus près l’objet d’étude de la terminologie qui doit être distingué

de l’objet de la lexicologie (L’Homme, 2004, p. 23). Dans la langue de spécialité (« LSP » en

anglais), les termes ont un sens bien délimité (monosémie) dans un domaine particulier et sont

5 Pour une introduction à la terminographie, voir (Rondeau, 1984).

Page 9: L’extraction terminologique et l’extraction d’hyperonymes

9

formés d’un mot ou de plusieurs mots. Dans la langue commune, par contre, les mots peuvent

avoir plusieurs sens (polysémie) et ne sont représentés que par un signe linguistique. En effet,

les termes recouvrent seulement un sous-ensemble du lexique de la langue. Mais qu’est-ce

que c’est qu’un terme ? L’Homme (2004, p. 22) définit terme comme suit :

Les termes sont des unités lexicales dont le sens est envisagé par rapport à un domaine de

spécialité, c’est-à-dire un domaine de la connaissance humaine, souvent associé à une activité

socio-professionnelle.

D’autres définitions de terme (cf. e.a. (Bowker, 2008, p. 286) et (Wright, 1997, p. 13))

soulignent que le concept doit être défini de manière transparente afin de respecter les

caractéristiques définitoires des termes, à savoir, la monosémie, la mononymie et

l’appartenance à un domaine particulier. En effet, la terminologie vise à la biunivocité ou la

réflexivité, c’est-à-dire une combinaison d’univocité (monosémie) et de monoréférentialité

(mononymie) (Rondeau, 1984, p. 22). Cela veut dire qu’« à une forme correspond un seul

concept et un concept est exprimé par une seule forme » (L’Homme, 2004, p. 27). En effet,

quand plusieurs synonymes coexistent, il faut choisir un terme de préférence. Si la

normalisation de la terminologie vise à réduire la synonymie, l’homonymie est bien tolérée.

Le terme aile par exemple se retrouve dans le domaine des transports (partie d’un avion), dans

celui de la biologie (partie d’un oiseau) et dans celui de l’architecture (partie d’un immeuble).

La terminologie n’éprouve pas de problèmes dans ce cas d’homonymie, parce qu’il s’agit de

termes qui appartiennent à des domaines de spécialités distincts.

Si la définition du mot terme n’est pas très problématique, l’identification et la sélection des

termes dans un texte spécialisé pose pourtant quelques problèmes. Il est en effet très difficile

de s’accorder sur le statut terminologique d’un mot ou d’une séquence de plusieurs mots.

L’Homme (2004) explique comment procéder pour distinguer les termes des non-termes. La

fréquence, par exemple, est souvent utilisée comme indicateur de l’appartenance d’un terme à

un domaine particulier (L’Homme, 2004, p. 57).

Il faut aussi être conscients des caractéristiques des termes pour les pouvoir reconnaître.

Quant à la catégorisation des termes, ils peuvent être classés d’après la forme et la classe

grammaticale. En effet, il y a des termes qui sont formés d’un mot (p. ex. POINTEUR) et il y

en a qui sont formés de plusieurs mots (p. ex. LISTE D’OUTILS). Nous parlons

respectivement de termes simples (« single word terms » en anglais) et de termes complexes

ou syntagmes nominaux (« multi word terms » en anglais). Ces derniers sont divisés en trois

sous-classes : compositions (termes composés), dérivations et formes abrégées (abréviations

et sigles). En guise d’exemple, citons quelques termes tirés de notre corpus qui font partie du

Page 10: L’extraction terminologique et l’extraction d’hyperonymes

10

domaine technique/informatique : AFFICHAGE (dérivation), RECTANGLE DE

SÉLECTION (composition), RAM (sigle). Pour une vue d’ensemble de tous les modes de

formations des termes, voir (Wright, 1997, p. 13-18).

D’après la catégorie grammaticale du mot central, les séquences de mots pouvant être retenus

comme termes d’un domaine de spécialité constituent différentes sortes de termes. Les trois

classes grammaticales les plus fréquentes sont les noms, les verbes et les adjectifs. Il est clair

que la catégorie grammaticale des termes dépend de la langue dans laquelle les termes sont

construits. En effet, la structure morphosyntaxique des termes en français6 est souvent N, N +

Adj, N1 de N2, Inf ou N + N (Daille, 1996, p. 29). En anglais, par contre, les structures

morphosyntaxiques les plus fréquentes des termes sont : N, V-ing, N + N, Adj + N, Adj, N +

N + N et V. Il est donc possible qu’en français un terme simple est détecté alors qu’en anglais

le même concept est désigné par un terme complexe (Wright, 1997, p. 14). Lorsqu’un mot est

retenu comme terme, il faut toujours utiliser la forme standard au singulier et supprimer les

articles ainsi que le to d’un verbe en anglais (Wright, 1997, p. 17-18).

2.1.2. Hyperonyme et hyponyme

Entre les mots peuvent exister différents types de relations sémantiques lexicales : la

synonymie, l’antonymie, l’homonymie, la polysémie, l’hyperonymie, l’hyponymie et la

conversivité (Polguère, 2008). Les deux relations sémantiques que nous voudrions détecter

dans notre corpus sont l’hyponymie et l’hyperonymie. En général, l’hyperonymie et

l’hyponymie induisent des rapports d’ordre hiérarchique ou non-hiérarchique entre les

concepts (Depecker, 2003, p. 149). Il faut distinguer deux grands types de liens: les liens

logiques et les liens ontologiques. Les premiers concernent le genre et ses espèces (genus >

species, p.ex. animal > chat). Le deuxième type de liens hiérarchiques, les liens ontologiques,

concernent les parties d’un tout ; notamment un rapport partitif (p. ex. voiture > porte). Pour

notre recherche, nous allons prendre en considération uniquement le premier type de liens

hiérarchiques (genus > species) et nous adopterons la définition de Polguère (2008). Ce

dernier définit les notions d’hyperonyme et d’hyponyme comme suit (p. 148) :

La lexie Lhyper est un hyperonyme de la lexie Lhypo lorsque la relation sémantique qui les unit

possède les deux caractéristiques suivantes :

1. le sens (Lhyper

) est inclus dans le sens

(Lhypo

);

2. (Lhypo

) peut être considéré comme un cas particulier de

(Lhyper

).

La lexie (Lhypo

) quant à elle, est appelée hyponyme de Lhyper.

6 Comme notre corpus comprend des textes en anglais et en français, nous nous limitons ici à traiter les

caractères morphosyntaxiques de termes pour ces deux langues.

Page 11: L’extraction terminologique et l’extraction d’hyperonymes

11

2.1.3. Corpus parallèle (aligné)

Pour faire l’extraction terminologique bilingue nous avons besoin de ressources textuelles. La

meilleure ressource pour notre recherche est un corpus parallèle aligné. En général, un corpus

est une collection de textes écrits ou de transcriptions de conversations dans une langue

particulière qui nous aide à analyser et décrire un phénomène (linguistique). De nos jours, il

est indispensable de travailler avec des corpus électroniques, étant donné que les outils

électroniques (KWIC Concordance, etc.) nous pourront aider à chercher et trouver vite des

contextes, des équivalents etc. Les études fondées sur corpus sont aussi très importantes pour

améliorer les systèmes de traduction automatique, les mémoires de traduction, l’extraction

terminologique, etc. (Baker, 1995, p. 224). Il existe différents types de corpus, qui ont été

classés d’après une typologie basée sur trois paramètres qui concernent le nombre de langues

(monolingue, bilingue ou multilingue), le statut du texte (texte original /vs/ texte traduit) et la

direction de la traduction (unidirectionnel, bidirectionnel).

En outre, nous distinguons des corpus parallèles et des corpus comparables. Un corpus

parallèle est constitué de textes dans la langue source et leurs traductions dans la langue cible

(Baker, 1995, p. 230). Un corpus comparable, par contre, est constitué de textes qui relèvent

d’un même domaine et qui sont écrits, soit dans deux variantes d’une même langue (textes

originaux et textes traduits dans cette langue à partir d’une autre) (Baker, 1995, p. 234), soit

dans deux langues différentes (p. ex. les textes de Wikipedia). Si un corpus parallèle est

toujours au moins bilingue, un corpus comparable peut donc être monolingue, bilingue ou

même multilingue. Les textes d’un corpus parallèle sont alignés au niveau de la phrase ou au

niveau du mot de façon qu’il y ait des couples de phrases ou des couples de mots avec les

éléments sources et leurs équivalents côte à côte. Ainsi, les corpus parallèles nous donnent des

informations sur, par exemple, les problèmes de traductions qu’éprouvent les traducteurs

(Baker, 1995, p. 231). Cependant, la construction d’un corpus parallèle est un processus

coûteux parce qu’il faut beaucoup plus de temps que celui prévu pour construire un corpus

comparable. Voilà enfin pourquoi les corpus parallèles sont des ressources rares (Clouet,

2014, p. 43).

Pour notre recherche, nous avons opté pour un corpus parallèle unidirectionnel dont la langue

source est l’anglais et la langue cible le français. Ce corpus nous permettra de comparer

précisément les paires de termes et les paires d’hyperonymes dans les deux langues.

Page 12: L’extraction terminologique et l’extraction d’hyperonymes

12

2.2. Traitement automatique de la terminologie

Comme nous l’avons déjà mentionné dans l’introduction, l’extraction terminologique

manuelle est un processus long et cher qui résulte surtout de l’intuition humaine. Les outils

informatiques doivent alléger le repérage des termes, mais, et nous le verrons dans la suite de

la présente section, cette activité n’est pas toujours plus facile pour l’ordinateur que pour

l’humain. Ainsi, nous allons montrer les avantages ainsi que les limites de ces outils

informatiques.

2.2.1. Extraction terminologique automatique

En général, deux approches ont été proposées afin d’automatiser l’extraction des termes :

l’approche linguistique et l’approche statistique (Macken et al., 2013, p. 4). Avant de traiter

de ces deux approches, nous devons faire la distinction entre les deux types d’extraction

terminologique, c’est-à-dire, l’extraction monolingue et l’extraction bilingue.

En ce qui concerne l’extraction des termes monolingues, il existe deux techniques pour

repérer les termes candidats à partir d’un corpus de textes : par patrons linguistiques ou par

filtrage statistique. L’approche linguistique (« rule-based approach » en anglais) ((Dagan et

Church, 1994) et (Ananiadou, 1994)) est basée sur les règles grammaticales de la formation

des termes dans une langue spécifique. Lors du prétraitement linguistique les patrons

morphosyntaxiques spécifiques pour la langue en question sont déterminés à travers des

étiqueteurs grammaticaux (« part-of-speech-taggers » en anglais), p. ex. N, N + N, N + Prép +

N, Adj + N (cf. 2.1.1.). Ensuite, sont détectés les constituants (« chunks »). Les systèmes

d’extraction terminologique qui appliquent cette méthode linguistique sont donc toujours des

systèmes dépendants de la langue. Cependant, le désavantage de cette approche est la

tendance à surgénéraliser. En effet, il se peut que tous les substantifs précédés par un adjectif

soient inclus dans la liste des termes extraite.

L’approche statistique (Pantel et Lin, 2001), par contre, est indépendante de la langue et basée

sur des mesures statistiques pour exclure des termes candidats. Nous pouvons filtrer les

termes candidats en mesurant le degré de spécificité (« termhood » en anglais) et le degré

d’unité (« unithood » en anglais). Pour les termes simples, la mesure de Log-likelihood (LL)

détermine la spécificité d’un terme pour un domaine donné. Cette mesure part de l’idée que

les termes ont tendance à apparaître plus fréquemment dans des textes spécialisés plutôt que

dans des textes généraux. Pour les termes complexes, la mesure de « C-value » indique dans

quelle mesure un terme complexe apparaît comme une unité conceptuelle. Cette mesure part

donc de l’idée que les termes complexes montrent un degré de cohésion élevée et vise à

Page 13: L’extraction terminologique et l’extraction d’hyperonymes

13

exclure les termes (simples) qui apparaissent uniquement dans des termes complexes

compositionnels. Le désavantage de l’approche statistique est pourtant la production de bruit

(« noise » en anglais) par le système. En effet, l’extracteur ramène des mots qui ne sont pas du

tout des termes, par exemple les articles.

De nos jours7 une approche hybride ((Daille, 1996), (Frantzi et Ananiadou, 1999) et (Maynard

et Ananiadou, 1999)), combinant information linguistique et information statistique est plus

couramment utilisée pour créer des modules d’extraction terminologique. Ces systèmes

hybrides utilisent d’abord les filtres linguistiques pour identifier les termes candidats, puis les

filtres statistiques pour distinguer les termes des non-termes. Pour le français, Daille (1996) a

développé des filtres statistiques pour extraire des collocations uniquement techniques en

étudiant les spécificités linguistiques des termes pour le domaine des télécommunications.

Si les logiciels d’extraction terminologique monolingue extraient des listes de termes dans

une langue donnée, les logiciels d’extraction terminologique bilingue (ou multilingue)

identifient des termes dans le texte source et les relient avec leurs traductions correspondantes

sur la base de l’alignement au niveau du mot. En effet, ces systèmes produisent d’abord des

listes de termes monolingues, puis ils alignent les termes correspondants dans les deux

langues, ce qui résulte enfin dans une liste de termes bilingues. Pourtant, récemment une

approche hybride a été développée qui ne part pas de la langue source et ses patrons

spécifiques, mais qui adopte une approche plurilingue dès le début en identifiant les termes

sur la base des phrases alignées et en combinant ensuite plusieurs filtres statistiques pour

déterminer la spécificité des termes candidats (Macken et al., 2013, p. 17). Cet extracteur a été

créé par Macken et al. (2013) à l’Université de Gand, dans le cadre du projet TExSIS8

(Terminology Extraction for Semantic Interoperability and Standardization). La figure 1 ci-

dessous montre l’architecture du module d’extraction terminologique de TExSIS. Pour notre

analyse, nous allons avoir recours à cet outil pour extraire une liste de termes bilingues à

partir de notre corpus parallèle.

Automatiser entièrement l’extraction des termes reste cependant une utopie, puisque dans la

plupart des cas la liste de termes générée par le logiciel doit être épurée ou enrichie par des

experts humains (Macken et al, 2013, p. 4). En effet, les extracteurs de terminologie

connaissent plusieurs problèmes. Les principaux travaux d’extraction de terminologie

rapportent notamment le problème des termes compositionnels qui sont plus difficiles à

7 Pour une comparaison de la performance et de l’efficacité des programmes d’extraction terminologique « state-

of-the-art », comme les logiciels commerciaux SDL MultiTerm Extract et Similis, voir (Stevens et al., 2012). 8 http://www.lt3.ugent.be/en/projects/texsis/

Page 14: L’extraction terminologique et l’extraction d’hyperonymes

14

extraire que les termes simples parce que « les termes simples et complexes ne se traduisent

pas systématiquement par un terme de même longueur » (Morin et al., 2004, p. 2), puisque

« la traduction d’un terme complexe n’est pas toujours obtenue par la traduction de ces

composants » (ib.) et à cause des variations morphologiques, syntaxiques ou sémantiques

d’un même terme (ib.). Un autre problème concerne l’usage du critère de la fréquence d’un

terme qui n’exclut pourtant pas le repérage des non-termes fréquents dans un texte donné.

Pour l’évaluation de la performance des outils d’extraction terminologique, voir la section

2.2.3.

Figure 1 : Architecture de l’extracteur terminologique de TExSIS (prise de (Macken et al.,

2013, p. 11)).

Page 15: L’extraction terminologique et l’extraction d’hyperonymes

15

2.2.2. Détection d’hyperonymes

Les simples listes de termes obtenues automatiquement peuvent être structurées d’une façon

sémantique en identifiant ce que nous avons défini comme hyp(er)onymes dans la section

2.1.2. La détection d’hyperonymes est donc une forme d’enrichissement de l’extraction

terminologique. Pour extraire des paires d’hyperonymes à partir de textes spécialisés,

différentes approches ont été proposées. Nous nous limitons ici à traiter des trois approches

principales suivantes : une approche lexico-syntaxique basée sur des patrons lexico-

syntaxiques, un modèle distributionnel et une méthode morphosyntaxique.

L’approche lexico-syntaxique (Hearst, 1992) identifie des relations sémantiques comme

l’hyponymie à travers une série de patrons lexico-syntaxiques fréquents et facilement

reconnaissables. Pour l’anglais, Hearst a trouvé six patrons lexico-syntaxiques indiquant la

relation d’hyperonymie (1992, p. 539-541)9 :

1. NP0 such as {NP1, NP2 … , (and|or)} NPn

Exemple : The bow lute, such as the Bambara ndang, is plucked and has an individual curved

neck for each string.

Paire d’hyperonymes résultante : (Bambara ndang, bow lute)

2. such NP as {NP ,}* {(or|and)} NP

Exemple : …works by such authors as Herrick, Goldsmith, and Shakespeare.

Paires d’hyperonymes résultantes : (Herrick, author), (Goldsmith, author), (Shakespeare,

author)

3. NP {, NP}* {,} or other NP

Exemple : Bruises, wounds, broken bones or other injuries…

Paires d’hyperonymes résultantes : (bruise, injury), (wound, injury), (broken nose, injury)

4. NP {, NP}* {,} and other NP

Exemple : …temples, treasuries, and other important civic buildings.

Paires d’hyperonymes résultantes : (temple, civic building), (treasury, civic building)

5. NP {,} including {NP ,}* {or|and} NP

Exemple : All common-law countries, including Canada and England…

Paires d’hyperonymes résultantes : (Canada, common-law country), (England, common-law

country)

6. NP {,} especially {NP ,}* {or|and} NP

Exemple : … most European countries, especially France, England, and Spain.

Paires d’hyperonymes résultantes : (France, European country), (England, European country),

(Spain, European country)

9 NP : Noun Phrase (Syntagme Nominal), accolades : éléments optionnels.

Page 16: L’extraction terminologique et l’extraction d’hyperonymes

16

Le travail de Hearst a inspiré tant de chercheurs d’utiliser cette méthode pour trouver des

patrons lexico-syntaxiques dans d’autres langues. Pour la construction de patrons lexico-

syntaxiques en français, Malaisé et al. (2004a) ont focalisé sur les marqueurs lexico-

syntaxiques parenthèse, par exemple et sorte de dans son corpus. En guise d’exemple, citons

quelques phrases qui présentent ces patrons lexico-syntaxiques :

Quand les bras ne sont pas disponibles, il y a le moïse (ou berceau), quoiqu’il est vrai que cet

achat se révèle souvent onéreux. (Malaisé et al., 2004b)

Le matin, j’aime manger du fruit, par exemple une pomme et une banane.

Un avion est une sorte de moyen de transport.

Les constructions dans une langue particulière, comme celles ci-dessus, indiquent donc le

type de relation sémantique entre les éléments lexicaux. Voilà l’idée derrière l’approche

lexico-syntaxique. Les deux grands avantages de cette méthode consistent dans le fait qu’elle

ne requiert pas d’effectuer un prétraitement syntaxique des phrases entières (« parsing ») et

qu’elle peut être appliquée sur un grand ensemble de textes de tous les genres (Hearst, 1992,

p. 539-540). Cependant, Lefever et al. (2014a) ont critiqué cette méthode puisque seulement

une partie des relations d’hyperonymie est obtenue à cause des strictes contraintes

syntaxiques définies par les patrons. En effet, les relations d’hyperonymie peuvent être

exprimées d’une autre manière. De plus, cette méthode a tendance à surgénéraliser et à

identifier uniquement les relations sémantiques au niveau de la phrase et non pas entre

plusieurs phrases (Lefever et al., 2014a, p. 492-494).

D’autres chercheurs ((Caraballo, 1999), (Van der Plas et Bouma, 2005) et (Lenci et Benotto,

2012)) ont opté pour une approche distributionnelle afin de repérer automatiquement les

paires d’hyperonymes dans un texte spécialisé. Cette méthode prend pour point de départ que

les termes apparaissant dans un contexte lexical similaire sont reliés sémantiquement, c’est-à-

dire qu’ils montrent une similarité sémantique (Harris, 1968). Cette approche est capable

d’identifier plusieurs relations sémantiques entre les termes, notamment la synonymie,

l’hyperonymie, l’hyponymie et l’antonymie, sans que la relation n’ait été définie par un

patron syntaxique fixe. Pourtant, il est très difficile d’identifier l’exact type de relation

sémantique entre les concepts figurant dans le texte (Lefever et al., 2014a, p. 492). En guise

d’exemple, nous avons construit une matrice distributionnelle pour une partie de notre corpus

français. Les lignes de la matrice montrent les mots cibles et les colonnes montrent les mots

Page 17: L’extraction terminologique et l’extraction d’hyperonymes

17

lexicaux qui apparaissent dans le contexte des mots cibles. Dans les cellules nous avons mis

« 1 » si le mot apparaît dans le contexte du mot cible, et « 0 » si ce n’est pas le cas.

Si l’on remplaçait la configuration de ce moniteur plus grand par 1 024 x 768 pixels, l’image

affichée serait plus petite et occuperait seulement une partie de l’écran. Lors de la préparation

d’une image pour l’affichage en ligne (par exemple, une page Web à afficher sur divers

moniteurs), les dimensions de pixel deviennent essentielles. L’image pouvant éventuellement

être affichée sur un moniteur 15 pouces, vous pouvez décider de limiter sa taille à 800 x 600

pixels afin de laisser de l’espace pour l’affichage des commandes du navigateur Web.

contexte

Mot cible configuration grand affichée pixel commandes

image 0 0 1 0 0

moniteur 1 1 0 0 0

dimensions 0 0 0 1 0

La troisième approche, l’approche morphosyntaxique, concerne les termes composés

(« compounds »). Il est possible d’étendre automatiquement la liste d’hyperonymes en

considérant le suffixe le plus long d’un terme composé comme plus général et par conséquent

comme hyperonyme du terme composé (Bosma et al., 2010 ; 2011). Ainsi, le terme composé

constitue l’hyponyme de la paire en question (Lefever et al., 2014a, p. 493). LISTE

D’OUTILS MASQUÉS, par exemple, est un hyponyme de LISTE. En comparaison avec leur

corpus de référence manuellement annoté, Lefever et al. ont constaté que l’approche

morphosyntaxique s’avère l’approche qui obtient les meilleurs résultats (2014a, p. 490).

Schropp et al. ont développé pour le néerlandais un système de détection d’hyperonymes basé

sur une méthode hybride utilisant information distributionnelle pour filtrer l’output basé sur

les patrons (2013, p. 593). Cette approche hybride augmente nettement la précision (cf. 2.2.3.)

du système.

Page 18: L’extraction terminologique et l’extraction d’hyperonymes

18

2.2.3. Les mesures du bruit et du silence : la précision, le rappel et la F-mesure

Comme nous l’avons déjà effleuré dans les paragraphes précédents, les outils informatiques

qui nous aident à repérer automatiquement la terminologie et/ou les hyp(er)onymes dans un

corpus de textes d’un domaine spécifique ne sont pas parfaits et produisent parfois du bruit

(« noise » en anglais), à savoir des unités extraites, mais pas pertinentes du point de vue de

l’utilisateur et du silence, à savoir des unités pertinentes dans le texte, mais pas extraites par le

logiciel évalué (L’Homme, 2004, p. 193).

Afin de mesurer le bruit et le silence et donc d’évaluer la performance de l’outil, il faut

calculer la précision, le rappel (« recall ») et la F-mesure. La précision évalue le nombre de

couples corrects par rapport à la liste de couples extraits automatiquement et est égal au

nombre de paires correctes divisé par le nombre total de paires dans la liste extraite du

système. Quand la précision s’avère élevée, il y a peu de bruit. Le rappel évalue le nombre de

couples corrects par rapport à ceux qui figurent dans la liste de référence et est égal au nombre

de paires correctes divisé par le nombre total de paires dans la liste de référence. Quand il y a

peu de silence, le rappel se révèle élevé (L’Homme 2004, p. 193). La F-mesure calcule la

moyenne pondérée du taux de précision et de rappel.

Ci-dessous nous présentons les formules pour calculer respectivement la précision, le rappel

et la F-mesure (basées sur Lefever et al., 2014b, p. 266 ; p. 271). Il va de soi que les mêmes

formules sont applicables pour évaluer l’extraction des couples de termes et des couples

d’hyperonymes.

Précision =

Rappel =

F-mesure = 2.

Nombre de termes corrects extraits par le système

Nombre total de termes extraits par le système

Nombre de termes corrects extraits par le système

Nombre total de termes dans le Gold Standard

Précision . rappel

Précision + rappel

Page 19: L’extraction terminologique et l’extraction d’hyperonymes

19

2.3. Utilité de la détection des relations sémantiques

L’identification des relations sémantiques est une forme d’enrichissement de l’extraction

terminologique. Comme nous l’avons déjà effleuré dans notre introduction, la construction

manuelle de bases lexicales et bases terminologiques est une activité chère qui prend

beaucoup de temps et d’efforts. Pourtant, en dégageant automatiquement de l’information

structurée sur les relations entre les termes, il est possible de structurer les simples listes

terminologiques obtenues par l’extraction automatique. Ainsi, les divers liens sémantiques

entre les concepts du domaine de spécialité deviennent clairs.

Pour les entreprises qui ne peuvent plus suivre l’évolution rapide des domaines, la

classification sémantique automatique se révèle très utile afin de générer des taxonomies qui

incluent la terminologie spécifique de l’entreprise. Une autre conséquence directe de

l’identification des relations sémantiques est une meilleure compréhension du domaine de

spécialité, notamment pour l’étudiant ou le traducteur qui n’est pas du tout expert du domaine

en question (Picht et al. 1990, p. 92).

L’identification des relations sémantiques dans un corpus de textes spécialisés peut résulter

dans la compilation de taxonomies, thésauri ou ontologies (De Groote, 2015). Une taxonomie

présente un seul type de relations, à savoir les relations hiérarchiques, alors qu’un thésaurus

présente trois types de relations sémantiques : les relations d’équivalences (la synonymie,

(EP10

)), les relations hiérarchiques (hyperonymes (TG) et hyponymes (TS)) et les relations

associatives (p. ex. un co-hyponyme (TA)) (Aitchison et al., 2000, pp. 50, 54, 60)11

. Une

ontologie est encore plus large et représente la conceptualisation d’un domaine de

connaissance en indiquant les relations sémantiques entre les entités ontologiques (De Groote,

2015). Il existe donc plusieurs façons de modéliser les rapports entre les termes d’un domaine

spécialisé. Regardons maintenant de plus près comment un thésaurus les rend concrètement

visibles. Ci-dessous nous avons repris le résultat de la recherche du mot véhicule dans le

Thésaurus de l’UNESCO12

:

10

EP : Employé Pour (Used For), TG : terme générique (Broader Term), TS : terme spécifique (Narrower Term),

TA : Terme Associé (Related Term). 11

Pour de plus amples informations sur la construction de thésauri, voir (Aitchison et al., 2000). 12

http://databases.unesco.org/thesfr/

Page 20: L’extraction terminologique et l’extraction d’hyperonymes

20

Figure 2 : Résultat pour la recherche du mot « véhicule » dans le Thésaurus de l’UNESCO.

Outre la représentation des relations dans une liste, il existe des représentations graphiques

des relations sémantiques d’un domaine de connaissance. Le « Visual Thesaurus »13

par

exemple donne une ensemble de vue du réseau de rapports qui existent entre un terme cible et

d’autres termes.

Figure 3 : Résultat de la recherche du mot « train » dans le Visual Thesaurus.

13

http://www.visualthesaurus.com

Page 21: L’extraction terminologique et l’extraction d’hyperonymes

21

3. Méthodologie

Le présent chapitre rend compte de la méthode que nous avons appliquée pour faire notre

recherche. En outre, nous décrirons la construction de notre corpus ainsi que l’élaboration de

notre corpus d’analyse qui fonctionne comme liste de référence. Nous présenterons également

les caractéristiques et quelques chiffres de notre corpus manuellement annoté. Enfin, nous

signalons quelques problèmes que nous avons rencontrés lors de l’annotation du corpus de

référence.

3.1. Méthode de travail

Afin de répondre aux questions présentées dans l’introduction, nous mènerons une étude de

corpus qui s’inscrit dans le domaine de la recherche en traitement automatique des langues

(TAL).

D’abord, nous avons construit un corpus parallèle aligné anglais/français dont nous avons

annoté manuellement les termes, les entités nommées ainsi que les relations d’hyperonymie.

Les listes de termes et d’hyperonymes obtenues par ce processus d’annotation fonctionneront

comme listes de références pour l’évaluation de l’extraction automatique. Pour notre

recherche, nous avons utilisé TExSIS (Macken et al., 2013), un extracteur de termes qui

combine une approche linguistique et une approche statistique pour sélectionner et filtrer les

termes candidats. Les résultats de cette application de TExSIS ont été comparés à nos

annotations manuelles, de sorte que nous puissions évaluer la performance (la précision et le

rappel) de l’outil.

La prochaine étape était la comparaison des listes d’hyperonymes du Gold Standard à la liste

bilingue extraite par TExSIS. Concrètement nous avons essayé de projeter les paires

d’hyperonymes anglaises sur les paires françaises à l’aide de la liste bilingue

automatiquement extraite, pour enfin décider dans quelle mesure un système complètement

automatisé serait capable de projeter les couples anglais sur une langue cible. Ce que nous

voudrions en effet évaluer est la qualité de la liste bilingue extraite par TExSIS qui pourrait

être utilisée comme point de départ pour la détection automatique des paires d’hyperonymes

anglais/français.

Page 22: L’extraction terminologique et l’extraction d’hyperonymes

22

3.2. Construction du corpus

Tout d’abord, nous avons constitué un corpus parallèle aligné. Nous avons choisi un texte

technique, c’est-à-dire un guide de l’utilisateur de Adobe Photoshop 6.0 en français et en

anglais qui comprend pas mal de terminologie technique. Puis, nous avons converti le PDF en

format texte (TXT) et aligné le corpus au niveau de la phrase avec LF Aligner14

afin de créer

un corpus parallèle. Ensuite, nous avons dû effectuer un contrôle manuel sur l’output du

système d’alignement puisque les résultats n’étaient pas satisfaisants. Le texte entier étant trop

large pour être annoté manuellement, nous avons sélectionné une partie de 1012 phrases qui

compte environ 14 000 mots. Enfin, nous nous sommes posé la question de savoir quelle était

la langue source, mais nous ne le pouvions pas déduire des textes. Ainsi, nous avons décidé

que pour notre recherche l’anglais sera considéré comme la langue source et le français

comme la langue cible.

3.3. Élaboration du corpus d’analyse (Gold Standard)

Afin de pouvoir évaluer l’output de l’extracteur de termes (TExSIS) et afin de projeter les

relations d’hyperonymes, nous avons compilé une liste idéale qui comprend tous les termes

corrects et toutes les paires d’hyperonymes, c’est-à-dire un Gold Standard. Dans le corpus

parallèle décrit ci-dessus, nous avons donc manuellement annoté les termes, les entités

nommées (NE) et les paires d’hyperonymes avec l’outil d’annotation brat (Stenetorp et al.,

2012). Nous l’avons fait en parallèle pour les deux langues. La figure 4 montre un exemple du

processus d’annotation dans brat pour une phrase française contenant trois termes, deux

entités nommées et une relation d’hyperonymie entre BOUTON DROIT DE LA SOURIS et

BOUTON DE LA SOURIS. Il est important de retenir que nous avons indiqué les relations

d’hyperonymes aussi bien à l’intérieur d’une phrase qu’à travers plusieurs phrases.

Figure 4 : Exemple de l’annotation des termes, des entités nommées et des hyper(on)ymes

dans brat.

Le tableau 1 montre le nombre total de termes et de paires d’hyperonymes dans notre Gold

Standard pour le corpus en anglais et en français. Les entités nommées qui figurent dans notre

14

https://sourceforge.net/projects/aligner/

Page 23: L’extraction terminologique et l’extraction d’hyperonymes

23

corpus, à savoir Windows, Mac OS, ImageReady, Photoshop, Adobe Acrobat, Acrobat et

Macintosh sont considérées comme termes, parce que TExSIS n’a pas fait la distinction entre

termes et entités nommées et cette différence n’influencera pas notre étude.

Langue Termes Paires d’hyperonymes

français 963 274

anglais 1007 274

Tableau 1 : Nombre total de termes et de paires d’hyperonymes dans le corpus d’analyse

(Gold Standard)

Afin d’annoter les termes et les paires d’hyperonymes, nous nous sommes concentrée aussi

bien sur la forme et le sens des mots que sur le contexte. En d’autres mots, outre la

composition des termes composés (la morphosyntaxe), nous avons pris en considération

également les marqueurs lexico-syntaxiques (cf. 2.2.2.) comme the following tools, palettes

such as et par exemple qui annoncent que les termes qui suivent sont des types du terme

mentionné auparavant et donc des hyponymes de ce terme.

En annotant les termes composés, par exemple LISTE D’OUTILS MASQUÉS, nous avons

procédé comme suit : d’abord annoter le terme entier LISTE D’OUTILS MASQUÉS, puis

rechercher si l’hyperonyme LISTE figure dans le corpus entier et enfin relier LISTE

D’OUTILS MASQUÉS à LISTE si c’était le cas. Notre corpus présente des termes qui sont

des sous-types d’un terme dont l’hyperonyme à son tour figure aussi dans le corpus. Ainsi,

nous avons relié AUDIO ANNOTATION ICON à ANNOTATION ICON qui à son tour est

relié à ICON. Nous n’avons donc pas établi de relations directes entre AUDIO

ANNOTATION ICON et ICON.

Au moment où la sélection des termes posait des problèmes ou en cas d’hésitation, nous

avons consulté l’index du manuel qui présente tous les termes récurrents dans le texte entier

de façon structurée. Pour un aperçu des problèmes que nous avons rencontrés lors de

l’annotation, voir la section suivante (3.3.).

Enfin, à partir de l’outil d’annotation brat nous avons extrait une liste présentant les paires

d’hyperonymes par ligne pour chaque langue, de sorte que nous puissions analyser phrase par

phrase s’il serait possible de trouver les paires d’hyperonymes correspondantes dans la langue

cible à l’aide de la liste bilingue extraite par TExSIS.

Page 24: L’extraction terminologique et l’extraction d’hyperonymes

24

3.4. Problèmes rencontrés lors de l’annotation

Lors de l’annotation de notre corpus d’analyse, nous avons rencontré plusieurs problèmes. Le

corpus choisi est en effet un manuel qui comprend des instructions qu’il faut suivre pendant la

première utilisation du programme Photoshop ou ImageReady et qui décrit donc étape par

étape sur quels boutons l’utilisateur doit cliquer à travers des phrases comme : « Choisissez

Edition > Préférences > Général ». Dans ce type de phrases, les dénominations des boutons

sont toujours écrites avec une majuscule et donc vite identifiables dans le texte. Nous nous

sommes alors posé la question de savoir si nous devrions les annoter comme termes ou

comme entités nommées. Nous avons décidé de les annoter en tant que termes, mais de ne pas

les relier à d’autres termes parce que ces mots ou groupes de mots se situent dans une zone

grise entre les termes et les entités nommées.

Pourtant, dans les autres phrases donnant des informations sur le programme et son

fonctionnement, nous avons sélectionné les dénominations de boutons ou touches du type

‘touche Maj’ et ‘commande Tab’, nous les avons annotées comme termes et si possible nous

les avons reliées à leur hyperonyme.

Un autre problème concerne les termes compositionnels qui se suivent sans répéter le lemme

principal du syntagme nominal. Dans la séquence de mots « outils de déplacement,

d'annotations et de texte » par exemple, l’extracteur automatique va uniquement identifier

OUTILS DE DÉPLACEMENT comme terme et non OUTILS D’ANNOTATIONS, ni

OUTILS DE TEXTE. En effet, le lemme principal dont le terme entier dépend, à savoir

OUTILS, se trouve tout au début et ne précède pas immédiatement les autres mots

dépendants. L’outil d’annotation brat permet d’annoter ces trois termes compositionnels avec

une relation spécifique indiquant qu’il s’agit d’un terme composé (« same span »). La figure 5

montre comment nous avons annoté ces types de termes dont nous avons déjà effleuré la

problématique dans la section 2.2.1.

Figure 5: Exemple de l’annotation des termes compositionnels dans brat.

Page 25: L’extraction terminologique et l’extraction d’hyperonymes

25

Si le terme compositionnel figure uniquement séparé dans le corpus, les extracteurs

automatiques d’aujourd’hui ne sont toujours pas capables d’identifier ce type de termes. Voilà

un des défauts à résoudre pour améliorer l’extraction terminologique automatique.

Quant aux verbes, nous avons décidé de repérer uniquement les verbes les plus fréquents à

l’infinitif. Il s’agit des couples français/anglais suivants: (AFFICHER,

VIEW/SHOW/DISPLAY), (DÉPLACER, MOVE), (MASQUER, HIDE), (SUPPRIMER,

DELETE), (RÉTABLIR, RESTORE/RESET) et (FERMER, CLOSE). Ces verbes

apparaissent fréquemment avec une majuscule pour désigner un bouton ou une touche. Il est

clair que nous n’avons pas prêté beaucoup d’attention aux verbes, étant donné que nous avons

appliqué TExSIS avec les paramètres par défaut qui ne tiennent pas compte des syntagmes

verbaux comme termes. De plus, notre recherche se veut une étude d’hyperonymes, à savoir

des unités lexicales constituées de noms.

Page 26: L’extraction terminologique et l’extraction d’hyperonymes

26

4. Partie expérimentale

Le présent chapitre rend compte de la partie expérimentale de notre mémoire. D’abord nous

esquisserons les résultats de la performance de l’extraction automatique appliquée sur notre

corpus avec l’outil d’extraction de TExSIS. Nous allons calculer la précision et le rappel en

comparant les résultats de TExSIS à notre corpus d’analyse (Gold Standard). Puis, nous

essaierons de projeter les paires d’hyperonymes du corpus anglais sur les paires

d’hyperonymes du corpus français en utilisant uniquement la liste bilingue extraite par

TExSIS. Enfin, nous conclurons avec une évaluation de la qualité de cette liste pour la

détection (automatique) des paires d’hyperonymes.

4.1. Évaluation de l’extraction avec TExSIS et analyse des résultats

L’outil d’extraction TExSIS a automatiquement extrait deux listes monolingues et une liste

bilingue à partir de notre corpus parallèle aligné. Le tableau 2 présente les chiffres de l’output

de l’extraction terminologique monolingue par TExSIS.

Langue Nombre de termes

anglais 1817

français 1789

Tableau 2 : Nombre total de termes monolingues extraits par TExSIS

Le système a généré une liste monolingue de 1817 termes anglais et une liste monolingue de

1789 termes français. En ce qui concerne l’extraction terminologique bilingue effectuée par

TExSIS, l’output consiste en une liste de 719 couples de termes français/anglais. Il est donc

clair que la liste bilingue est moins large que l’ensemble des listes monolingues. En effet,

l’outil TExSIS sélectionne seulement les paires de termes pour lesquelles il a pu trouvé un

lien entre les deux langues à travers l’alignement des mots (cf. 2.2.1.). Puisque l’anglais et le

français ont des structures de langue très différentes, les paires de termes ne sont pas toutes

retenues par le système. Voilà de nouveau un grand défaut des outils d’extraction

terminologique automatiques. En outre, dans le texte anglais au format PDF une faute de

frappe complique les choses. Le couple (fichiers, filesfor) est sélectionné comme paire de

termes au lieu de (fichiers, files), à cause de cette erreur. Ainsi, nous constatons que la qualité

du système d’extraction dépend aussi dans une moindre mesure de la qualité du texte original.

Page 27: L’extraction terminologique et l’extraction d’hyperonymes

27

Afin de comparer les listes monolingues extraites par TExSIS à nos annotations manuelles,

nous devrons calculer la précision, le rappel et la F-mesure. Le tableau 3 présente toutes ces

données.

Corpus anglais Corpus français

Nombre total de termes dans

le Gold Standard

963 1007

Nombre total de termes

retenus par TExSIS

1817 1789

Termes corrects 622 534

Précision 34.2322509631 29.849077697

Rappel 64.5898234683 53.0287984111

F-mesure 44.7482014388 38.1974248927

Bruit (termes retenus, mais

pas corrects)

1195 1255

Silence (termes pas retenus,

mais corrects)

523 627

Tableau 3 : Nombre total de termes dans le Gold Standard, nombre total de termes retenus

par TExSIS, termes corrects, précision, rappel et F-mesure du corpus anglais et français

Ce qui nous intéresse le plus pour notre recherche est évidemment la qualité de la liste

bilingue automatiquement extraite. Nous ne disposons pas d’une liste bilingue de référence

avec laquelle nous pourrions calculer la précision et le rappel de la liste bilingue de TExSIS,

mais nous pouvons bien calculer la précision de l’extraction automatique bilingue en divisant

le nombre total des paires correctes (357) par le nombre total des paires extraites (719). Le

taux de précision remonte en effet à 49,6522948539. La basse précision peut s’expliquer par

le fait que beaucoup de termes n’ont pas été retenus par TExSIS ou ont été mal reliés à leurs

équivalents français.

La liste générée par TExSIS comprend des paires de mots et de groupes de mots qui sont tout

à fait des termes que nous avons annotés manuellement. Voici quelques-unes des paires de

termes correctes :

lines per inch lignes par pouce

hand tool outils Main

browser navigateur

Page 28: L’extraction terminologique et l’extraction d’hyperonymes

28

scroll bar barre de défilement

Mac OS Mac OS

file size taille de fichier

original file fichier original

image with a high resolution image haute résolution

full-screen window fenêtre plein écran

snapshot of the initial state instantané de la version initiale

Pourtant, le bruit, à savoir des termes que TExSIS a identifiés mais qui en réalité ne sont pas

des termes, n’est pas du tout absent dans cette liste bilingue. Le critère du degré de spécificité

(« termhood », cf. 2.2.1.) qu’un extracteur automatique prend en compte pour filtrer les

termes candidats, nous intéresse ici. En effet, TExSIS a extrait des termes qui n’ont rien à voir

avec le domaine particulier de notre corpus. Le bruit dans la liste bilingue apparaît sous

plusieurs formes de sorte que nous puissions distinguer cinq catégories. La première catégorie

concerne les couples dont les équivalents français/anglais correspondent, mais qui ont été

retenus de travers par TExSIS. Comme les exemples suivants le montrent bien, il s’agit

surtout de mots simples :

following suivantes

bottom bas

default défaut

dialog dialogue

operation opération

left gauche

following information informations suivantes

elements éléments

pause pause

temp temporaire

laser laser

title titre

bicycle tire pneu de bicyclette

playback exécution

detail détail

steps étapes

Page 29: L’extraction terminologique et l’extraction d’hyperonymes

29

Une deuxième catégorie que nous pouvons identifier dans le bruit regroupe les couples

français/anglais dans lesquels figure une préposition qui ne dépend pas du noyau du groupe

identifié, mais du verbe de la phrase. Il s’agit en effet des contextes suivants : « Placez le

pointeur sur l’outil visible et maintenez… » / « Position the pointer on the visible tool and

hold down… ». Les constituants de la structure verbale de la phrase ne sont donc pas bien

segmentés. Voici quelques exemples de couples de ce deuxième type de bruit :

annotations into Photoshop annotations dans Photoshop

(< to import X into Y) (< importer X dans Y)

pointer on the visible tool pointeur sur l’outil visible

(< to place X on Y) (< placer X sur Y)

Libraries with the Preset Manager bibliothèques avec le gestionnaire des

(< to manage X with Y) paramètres prédéfinis (< gérir X avec Y)

library from the pop-up menu bibliothèque dans le menu déroulant

(< to select X from Y) (< sélectionner X dans Y)

state to the Trash button état vers le bouton Corbeille

(< to drag X to Y) (< faire glisser X vers Y)

palette to another group palette vers un autre groupe

(< to move X to Y) (< déplacer X vers Y)

library to the current list bibliothèque à la liste existante

(< to add X to Y) (< ajouter X à Y)

tool to multiples outil à des multiples

(< to constrain X to Y) (< contraindre X à Y)

state onto the document état vers le document

(< to drag X onto Y) (< faire glisser X vers Y)

current list with a different library liste existante par la nouvelle bibliothèque

(< to replace X with Y) (< remplacer X par Y)

Une troisième catégorie de bruit est constituée de couples qui représentent une partie des

termes compositionnels dont le lemme principal fonctionne également comme lemme

principal pour d’autres mots dans la même phrase (cf. 3.4.). Ce problème d’identification des

termes composés est à mettre en relation avec le critère du degré d’unité (« unithood », cf.

2.2.1.) qu’un extracteur automatique prend en compte pour filtrer les termes candidats.

Comme c’était également le cas dans la catégorie précédente, TExSIS a en effet mal délimité

les mots qui apparaissent souvent ensemble pour désigner un seul concept. Comme prévu (cf.

3.4.), l’outil d’extraction n’est pas capable de reconnaître ces termes complexes. Ainsi, dans

Page 30: L’extraction terminologique et l’extraction d’hyperonymes

30

la liste bilingue nous voyons des couples présentant en français ou en anglais un mot simple

au lieu d’un mot complexe :

tool Texte

sponge tools Eponge

slice tool tranche

history options historique

note icon icône

library file bibliothèque

monitor resolution moniteur

bars défilement

tool forme

gradient tool Dégradé

area partie

La catégorie précédente anticipe déjà ce qu’il y a de frappant dans la quatrième catégorie de

bruit. En effet, comme nous le voyons déjà bien dans quelques-uns des couples précédents (p.

ex. (NOTE ICON, ICON)), le mot en anglais ou en français est l’hyperonyme ou (une partie

de) l’hyponyme de l’autre mot français/anglais. Or, cela peut s’expliquer par le fait que le

texte français renvoie parfois à un hyponyme (« outil Déplacement ») en utilisant uniquement

l’hyperonyme (« cet outil ») précédé par un déterminant démonstratif, alors que l’anglais

répète l’hyponyme entier. Parfois, le texte anglais est plus concret que le texte français et

laisse tomber l’hyperonyme, p. ex. « Record » en anglais et « commande d’enregistrement »

en français. Ce n’est alors pas vraiment une faute. À cause de ces références non-parallèles et

grâce à la composition des syntagmes compositionnels, la liste bilingue présente des couples

de termes qui donnent déjà une indication des relations d’hyperonymie entre les deux langues.

Les couples suivants témoignent de cette catégorie spéciale dans notre liste bilingue15

:

annotation annotation audio

title bar barre de titre de la fenêtre

spacing espacement des repères

plug-in modules

15

Pour qu’il soit clair quel serait l’hyperonyme ou l’hyponyme correct, nous l’avons indiqué en dessous de

l’exemple.

Page 31: L’extraction terminologique et l’extraction d’hyperonymes

31

(< plug-in modules) (< modules externes)

graphics graphiques vectoriels

path tracé de destination

bucket peinture

(< paint bucket) (< pot de peinture)

background calque du fond

editing commands commandes

image taille

preference option de préférence

menu menus contextuels

Notre cinquième catégorie est une catégorie restante dans laquelle nous avons regroupé le

bruit qui mêle un peu toutes les catégories précédentes et pour lequel nous n’avons pas

d’explication. En sélectionnant les exemples suivants, TExSIS s’est trompé :

marquee to a new location déplaçant vers un nouvel emplacement

value durée

previous preset percentage taux de réduction prédéfini suivant

previous preference set fenêtre précédente

name for the library file nom pour la bibliothèque

current list bibliothèque à la liste

channels couches compris

slider box extérieur du menu

Outre le bruit, TExSIS a également produit du silence, ou autrement dit l’outil a oublié de

sélectionner des termes que nous avons bel et bien annotés comme de vrais termes. Les

couples de termes suivants n’ont pas été retenus par l’extracteur automatique :

digital images images numériques

snapshot of the initial state instantané de la version initiale

of the document du document

dimensions de pixel pixel dimensions

imprimante laser laser printer

onglet d’une palette/onglet de la palette palette’s tab/palette tab

Page 32: L’extraction terminologique et l’extraction d’hyperonymes

32

monitor resolution résolution d’écran

color adjustment dialog box boîtes de dialogue de réglage de

couleur

CMYK ink encres CMJN

Navigator palette view box zone de visualisation de la palette

Navigation

Zoom Level pop-up menu menu déroulant Echelle

Enfin, il convient encore de remarquer que la liste bilingue rend compte de quelques

synonymes figurant dans notre corpus et indiquant les mêmes concepts. Pourtant, cette liste de

synonymes n’est pas exhaustive et il est frappant que TExSIS ait uniquement identifié des

synonymes dans le corpus anglais, alors que le corpus français présente également des

synonymes (p. ex. PLAN DE TRAVAIL et ZONE DE TRAVAIL pour WORK AREA).

L’identification (partielle) des synonymes pourrait être intéressante pour la normalisation (cf.

2.1.1.). Néanmoins, dans la suite de notre analyse il deviendra clair que ces synonymes posent

aussi des problèmes. Voici les couples doubles identifiés par TExSIS :

versions versions

states versions

duplicate copie

copy copie

view option option d’affichage

display option option d’affichage

script script

action script

pop-up palette palette

dots points

points points

tool pointer appearance forme du pointeur

Page 33: L’extraction terminologique et l’extraction d’hyperonymes

33

tool pointer setting forme du pointeur

units unité de mesure

unit of measurement unité de mesure

unit of measure unité de mesure

view box zone de visualisation

view area zone de visualisation

4.2. Analyse des relations d’hyperonymie dans le Gold Standard

Dans la présente section, nous analyserons les types de relations d’hyperonymie identifiées

dans le Gold Standard à partir des textes français/anglais du corpus d’étude. La plupart de nos

paires d’hyperonymes identifiées sont des paires constituées d’un terme simple et d’un terme

complexe. En effet, le guide de l’utilisateur mentionne toutes sortes de palettes, de boutons,

d’options et d’outils. Le nombre de co-hyponymes est donc plus élevé que le nombre

d’hyperonymes uniques. Alors, en analysant les caractéristiques des couples d’hyperonymes,

nous voudrions bien savoir si nous pourrions appliquer une approche lexico-syntaxique ou

morphosyntaxique (voir la section 2.2.2.) afin de rendre automatique l’identification des

hyperonymes dans la langue source. En effet, il existe beaucoup plus de systèmes de détection

d’hyperonymes pour l’anglais que pour le français.

Notre corpus ne présente pas beaucoup de patrons lexico-syntaxiques. En outre, la plupart des

relations d’hyperonymie excède le niveau de la phrase. Pourtant, dans notre corpus anglais,

nous avons trouvé 11 occurrences de patrons lexico-syntaxiques identifiant une paire

d’hyperonymes. En voici les occurrences dans le corpus anglais :

with all tools except the move tool and x tool (phrase 18)

[…] control the pointers for the following tools: eraser, pencil, […] and sponge tools

(phrases 29-31)

[…] control the pointers for the following tools: marquee, lasso, and color sampler tools.

[…] and slice tools (phrases 32-34)

some settings […] are […] (such as painting modes and opacity), and some are […] (such

as the Auto Erase setting for the pencil tool) (phrase 40)

palettes such as Swatches and Actions (phrase 43)

use settings that use pop-up sliders (for example, the opacity option in the layers

palette) (phrase 116)

Page 34: L’extraction terminologique et l’extraction d’hyperonymes

34

[…] use any color adjustment dialog box (for example, Curves) (phrase 172)

to use the hand tool while another tool is selected […] (phrase 240)

If you have […] for different script systems (for example, Roman, Japanese, or Cyrillic)

installed on your computer […] (phrase 719)

you can add more applications, including non-Adobe applications (phrase 788)

the number of ink dots per inch (dpi) produced by all laser printers, including imagesetters

(phrase 996)

Il faut également remarquer qu’en appliquant une approche lexico-syntaxique il y aurait une

surgénéralisation des patrons prédéfinis, puisqu’il y a des occurrences avec « such as » qui

n’indiquent absolument pas la présence d’une relation d’hyperonymie.

L’approche morphosyntaxique par contre serait bien applicable à notre corpus étant donné

que les termes multi-mots y sont très fréquents. Nous pouvons en effet distinguer cinq types

d’hyponymes dont la tête du syntagme nominal constitue la catégorie sémantique générale (ou

l’hyperonyme) du syntagme nominal, alors que la partie restante restreint le sens du terme

complexe :

anglais français

Adj + N (tête)

(ORIGINAL TAB, TAB)

N (tête) + Adj

(IMAGE NUMÉRIQUE, IMAGE)

N + N (tête)

(DELETE COMMAND, COMMAND)

N (tête) + N

(BOUTON CORBEILLE, BOUTON)

N (tête) + (Prép) + N

(UNIT OF MEASUREMENT, UNIT)

N (tête) + (Prép) + N

(UNITÉ DE MESURE, UNITÉ

N + Prép + (Adj) + N

(SNAPSHOT OF THE ORIGINAL STATE,

SNAPSHOT)

N + Prép + N (+ Adj)

(AFFICHAGE DE L’IMAGE,

AFFICHAGE)

N + Prép + (Adj) + N + Prép + N

(SNAPSHOT OF THE INITIAL STATE OF

THE DOCUMENT, SNAPSHOT OF THE

INITIAL STATE)

N + Prép + N + (Adj) + Prép + N

(BARRE DE DÉFILEMENT DE LA

FENÊTRE, BARRE DE DÉFILEMENT)

Il est clair que dans les deux langues les têtes des syntagmes nominaux ne se trouvent pas

toujours au même endroit, puisque les structures des langues ne sont pas identiques. En effet,

les têtes des termes multi-mots sans préposition(s) se trouvent à droit en anglais et à gauche

Page 35: L’extraction terminologique et l’extraction d’hyperonymes

35

en français. Cette analyse a également fait apparaître quelques disparités de terminologie. À

un terme composé dans le corpus anglais (p. ex. TOOL POINTER) correspond parfois un

terme simple en français (POINTEUR). Ces termes ne forment donc pas un couple

d’hyperonymes qui soit projetable de l’anglais sur le français.

Enfin, nous pouvons conclure qu’un système d’identification automatique des relations

d’hyperonymes combinant les approches lexico-syntaxique et morphosyntaxique, comme

HypoTerm (Lefever et al., 2014b), serait bien capable d’identifier tous nos couples

d’hyperonymes anglais, sauf ceux dont la tête d’un terme multi-mots ne précède ou ne suit

pas immédiatement la partie restante du syntagme nominal.

Page 36: L’extraction terminologique et l’extraction d’hyperonymes

36

4.3. Projection des relations d’hyperonymie

Dans cette section nous allons analyser la qualité de la liste bilingue extraite par TExSIS en

tant qu’input pour la détection automatique des paires d’hyperonymes. Nous évaluerons cette

détection (hypothétique) en comparant les résultats aux annotations manuelles du Gold

Standard. En d’autres mots, nous essayerons donc de projeter les paires d’hyperonymes

anglaises sur celles françaises en utilisant uniquement la liste bilingue extraite par TExSIS.

Ainsi, nous voudrions savoir dans quelle mesure il serait possible de trouver toutes les

relations d’hyperonymie identifiées dans le Gold Standard en appliquant un système

complètement automatique qui détecte d’abord les termes bilingues, puis détecte les relations

d’hyperonymie entre ceux-ci en anglais et les relie enfin à leurs équivalents français. Nos

listes de référence des paires d’hyperonymes anglais/français sont parallèles et comptent 274

couples dans chaque langue. En annexe nous avons inclus ces listes uniques des paires

d’hyperonymes que nous avons manuellement annotées ainsi que la liste bilingue

automatiquement extraite par TExSIS et la liste des paires correctes extraites par TExSIS16

.

La liste bilingue compte au total 719 couples de termes anglais/français. Après avoir

manuellement indiqué les couples de termes qui sont utilisables pour projeter nos paires

anglaises sur nos paires françaises, il résulte que 257 couples de la liste bilingue pourront

aider à traduire les hyperonymes anglais en français. Pourtant, ces couples de termes incluent

des variantes morphologiques (singulier /vs/ pluriel, déterminant défini /vs/ déterminant

indéfini) et des synonymes pour les mêmes concepts. Afin de calculer et d’analyser les paires

d’hyperonymes de notre Gold Standard, nous avons distingué quatre catégories de paires

d’hyperonymes à partir de leur statut projetable. En effet, nous avons manuellement indiqué si

1) une paire d’hyperonymes du Gold Standard était complètement projetable :

l’hyponyme et l’hyperonyme figurent dans la liste bilingue,

2) une paire d’hyperonymes du Gold Standard était partiellement projetable :

uniquement l’hyperonyme figure dans la liste bilingue,

3) une paire d’hyperonymes du Gold Standard était partiellement projetable :

uniquement l’hyponyme figure dans la liste bilingue,

4) une paire d’hyperonymes du Gold Standard n’était simplement pas projetable : ni

l’hyponyme, ni l’hyperonyme figurent dans la liste bilingue.

16

Dans les listes des paires d’hyperonymes, les parenthèses indiquent que le terme complexe figure une seule

fois dans le corpus étant séparé de la tête du syntagme, donc de son hyperonyme (voir section 3.4.).

Page 37: L’extraction terminologique et l’extraction d’hyperonymes

37

Dans ce qui suit nous allons discuter les résultats de cette analyse, qui ont été synthétisés dans

le tableau 4 ci-dessous.

Catégorie 1 Catégorie 2 Catégorie 3 Catégorie 4

Nombre de paires

du GS qui

correspondent à la

catégorie

121 133 4 16

Total de paires

dans le GS

274 274 274 274

Pourcentage 44,16% 48,54% 1,46% 5,84%

Tableau 4 : Résultats de la projection des paires d’hyperonymes du Gold Standard à l’aide de

la liste bilingue extraite par TExSIS.

La première catégorie consiste des paires d’hyperonymes qui sont entièrement projetables de

l’anglais sur le français et dont les termes figurent donc tous dans la liste bilingue

automatiquement extraite par TExSIS. Si nous appliquerons un système complètement

automatique, 121 des 274 paires d’hyperonymes du Gold Standard (44,16 %) seraient

détectées. Ce sont presque toutes des paires d’hyperonymes constituées d’hyponymes dont le

lemme principal est l’hyperonyme du terme entier (termes multi-mots). Ainsi, nous avons

trouvé la performance maximale (« upper bound ») qu’un système automatique

d’identification d’hyperonymes pourrait atteindre lorsqu’il serait capable de projeter

correctement toutes les relations d’hyperonymie de l’anglais sur le français. Voici quelques

exemples de nos paires d’hyperonymes complètement projetables :

(Roman, script systems) (Romain, système de script)

(Japanese, script systems) (Japonais, système de script)

(photoshop file, file) (fichier Photoshop, fichier)

(original state, state) (état original, état)

(airbrush, tool) (aérographe, outil)

(Digimarc watermark, watermark) (filigrane Digimarc, filigrane)

(Adobe Photoshop settings file, (fichier de paramètres Adobe Photoshop,

file) fichier)

(original image, image) (image originale, image)

(context menus, menus) (menus contextuels, menus)

(document window, window) (fenêtre de document, fenêtre)

Page 38: L’extraction terminologique et l’extraction d’hyperonymes

38

La deuxième et la plus grande catégorie regroupe les paires d’hyperonymes dont seulement

l’hyponyme n’est pas projetable. Ce sont surtout des termes complexes qui apparaissent une

seule fois dans le corpus entier et dont la tête du syntagme nominal ne précède ou ne suit pas

immédiatement le reste du syntagme. Si ce problème de l’extraction terminologique, dont

nous avons déjà traité dans la section 3.4. serait résolu, la performance maximale du système

complètement automatique atteindrait une valeur beaucoup plus élevée. Voici quelques

exemples des paires d’hyperonymes de cette deuxième catégorie :

(15-inch monitor, monitor) (moniteur de 15 pouces, moniteur)

(Acrobat document, document) (document Acrobat, document)

(Adobe graphics-editing application, (application d’édition graphique Adobe,

graphics-editing application) application d’édition graphique)

(annotation tools, tools) (outils d’annotations, outils)

(libraries of preset brushes, libraries) (bibliothèques de formes prédéfinis,

bibliothèques)

(Adobe Photoshop 6 settings folder, (dossier paramètres Adobe Photoshop 6,

folder) dossier)

(Allow non-linear history option (option Accepter un historique non

option) linéaire, option)

(audio annotation icon, annotation (icône d’annotation audio, icône

icon) d’annotation)

(blur, tool) (goutte d’eau, outil)

(color sampler tools, tools) (Échantillonage de couleur, outil)

Il est frappant que l’hyponyme du couple (cyrillic, script systems) ne peut pas être projeté,

alors que les deux autres hyponymes de l’hyperonyme ont été bien identifiés.

Il n’y a que quatre occurrences de la troisième catégorie qui est constituée des paires

d’hyperonymes dont uniquement l’hyperonyme n’est pas projetable. Voici ces quatre paires

d’hyperonymes anglais/français :

(imagesetters, laser printers) (photocomposeuses, imprimantes laser)

(hidden tools list, list) (liste d’outils masqués, liste)

(list of states, list) (liste des états, liste)

Page 39: L’extraction terminologique et l’extraction d’hyperonymes

39

(right mouse button, mouse button) (bouton droit de la souris, bouton de la

souris)

La quatrième catégorie regroupe les paires d’hyperonymes qui ne sont pas entièrement

projetables, ou en d’autres mots, ni l’hyperonyme, ni l’hyponyme figurent dans la liste

bilingue. Il résulte que 16 paires d’hyperonymes anglaises ne seraient pas extraites par le

détecteur automatique. Il s’agit surtout des paires d’hyperonymes constituées d’un

hyperonyme qui figure également comme hyponyme dans notre Gold Standard. Voici

quelques exemples des paires d’hyperonymes de la quatrième catégorie :

(600 dpi laser printers, laser printer) (imprimantes laser 600 ppp,

imprimante laser)

(standard editing commands, (commandes d’édition standard,

editing commands) commandes d’édition)

(list of items, list) (liste d’éléments, liste)

(image’s magnification, (taux d'agrandissement de l'image,

magnificiation) taux d’agrandissement)

(default palette positions, (positions par défaut des palettes,

default positions) positions par défaut)

(default dialog box positions, (positions par défaut des boîtes de

default positions) dialogue, positions par défaut)

(desktop laser printer, laser printer) (imprimantes laser de bureau,

imprimante laser)

(precise cursors, cursors) (pointeurs précis, pointeurs)

Efin, nous constatons que le statut projetable des paires d’hyperonymes dépend dans une

grande mesure de la qualité de la liste bilingue et donc des termes bilingues corrects identifiés

par TExSIS. Étant donné que l’outil TExSIS n’est pas capable de ramener les termes

complexes dont la tête ne suit ou ne précède pas immédiatement la partie restante du terme

complexe, un système complètement automatique ne serait capable d’identifier que la moitié

de nos paires d’hyperonymes de référence. Il faut donc vraiment chercher des méthodes afin

de résoudre le problème de l’identification des termes complexes dans les textes spécialisés.

Page 40: L’extraction terminologique et l’extraction d’hyperonymes

40

5. Conclusion

L’identification automatique de termes et de relations d’hyperonymie dans des textes

techniques a constitué l’objet d’étude du présent mémoire. Afin d’explorer ce sujet, nous

avons commencé par établir un cadre théorique qui définit les notions de base dont nous

avons besoin pour notre recherche, à savoir les notions de « terminologie », « terme »,

« hyp(er)onyme » et « corpus parallèle aligné ». Dans cette partie nous avons constaté qu’il

n’est pas toujours facile de s’accorder sur le statut terminologique d’un mot ou d’une

séquence de plusieurs mots. Lors de l’identification et la sélection des termes, il faut en effet

prendre en compte plusieurs critères, comme par exemple l’appartenance à un domaine

particulier et la fréquence. Nous nous sommes également concentrée sur la composition des

termes, notamment sur les diverses formes sous lesquelles un terme peut apparaître. En ce qui

concerne les relations sémantiques lexicales, nous avons défini l’hyponymie et

l’hyperonymie, puisque ce sont les relations que nous voudrions détecter dans notre corpus.

Enfin, nous avons abordé une typologie de corpus électroniques dont les notions de « corpus

parallèle » et « corpus comparable » ont été au centre.

Dans la deuxième partie du chapitre théorique, nous avons parcouru les principales approches

pour l’identification automatique des termes et des relations sémantiques ainsi qu’une série

d’études pertinentes qui ont été réalisées à propos du sujet. Ce faisant, aussi bien les avantages

que les lacunes des systèmes automatiques ont été discutés. Pour ce qui est de l’extraction

terminologique automatique, nous avons d’abord fait la distinction entre l’extraction

monolingue et l’extraction bilingue. Puis, nous avons traité des approches linguistique et

statistique qui sont respectivement dépendante et indépendante de la langue. De nos jours, tant

de systèmes ont recours à une approche hybride combinant information linguistique et

information statistique, comme TExSIS, l’outil que nous avons utilisé pour l’extraction

terminologique de notre corpus. Pourtant, automatiser entièrement l’extraction des termes

reste une utopie, puisque aussi bien les systèmes basés sur une approche linguistique que les

systèmes basés sur une approche statistique produisent du bruit et du silence. En effet, les

principaux travaux d’extraction terminologique ont rapporté le problème des termes

compositionnels qui sont plus difficiles à extraire que les termes simples. En ce qui concerne

la détection d’hyperonymes, nous avons parcouru les principales approches qui ont été

proposées : l’approche lexico-syntaxique, l’approche distributionnelle et l’approche

morphosyntaxique. À nouveau, ces approches ont toutes leurs propres défauts.

Page 41: L’extraction terminologique et l’extraction d’hyperonymes

41

Après avoir traité des mesures du bruit et du silence (la précision, le rappel et la F-mesure) qui

évaluent la performance d’un système automatique par rapport à un Gold Standard créé

manuellement, nous avons cherché à préciser l’utilité de l’extraction automatique des termes

et des relations sémantiques. En effet, l’automatisation de l’extraction sert à rendre plus

efficace la communication internationale, à gérer et suivre la terminologie malgré l’évolution

rapide des sciences et à gagner du temps puisque l’extraction manuelle est un processus long

et cher qui résulte surtout de l’intuition humaine. En outre, l’extraction des relations

sémantiques sert à structurer les simples listes terminologiques et donc à une meilleure

compréhension d’un domaine de spécialité pour par exemple un traducteur qui n’est pas

expert en la matière. Une classification sémantique automatique peut résulter dans la

compilation de taxonomies, thésauri ou ontologies. En guise d’exemple nous avons montré les

divers modes de modélisation qu’un thésaurus peut adopter afin de préciser les rapports entre

les termes d’un domaine donné. En effet, un thésaurus peut représenter les trois types de

relations sémantiques de façon classique dans une liste, mais également de façon graphique.

Le but de ce mémoire était d’examiner dans quelle mesure fonctionnerait un système

automatique qui extrait les relations d’hyperonymie entre les termes extraits dans une langue

source et les projette sur une langue cible à l’aide d’une liste bilingue extraite de façon

automatique. Pour ce faire nous avons mené une recherche préliminaire basée sur corpus.

D’abord nous avons constitué et annoté un corpus parallèle aligné qui se compose d’une

partie de 1000 phrases d’un guide de l’utilisateur de Photoshop 6.0 en anglais et sa traduction

parallèle en français. L’annotation manuelle avec l’outil d’annotation brat concernait les

entités nommées, les termes ainsi que les relations d’hyperonymie entre les termes identifiés.

Cette étape de la recherche ne s’est pourtant pas déroulée sans problèmes. Étant donné le

grand nombre de termes compositionnels qui se suivent sans répéter la tête du syntagme

nominal, nous avons en effet relié manuellement la tête à la partie restante du SN. Ce

problème était fréquent aussi bien dans le corpus anglais que dans le corpus français.

Après l’élaboration du Gold Standard et l’extraction des listes de termes et d’hyperonymes du

Gold Standard, nous avons analysé les résultats de l’extraction automatique monolingue et

bilingue effectuée par TExSIS. Il résulte que pour le corpus anglais le taux de précision

remonte à 34% et le taux de rappel à 64%, et que pour le corpus français le taux de précision

remonte à 30% et le taux de rappel à 53%. La précision de l’extraction terminologique

bilingue, à son tour, remonte à 49%. Cela indique déjà que TExSIS a extrait beaucoup de

mots ou séquences de mots qui en réalité ne sont pas des termes. En effet, une partie

Page 42: L’extraction terminologique et l’extraction d’hyperonymes

42

considérable de notre recherche consistait à évaluer la qualité de la liste bilingue extraite par

TExSIS et à analyser quelles sortes de termes l’outil a extrait de travers. Nous avons ensuite

procédé à une classification de cinq types de bruit qui sont à mettre en relation avec les degrés

d’unité et de spécificité qu’un extracteur automatique prend en compte afin de sélectionner

des termes. Ce faisant, il était frappant que certains couples anglais/français présentaient déjà

la structure d’un couple d’hyperonymes.

Une autre partie considérable du quatrième chapitre a focalisé sur l’analyse des types de

relations d’hyperonymie identifiées dans le Gold Standard. La plupart de nos paires

d’hyperonymes sont des paires constituées d’un terme simple et d’un terme complexe et

excèdent le niveau de la phrase. Une approche morphosyntaxique serait donc bien applicable

afin de rendre automatique l’identification des hyperonymes dans la langue source.

Néanmoins, certaines paires d’hyperonymes seront uniquement identifiables à travers de

patrons lexico-syntaxiques. Ainsi, un système complètement automatique dont le détecteur

d’hyperonymes applique une approche hybride combinant l’approche lexico-syntaxique et

l’approche morphosyntaxique serait capable d’identifier presque toutes nos paires

d’hyperonymes anglaises, sauf celles dont les termes compositionnels apparaissent

uniquement séparés de la tête du SN.

Dans la dernière partie du quatrième chapitre, nous avons analysé dans quelle mesure il serait

possible d’utiliser la liste bilingue extraite par TExSIS en tant qu’input pour la détection

automatique des paires d’hyperonymes. Concrètement nous avons essayé de trouver les

équivalents français des paires d’hyperonymes anglaises du Gold Standard à l’aide de la liste

bilingue de TExSIS. Ainsi, nous voudrions savoir combien de relations d’hyperonymie du

Gold Standard seraient identifiables en appliquant un système complètement automatique qui

détecte d’abord les termes bilingues, puis détecte les relations d’hyperonymie entre ceux-ci en

anglais et finalement les relie à leurs équivalents français. Notre analyse a montré que de

toutes les paires d’hyperonymes, 44,16% est entièrement projetable, 5,84% n’est pas

projetable, 48,54% est partiellement projetable (uniquement l’hyperonyme) et 1,46% est

partiellement projetable (uniquement l’hyponyme). La performance maximale d’un système

complètement automatique remontera à une valeur beaucoup plus élevée si les termes

complexes qui apparaissent une seule fois dans le corpus entier et dont la tête du SN ne

précède ou ne suit pas immédiatement le reste du syntagme pouvaient être identifiés par

TExSIS.

Page 43: L’extraction terminologique et l’extraction d’hyperonymes

43

Notre recherche a montré que l’identification des termes compositionnels reste un problème

pour le traitement automatique de textes. Reste la question de savoir s’il serait possible de

détecter des termes complexes dont la tête du syntagme nominal ne précède ou ne suit pas

immédiatement le reste du syntagme.

Page 44: L’extraction terminologique et l’extraction d’hyperonymes

44

Bibliographie

Aitchison, J., Gilchrist, A., & Bawden, D. (2000). Thesaurus construction and use : a

practical manual. 4ième éd. London : Europa publications.

Ananiadou, S. (1994). A methodology for automatic term recognition. Dans Proceedings of

the 15th

conference on computational linguistics, pp. 1034-1038.

Baker, M. (1995). Corpora in Translation Studies : An Overview and Some Suggestions for

Future Research. Target, vol. 7, n° 2, pp. 223-243.

Bosma, W. E. & Vossen, P. (2010). Bootstrapping language neutral term extraction. Dans

Proceedings of the 7th

international conference on Language Resources and Evaluation

(LREC2010), mai.

Bosma, W. E., Vossen, P. & van der Vliet, H. (2011). Termextractie in kyoto. Dans

Terminologie in het Nederlandse taalgebied, volume 2010.

Bowker, L. (2008). Terminology. Dans Baker, M., & Saldanha, G. Routledge encyclopedia of

translation studies. 2ième éd. London ; New York : Routledge, pp. 286-290.

Caraballo, S. (1999). Automatic acquisition of a hypernymlabeled noun hierarchy from text.

Dans Proceedings of ACL-99, pp. 120-126, Baltimore, MD.

Clouet, E. L. (2014). Traitement automatique des termes composés : segmentation, traduction

et variation. Traitement du texte et du document. Université de Nantes.

Dagan, I. & Church, K. (1994). Termight : identifying and translating technical terminology.

Dans Proceedings of Applied Language Processing, pp. 34-40.

Daille, B. (1995). Study and implementation of combined techniques for automatic extraction

of terminology. Dans J. Klavans & P. Resnik, The Balancing Act: Combining Symbolic and

Statistical Approaches to Language, pp. 49–66. MIT Press, Cambridge, Massachusetts;

London, England.

De Groote, C. (2015). Cours de Terminologie dans le cadre du Master en Traduction,

Université de Gand, septembre-décembre.

Depecker, L. (2003). Entre signe et concept : éléments de terminologie générale, Paris :

Presse de la Sorbonne Nouvelle.

Page 45: L’extraction terminologique et l’extraction d’hyperonymes

45

Frantzi, K. T. & Ananiadou, S. (1999). The c-value/nc-value domain independent method for

multiword term extraction. Journal of Natural Language Processing, 6 (3), pp. 145-180.

Harris, Z. Sabbettai. (1968). Mathematical structures of language. New York (N.Y.) :

Interscience.

Hearst, M. (1992). Automatic acquisition of hyponyms from large text corpora. Dans

Proceedings of the International Conference on Computational Linguistics (COLING-1992),

Nantes, France, pp. 539–545.

Lefever, E., Macken, L., & Hoste V. (2009). Language-independent bilingual terminology

extraction from a multilingual parallel corpus. Proceedings of the 12th Conference of the

European Chapter of the Association for Computational Linguistics, pp. 496-504.

Lefever, E., Van de Kauter, M., & Hoste, V. (2014a). Evaluation of Automatic Hypernym

Extraction from Technical Corpora in English and Dutch. Dans Calzolari, N., Choukri, K.,

Declerck, T., Loftsson, H., Maegaard, B., Mariani, J., Moreno, A., Odijk, J. & Piperidis, S.

Proceedings of the Ninth International Conference on Language Resources and Evaluation

(LREC'14), pp. 490-497. European Language Resources Association (ELRA), Reykjavik,

Iceland.

Lefever, E., Van de Kauter, M., & Hoste, V. (2014b). HypoTerm: Detection of hypernym

relations between domain-specific terms in Dutch and English. TERMINOLOGY, 20 (2):

Special issue: Lexical-semantic approaches to terminology, pp. 250–278. John Benjamins

Publishing Company.

Lenci, A. & Benotto, G. (2012). Identifying hypernyms in distributional semantic spaces.

Dans Proceedings of the first Joint conference on Lexical and Computational Semantics

(*SEM), pp. 75-79, Montréal, Canada.

L'Homme, M. (2004). La terminologie : principes et techniques. Montréal : Les Presses de

l'Université de Montréal.

Macken, L., Lefever, E., & Hoste, V. (2013). TExSIS: Bilingual Terminology Extraction from

Parallel Corpora Using Chunk-based Alignment. Terminology, 19(1), pp. 1-30. John

Benjamins Publishing Company.

Page 46: L’extraction terminologique et l’extraction d’hyperonymes

46

Malaisé V., Zweigenbaum, P., Bachimont, B. (2004a). Detecting semantic relations between

terms in definitions. Dans 3rd

International Workshop on Computational Terminology,

CompuTerm, Genève, Suisse, pp. 55-62.

Malaisé, V., Zweigenbaum, P., Bachimont, B. (2004b). Repérage et exploitation d’énoncés

définitoires en corpus pour l’aide à la construction d’ontologie. Actes de TALN, pp. 269–278.

Maynard, A. & Ananiadou S. (1999). Identifying contextual information for multi-word term

extraction. Dans Proceedings of Terminology and Knowledge Engineering Conference -99,

pp. 212-221.

Morin, E., Dufour-Kowalski, S., Daille, B. (2004). Extraction de terminologies bilingues à

partir de corpus comparables. Actes, 11ème Conférence annuelle sur le Traitement

Automatique des Langues Naturelles (TALN), 10 pp.

Pantel, P. & Lin, D. (2001). A statistical corpus-based term extractor. Dans Proceedings of

the 14th

Biennial Conference of the Canadian Society on Computational Studies of

Intelligence: Advances in Artificial Intelligence, pp. 36-46.

Picht, H. & Draskau, J. (1985). Terminology: An introduction. Guildford : University of

Surrey, Dep. of Linguistic and International Studies.

Polguère, A. (2008). Lexicologie et sémantique lexicale : notions fondamentales. Nouv. éd.

rev. et augm. Montréal : Les Presses de l'Université de Montréal.

Rondeau, G. (1984). Introduction à la terminologie. 2ième éd. Québec : Morin.

Schropp, G., Lefever, E., Hoste, V. (2013). A combined pattern-based and distributional

approach for automatic hypernym detection in Dutch. Proceedings of the 9th International

Conference on Recent Advances in Natural Language Processing (RANLP 2013). Hissar,

Bulgaria.

Stenetorp, P., Pyysalom, S., Topic,, T. Ohta, G., Ananiadou, S. & Tsujii, J. (2012). brat: a

Web-based Tool for NLPAssisted Text Annotation. Dans Proceedings of the Demonstrations

Session at EACL 2012, Avignon, France.

Stevens, J. & Buysschaert, J. (2012). Comparison of the terminology extraction performance

of SDL MultiTerm Extract 2009 and Similis. Gent : s.n.

Page 47: L’extraction terminologique et l’extraction d’hyperonymes

47

Van der Plas, L. & Bouma, G. (2005). Automatic acquisition of lexico-semantic knowledge

for question answering. Dans Proceedings of the IJCNLP Workshop on Ontologies and

Lexical Resources, Jeju Island, Korea.

Vanopstal, K., Macken, L., Lefever, E., Van de Kauter, M., Buysschaert, J., & Hoste, V.

(2014). Terminologie: op het snijvlak van ambacht en technologie. Dans S Evenepoel, P.

Goethals, & L. Jooken, Beschouwingen uit een talenhuis : opstellen over onderwijs en

onderzoek in de vakgroep Vertalen, Tolken en Communicatie aangeboden aan Rita Godyns,

pp. 179–189. Gent : Academia Press.

Wright, S. Ellen, (1997). Term selection : the initial phase of terminology management, Dans

Budin, G. & Wright, S. E., Handbook of terminology management : Basic aspects of

terminology management. pp. 13-23. Amsterdam ; Philadelphia : Benjamins.

Page 48: L’extraction terminologique et l’extraction d’hyperonymes

48

Annexes

A. Listes des paires d’hyperonymes anglaises

15-inch monitor monitor

1-by-1-inch image image

600-dpi laser printers laser printer

acrobat documents document

actions Palette palette

adobe graphics-editing (application) graphics-editing applications

adobe photoshop 6 prefs file file

adobe photoshop 6 prefs.psp file file

adobe photoshop 6 settings folder folder

adobe photoshop settings file file

airbrush tool

allow non-linear history option option

annotation icon icon

annotation tools tools

audio annotation annotation

audio annotation icon annotation icon

audio annotation tool tool

audio file file

auto erase setting settings

automatically create first snapshot option options

bitmap images graphics

blur tools

brush pop-up palette in the options bar pop-up palette

burn tools

color sampler tools tools

context menus menus

(libraries of) contours libraries

crop command command

crop tool tool

current states states

cursor options options

(library of preset) custom shapes libraries

cyrillic script systems

default library library

default palette positions default positions

default presets presets

default settings setting

default window windows

desktop laser printers laser printers

(default) dialog box positions default positions

digimarc watermark watermark

digital images images

display option option

display size of an image size

Page 49: L’extraction terminologique et l’extraction d’hyperonymes

49

document window windows

dodge tools

don't show again option option

duplicate image image

duplicate image window image window

duplicate optimized image optimized image

edit > preferences submenu submenu

edit menu menu

editing commands commands

erase to history option option

eraser tools

eraser tools tools

existing measuring line measuring line

eyedropper tools

eyedropper icon icon

file extension extension

file size size

file's initial snapshot snapshots

file-saving options options

first snapshot snapshots

full-screen window window

general display options options

gradient tools

(libraries of) gradients libraries

(libraries) of preset gradients libraries

graphics editing applications applications

halftone image of the highest quality image

hand tool tool

hidden extras extras

hidden options options

hidden tools tools

hidden tools list list

higher resolution image image

high-quality images images

history brush tool tool

history list list

history options options

history palette palette

history palette menu palette menu

history palette tab tab

history state state

horizontal guide guide

horizontal ruler rulers

html editing applications applications

html file files

image pixels pixels

Page 50: L’extraction terminologique et l’extraction d’hyperonymes

50

image resolution resolutions

image size size

image states states

image window window

image with a high resolution image

image with a low resolution image

image's magnification magnification

imageready preferences preferences

imageready work area work area

imagesetters laser printers

info palette palette

ink jet printers printer

japanese script systems

jump to submenu submenu

lasso tool

lasso options bar options bar

layer options (Palette) palettes

layers palette palettes

libraries of brushes libraries

libraries of preset brushes libraries

libraries of presets library

line tool tool

list of items list

list of states list

list of states in the history palette list of states

lower-resolution images image

mac os monitors monitors

magic wand tools

magnetic lasso tools

magnetic pen tools

marquee tools tools

marquee tool tool

maximum magnification level magnification level

maximum reduction level reduction level

measure tools

measure tool tool

measuring line line

monitor pixels pixels

monitor resolution resolution

monitor resolution setting setting

monitor size size

mouse button button

move tool tools

new snapshot button buttons

next (state) state

nonhalftone printer printer

Page 51: L’extraction terminologique et l’extraction d’hyperonymes

51

note annotations

note annotations annotations

note icon icon

note window window

notes tool tool

(resolution) of images resolution

state of the image state

size of the monitor size

older states states

opacity settings

optimize Palette palettes

optimized file files

optimized image image

file size for the optimized image file size

options for plug-ins options

original size size

optimized sizes size

original file files

original image image

original image file size file size

original state state

other cursors options options

paint bucket tools

paintbrush tools

painting cursors options options

painting modes settings

painting tools tools

palette menu menu

palette tab tabs

palette's tab tabs

particular state states

pattern stamp tools

(libraries of) patterns libraries

(libraries) of preset patterns libraries

pen tools

pen tool tool

pencil tools

pencil tool tool

photoshop (work area) work area

photoshop documents document

photoshop file file

pixel dimensions dimensions

pixel dimensions of the image pixel dimensions

pixels high pixels

pixels wide pixels

polygon lasso tools

Page 52: L’extraction terminologique et l’extraction d’hyperonymes

52

pop-up menu menu

pop-up slider box slider box

precise cursors cursors

preference option option

preferences dialog box dialog boxes

preferences files files

preferences folder folder

preset library library

preset manager dialog box dialog boxes

preset manager pop-up menu pop-up menu

preview in default browser tool tool

preview in menu menu

previous state state

previous state of an image state of the image

printer resolution resolution

printer's screen frequency screen frequency

program settings settings

purge command command

redo key key

resolution of an image resolutions

right mouse button mouse button

roman script systems

rotate canvas dialog box dialog box

rubber stamp tools

rulers' settings setting

screen (pixels) pixels

screen mode button button

selected state state

setting of the monitor setting

shape tools tool

(libraries of) shapes libraries

sharpen tools

show submenu submenu

shown extras extras

size of images size

size of the image size

size of the monitor size

size of the optimized image size

slice tools

slice palettes palettes

slice tool tool

smudge tools

snapshot of the image snapshot

snapshot of the initial state of the document snapshot

snapshot of the initial state of the image snapshot

sponge tools tools

Page 53: L’extraction terminologique et l’extraction d’hyperonymes

53

standard (cursors) cursors

standard editing commands editing commands

state of the image states

stored palette palettes

(libraries of) styles libraries

(libraries of) preset styles libraries

(libraries of) swatches libraries

(libraries of) preset swatches libraries

temporary snapshot of a state snapshots

thumbnail icons icons

tool options bar options bar

total distance traveled (d1) distances traveled (d1 and d2)

transparency options options

trash button buttons

undo command command

unit of measurement units

vector graphic graphic

vertical guide guide

vertical ruler rulers

view option option

watermark information dialog box dialog box

window scroll bars scroll bar

window size size

x- and y-coordinates of the pointer x- and y-coordinates

zoom tool tools

zoom-out tool tool

default folder folder

pop-up slider slider

snapshot of the initial state snapshot

navigator palette palette

optimized tab tab

digital watermarks watermarks

snapshot command command

reset command command

original tab tab

window's title bar title bar

Load command command

new document button button

Save command command

color settings settings

library file file

scratch disk disk

thumbnail of the image thumbnail

thumbnail of a snapshot thumbnail

Window menu menu

detele command command

Page 54: L’extraction terminologique et l’extraction d’hyperonymes

54

B. Listes des paires d’hyperonymes françaises

moniteur 15 pouces / moniteur de 15 pouces moniteur

image de 1 x 1 pouce image

imprimantes laser 600 ppp imprimante laser

(document) acrobat document

palette scripts palette

applications d’édition graphique adobe applications d’édition graphique

(fichier) préfs adobe photoshop 6 fichier

fichier préfs adobe photoshop 6.psp fichier

dossier paramètres adobe photoshop 6 dossier

fichier de paramètres adobe photoshop fichier

Aérographe outil

l’option Accepter un historique non linéaire option

icône d’annotation icône

outil Annotation outil

annotation audio annotation

icône de l’annotation audio icône d'annotation

outil annotation audio outil

fichier audio fichier

paramètre Effacement automatique paramètre

option Créer le premier instantané automatiquement option

images bitmap graphiques

goutte d'eau outil

Palette Formes dans la barre d’options palette

densité + outil

(outil) échantillonnage de couleur outil

menus contextuels menus

(bibliothèques de) contours bibliothèques

commande de recadrage commande

outil de recadrage outil

états existants états

(options de) curseurs options

(bibliothèque) de formes personnalisées prédifinis bibliothèque

cyrillique système de script

bibliothèque par défaut bibliothèque

positions par défaut des palettes positions par défaut

paramètres prédéfinis par défaut paramètres prédéfinis

paramètres par défaut paramètres

fenêtre par défaut fenêtre

imprimantes laser de bureau imprimante laser

(positions par défaut) des boîtes de dialogue positions par défaut

filigrane digimarc filigrane

images numériques images

option d'affichage option

taille d’affichage d’une image taille

fenêtre de document fenêtre

Page 55: L’extraction terminologique et l’extraction d’hyperonymes

55

densité - outil

option Ne plus afficher option

image dupliquée image

fenêtre de l’image dupliquée fenêtre de l’image

image optimisée dupliquée image optimisée

sous-menu Edition > Préférences sous-menu

Menu Édition menus

commandes d'édition commandes

option Effacer de l’historique option

Gomme outil

outil Gomme outil

ligne de mesure existante ligne de mesure

Pipette outil

icône Pipette icône

extension de fichier extension

taille de fichier taille

instantané de la version initiale du document instantané

(options) d’enregistrement de fichiers options

premier instantané instantané

fenêtre plein écran fenêtre

options générales d’affichage options

Dégradé outil

(bibliothèques de) dégradés bibliothèques

(biliothèques de) dégradés (prédéfinis) bibliothèques

application d’édition graphique application

image en demi-teintes de qualité supérieure image

outil Main outil

extras masqués extras

options masqués options

outils masqués outils

liste d'outils masqués liste

image de résolution supérieure image

images de haute qualité images

outil forme d’historique outil

liste d’historique liste

options d’historique options

Palette Historique palette

menu de la palette historique menu de la palette

onglet de la palette Historique onglet

etat d’historique état

repère horizontal repère

règle horizontale règle

application d’édition html application

fichier html fichier

pixels d'image pixels

résolution d'image résolution

Page 56: L’extraction terminologique et l’extraction d’hyperonymes

56

taille de l'image taille

états de l'image états

fenêtre de l'image fenêtre

image haute résolution image

image basse résolution image

taux d'agrandissement de l'image taux d'agrandissement

préférences imageready préférences

plan de travail d’imageready zone de travail

photocomposeuses imprimantes laser

Palette Infos palette

imprimantes à jet d’encre imprimantes

japonais système de script

sous-menu Passer à sous-menu

lasso outil

barre d’options de l’outil lasso barre d'options

(Palette) Options de Calque palette

palette calques palette

bibliothèques de formes de pinceaux bibliothèques

bibliothèques de formes prédéfinis bibliothèques

bibliothèques de paramètres prédéfinis bibliothèques

outil Trait outil

liste d'éléments liste

liste des états liste

liste des états de la palette historique liste des états

images de résolution inférieure images

moniteurs mac os moniteurs

baguette magique outil

lasso magnétique outil

plume magnétique outil

outils de sélection outils

rectangle de sélection outil

taux maximum d’agrandissement taux d'agrandissement

taux maximum de réduction taux de réduction

Mesure outil

outil Mesure outil

ligne de mesure ligne

pixels de moniteur pixels

résolution du moniteur résolution

paramètre de résolution du moniteur paramètre

(taille du) moniteur taille

bouton de la souris bouton

outil Déplacement outil

bouton Nouvel instantané bouton

état suivant état

imprimante sans demi-teintes imprimante

note annotation

Page 57: L’extraction terminologique et l’extraction d’hyperonymes

57

annotations textuelles annotations

icône de note icône

fenêtres de notes fenêtres

outil annotation outil

résolution d'images résolution

état de l'image état

(taille du) moniteur taille

versions plus anciennes versions

opacité paramètres

palette optimiser palette

fichier optimisé fichier

image optimisée image

taille du fichier de l’image optimisée taille du fichier

options pour les modules externes optios

taille originale taille

taille optimisée taille

fichier original fichier

image originale image

taille originale du fichier image taille du fichier

état original état

options Pointeurs autres outils options

pot de peinture outil

pinceau outil

options pointeurs outils dessin options

modes de dessin paramètres

outils de peinture outils

menu de la palette menu

onglet de la palette onglet

onglet d'une palette onglet

état spécifique état

tampon de motif outil

(bibliothèques) de motifs bibliothèques

(bibliothèques) de motifs prédéfinis bibliothèques

plume outil

(outil) plume outil

crayon outil

outil Crayon outil

(plan de travail) de photoshop zone de travail

documents photoshop document

fichier photoshop fichier

dimensions de pixel dimensions

dimensions de pixel de l’image dimensions de pixel

pixels de hauteur pixels

pixels de largeur pixels

lasso polygonal outil

menu déroulant menu

Page 58: L’extraction terminologique et l’extraction d’hyperonymes

58

menu du curseur déroulant menu

pointeurs précis pointeurs

option de préférence option

boîte de dialogue de préférences boîte de dialogue

fichiers de préférences fichiers

dossier Préférences dossier

bibliothèque des paramètres prédéfinis bibliothèque

boîte de dialogue gestionnaire des paramètres prédéfinis boîte de dialogue

menu déroulant gestionnaire des paramètres prédéfinis menu déroulant

outil Aperçu dans le navigateur par défaut outil

menu aperçu dans menu

état antérieur état

état antérieur de l'image état de l'image

résolution d'imprimante résolution

linéature d'imprimante linéature

options de programme options

commande Purger commande

touche Rétablir touche

résolution d'une image résolution

bouton droit de la souris bouton de la souris

romain système de script

boîte de dialogue rotation de la zone de travail boîte de dialogue

tampon outil

paramètres des règles paramètres

pixels de trame pixels

option de fenêtre option

état sélectionné état

paramètres du moniteur paramètres

(outil de) formes outil

(bibliothèsques de) formes bibliothèques

netteté outil

sous-menu Afficher sous-menu

extras affichés extras

(taille) d'image taille

taille de l'image taille

(taille du) moniteur taille

taille de l’image optimisée taille

Tranche outil

(Palette) Tranche palette

(outil de) tranche outil

doigt outil

instantané de l'image instantané

instantané de la version initiale du document instantané

instantané de l’état initial de l’image instantané

(outils) éponge outil

pointeurs standard pointeurs

Page 59: L’extraction terminologique et l’extraction d’hyperonymes

59

commandes d’édition standard commandes d'édition

état de l'image état

palette masquée palette

(bibliothèques) de styles bibliothèques

(bibliothèques de) styles (prédéfinis) bibliothèques

(bibliothèques) de nuances bibliothèques

(bibliothèques de) nuances (prédéfinis) bibliothèques

instantané temporaire d’un état instantané

icône miniature icône

barre d’options d’outils barre d'options

distance totale parcourue (d1) distances parcourues (d1 et d2)

(options de) transparence options

bouton Corbeille bouton

commande annuler commande

unité de mesure unité

graphiques vectoriels graphiques

repère vertical repère

règle verticale règle

option d'affichage option

boîte de dialogue d’informations sur le filigrane boîte de dialogue

barres de défilement de la fenêtre barre de défilement

taille de la fenêtre taille

coordonnées x et y du pointeur coordonnées x et y

outil Loupe outil

zoom arrière outil

dossier par défaut dossier

curseur déroulant curseur

instantané de la version initiale instantané

Palette Navigation palette

onglet Optimisé onglet

filigranes numériques filigranes

Commande instantané commande

commande réinitialiser commande

onglet original onglet

barre de titre de la fenêtre barre de titre

commande Charger commande

bouton nouveau document bouton

commande Enregistrer commande

paramètres de couleur paramètres

fichier de bibliothèque fichier

disque de travail disque

vignette de l'image vignette

vignette d'un instantané vignette

menu Fenêtre menu

commande Supprimer commande

Page 60: L’extraction terminologique et l’extraction d’hyperonymes

60

C. Liste bilingue extraite par TExSIS

ImageReady ImageReady

palette palette

palettes palette

Photoshop Photoshop

image image

snapshot instantané

palettes palettes

palette palettes

window fenêtre

button fenêtre

Fit fenêtre

pointer pointeur

annotations annotations

annota-tions annotations

preset paramètres prédéfinis

presets paramètres prédéfinis

setting paramètres

settings paramètres

presets paramètres

display affichage

zoom affichage

pixels pixels

preferences préférences

settings préférences

preference préférences

Redo Rétablir

annotation annotation

prefs préfs

pointers pointeurs

tool pointers pointeurs

Extras extras

bar barre

following suivantes

History palette palette Historique

tool outil

tools outil

option option

preference option

options options

submenu sous-menu

guide repères

guides repères

resolution résolution

Styles.psp Styles.psp

Patterns.psp Motifs.psp

Page 61: L’extraction terminologique et l’extraction d’hyperonymes

61

Contours.psp Contours.psp

Shape.psp personnalisées.psp

In Helpers\Preview

Curves.psp forme.psp

layers calques

Digimarc Digimarc

screen frequency linéature

screen linéature

file fichier

grid grille

menu menu

guide repère

history historique

history options historique

imagesetters photocomposeuses

snap magnétisme

bitmap bitmap

dpi ppp

ppi ppp

key touche

OS OS

default défaut

command commande

buffer commande

Mac OS Mac OS

maps cartes-images

Arrange Réorganiser

Delete Supprimer

states états

Mac Mac

icon icône

note icon icône

states état

vector vectoriels

optimized image image optimisée

Optimized image optimisée

Info palette palette Infos

library bibliothèque

library file bibliothèque

button bouton

level agrandissement

size taille

image taille

Reset Réinitialiser

angle angle

box zone

Page 62: L’extraction terminologique et l’extraction d’hyperonymes

62

area zone

grid graduations

tab onglet

dialog dialogue

CMYK CMJN

pixel pixel

inch pouce

watermark filigrane

Preset Manager gestionnaire des paramètres prédéfinis

Fit fenêtres

windows fenêtres

Undo Annuler

browser navigateur

images images

image images

color couleur

document document

monitor moniteur

monitor resolution moniteur

space moniteur

tools outils

tool outils

lasso Lasso

watermarks filigranes

Preset Manager gestionnaire

Custom Shape.psp Formes personnalisées.psp

audio annotations annotations audio

bars défilement

Alt Alt

audio annotation annotation audio

annotation annotation audio

slider curseur

thumbnail vignette

application application

appli-cation application

snapshots instantanés

triangle triangle

opacity opacité

icons icônes

rulers règles

ruler règles

presets paramètre

settings paramètre

operation opération

process opération

hidden tools outils masqués

Page 63: L’extraction terminologique et l’extraction d’hyperonymes

63

glass loupe

magnifying glass loupe

pop-up palettes palettes déroulantes

dimensions dimensions

Adobe Adobe

graphics graphiques vectoriels

options bar barre d'options

OK OK

Digimarc watermark filigrane Digimarc

marquee rectangle

change modification

pop-up menu menu déroulant

location emplacement

positions emplacement

locations emplacement

marquee sélection

selection sélection

edges sélection

selections sélection

layer calque

slices tranches

original image image originale

value valeur

samplers échantillonneurs

screen écran

monitor écran

boxes boîtes

duplicate image image dupliquée

shortcut raccourci

files fichiers

filesfor fichiers

lpi lpp

Optimized Optimisé

eyedropper Pipette

ruler règle

Layers palette palette Calques

Shape Curves.psp Courbes de forme.psp

percentage pourcentage

left gauche

text texte

tool texte

hidden Extras extras masqués

edit modifier

change modifier

Navigator palette palette Navigation

edge bords

Page 64: L’extraction terminologique et l’extraction d’hyperonymes

64

Show submenu sous-menu afficher

graphics graphiques

width largeur

zoom tool outil Loupe

magnifying glass outil Loupe

Trash Corbeille

brush forme

tool forme

bottom bas

active tool outil sélectionné

measure mesure

measurement mesure

eraser Gomme

eraser tools Gomme

context menu menu contextuel

versions versions

states versions

Purge Purger

level réduction

monitors moniteurs

slice tool tranche

folder dossier

preset type type de paramètres prédéfinis

position position

positions position

Pica Size picas

Restart Redémarrez

rotation rotation

ImageReady preferences préférences ImageReady

libraries bibliothèques

pop-up sliders curseurs déroulants

preset paramètre prédéfini

buffer tampon

context menus menus contextuels

menus menus contextuels

Acrobat Acrobat

dialog box boîte de dialogue

dialog boîte de dialogue

applications applications

Trash button bouton Corbeille

colors couleurs

color couleurs

bitmap image image bitmap

swatches nuances

image resolution résolution d'image

preset item élément de paramètres prédéfinis

Page 65: L’extraction terminologique et l’extraction d’hyperonymes

65

technologies tramage

Optimized tab onglet Optimisé

units unité

unit unité

pop-up slider curseur déroulant

menus menus

first snapshot premier instantané

notes notes

note notes

annotations into Photoshop annotations dans Photoshop

digital watermarks filigranes numériques

bytes octets

values valeurs

All fermer

open palettes palettes ouvertes

display image affichée

intersection intersection

dialog boxes boîtes de dialogue

polygon lasso Lasso polygonal

current list liste existante

shapes formes

brushes formes

commands commandes

editing commands commandes

horizontal guide repère horizontal

document window fenêtre de document

vertical guide repère vertical

ImageReady application application ImageReady

Tile Juxtaposer

measure tool outil Mesure

PostScript PostScript

document window fenêtre du document

Info Infos

destination cible

mosaic mosaïque

resizable window fenêtre redimensionnable

previous state état antérieur

copy copie

duplicate copie

color sampler échantillonneur

example exemple

history options options d'historique

Automatically Créer

view of the Preset Manager affichage du Gestionnaire des paramètres prédéfinis

microphone microphone

title bar barre de titre

Page 66: L’extraction terminologique et l’extraction d’hyperonymes

66

item in a pop-up palette élément dans la palette

item in the pop-up palette élément dans la palette

Maximize Réduire

gradient Dégradé

gradient tool Dégradé

alias alias

Arbitrary Paramétrée

pencil Crayon

notes tool outil Annotations

Undo command commande Annuler

active window fenêtre active

image window fenêtre active

Extra extra

Extras extra

printers imprimantes

color values valeurs chromatiques

Window menu menu Fenêtre

view option option d'affichage

display option option d'affichage

marquee rectangle de sélection

marquee tool rectangle de sélection

annotation icons icônes d'annotation

skew inclinaison

vector graphique

graphics graphique

graphic graphique

selections sélections

selec-tions sélections

airbrush Aérographe

script script

action script

magnification level taux d'agrandissement

changes modifications

HTML HTML

hidden tools list liste des outils masqués

point point

status bar barre d'état

upper right corner of the pop-up palette angle supérieur droit de la palette

upper right corner of the palette angle supérieur droit de la palette

protractor rapporteur

keyboard shortcut raccourci clavier

memory mémoire

resolution of an image résolution d'une image

following information informations suivantes

printed image image imprimée

option in ImageReady option dans ImageReady

Page 67: L’extraction terminologique et l’extraction d’hyperonymes

67

screen frequency linéature de trames

scroll bars barres de défilement

cross-hairs croix

hairs croix

Snapshot command commande Instantané

endpoint extrémités

Clear Effacer

Erase Effacer

eyedropper icon icône Pipette

image in Photoshop image dans Photoshop

snapshot of an image instantané de l'image

snapshot of the image instantané de l'image

keyboard clavier

Actions Palette Palette Scripts

printing impression

magnetic lasso Lasso magnétique

type type de paramètres

default presets paramètres par défaut

pen Plume

angle of rotation angle de rotation

correct angle of rotation angle de rotation

right button bouton droit

tire pneu

bicycle pneu

Annotating images Annotation d'images

elements éléments

tool options bar barre d'options d'outils

Edit menu menu Edition

pixels per inch pixels par pouce

Reset command commande Réinitialiser

hand tool outil Main

session séance

destination application application cible

Original tab onglet Original

palette group groupe de palettes

Photoshop file fichier Photoshop

Optimize Optimiser

Purge command commande Purger

undos annulations

option from the submenu option dans le sous-menu

audio annotation tool outil Annotation audio

file size taille de fichier

angle of horizontal skew angle d'inclinaison horizontal

startup of Photoshop démarrage de Photoshop

Preset Type menu menu Type

preset type from the Preset Type menu type de paramètres prédéfinis dans le menu Type

Page 68: L’extraction terminologique et l’extraction d’hyperonymes

68

pause pause

work area zone de travail

area partie

device périphérique

active tool outil actif

number of pixels nombre de pixels

mouse button bouton de la souris enfoncé

application from ImageReady application depuis ImageReady

resolutions résolutions

temp temporaire

dots points

points points

styles styles

Opacity option in the Layers palette option Opacité de la palette Calques

eraser tool outil Gomme

edge bord

shortcuts raccourcis

layers in the image calques de l'image

annotation icon icône d'annotation

type type

bounds limites

version version

Digimarc digital watermark in the optimized image filigrane numérique Digimarc dans l'image optimisée

list of states liste des états

Optimized Savings Enregistrements optimisés

palettes in the options bar palettes dans la barre d'options

default library bibliothèque par défaut

tool pointer appearance forme du pointeur

tool pointer setting forme du pointeur

eliminated states versions éliminées

laser laser

items in a pop-up palette éléments dans une palette

Optimized vue Optimisé

Preferences submenu in the Edit menu sous-menu Préférences du menu Edition

screen display mode mode d'affichage écran

lines lignes

operations opérations

selected state version sélectionnée

DY DY

Painting Cursors options options Pointeurs outils dessin

units unité de mesure

unit of measurement unité de mesure

unit of measure unité de mesure

bottom of the window bas de la fenêtre

previous state of an image état antérieur de l'image

magic wand Baguette magique

Page 69: L’extraction terminologique et l’extraction d’hyperonymes

69

notes note

note note

note windows note

preset color couleur existante

ruler origin origine des règles

snapshot on the History palette instantané sélectionnés dans la palette Historique

options bar barre des options

Watermark Strength Intensité du filigrane

icon for the shortcut icône du raccourci

Zoom text box zone de texte

text area zone de texte

sharpen Netteté

original file fichier original

menu bar barre de menu

view box zone de visualisation

view area zone de visualisation

window's title bar barre de titre de la fenêtre

title bar barre de titre de la fenêtre

palette menu menu de palette

options for palettes options des palettes

PostScript device périphérique PostScript

available Extras extras disponibles

sponge tools Eponge

extension extension

entire image image entière

spacing espacement des repères

open images images ouvertes

keyboard shortcuts raccourcis clavier

optimized file fichier optimisé

file size taille du fichier

editor éditeur

toolbox boîte à outils

Load command commande Charger

Adobe Photoshop settings file fichier de paramètres Adobe Photoshop

Preset Manager dialog box boîte de dialogue Gestionnaire des paramètres prédéfinis

radius rayon

title titre

move tool outil Déplacement

pointer on the line pointeur sur la ligne

dots per inch points par pouce

existing measuring line ligne de mesure existante

gripper manipulation

pointer over the guide pointeur sur le repère

New Document button bouton Nouveau document

bicycle tire pneu de bicyclette

warnings alerte

Page 70: L’extraction terminologique et l’extraction d’hyperonymes

70

scroll bar barre de défilement

step étape

default folder dossier par défaut

preference for the Redo key option pour la touche Rétablir

current presets with the default presets paramètres prédéfinis existants par les paramètres par défaut

full-screen window fenêtre plein écran

intersection of the rulers intersection des règles

painting épaisseur

mouse button bouton droit de la souris

right mouse button bouton droit de la souris

monitor resolution résolution d'écran

browsers navigateurs

snapshot to the Trash button instantané vers le bouton Corbeille

monitor pixels pixels de moniteur

current states off the palette états existants dans la palette

snapshot of the initial state instantané de la version initiale

color for the note icon couleur pour l'icône

name for the duplicated image nom pour l'image dupliquée

opacity of the current layer opacité du calque actif

pointer over an annotation icon pointeur sur l'icône d'une annotation

combina-tion combinaison

thumbnail of the image vignette de l'image

plug-in modules

entire docked group groupe ancré de palettes

previous preset percentage taux de réduction prédéfini suivant

following display options options d'affichage suivantes

image information informations sur l'image

mosaic of pixels mosaïque de pixels

positions of all open palettes position des palettes ouvertes

selection edges bords de la sélection

scroll bars on the sides barres de défilement latérales

width of a bitmap image largeur d'une image bitmap

Thumbnail of a snapshot Vignette d'un instantané

Save command commande Enregistrer

startup démarrage

pointer on the visible tool pointeur sur l'outil visible

previous preference set fenêtre précédente

magnetic pen Plume magnétique

ImageReady from another application ImageReady depuis une autre application

graphics in Photoshop graphique dans Photoshop

memory for Photoshop mémoire pour Photoshop

Record commande d'enregistrement

distance distance

preference option de préférence

libraries with the Preset Manager bibliothèques avec le gestionnaire des paramètres prédéfinis

preset in the list paramètre prédéfini dans la liste

Page 71: L’extraction terminologique et l’extraction d’hyperonymes

71

file information informations sur le fichier

area of an image partie de l'image

action procédure

hidden tools list liste d'outils masqués

Lasso options bar Barre d'options de l'outil Lasso

name for the library nom pour la bibliothèque

name for the library file nom pour la bibliothèque

measure tool outil de mesure

color for the guides couleur des repères

Extra from the submenu extra dans le sous-menu

image with a high resolution image haute résolution

target paths tracés de destination

temp file fichier temporaire

format format

image on a nonhalftone printer image sur une imprimante sans demi-teintes

color beneath the pointer couleur sous le pointeur

higher resolution image image de résolution supérieure

history states from the History palette états d'historique de la palette Historique

session séance de travail

filter filtre

patterns motifs

group of Extras groupe d'extras

view of an image vue de l'image

view of the image vue de l'image

rulers ' settings paramètres des règles

color sampler tools Echantillonnage de couleur

Actual Pixels Taille réelle des pixels

area of the image zone de l'image

color settings paramètres de couleur

filename nom de fichier

library from the pop-up menu bibliothèque dans le menu déroulant

following guidelines observations suivantes

Image Info Infos image

contents of layers contenu de calques

image sections

measuring line ligne de mesure

rotation of the crop marquee rotation de l'outil de recadrage

specific color couleur spécifique

HTML file fichier HTML

original image file size taille originale du fichier image

halftone image of the highest quality image en demi-teintes de qualité supérieure

ruler origin point d'origine des règles

Extra fonction

Ctrl Ctrl

Original view in the duplicate image window vue Original de la fenêtre de l'image dupliquée

channels couches

Page 72: L’extraction terminologique et l’extraction d’hyperonymes

72

combi-nation of Extras combinaisons de fonctions extras

top of the image window partie supérieure de la fenêtre de l'image

file size for the optimized image taille de fichier de l'image optimisée

zoom-out tool zoom arrière

audio file fichier audio

Fit on Screen Taille écran

custom-sized window fenêtre de taille personnalisée

preferences dialog box boîte de dialogue de préférences

temporary copy copie temporaire

reduction level taux de réduction

Total Ink Encrage total

percentage change in width pourcentage de modification de la largeur

status bar at the bottom barre d'état au bas

color for the audio annotation icon couleur pour l'icône de l'annotation audio

key touche de commande

Delete command from the palette menu commande Supprimer dans le menu de la palette

subset of a library sous-ensemble de paramètres d'une bibliothèque

original state état original

ink encres

history brush tool outil Forme d'historique

name of the snapshot nom de l'instantané

detail détail

playback exécution

state to the Trash button état vers le bouton Corbeille

Snapshot in the Name text box instantané dans la zone de texte

available views from the pop-up menu options d'affichage disponibles dans le menu déroulant

tool icon icône des outils

grid of colors grille de couleurs

initial state version initiale

paint Pot

view in the document window affichage dans la fenêtre de document

hand tool outils Main

printing of the image impression de l'image

DX DX

marquee tools outils de sélection

entire palette group groupe de palettes entier

Web browser navigateur Web

steps étapes

commands from the Edit commandes des menus Edition

image in Optimized image en vue Optimisé

screen display mode mode d'affichage écran sélectionné

set of hidden tools série d'outils masqués

Zoom box case Zoom

marquee to a new location déplaçant vers un nouvel emplacement

Printer resolution Résolution d'imprimante

name of the tool nom de l'outil

Page 73: L’extraction terminologique et l’extraction d’hyperonymes

73

library file fichier de bibliothèque

bottom of the palette menu bas du menu de la palette

lines per inch lignes par pouce

current magnification taux d'affichage

Digimarc Web site site Web Digimarc

palette to another group palette vers un autre groupe

states of the image états de l'image

list of open windows liste des fenêtres ouvertes

paragraph paragraphe

top of the palette haut de la palette

Preview Preview

name of the active tool nom de l'outil sélectionné

layer masques

left button bouton de gauche

view box in the thumbnail zone de visualisation dans la vignette

hand Main

close box case de fermeture

bicycle tire in a vector graphic pneu de bicyclette dans un graphique vectoriel

libraries of brushes bibliothèques de formes de pinceau

library to the current list bibliothèque à la liste existante

version of the image version de l'image

cells cellules

Mac OS Macintosh

number of undos nombre d'annulations

right droite

color box zone de couleur

tool to multiples outil à des multiples

state of the image état de l'image

small nonprintable icons on the image forme de petites icônes non imprimables dans l'image

zoom level niveau d'agrandissement

change to an image modification à une image

current list bibliothèque à la liste

image for online display image pour l'affichage en ligne

HTML editor application d'édition HTML

change to the image modification à l'image

name of the state nom de l'état

graphics-editing application application d'édition graphique

monitor resolution notion de résolution du moniteur

color value valeur de couleur spécifiques

script system système de script

image with dimensions image avec des dimensions

contents contenu

options for plug-ins options pour les modules externes

specific point on the image point spécifique de l'image

color of the tire couleur du pneu

state onto the document état vers le document

Page 74: L’extraction terminologique et l’extraction d’hyperonymes

74

current list with a different library liste existante par la nouvelle bibliothèque

ink dots per inch points d'encre par pouce

bottom border of the application window bord inférieur de la fenêtre de l'application

library from the list bibliothèque dans la liste

unit of measurement unité de mesure pour la règle

unit of length unité de longueur

bottom of the application window bas de la fenêtre de l'application

total number of pixels nombre total de pixels

path tracé de destination

full-screen window with a black background fenêtre plein écran avec arrière-plan noir

right droit

menu bar at the top barre de menu en haut

bucket peinture

types types

kinds types

channels couches compris

symbol symbole

Cut Couper

tool tips descriptions d'outils

larger monitor moniteur plus grand

type of library type de bibliothèque

Revert Version précédente

ID créateur

length longueur

file with a new name fichier sous un autre nom

difference différence

image with a caption image avec une légende

change variation

views vues

top of the dialog box haut de la boîte de dialogue

paintings peintures

System Alert Alerte système

effect effet

background calque du fond

paint bucket Pot de peinture

zoom level facteur de réduction

maximum reduction level taux minimum de réduction

scratch disk disque de travail

list of the editing steps liste des étapes d'édition

sizes tailles

maximum number of items nombre maximum d'éléments

selected modem speed vitesse du modem sélectionné

stamp motif

HTML information in the second paragraph informations HTML dans le deuxième paragraphe

number of colors nombre de couleurs

disk disque

Page 75: L’extraction terminologique et l’extraction d’hyperonymes

75

zoom facteur

center button bouton du centre

guidelines observations

Roman Romain

images for online media images pour des supports en ligne

contents of notes contenu des notes

action in the image action sur l'image

specifications spécifications

value durée

ending position arrivée

slider box extérieur du menu

caption légende

contents of a note contenu d'une note

formats formats

axis axe

author name nom de l'auteur

warning messages messages d'alerte

grayscale images images en niveaux de gris

Japanese Japonais

current working session séance de travail en cours

top of the list début de liste

quality qualité

Read Watermark Lecture copyright

photograph photographie

Next Suivante

service provider prestataire de services

process traitement

mode choisi

owner propriétaire

Preview In Preview in

Page 76: L’extraction terminologique et l’extraction d’hyperonymes

76

D. Liste des paires correctes extraites par TExSIS

ImageReady ImageReady

palette palette

palettes palette

Photoshop Photoshop

image image

snapshot instantané

palettes palettes

palette palettes

window fenêtre

pointer pointeur

annotations annotations

preset paramètres prédéfinis

presets paramètres prédéfinis

setting paramètres

settings paramètres

presets paramètres

display affichage

pixels pixels

preferences préférences

settings préférences

preference préférences

Redo Rétablir

annotation annotation

pointers pointeurs

tool pointers pointeurs

Extras extras

bar barre

History palette palette Historique

tool outil

tools outil

option option

options options

submenu sous-menu

guide repères

guides repères

resolution résolution

layers calques

screen frequency linéature

file fichier

grid grille

menu menu

guide repère

imagesetters photocomposeuses

dpi ppp

ppi ppp

Page 77: L’extraction terminologique et l’extraction d’hyperonymes

77

key touche

command commande

Mac OS Mac OS

Arrange Réorganiser

Delete Supprimer

states états

icon icône

states état

optimized image image optimisée

Info palette palette Infos

library bibliothèque

button bouton

size taille

Reset Réinitialiser

tab onglet

pixel pixel

inch pouce

watermark filigrane

Preset Manager gestionnaire des paramètres prédéfinis

windows fenêtres

Undo Annuler

browser navigateur

images images

image images

document document

monitor moniteur

tools outils

tool outils

lasso Lasso

watermarks filigranes

Preset Manager gestionnaire

audio annotations annotations audio

audio annotation annotation audio

slider curseur

thumbnail vignette

application application

appli-cation application

snapshots instantanés

opacity opacité

icons icônes

rulers règles

ruler règles

presets paramètre

settings paramètre

hidden tools outils masqués

magnifying glass loupe

Page 78: L’extraction terminologique et l’extraction d’hyperonymes

78

pop-up palettes palettes déroulantes

dimensions dimensions

Adobe Adobe

options bar barre d'options

Digimarc watermark filigrane Digimarc

pop-up menu menu déroulant

selection sélection

selections sélection

layer calque

slices tranches

original image image originale

screen écran

duplicate image image dupliquée

files fichiers

lpi lpp

eyedropper Pipette

ruler règle

Layers palette palette Calques

hidden Extras extras masqués

edit modifier

change modifier

Navigator palette palette Navigation

Show submenu sous-menu afficher

graphics graphiques

width largeur

zoom tool outil Loupe

magnifying glass outil Loupe

Trash Corbeille

measure mesure

measurement mesure

eraser Gomme

eraser tools Gomme

context menu menu contextuel

versions versions

states versions

Purge Purger

monitors moniteurs

slice tool tranche

folder dossier

preset type type de paramètres prédéfinis

Restart Redémarrez

ImageReady preferences préférences ImageReady

libraries bibliothèques

pop-up sliders curseurs déroulants

preset paramètre prédéfini

context menus menus contextuels

Page 79: L’extraction terminologique et l’extraction d’hyperonymes

79

Acrobat Acrobat

dialog box boîte de dialogue

applications applications

Trash button bouton Corbeille

bitmap image image bitmap

swatches nuances

image resolution résolution d'image

preset item élément de paramètres prédéfinis

Optimized tab onglet Optimisé

units unité

unit unité

pop-up slider curseur déroulant

menus menus

first snapshot premier instantané

notes notes

note notes

digital watermarks filigranes numériques

dialog boxes boîtes de dialogue

polygon lasso Lasso polygonal

shapes formes

brushes formes

commands commandes

horizontal guide repère horizontal

document window fenêtre de document

vertical guide repère vertical

ImageReady application application ImageReady

Tile Juxtaposer

measure tool outil Mesure

document window fenêtre du document

Info Infos

previous state état antérieur

copy copie

duplicate copie

history options options d'historique

view of the Preset Manager affichage du Gestionnaire des paramètres prédéfinis

microphone microphone

title bar barre de titre

Maximize Réduire

gradient Dégradé

gradient tool Dégradé

Arbitrary Paramétrée

pencil Crayon

notes tool outil Annotations

Undo command commande Annuler

Extra extra

Extras extra

Page 80: L’extraction terminologique et l’extraction d’hyperonymes

80

printers imprimantes

Window menu menu Fenêtre

view option option d'affichage

display option option d'affichage

marquee rectangle de sélection

marquee tool rectangle de sélection

annotation icons icônes d'annotation

graphics graphique

graphic graphique

selections sélections

selec-tions sélections

airbrush Aérographe

action script

magnification level taux d'agrandissement

hidden tools list liste des outils masqués

status bar barre d'état

protractor rapporteur

resolution of an image résolution d'une image

screen frequency linéature de trames

scroll bars barres de défilement

Snapshot command commande Instantané

eyedropper icon icône Pipette

snapshot of an image instantané de l'image

snapshot of the image instantané de l'image

Actions Palette Palette Scripts

magnetic lasso Lasso magnétique

default presets paramètres par défaut

pen Plume

angle of rotation angle de rotation

Annotating images Annotation d'images

tool options bar barre d'options d'outils

Edit menu menu Edition

pixels per inch pixels par pouce

Reset command commande Réinitialiser

hand tool outil Main

Original tab onglet Original

palette group groupe de palettes

Photoshop file fichier Photoshop

Optimize Optimiser

Purge command commande Purger

audio annotation tool outil Annotation audio

file size taille de fichier

angle of horizontal skew angle d'inclinaison horizontal

Preset Type menu menu Type

work area zone de travail

resolutions résolutions

Page 81: L’extraction terminologique et l’extraction d’hyperonymes

81

styles styles

eraser tool outil Gomme

annotation icon icône d'annotation

version version

list of states liste des états

Optimized Savings Enregistrements optimisés

default library bibliothèque par défaut

tool pointer appearance forme du pointeur

tool pointer setting forme du pointeur

Preferences submenu in the Edit menu sous-menu Préférences du menu Edition

screen display mode mode d'affichage écran

lines lignes

selected state version sélectionnée

Painting Cursors options options Pointeurs outils dessin

unit of measurement unité de mesure

unit of measure unité de mesure

previous state of an image état antérieur de l'image

magic wand Baguette magique

notes note

note note

options bar barre des options

Watermark Strength Intensité du filigrane

Zoom text box zone de texte

sharpen Netteté

original file fichier original

menu bar barre de menu

view box zone de visualisation

window's title bar barre de titre de la fenêtre

palette menu menu de palette

sponge tools Eponge

extension extension

optimized file fichier optimisé

file size taille du fichier

editor éditeur

toolbox boîte à outils

Load command commande Charger

Adobe Photoshop settings file fichier de paramètres Adobe Photoshop

Preset Manager dialog box boîte de dialogue Gestionnaire des paramètres prédéfinis

move tool outil Déplacement

dots per inch points par pouce

existing measuring line ligne de mesure existante

New Document button bouton Nouveau document

scroll bar barre de défilement

default folder dossier par défaut

full-screen window fenêtre plein écran

mouse button bouton droit de la souris

Page 82: L’extraction terminologique et l’extraction d’hyperonymes

82

right mouse button bouton droit de la souris

browsers navigateurs

monitor pixels pixels de moniteur

snapshot of the initial state instantané de la version initiale

thumbnail of the image vignette de l'image

image information informations sur l'image

selection edges bords de la sélection

Thumbnail of a snapshot Vignette d'un instantané

Save command commande Enregistrer

magnetic pen Plume magnétique

Record commande d'enregistrement

preference option de préférence

file information informations sur le fichier

hidden tools list liste d'outils masqués

Lasso options bar Barre d'options de l'outil Lasso

measure tool outil de mesure

image with a high resolution image haute résolution

target paths tracés de destination

higher resolution image image de résolution supérieure

filter filtre

patterns motifs

rulers ' settings paramètres des règles

color sampler tools Echantillonnage de couleur

Actual Pixels Taille réelle des pixels

color settings paramètres de couleur

Image Info Infos image

measuring line ligne de mesure

HTML file fichier HTML

original image file size taille originale du fichier image

halftone image of the highest quality image en demi-teintes de qualité supérieure

Ctrl Ctrl

channels couches

file size for the optimized image taille de fichier de l'image optimisée

zoom-out tool zoom arrière

audio file fichier audio

Fit on Screen Taille écran

preferences dialog box boîte de dialogue de préférences

reduction level taux de réduction

Total Ink Encrage total

percentage change in width pourcentage de modification de la largeur

key touche de commande

original state état original

history brush tool outil Forme d'historique

tool icon icône des outils

initial state version initiale

hand tool outils Main

Page 83: L’extraction terminologique et l’extraction d’hyperonymes

83

marquee tools outils de sélection

Web browser navigateur Web

Zoom box case Zoom

Printer resolution Résolution d'imprimante

library file fichier de bibliothèque

lines per inch lignes par pouce

current magnification taux d'affichage

states of the image états de l'image

layer masques

hand Main

close box case de fermeture

libraries of brushes bibliothèques de formes de pinceau

Mac OS Macintosh

color box zone de couleur

state of the image état de l'image

zoom level niveau d'agrandissement

graphics-editing application application d'édition graphique

script system système de script

options for plug-ins options pour les modules externes

ink dots per inch points d'encre par pouce

Cut Couper

tool tips descriptions d'outils

type of library type de bibliothèque

Revert Version précédente

System Alert Alerte système

paint bucket Pot de peinture

scratch disk disque de travail

sizes tailles

disk disque

Roman Romain

warning messages messages d'alerte

Japanese Japonais

Read Watermark Lecture copyright

photograph photographie

Next Suivante

Preview In Preview in