Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de...

73
UniVER/ITE CLflUDE BEPDflPO LVOfl-l 43. Boulevord du II flovembre 1918 69621 VILLEUPBflnnE Dipldme d'*8tudes ^uperieures ^pecialistes MFormtfaiM doeumeiitaire # nOTE OE /VnTHE/E f TRAITEMENT AUTOMATIQUE DES LANGUES ET DOCUMENTATION V flUTEUR : Paulette BERNHARD OflTE : mai 1979

Transcript of Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de...

Page 1: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

UniVER/ITE CLflUDE BEPDflPO LVOfl-l 43. Boulevord du II flovembre 1918

69621 VILLEUPBflnnE

Dipldme d'*8tudes ^uperieures ^pecialistes

MFormtfaiM doeumeiitaire

# nOTE OE /VnTHE/E

f

TRAITEMENT AUTOMATIQUE DES LANGUES

ET DOCUMENTATION

V

flUTEUR : Paulette BERNHARD

OflTE : mai 1979

Page 2: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

UNIVERSITE CLAUDE BERNARD (LYON - 1)

D.E.S.S. D'INFORMATIQUE DOCUMENTAIRE

T R A I T E M E N T A U T O M A T I Q U E

D E S L A N G U E S

E T D O C U M E N T A T I O N

Note de synth§se

prfesentfee par

Paulette BERNHARD mai 1979

Page 3: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

T A B L E D B S H A T I B R B S

I Pr6eent»tlon et eeaai de d611altatlon du eujet

II Sltuatlon dee dlff6rente eyetdmee retenue dane la chalne documentalre

III Bxmnplee de eyetdmee d'6dltlon automatlque d'lndex permut6e

IV Bxeaplee de eyetdmee n6ceeeltant une deecrlptlon 61abor6e dee lnformatlone (utllleatlon d'un mdtalangage)

V Bxemplee de eyetdmee de traltement dee lnformatlone en langage naturel

VI Beeel de concluelon et tableaux eynoptlquee

VII Blbllographle

Page 4: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

Considerone une collection de 20.000 documente

compos6e chacun de tyOO caractdree, eoit au

total 20.000 x 400 e 8 millione de caractS-

ree, ou 160.000 lignee, une ligne etant

formee de 50 caracteree.

Si un individu lit en moyenne 1 ligne a la

eeconde, il lui faudra approximativement

40 heuree pour lire la totalitS dee documente,

tandie que 1'ordinateur accomplira cette

operation de lecture en moine d'une minute.

note extraita de l*ouvrage de L. BOURELLT et E. CHOURAQUI eur le eyetdme documentair< SATIN 1.

Page 5: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

N O T E P K E L I M I N A I R E

Je suls bien coneciente du fait que le sujet de cette note de eynthdse reste vaste, malgr6 les limitations successives apporteee.

II m*a semb!6 important, puisque j'avais r6uni une informatio assez diversifi6e, de tenter de faire plut6t une pr£sentation eommaire des diff6rents systemes recenses que leur 6tude appro-fondie, qui pourrait cependant faire 1'objet de travaux - et de m6moiree - ultdrieure.

L'6tude qui suit n'est donc ni exhaustive ni meme tr6e poueeei Elle pourrait 8tre consid6r6e comme une eepece de "doeeier" sur quelquee aepecte du traitement automatique dee languee en docum entation•

Je voudraie enfin remercier toutes les pereonnee - et ellee eont nombreueee - qui m'ont permie d'acc6der aux informatione, ainsi qu»a 1'ensemble dee documente cites dans la bibliographie.

Page 6: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

I PRESENTATION ET ESSAI DE DELIMITATION DU SUJET

Page 7: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 1 -

I PRESENTATION ET ESSAI DE DELIMITATION DU SUJET

Le traitement automatique des langues releve k la fois des MathSmatiques, de 1'Informatique et de la Linguistique; son but central, en doctunentation, est de pennettre 1 'amalyse automatique des documents, mais il peut ddboucher auesi bien sur des traitements d*edition automatique d'index que sur dee proceesus de traduction automatique, ou encore sur la construction automatique de thesaurus, et bien d'autres applications...

Dane chacun de ces types d'operations entrent en Jeu des proc6-dures plue ou moins complexes, a partir de textee ayant deja subi une prdparation d1 entree, ou d. partir de textes en langue naturelle; ces proc6duree peuvent etre uniquement statistiques (fr6quences, cooccurences), uniquement linguistiques (aspects morphologiques, syntaxiques, s6mantiques), ou encore combinees.

Le domaine du traitement automatique des langues, en particulier des languee naturelles, dans les systSmes documentaires, fait encore trds largement 1'objet de recherches et d'experimentations.

Les recherches bibliographiques

Le champ bibliographique couvert au depart 6tait tres vaste. Lee recherches ont port6 :

- sur le d6p0ttillement pour 1'annee 1978 d*un certain nombre de bibliographiee specialisees (Bulletin signaletique 101. Information science abstracts, library and information science abetracts, computing rewiews)

Page 8: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- sur une coneultation plus complSte en particulier des revuee Documentaliste et TA Informatione

- sur une interrogation d'un fichier de l'ASE (Agence spatiale euro-peenne) ,qui n*a malheureueement pae donn6 d'lsfozaations imm6-diatement utilieablee

- eur lee bibliographiee citeee dane dee ouvragee plue g6n6raux (1) ou dans dee articlee de eynthdee (2) concernant 1'analyee docu-mentaire

- enfin, au fur et & meeure de leur coneultation, eur lee bibliogra-phiee des differents ouvragee ou articlee concernant chacun dee eystemee ou aepecte particuliers.

C'est ainsi qu'une centaine de referencee avaient 6t6 coll6ct6es, principalement & partir des concepte euivants (en fran?ais et en anglaie) : ANALTSE AUTOMATIQUE / LAN6AGE NATUREL / INDEXATION AUTO-MATIQUE / TRADUCTION AUTOMATIQUE / TRAITEMENT AUTOMATISE .

Dans un premier trl, je n'ai retenu que celles concernant 1'entree dee informations dans les eyetemes documentaires, y compris cellee incluant 1'indexation et la traduction automatiques, en 6limi-nant d«une part les methodee purement statistiques et, de 1'autre, celles propree a la recherche ou k la formulation dee questions : il restait une quarantaine de r6ferencee.

Par la suiteK compte tenu des objectife de 1'etude (aboutir & une "note de synthese" en un temps aeeez court), ainei que dee do-cuments qu'il m*a r6ellement et6 possible d'obtenir et de consulter, le travail qui suit se limite & la pr6sentation de quelques systemes - op6rationnels ou en cours d'exp6rimentation - partag6s entre :

(1) en particulier les ouvragee de BELT, BORILLO, VIRBEL - CHAUMIER et COTAUD, SIOT DECAUVILLE

(2) lee articlee de COUHRIER et SPARK JONES

(3) Cependant, Taspect "traduction automatique des langues naturelles" a ete volontairement neglige dans cette etude (il correspond d une grande par-tie des references eliminees). On peut signaler toutefois que les travaux les plus importants men§s dans ce domaine en France ont ete conduits par le GETA (M. VAUQUOIS, Grenoble), qui continue ses recherches en particulier sur des applications possibTes i la documentation.

Page 9: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 3 -

- dee eyetdmee qui exigent, & 1'entr6e, dee typee plue ou moine 61abor6e d1expreeeione de relatione et qui aboutieeent d'une part A 1'edition automatique d'index et, de 1'autre, a dee traitemente plue ep6cifiquee dee informatione que dane lee eyet6mee automa-tie6e traditionnele

- dee eyetemee qui traitent le texte integral en langage naturel et dane leequele lee compoeantee linguietiquee eont int6greee dane lee programmee de traitement eux-m§mee.

1 Le lien entre cee differente r6alieatione eet la pr6eence de

compoeantee linguietiquee (en particulier grammaticalee) intervenant eoit au moment de 1'introduction dee donneee eoit au niveau du trai-tement.

L'eneemble dee eyetemee d6crite eet le euivant z

/ comme exemplee d'edltion automatique d'index

- OLPI (On-Llne Phrase Input) - Chemlcal Abetracte Service - NEPHIS (NEsted PHraee Indexing System) -")Dnivereity of Weetern - Belational indexing -JOntario

- PRECIS (PREeerved Context Indexing Syetem) - Britieh Library

/ comme exemplee de eyetemee exigeant 1'introduction de deecrlptione 61aboreee (utilieation d'un m6talangage)

- SATIN 1 - Dnit6 de recherche Analyee documentalre et calcul en arch6ologie. CNRS.

- TITDS II - Inetitut textile de France

/ comme exemplee et exp6rimentatione du traitement du texte int6gral

- SYNTAXEME - Direction dee Recherchee et Hoyene d'Essaie (DRME) - Systdme a 1'etude a 1'Inetitut national dee Sciences et Techni-

quee Nudeairee (IKSTK/CEA) et au Centre d»Informatique Juridi-que (CEDIJ)

- PIAFDOC (Programmee Interactife d'Analyee du Frangaie appliqu6e a la DOCumentation) — Dnivereite de Grenoble et Documentation frangaiee

- CONDOR - (fdmmunication in. Nattirlicher Sprache mit Dialog Orientierten Retrieval Systemen) - Societe Siemene

Page 10: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

II SITUATION DANS LA CHAINE DOCUMENTAIRE

0

Page 11: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

II SITUATION DES DIFFERENTS SYSTEMES RETENUS DANS LA CHAINE DOCUMENTAIRE

Lee Stiquettes 14^ plac6ee eur le sch6ma de la chalne documentaire qui suit, designent les diff6rents points 06 intervien-nent les eyetdmes decrits; il s*agit en particulier :

- de celui de la caract6rieation du contenu , oti lee eystemes aussi bien d*6dition automatique que de descriptions 6 l*aide d*un m6ta-langage 61abor6 r6clament un travail humain d'analyse et de deci-sion

- de celui des traitements k proprement parler automatiques de la langue, qui se font sur le mode conversationnel et oti souvent sont prevues des interruptions pour les nombreux cas (d"erreurs, d'ambi-guitee, de mote nouveaux & introduire, etc.) que doit r6eoudre, la encore, le documentaliete ou 1'analyete.

- de celui, qui eemble le plue performant maie n'eet que le r6eultat dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique

II semble resulter de cette rapide pr6sentation que la notion de "traitement automatique dee langues" ne se traduit encore que bien rarement - en eatier - dans la realit6 et que 1 'interven-tion humaine reete relativement pr6pond6rante.

Une 6volution se dessine cependant, car il y a une importante diff6rence entre le travail intellectuel que demande par exemple 1'indexation "traditionnelle" et les interventione de choix que r6clament les programmes; dane ce cae, une grande partie de 1'analyse est d6jA "dig6r6en par le systdme (mais la miee au point des program-mes est un travail tres lourd et tr6s cduteux).

Page 12: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

—jp*j-—"J*~ -Jb4cn

orndine1

--Btejfrqt JdMti-Si l^: Uijr.

.;'VT.e.pAfa.-Lfo \

. J—U ^51-1

i£_i dU-L

c/ Ocdcin e«Lita.Llrie-1--.:..-L..... —1 i ii i n 1 i ; i 1 i Oj/l ; gj[uL 4<&ti9lnr\4.ti£ g(«&

c T g ; g ; r .^_S / T7 O N>

Xi£is i>acr«M fewxs M, l , j i , 7 , , •

• i •' ' • i. ! • ' 1 £|NjRegt^RgH€WT g t T Rf t f rg - f fCNT

h f\l~B R l £<-

-TWlbffciHgyT'- mTFu.FgrqgL

«taurAct^rl ^q-bi or> dluL -conri. e,rva.iffc

-jX fc 6 N - X as. N

•• J i ii ii ; I ' I ! I l i

_daJraic^tejJ^dHb/o^ gp/> fcjBU /) ct

* e.ondan &a.-iibr\ * e. la. ejKf^/carti o h i inidDca^on

4 -1-

- L -

P-ti-U

lJ>jP^U!HjgltfTS - r r •

STdcicQQg; gr r^ ft iTB-M tWTS ^gS ^ > JNfQR H *rp-f OfVS C rea^ion dl«. ^i thVoxi. •tou.vKj^Ha ti -Vbui orts

ions

g j ) /T / QN g~T D lPPUS/QN

- X n ol «.>L

« B> w. I i«_-h' A s.

RttkercU >«ffar4ipt> Mr|rO&- acledtive

eZ.«L. ptc#ite. L^ihrjocOwftiflK

y

Page 13: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

EDITION AUTOMATIQUE D1INDEX

Page 14: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

III EXEMPLES DE SYSTEMES D'EDITION AUTOMATIQUE D'INDEX PERMUTES

Les infonnations reqejuilliee ont perais de receneer quatre eyetemee vieant A 1•edition automatique d'index permut6e et necee-eitant une prdsentation plue ou moine compliqu6e dee donn6ee d1en-tr6e.

Les deux premiere, OLPI et NEPHIS, sont tree eimplee et ne font pratiquement pae intervenir de relations entre les termes & permuter.

Les deux suivants, RELATIONAL INDEXING et PRECIS, plus elaboree, utilieent une eerie d'indicateure de relations ou d'operateurs de rfile.

Lee pagee euivantee preeentent lee grande traite de cee systdmes; pour plue de precieion, chaque deecription eet compl6tee par des schimae et des exemples.

Page 15: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 7 -

III» 1 0 L P I (On-Line Phrase Input)

Ce systeme est mis en oeuvre, k titre exp6rimental, par le Chemical Abstracts Service, pour la generation dfindex "articulds1

A partir de phrases en langage naturel»

II est caract6ris6 par un processus de traitement interactif, qui fait intervenir un jeu de 12 fonctions et une suite d* "6crans programm6s", chaque ecran correspondant au choix, par 1'analyste, d»un mot ou d'un groupe de mots dans la phrase introduite.

Le seul type de relation, ou plutdt d'inclusion, qui est pr6vu par le systeme est celui aboutissant a la cr6ation de specifiques d*un terme alors qu'ils n'apparaissent pas dans la phrase initiale (cf les ecrans 5 ®t 6 de la page suivante).

L'exp6rience decrite proposait deux types de procedures :

— soit le systdme propose 6. 1'analyste une suite d'ecrans sur lesquels il ddsigne le ou les mots a s61ectionn.er comme entrdes (voir l'ensemble des schemas de la page suivante)

* soit il propose lui-mime une serie de mots "candidats", que 1'analyste accepte ou refuse ou modifie, par 1'intermediaire d'un

"Scran. de transaction".

La seconde procidure n'aboutit pae exactement aux mftmes resultats que lapremiere et nScessite encore quelques "ajuste-ments".

Le systeme est present6 comme satisfaisant du point de vue op6rationnel; une moyenne de 3»31 "eatrees" ont 6t6 g6n6r6es par phrase, 96,5 % d1entre elles 6tant conrid6r6es comme "acceptables".

Page 16: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

Un-Line Phrase Input ( Chemical Abstracts Service )

- 8 - 0 L P I

cX i*. ~f 5u.r C £-c raiix -4. ^ov- x*ul lt_ r>° ' f<t»n •#•>' o/i o-jjeyyaX^- ^

eCfitA FLAC HEADING

7MTI546X affscl of «odium Uiiocyuuta en (lycopioluu Mcnbon Ui

>2 3 4 1 6 7 «

Krachetl VDUCU*

9 10

HDC: | 3,4 |

NUM: Q

CLASS:

FLAG HE'ADING

7667SI46X

cffecl of aodium IhwcyaeaU on glycoprolemi eecrelion in I 2 S 4 3 6 7 8

trcchcal mucue 9 10

HDG: (T|

NUM.

CLASS:

tCTOM

choi* JLU.

/H ^

FLAG HEAMNG

76671546X cffecl of «odium Uuocjriula oo (lyeopraKuu socnboo in

1 2 3 4 1 6 7 8

Inchcal muciu 9 10

HDG: [fi>]

NUM.

CLASS:

^cnviA cte.s. K'SU.G Va.4-^ C^orrCS.potndaLrft q ^

RESULTS

7667S546X

effecl of sodium (hiocyanaU on glycoproictna aacraltof» bi trachcal mucui

Sodium thlocyanale gtycoproleuu aecreUoe in tracheal mucua tn relalioe lo

Clycoproteina aecretioe, in tracheal mueua, aodwm Uuocyanale effect oa

Mueua tracheal, glycoprotalns secrebon ia, aodmm thtocyanate

effect on

£rvWc. de. •Vft-fnrve.s. s apporeu&gaw"t" poc ihi^ial "fv /n*v o fofSL*. d* " jorv t >" *>£ "

SURROGATE

76678546X •ffect of eodium titiocyanale oo glycoproteuix ecrdie* m

1 2 3 4 5 6 1 t

tracbcal mucua 9 10

CTH: GLYCOPROTEINS

SURROGATE: lAwdnul

NUM: Q

HEADING WORD NUMBERS: 6

X SURROGATE

7667854X

effecl of lodium Ihiocyanate oe ghrcoproteina aeoition in 1 2 3 4 5 6 7 8

tracheal mucua 9 10

CTH: GLYCOPROTEINS

SURROGATE: |GLYCOPHORINS|

NUM:

HEADING WORD NUMBERS: 6

•eorBLiA. ciin. re&oL.C.V-a."U. C*>rrtt \

RESULTS

7667854X «ffcct of aodium thioqranau on glycoproleuia aecretioe in

tracheal mucua

Avidin» aecrction, in Iracheal mucua, aodiuie Ihiocyanale effecl on

Glycophonns woetion, in tracheil mucui, aodium thiocyanate «ffect on

Page 17: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 9 -

III» 2 N E P H I S (NEsted PHrase Indexing System)

Ce systeme» mis au point & VUniversity of Western Ontario. M

vise a la froduction d'une indexation permut6e par matidres assis-tee par ordinateur". II permet aussi bien la permutation de phrases courtes (titres) que celles d'ensembles plus longs (par exemple des notices compldtes).

Dans ce systdme, le jeu dee relations entre les mots ou grou-pes de mote est exprime par des emboitements euccessifs, que diri-gent quatre fonctions de commande (utilieation des caracteres spe-ciaux suivante : < ^ (O )» Les mots ou groupes de mots sont alors remplaces par un tiret dans les differentes permutations.

Les caracteres speciaux ? et (® marquent les chalnes de caractSres (en particulier les prepositions et les d6buts de phrases non aignificatifs) qu'il convient ou non de permuter et d'6diter, selon les cas.

On. verra, dans le sch6ma de la page suivante, deux eacemples de prdsentation des textes & permuter, avec en regard les permutations obtenues.

II est pr6vu, dans une exploitation ult6rieure du systdme en mode conversationnel, de regrouper les "entrees" par tStes de c&apitre.

Pourvu que l'on evite d'employer des verbes, que l'on utilise de pr6f6rence des substantifs et des pr6positions ainsi que, si possible, un vocabulaire contrSle, ce systdme est pr6sent6 comme permettant d'assurer, en des permutations 616gantes, la des-cription de sujets compliqu6e - et cela k un coflt trds raisonnable (en place et en temps de traitement).

Page 18: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 10 - N E P H I S

t x e m p l e d a . p r tSp r>^a~) i pErp"ifc"kiu4iOA<» r>c re.«-«* p*-r |e pro^n-r*r*e-cko- l<it- pkmsc- d ;

Teaching of Information Science at University of Strathclyde

Teaching of <Information Science> at <University of<Strathclyde» \ lnformation Science, Teaching of-at University of

Strathclyde

University of Strathclyde. Teaching of Information Science at—

Sirathclyde, Uniyersity of-. Teaching of Information Science at-

Computer Analysis of Library Postcards (CALP)?/ <@Norman D <Stevens»?. - in -CJournal? of the <American Society for Information Science> 25 (1974), 332>?: <Humour? on <@Analysis? of <Postcards? Depicting <Libraries?. Depictions — »? by <Computers»?: >

-pe.«" fv o a lo"l e rx v e.

\ raX"ie /wG-a"V eL uwe^ r>o4r c«2_ C^r^pUij

Computer Analysis of Libraiy Postcards (CALP)/ Norman D Stevens. - in Journal of the American Society for Infoimation Science 25 (1974), 332: Humour on Analysis of Postcards Depicting Libraries by Computers

Stevens. Norman D Computer Analysis of Libraiy Postcards (CALP). - in Journal of the American Society for Information Science 25 (1974), 332: Humour on An^lysis of Postcards Depicting Libraries by Computers

American Society for Information Science. Jour-nal 25 (1974), 332. Computer Analysis of Library Postcards (CALP)/ Norman D Stevens: Humour on Analysis of Postcards Depicting Libraries by Computers

Computers. Analysis of Postcards Depicting Libraries. Humour: Computer Analysis of Library Postcards (CALP)/ Norman D Stevens. —in Journal of the American Society for Infor-mation Science 25 (1974), 332

Humour on Analysis of Postcards Depicting Libraries by Computers: Computer Analysis of Library Postcards (CALP)/ Norman D Stevens.

in JournaJ of the American Society for Infor-mation Science 25 (1974), 332

Libraries. Depictions-Postcards. Analysis by Computers. Humour: Computer Analysis of Library Postcards (CALP)/ Norman D Stevens. —in Journal of the American Society for Infor-mation Science 25 (1974), 332

Joumal of the American Society for Information Science 25 (1974), 332. Computer Analysis of Libraiy Postcards (CALP)/ Norman D Stevens: Humour on Analysis of Postcards Depicting Libraries by Computers

Postcards Depicting Libraries. Anaiysis by Com-puters. Humour: Computer Analysis of Library nos*cardj (CALP)/ Norman D Strvens. — in Jour-nal of the American Society for Information Science 25 (1974), 332

Page 19: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

11 -

III. 3 RELATIONAL INDEXINQ SYSTEM

C'est egalement a 1•Dnlverslty of Western Ontarlo que ce systeme a 6te exp6rlment6, eur 1000 pule 3000 abstracts i 11 tente d•introdulre les m6canismes de la "psychologie de la pensee" dans 1 *expression de relations entre les sujets et se base sur des combinaisons par paires de mots ou groupes de mots, selon neuf "categories de relation", associees k neuf op6rateurs.

Ces relations peuvent 8tre repr6sent6es dans des diagrammes a deux dimensions, oii l'on observe des "directions" (de haut en bas et de gauche a droite) signlfiant que le mot du bas ou de droite est eubordonni k celui du haut ou de gauche.

Ces diagrammes prdsentent une analogie avec les formules des structures de composants en chimie organique et peuvent, comme elles, 8tre transcrites dans une "table de connection".

Cette operation - qui paralt relativement compliqu6e - est ensuite traduite eii "format d'entr6e" (dont on trouvera un exemple A la page suivante).

Les signee de relation sont remplaces, A l'6dition, par des pr6positions ou des phrasee pr6positionnelles.

Les auteurs assurent que cette m6thode de representation des relations n'entra£ne pas de distorsions de sens lors des per-mutations.

Page 20: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

( University of Western Ontario ) - 12 - RELATIONAL INDEXING

LtS^g- gV i 4* C^*^1 °A

COL~V tl R>A-v cAe. rc. l O- 4^' o A •.

Awaxeness Temporary Asiociaiion

Fixed Association

Concurrent ie Concunent

/* Self-activity

/; Association

Not distinct /=

Equivalence b Dimensional

/( Appurtenance

Distinct /) Distinctness

/-Action

/: Functional dependencc

\»dt>cc- :

"A proposal that copying for research should not be an infringement of copyright of docu-ments from projects supported by the government of the U.S.A " (J. Amer. Soc. lnf. Sci., 1974,23, 145).

Uu r O A yvu. rwe rf

/o /* /: 1 4 7 /= /+ /(

"> 5 8 /) /- /: 3 6 9

Po rfwo-1^ d '•

D i Q - e . c o r r C - g y ^ r o t c x y \ ' ( : • .

Research /;

Projects I: Documents /- Copying /; Proposal A /; F

Supporting Copyrighl /- Infringement /1

U.S.A. /( Government

n= v= v= v= v=

V: V: V =

V: V:

V: W: W: W: .6

W

R w w 6 w

251^5 1 :2 1 1 1 2 1 d •1 1

s=projects s=supported s=government s=USA s=documents s=copying s=res=arch s=infringement s=copyright

=7 =6 =9 :=4 =6

P=* r=7;p=*;w=2 r=7 P=*;w=3 r=8 l=l;w=^ W=1 r=9;i=i;w=5 r=6 l=l;w=6 w=7 r=7;p=for;1 r=ll ;w=8 r=6 ;p=of;w=8 w=5 ;r=7;1=1;w=9 p=: ;r=7;w=10

Governnent _ of OSA suppocted projects. : ddcuments

cepyin<) fo< ces»<krch not as lnfrin$e*eAt 6f ee»YCilht s pcepoaal. 25145

Page 21: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 13

III. 4 P R E C I S (PREserved Context Indexing System)

Ce eystdoe, mis au point dans le cadre de 1'automatisation de 1'index par matidres de la British national blbllography, est 6galement bas6 sur une indexation cod6e a l*entr6e, suivie de l'6di-tion par ordinateur. II a 6t6 experimenti par le D6partement dee Arts et Spectacles de la Bibliothdque nationale (1) et dans le cadre d*EUDISED pour la constitution d'un corpus commun de mat6riels audio-visuele (2),

II est original par la methode d'analyse du sujet qu'il intro-duit, ainsi que par ses composantes : eemantique (thesaurus) et eyntaxique (operateurs de rdle ou de fonction).

L'observation d'une correlation entre ces opirateurs, 6num6r6e toujoure dane le m8me ordre, et lee "cas profonds" de la langue de d6part,qu'il eet possible de consid6rer comme des "universele lin— guietiquee" (2), a amen6 d'une part 1'extension du systdme a d*autree languee europ6ennee (allemand, franqaie, danois, polonaie en parti-culier) et, de 1'autre, l*6tude de eon "potentiel translinguieti- -que"(3),

La page euivante donne deux exemplee de preeentation dee cha£nage d'entr6e et des permutatione correspondantee, ainei que la liste des op6rateurs de r6le.

Ce systeme est le seul parmi ceux retenus qui non seulement fasse appel a un thesaurus mais #ncore contribue & l'61aboration de celui-ci puisqu'il augmente au fur et a mesure que des termes nouveaux sont rencontr6e et retenus.

(1) cf FERRIER (2) cf S0REKSEN (3) cf VERDIER, AUSTIN - On entend "tranelinguietique" dans le sene

euivant :"commutation de chaines d'entree de termee dane une langue eource en chaines 6quivalentee dane une langue cible differente".

Page 22: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

14 -

Ger6 par un processus independant, le thesaurue admet lee troie relatione d*6quivalence, generique et aeeociative; lee ren-voie correepondant a un terme sont reproduite automatiquement dane 1'index si ce terme figure dans un chainage d'entr6e.

PRECIS repr6eente eans doute le eyetdme le plue prometteur dane le domaine de l'6dition automatique d'index. II eet proche, par 1 *elaboration qu'il exige dee donnees d*entr6e, dee eyetemee plue complete qui vont Btre decrits dans le chapitre euivant; mais on pourrait peut-etre regretter qu'il se limite i 1'edition auto-matique et n^volue pas vers dee traitemente plue 61abor6s.

Page 23: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

PREserved Context Indexing System ( British Library. London )

- 15 - P R E C I S

CUth t B A e zx4- r e ' e . ;

1) Oroenlaad

2) Sq>loration fiv par de

3) BaamuBBen, knud

Pe. r o\u4 a.+1* o A O JP«' rr'«-S. •.

aROSHUMD Exploration par BaamuBBen, Knud

KXPIOHATION. Oroenland par R&smueBen, Kiud

RASMUSSEN, KNUD

Bxploration du Croenland

d j . S f f i C A/Jt Ai

(1) thcatrc (p) actcur (p) jcu dc 1'acteur (2) cnscigncmcnt $w du (s) role §v de 1' $w dans I' (3) improvisation

THEATSE

d<? , aCteUr- Ensdgnernent- R6Ie de 1'improvisation. ACTEUK. 1 hiatre

Jcu de !'acteur- Enscigncment. R6!e de 1'improvisation JKI DE l ACTEtfR. Theatre.

Enseignemcnt. Rolc dc 1'improvisation. IMPROVISATION". TlltitrC

IMe dans rcnsrignement du jtu de 1'acteur.

c|. AF 11

LISTE DES OP6RATEURS DE ROLE

OpfiRATEURS PRINCIPAUX

Environncment du aysteme observe Systeme observi (Opirateurs de base)

A

0 Lieu 1 £liment-cl< : objet d'une action transi-

tive; agent d'une action intransitive 2 Action/Effet 3 Agent d'une action transitive; Aspccts;

Facteurs

Donn<es se rapportant a 1'observateur Exemple choisi

Prfsentation des donnies

OP6RATEURS INTERPOS6S £l<ments dipendants

Relations entre concepts

Concepts coordonnis st

4 Point de vue 5 £chantillonnage de population/R<gion

<tudi<e 6 Public/Forme

p Partie/Propri<t< q Membre d'un groupe quasi-g<ncrique r Ensemble • D<finisseur de role t association due a 1'auteur g concept coordonne

OP£RATEURS DIFFERENCIATEURS (prefixes par $)

CONNECTEURS (£l<ments de locutions dc liaison prifi-xes par $)

c.

h Differenciateur de 1" niveau n'appa-raissant pas en vedctte

i Diffcrenciateur de i,r niveau appa-• raissant en vedette

j Differenciateur mis en <vidcnce k Differenciateur dc nieme niveau n'ap-

paraissant pas en vedette m Differenciateur de nieme nive.iu appa-

raissant en vedcttc n Differenciateur entrc parcnthcses n'ap-

paraissant pas cn vedette 0 Differenciateur entre parentheses appa-

raissant en vedctte d Date

v terme de descente w terme de rcmont<e

LlENS ENTRE THfeMES * 1" <Kment d'un thime coordonn< y <Kment consccutif d'un theme coor-

donn< x Oement d'un thime commun

Page 24: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

SYSTEMES UTILISANT UN METALANGAGE

Page 25: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 16 -

I* KEMFLIS DE SYSTEMES NECESSITABT UNE DESCRIPTION ELABOREE DES INFORMATIONS (UTILISATION D'UN HETiLANGASE)

Lee «yettoee dicrite pr6c6d«uaeat pourraient itre conei-d6r6a cosee marginaax p*r rapport aux eyetAmes documentairee automatie6e, dane la meeure oii ile ne eont pae congua pour permet-tre le etockage et le traitement dee informatione en vue de la recherche* ce que r6alieent lee deux eyetdmee dont la pr6eentation euit.

•ffet», SATIN 1 et TITUS II eont dee eystdmee complete pemettent, par la fineeee et l'61aboration - en particulier lin-guietique - dee donn6ee d'entr6e, d'aboutir A dee traitemente et * dee produite tr6a divereifi6e.

I IV. 1 LB SYSTEME SATIN 1

II eet extrftmement difficile de tenter de r6eumer le contenu trAe d6taill6 dee deux volumee d6crivant le syetdme documen-taire SATIN 1.

Deox artidee, cependant, ee coneacrent au point central de la deecription des donn6ee, tandie qu'un troieidme expoee le d6tail d'une application dane le domaine biologique (1).

Le logiciel SATIN 1, mie au point dane le cadre du CNRS par l'Unit6 de recherche Analyee documentaire et calcul en arch6ologie

(1) voir la bibliographie

Page 26: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

17

de Mareellle, 6galeaent utilia6 par le Centre de documentation. pour 1'urbanisae, e»6tend au domaine agronomique (IKRA : recherchea eur lea nimatodee) et parait particulidrwaent adaptt A dee centree documentairee trte ep6cjalie6e et orient6e vere la recherche»

En effet» eee caract6rletiquee principalee eont de permettre une repr6eentation trde fine de divereee popmlatione de "documente" (textee, enqufttee» objete, etc«) et de fournir en eortie, outre lee poeeibillt6e habituellee de recherche docuoentaire, dee pro~ dulte euppl6m ntairee facilitant 1'interprdtation dee r6eultate (tableanx eynoptiquee ».») ou repr6eentant dee r6eultata interm6-diairee pour de nouveaux traitemente (calcule etatietiquee, trie, trac6e,.»).

ajet6me eet bae6 eur un langage documentaire compoe6 d'un vocabulaire tr*e etructur6 et d'une eyntaxe. Lee informatione d^eatrte* ou "documente" (1), eont d6critee en deux partiee dietinc-tee (th6matique et deecr(ptive) qui gouvernent 6galement deux typee de phraeee ( voir p. 2 dee ech6mae)i

- lee phraeee de "type texte",. qui regroupent lee informatione d'idemtification (auteur, titre,etc.) et de tjpe th6matique et dontlee 616mente eont appel6e dee "CHAMPS".

exemple de phraee de type texte t <code verbe> <champ 2>».., <ehamp n>

"* lee Phraeee de «type deecripteur» qui font plue particuli6rement r6f6rence A 1« "analyee deecriptive11 et dont lee 616mente eont appel6e dee "DESCHIPTEDHS"

exemple de phraee de type deecripteur t <code verbe> <chalne deecriptive 1> <chaine deecriptive n>

(1) Ub "document" eet 1'eneeable dee informationa organie6ee Jug6ee pertinentee pour repr6eenter une ou plueieure unit6e phyeiquee (cf. 1'article paru dane Automatieme - voir aueei p. 1 dee ech6mae)

Page 27: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

18 -

i i LELBCIQDB

L« lexlque correepondani eet form* de «taMgorlee lexlcalea d6elgn6ea par deeteraea appelis "VBRBES", et qul peuvent introdulre les deux types de phrases.

Cependant» seules lee catdgoriee de type "DESCRIPTEUR'% qul peuvent 8tre hi6rarchle6es (en des arboresceaces allant Jusqu'A 30 •Iwaux) ou non M6rarchie6es (expri»6es Un6airement), eont enr6-glstr6es dans le eyetdme et exploit6es (voir p. 3 des sch6mas). ***** 4 chaque Uescripteur" est assocl6 on "nomhre nlveau" et un code num6rique.

Lss 616ments dessfcructures hl6rarchls6es ont entre eux un certaln aomhre ds relatione (g6n6rique/sp6ciflque, appartenance A «t nlvean» contignlt^* succeeslon); les structures peuvent Stre explor6ee A l*alde d'op6rateurs lexicaux coame "CHBtlNBCENT ASCEN-

4HT ou "DBSCfflDANT"* tandle que l*op6rateur "COINCIDENCE" lnter-dlt ce type ds eonsultatlon du lexlque.

LA SYNTAXE

rslatione lyntaxlqu,. .atr. l.e d.icrlpt.ur. eoat t,tU" 4 .11.. peuv.nt Str. orl«t4.. 0« «on. .t

cMprmdr. oe aoa ua ladlcatmr d. llalron.

1« d.acrlpt.ura, «tla, p«T«t Itr. e«-.et«rie*. p„ «l~r. (m«r. .«.«Uqu.. cla.Be. w.. xiques) ou les quantifient (valeurs alg6brlquee).

1. »y»t*«. «*a*r., par appllc.tlon d. r6gl.e d. trroefor-"tV: "4<,CU"nt" tiMl "« 1« d«x typ.e d, phraa.a:

»®SCRIWHm. 4 partlr du l«lqu. ,t d.e ralatlon. ayntati-<!«••. II op*re, 4 1'enrigletre.ent, «a. analye. auto.atlqu» d. 1.

Page 28: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

• 19 -

aj&taxe du mttalangege* qui entralne le rejet de tout document coaportant une erreur.

Lee traitenente aboutlaeeat A dee fichlere de recherche, th6oa-tlque et deeerlptif» euxquele on peut acc6der eoit globalement eoit partiellraent (entr6e etatique ou dynamique)• La coneultation ee feit au moyen d'un langage d'interrogatioa qui permet de manipuler dee opdrateurs logiquee (6 typee d»op6ratenre boo!6eee), de compa-raieoa (5 typee drop6ratione), lexiceux ( cheminement et colncidence) et ep6ciflque (op6rateur MBM t identit6 entre lee claeeee eynta-xiquee)*

Cet eeeei de deecription» trde rapide, du lexlque et de la eyntaxe qui r6gleeent le »6talangage du eyet*me SATIK 1> doane uae id6e de la complexit6 d'61aboration A la foie dee outile eux-m8mee et dee informatione d•entr6e.

Ce dernier travail eet pr6eent6 comme "lourd" et NfaetidieuxN

per lee ohercheure qui oat appliqu6 le eyat6me A l'6tude dee n6ma-todee (1).

Ile pr6deent que SATIN 1 demande une "connaieeance trda fine du corpue de donn6ee que l«on eouhaite analyeer" et que eon appren-tieeage eet Nloatf*et Nd61icatN.

Ile conaiddrent tontefoie que Nc'eet un produit adapt6 A une recherche bien d6limit6eN.

(1) cf. 1'article de BRANCA-LACOMBE et TOMASSONB eur la conetitu-tion d*une banque de donneee en biologie.

Page 29: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

SATIN

Les grandes fonctions du systeme SATIN 1

Lletes / ILexJ

SATIN Cr6atlon iu lexlquc

exique en TLN

uestion-naire

Lexique rableaux 6^»^—

Borde reaux d'ana lyse

SATIN Modules d1ln-terrogation et de mise 1 jour

Codes escrip teurs

arti tions tati-g

ocumenls n TLN

Documents en T.L.N.

Documents cod6s

Creatlon et mise i jour

T R A I T E M E N T S

U L T E

SATIN Cr6ation Fich.Doc.

1 Etat I d'er-Lreurs - 1 1 Etat I d'er-Lreurs

Fictlrseffond

^"TtN du rccKittl J

Ronecu-V^

Th6mati Partie hgmatlqui

rUiu^lt. di<> «1» |vC4u~Wo»• CLL p»rV>»- p^Vi(L- :

1 + Groupe-pression 2 Groupc volontaire voisinage 3 + Adroport national 4 Bruit 5 Adroport de Toussus le Noble

= 5 = 3 = 3

Organisation du document Cu\- CHAUhiea ^ ->1

Page 30: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 21 - SATIN 1

RSgles de traneformation de la ggnSration d'un document

( portie themotique ) ( porlit descriptivt ] ( Teite ) ( Otscription )

t-li'cu.(<x"f i ons

i ol M.IX.

( merqut fin dr 4*6 ) cl oc.a(Htwf

ViffrVncr '4I2S (<««ript»n) type tette)

I

t t Himent element termmol terminol phrote phrosc rfference type teite t?pe t«te

drseripteur)

element element lerminol ttrmmol phrose phrose refertnce typt typ' destripteur dtscripteur

$4fUcA«(dL^OA A.CV l*^|o ()Vvft.^l'oKt cXc&i^j uia. ** jcu-iw * *.

'hfase r6f*rence de type texte> : .

l4e verbe 100 chalne textuelle>

o*te> t- phrase de type te*te> I

hrase de type text£<text£ (VfR0S)

hrase r6f#rence de typ. describteur^ .. de verbe 100<chatne>

- - - *

eecrlption> «•

hrase de type descrlpteur> |

hrase de type descripteur^descrlption >

ortie th6matlque> >>

Nrase r6f6rence de type texte^ j hreee r6f6rence de type texte> <text^

FIN

cl. Beweeuy i ' CHtlA/kfiti

*-• < Phraae tvne texte ) ..

cwroe)^//'^fCHiwe Temeut>Ivl:

cof«*t lexnieue ete»«e*r4«e i

CCMW)

~' c. *,

c cxeiHg remetu » CNW6R0 )

coos weee vauw OO «PCnfic OB e"MU> vwweesa. comarogt

( Phrase type deacripteur )

(CH6INE )

( CHAINE DESCRIPTIVE )

(LI5TE SYNTAXIOUE 1 (DESCRIPTEUR)

(COMPOSANTE^^YNTAXIOUE I

CCH4WE )

( CROUPE) (CLASSE 1) (CLASSE 2)

Codc VMf Voltur du Numere Voleur dtstr,pttur de de le

Volrur dt lc

artie descrlptlve «.

hrese rfiffirence de type descripteur^ I

riffirence de tvoe . v ype descripteur>^iescriptioA

irque de fln de document >i« FIN»

. I t-juAe dv CXP z)»u U. lo^utli

Page 31: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

SATIN 1-3

BAXOD CAPOT PIGOBBOLLBS

LIBU-DIT ^ LA BACHASSE (verbe)

% x LE TOLONET

\

\ X SAINT-LOUP \ • • • • • • • • \

exemple de cat6gorie non hierarchisee

CMou<e*6)wi ,> e.yu-ltru-»! , M. I

aemmua. G*rh*) o

MMM »

30, •KLASTICrT® wun

TECWit«V <ttn» IKNW «wt f-aMwe

LR»TT «L ** PREDALW <&* .SOR4<«. •.

w,|ewtw«a», -weei 3oj-mmvi*tan»r

— Jucrtpicur» fftr CoftnAmr A* MihonWt •

exemple de categorie hierarchisee

— OSVP : 6dltion de rttorencea pour les documente per-tinenta Issus d'une recherche;

— CPTG : comptage des documente pertlnents ; — GRIL : cr6ation d une TABLE SYNOPTIOUE et 6dltlon

des r£f6rences assoclties 6 un thfeme de re-cherches;

— CPTH : comptage des documents s6lectlonn6s sur un thftme;

— IDEX : 6dition de r6f6rences sous forme d'un index hi6rarchis6 ;

— FREF : 6dition de r6f6rences sans recherche pr6a-lable ;

— EXTR : extractlon de descrlpteurs ou de valeurs alg6-briques avec 6dltlon des r6f6rences ;

— EXTG : extractlon de descripteurs ou de valeurs alg6-briques sans 6dltlon des r6f6rences ;

: comptage des documents pertlnents et sauve-garde d'un flchler permettant de retrouver ces documents lors d'une utlllsatlon ult6rieure;

Page 32: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 23

IV» 2 LE SISTBCE TITUS II

HOTS ii, mod61e de deux±4»e gtoAratlon, apporte * l»a«to-eaUeatlon d»un ayetAme claeelque (deecrition par mote-cl6e et recherehe) dee poealhilit6a nouvellee duee & Vutilieation d*un

a»ea»«»t«lr. canonl^n." (LDC), «n pettouller l'lBd«attoB

•t 1« trwluettoa eutomatttue». II pemet «uleaeut uee codlfication sptdflqu. poUTant aboutir * 1. crt.tlon d'i» banqu. de do«n*e. num6riquee»

Le LDC eet baa6 eur la conetatation qu«une douzaine de etruc-turee de phraeee peuvent couvrir un grand nombre de r*eum6e analy-tlquem dane une diecipline donnfte, ecientifique ou technique.

Aimoi» lee rAeumte qui eervent de donn6ee d'entr6e au eyettoe TOt Stre r6dig6e eelon dee etructuree etandarde, que lee analyetee »o»t emen6e A "remplir" de note-cl6e et de aote-outile. Lee mote-cl6e eont reconnue automaUquement par l»ordinateur (an moment de la fueion avec la baee dee donn6ee d'entr6e valid6ee), ce qui correepond A la phaee d•indexation automatique, qui 8'accoapagne

prooeaeue de Pond6ration, de param6trage et de chainage.

Le documenteire eet conetitu6 d»une ,6rie de leziquee *n * laagu®a> «inei que d*une eyntaxe, qui eont codifi6e en un "l«Bgage-plivot» deetin6 A faciliter lee proc6duree de la traduction autom.tlque.

C'..t .n o. l«,gag.-pl,ot (o« eneore lMg„. int.ra.) eont oond.n.«.e, .. .ff.t, l.e phra... d'«tr*., qu'.ll.. .„ fPea.

ell«e.d ou «pagnol, ,,r*. d.. optratlona d. conaul-tattou de. dictionnairee et d'analy.. eyntaxlqu. ,»ere™*.,.

Te trl4ttctaur «to.attqu. de aorti. r.oon.tttu. p„ 1. eti.t. 1.. .truetur.e de pbra... correepondant * la langu. d*«4r*., 4 V ^4* <"»= eyntaxiqu. .t d. «rauwir.. pro-greni*e. ( Tolr 1'organlgrame. de TITDS II eur 1. Mh*a. ,. l).

Page 33: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

Lee lexlquea eoapreanent dea "deecrlpteure", dea "non-dee-crlpteura" (deatlnAa d r6duire lee polyedmlaa) et dee aote-outile, 1'eneeable foraant une euite d« "unit6e lexicalee", aveo l'enr6-gLetremeat de la caract6rieation de leure formee eingulier et pluriel et UBI "eode article" correepondant aux valeure eyntaxiquee que peut avoir le aot dane la phraae (1).

iex deacripteure - mote ou groupee de mote - ee trouvent 6ga-lement aaeooifte» eur l'axe paradigmatique, dee "mote de voiainage".

Lee "eyatagiee etandarde" (au nombre d'une quinzaine) eont compoe6e de 2 A 4 "groupea syntagmatiquee" et co*tiennent deux "acta&ta"» qui eont dee pr6poeitione ou dee locutione pr6poeitivee (au nombre de 33). Lee diff6rentee cwgbjnaieone poeajblee donnent un 6TentaJLl de 530 etructuree de phraeee diff6rentee»

La eyntaze eet introduite au niveau de l*Unit6 lexicale, qui comprend troie zonea t AR pour le code artiele» NB pour le pluriel et LX pour la valeur gramaaticale du. mot euivaitt,

Ce ayetAae n6ceeelte, comme le pr6c6dent, la r6daction tr*e rigoureuee de bordereaux d*analyee» Cependant 1•introductioa dee inforaatione peut ae faire par carte perfor6e ou par 6cran

cathodique» avec contrOle et correotion en tempe r6el»

Le traitement dee informatione aboutit A la conetitution de fichiere invere6e auxquele on peut acc6der par 7 options de e61ectlon diff6tentee»

Diff6rente produite de eortie caract6rieent enfin ce eyetAme documentaire, qui a 1 'avantage d»Stre op6rationnel» y comprie eur le plan international, gr&ce A aa dimeneion multilingue.

Une vereion TITUS IV (2) doit rendre poeaible la recherehe en texte libre et ee rapprocher, dans ea langue d»imdexation et de condensationk le plue poeaible de la langue naturelle,

(1) voir p.l du ech6ma (2) cf le compte rendu d*une comemnication faite par J.M. Ducrot

au*Deutecher Dokumentarverlag 1977 paru dane Nachrichten fur Dokumentatlon» 28» 1977» n® 6 p. 226 ' —

Page 34: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

Traitement de 1 *Information Textile Universelle et Selective

[nstitut textile de Frerace - 25 - TITUS II

Qrga-A; raLiKiKft. dL*. T«TU& m

»'flsr*l hweeer Bife.ot WMotr

ea eic-r

I |er$W6,w»t

S4r»cHu.r* du rmot «.w LBC.

liW | mm tf»icw.t fat) l*Ld fl« » ced« »r#«'ele 0«. ^rfiur $•«*.«d.<'«.4r

• u. Ho4- o«l(f

N K 9 C , a * " • • » - « » ' « e « . , » ( « r i » | «r Ce** f •wc-Wen «4« «i •)«.«. «At C'Ui.

ini <»»4 « LDC : dfeaiMiffatre ,

Cpiv>p*t'i4ioft <rf«»-w<*«•*.£.

c^. ai«OFt

f K«n*yL* ^'VP fNiiio»t a.u.4eo"Aei (*__ Prt<. a«Tc. ^.Oyfom Cj »

L.»t.fa**L «a^ iff, GSA cse lAtff»-

f 6SC f 6S» *cr*rr Acmer n*« y«miw*

CS s flrewF® «yntafwaWqua A»,At,D«s U»H4s Imticalra (ui)

-SLiti ) CT fB) MA V

Am#lioretlon de le teinture du Nylon FAR treltemente avec eolvents Am6Uoretlon.*telnture/»Nylon, treltement*.solvenf#-. < 6S* • • 05B » <—05 C p 4 6SD

ProcSdSe de flleture de 1« lelne fAR vole oneumetloue IVec turblne Proc6d6*.Flieture/*lninB. vole oneumetlque,turblne . *-***-> « CSB » 4 CSC •«-eso_> L" m6thode9 de ""'«tion M* cnuturp W,c dBS m s invlalbl,, »M6thodn*/confnctlon..couturn,»fll lnvlslble*. * -6SA QSC-» <- -G5D-

C^. *r^cte. fcUCRdT

Page 35: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

26 TITUS II- 2

£y.ai*§>U% p(a- phra-a«.«. TiTtf.S.

IXveloppement aax USA d*un ffl mixle polyester triacAate pour le tricotage des vttement» de noit 8UT 7 Ddveloppement » eux U.6A, un fil mlxte • polyeeter »

triac*tate, • trteetage. * vMement de nuit +

La p6riode actuelle n'est pas un phSnomfcne nouveau, en zone soudano-saharienne NES B * Pdriode actuelle, un ph6nom6ne nouveau, zone aoudano-

(®n) aaharienne

Les problfcmes de la tMumat dans 1'Afrique de FOuest SIM A * Problfcme +. * aAchereeae, * Afrique de 1'Oueet

(dana)

Etude du climat, de la pddologie et de ia v£g£tatkm en C6te-dlvoire. SIM B Etude, * cllmat ) * pddotogle ) • v*g6tation, C6te-d'lvoire

|. CIWtfVieR f (En) 6num6ration 6num6ratlon

<&«, sor-Me,.* <; «m' s <A ** ol»^(«US

60C.MH 40001 LA TFINVuftE CN MILIEII SOLVAMT _ U PMCEDE STX ua|D*]w7 ^^^''IVI-FASC.IOOS-P.SSIIOOOZP. )-OOfF|G.-VAL.00C.-2-VAL .SC1EMT.*3-FHAKE-

SLV7°,UR EFI'N5C^RN^5RNL'1 PRDT£T,E DT 11INTURE 6VEC SULVAW • SIX • [.£ fltOCC&C rfRflCI LA IflNIURl tAWS POLIUTI OH 0'EAU» bftTm^fnli ic fONTIWE DF RECUrEMTION CU SbLV*NT EVITE LA 6 mwuE l F ™™MTE D0 BAIMW TE INTORE.LA TECHMOUE *'* " «VIEM1 ET LA DUkfC l> • OPEkATl ON.

t?c2?HAl'^lT,DN " 6£ CVCRSIFICATIOW.LES RfiULTATS CES ESSAIS HOMTRENT LA ttUALlTE t>£ LA triu?D«cT,5 ,L ,TE 0E LA CO"«-EW.LA COMPOHTION DU BAIN t>E TEINTURE COHMNfc 1 MELANCE HOHOCENE C1ACENT DILUANT AVEt 1 ^V£NT.ET IES COLORAMTS.l SCHEHA OU fftOCEDE PONNE 1 EXWLE COUCERNANT LES TEINTURES 1>ES ROLYAMIOES.

MAROU.COMMERC.^STX FABR.= CILET-TH»0H_PR06IL_rH£

BOC.WR 4000£ LA TEINTURT FN HILIEU S0LV4NT _ LC PROC£OE STX ANGLAIS S0LV6NT PYELHFC - STX PFOCE&S

™?'u!?T'^Ei?!?l97',~'SS,?£ n<.1O03-F.527<000ZR.)-OO5F1G.-D0C.VAL.=2_SCIENT,VAL.=1_FRANCE_

I _ 1HE LNNOVAT|ON CONCERNS ONF SOLV£NT DYCIN& PROCESS »STX« THF C J . P U C E T J T P R O C E S S £ N A B L E S T H E D T F L N C W J 7 H D U T W A T E R P O L L U N O N .

•Irtf CONTINUOUS PROCtSS OF SOLVENT RECOVEFY AVOIDS THE ^rrlc^cl 5Nr°F ™E DYE ^™ "rOTAHTT.THE 7ECHN) OUE OECREASES THE COST PRICE ANP PROCFSSING TIHE.POSSIBILITIES OF mOHATION ANt> Dl VER Sl F ICAT I ON. THE RESOLTS OF TH£ TESTS SHOkJ THf UUflLlTV Of THf COLOR REPROOUCT IBILITr THE

!?NN°R J!SE ?YE M7H COMBINES ONE THINKER «OMOCfNCOUS rfofsss «•« "v» ss

TRAOE NFHt,=STX MANUFA C T . - 6 l LEL-THAON-PROGJL-FMC

Page 36: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

V SYSTEMES TRAITANT LE LANGAGE NATUREL

Page 37: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

27

f EXBCPLES DE SYSTEMES DE TRAITEMENT DES INFOBMATIONS EW LANQAGE NATOREL

Ceet surtout dane le domaine du traitement dee langaee uaturellee que ee d6veloppent actuelleaent recherohee et exp6rlmen-tatlome, oe que remd poeaLble l'6volutlon raplde de la teehnologle des ordlnateure (meilleuree capaclt6a de etookage et de traltement).

L*objeetlf de d6part estr dane cee eyetdmee;

m d*uae part» de falre l'6conomle du travail deanaly»e et d«indexa» tlon» puieque 1 *on fournlt 'A 1'ordlnateur, en langage naturel, la totallt6 dee textee 4 traiter» ce qul devrait entralner,

• 4'entre part, la dleparitlon dee dietoreione et du manque d*uni-formit6 dee amalyeee» dus en grande partie A la eubjectivlt6 de 1'lntervemtlon humaime (1).

H feut toutefoie remarquer que lee textee admle en entr6e •ont encore relatlvement courte et qu'11 e*aglt d*ailleure eouvent d*analyeee ou d*abetracte (ou de textee de d6plchee de preaee), ce qni elgnifieralt que «e eont eurtout le travail d*lndexation et eee lnconvdnlente que l«om 6vlte 4 l*heure actuelle.

La miee au point dee traltemente eorreepondante entrelae ce-penda&t dee inveetieseaente pr6alablee tr6e lmportante, pulequ *il faut, par dee programmee ad6quate, aeeortie d*une quantlt6 non

d °informatione e6mantiquee9 eyntaxlquee et grammatl-rendre 1 'ordinateur eapable d*effeetuer cee tSeh.ee, qui

(1) "Faieant lndexer le mSme texte par dee analystee dlff6rente, on conetate que le taux moyen de eoh6rence de 1'indexation ne d6paeee pae 50 %** cf. MANIEZ J.- Le B6le de la eyntexe dane lee eyetdmee de recher-

che documentaire.- Dljon: IUT Carrldree de l*information. 1976.- 2 vol.

Page 38: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

28

reeteat taiaongtent complexee.

L«0 ajetteee dont la deecrlptloa solt eont encore plue on BOlae ea phaee d»exp6rleantatioa; 11 eemhle que l'on puleee lee ceneld&per cease dee exeeplee de rtelleatlone faturee qul, lore-qu * ellee detlendront opiratioaaellei^ pourrost entrelner un uouveeu "bond ea avaat" dane le donalae dee Sdeacee de 1'Iafornatloi

T» 1 SYNTiXBCE

Ce eyetiae, qul ee baee sur lee thtorlee llnguletlquee dee graaaalree g6a6ratlve et traneforaatloanelle» veut dgaleaent lntro-dulre 1« "peychollnguletlque" et lee th6orlee loglquee relatlvee A la pr*euppoeltion.

floa ebjectif initial eet de eupprlmer 116tape d'lndexation dite MaanuelleM en effectuant un traiteaent direct de textee r6di-

fran^ale; il e'aglt en 1'occurence, pour lee deux exp6riencee dAcrltee (1)* de r6eua6e A caractdre eoientifique.

Lee traiteaente vieent A r6dulre le texte " A la deecrition de ea etracture profow/e"(2) au aoyen d'ua aaalyeeur aorphologique (exploration d*ua lexlque de foraee et d*uae table dee d6elnencee) et de diffdrentee op6ratione eyntaxlquee t analyee eyntaxique aboutleeant A dee deecriptione etructuralee» 6dition dee liaieone graaaaticalee unieeant lee teraee prle 2 A 2, chargeaeat de cee llaieone dane un fichier invere6.

Cependant» l*orlglnallt6 du eyetdme r6eide dane lee proc6duree de coneultatlon» en aode convereatlonnelt qui - eelon lee auteure -abontieeeat A 1* "exluelon totale du bruit docuaentalre" (J) j

(1) la lAre concerne un corpue reetreint de Jurleprudence (relatif A la filiatloa - cf. SOLET dane le eecond cae, 11 e'agit d'une recherche aen6e pour le coapte de la DRME - cf. STEHLIN(et ol la nature du corpue n'eet pae pr6cie6e]L

^ y a analogle avec lee "cae profonde" mle en 6vidence dane le eyeUae PRECIS ... (3) cf. SOLET

Page 39: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 29 -

•n fonctloa d'un "thdae" «n eatr*e, le syetAae g6n6re de» queetlone qul reprdeentent lee dlff6rentes dlrectlone poeelbleo de recherche (1 et qul aost dlrectwnent d6pendentea dee laforaatlone Int6gr6ee dan» le eyetdae (cf. 1'exeaple du ech6aa).

Lee anteure envleagent une 6volutlon de ce eyetdae dana le doaalne aultlllngue t posalblllt6 aultlllngae de consultatlon •t posalblllt6 de aultltraductlon de la r6ponee (cf. 5TEHLIN).

(1) Cetype de chealnement A 1'lnterrogatlon apparait 6galeaent dans le syetdae ARIANBf ale en oeuvre sur la banque de donn6es du CATBD (Centre d'asal8tance technlque et de documentatlon) dans le doaalne du bfttlment.

Page 40: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 50 -SYNTAXEME

Textc de» <nonc£s

Mtee «ur support Informatlque

Sortle : Enoncde tndexds • description etructurale dc chaque dnoncd

Sortle : Arboresccnce dc consultation pour thaque index

£ Analyseur

/^orrections^

Transformatcur

A Rchier

Gcndrotcur

Index

\ . \ \ \ \

\ X \ \

Compte rendu

—X1 7t

Comptc rendu

/ Locuteur

1/ compelent f (contrSle)

Liste index

Dessin de chaine du "noyau" de SYNTAXEME

Ce^. sotef

Exemple d'interrogation

wem.TI»»dos UMI WCMIIWME AVCC THESAUIHIS - CO-N) >M •wvsurvuez SOUMBTTRfi WOTRE REQUCTEwti >PAOMtICTES. 1 3*A0IT-IL 0'UNE «tOPRICTE THEHNTflUE 8 3'AGTT-IL 86 LA MWPRIETC 0»UNE F0N0CR1C S SMOIT-IL K LA PROPMCTC 0'WC SUSPBffSION • S'ACIT-IL DE Lfl WOMMETE D'UW HYbKUHE 5 S'AOIT-IL 0'UNE PROPRIETE AH60LO6I4UE 6 S*A0lT-tL D6 LA PROPMSTE 66 SOLjeCS 7 S'AOIT-IL D'UNE PR0PMET6 IMMUMOLOOIqUE 6 SMOTT-IL P'UNE PROPMETE MECANlOUE 5 S'AOIT-IL »E LA FHOFRieTE 06 »6CM<MW6S 10 S»AOTT-tL D*UNE MtOPRlSTE BONNE 41 S>AOIT-IL D*INFLUBMCER OES PROPAItTES 42 s»floiT-iL ee ul6Tuee 66 PROPMETES 43 S*AOIT-IL »E LA CAWACTERtSATlON »6 FKOMtlBTCS 14 S»A0TT-1L 0'U*E 66NN6E SUH 6E5 PftoNUBTfiS 4$ 5'AGIT-IL 0'UNE «ELATI0N 6NT>W OCS PAOPRICTES >5.

w«v FICHE N0 m 74020200 V0UL£Z-V6US L INPRESSIOM OE& FICHES RSTENUC3 - <0,N>

>0 Wi FtCHE NOf 74080300 ETUDIER LES DtFFERENTS FWWETRES INFLUEKANT LES fROFRIETES RHFOLOSItiUES OE LA SUSTOISION SAW8UINE. UOULE7-UOUS REVENER fl L ETAPE ANTERIEUR6 - <R> » OU EFFECTUER ONE WJTRE RECMERCHE - <0>N> 9 *> . VOULEZ-VOOS UME AECHEHCHE AVEC THESAUM6 - <0-N> CJ . STTHtitJ

Page 41: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

V» 2 LB SYOTBCB A L'ETPDB AP CEHTRE D'IWFOHKATIQUE JPRIDIfflE (CEDIc BT A L 'IWSTITOT HATIONAL DES SCIEWCES ET TECHHIfflES WUCL^TPttf

a»STN/ CBA)

Cest le groupe de recherehe en llnguletlque automatlque» dont lee travaux dane le domalne du tralteaent automatlque du langa-ee eont varl6e et nombreux (1)» qui a mie au point, en collaboration aveo le CBDIJr un eyetdme d'indezation automatique A partir du tezte iattgral,. dont une vereion est actuellement en d6aonetratlon A Saelay.

II a'agit de textea Juridiquee, eur leequele eont effectuSe des traitement linguietiquee et etatietiquee.

La m6thode propoe6e par le groupe (2) eoaprend la conetruction automatique d'un theeaurua et d'une liste de mote videe; le the-eenrue eet conetitu6 :

• **une liete de deecripteure (avec rtgpLee de reconnaieeance de 1 •homographie* lietee dee termee g6n6riquee, ep6dflqueet eyno-nsaee et parente» fonctione de poide eSmantique)

- d»un eyetdme de reconnaieeance 4ee mote conpoe6e.

tlfno s6rie de programmee d'analyee linguietique et etatietique ont 6t6 61abor6e,, comprenant t

/ uae analyee morphologique (elgnalant notamment les erreure typo-graphiquee)

/ une analyee eyntaxique (eyntaxe oonetruite automatiquement A partir d«uae m6thode d«apprentieeage) permettant de lever lee «*W.guIt6e greaaaticales, euivie de pro-ceeeue de filtrage de

aote graamaticalement videe.

(1) Je reaercie viveaent M. Andreeweky pour 1'eneemble dee docuaente qu'11 a trde aimablement accept6 de ae coaauniquer et dont ceux que d'al principalement utilie6e eont cit6e dane la partie bi-bliographlque.

(2) cf. la coamunication IRIA- ateller SESORI

Page 42: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 32 -

/ «u» «nelyee «tatletlque» avec recoBsaleeance dee homographlee, dee ejaoByaea» dee teraee g6n6rlquee et ep6olflquee et de la parent* etaastlque (traltMient de champa edmaatlquee partlele)

/ dee prograaaee de calcul de la fonctloa de polda e&nantlque.

Lee exp*rlencee nen6ee eur lee textee Jurldlques portent partlcullAreBeat eur 1'Indexatlon automatlque.

Lee queetlone eont poedee en langage naturel, eur 1» aode eOKtereationnel h et font apparaltre lee docuaente " par ordre de proxlalt* d6croleaante par rapport 4 la queetlon ".

D'antree exp6rlencee» aen6ea eur aa " corpue coneld6rable " (1), aa6nent lee auteure 4 la conclueloa que 1'lndexatlo» autoaa-tlque eet plue "eouple" et plue "objectlve11 que 1'ladexatloa aaauelle et qu1 elle donne dee r6poneee » daae la plupart dee caa aelllaure» que lee r6poneee aux eyet*aee ladexAe msuuiellement »,

(1) cf. note CBA-H-1795.

Page 43: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

ristltut National des Sclences et Technlques Nuclfeaires /CEA intre D'Informatique Juridique

- 33 -SYSTEME DE L*INSTN(CEA)/CEDIJ - ±

CENTRE

D'INFORMATIQUE JURIDIQUE

UfiE EOUIPE DE RECHERCHE:

? a r a 1 l e i e m e n t 8 1 ' e x p l o l t a t l o n d u $ y $ t 6 m e D O C I L I S q u ' 1 1 a c r 6 6 , 1 e C E D I J p o u r $ u 1 t $ e $ t r a v a u x d e r e c h e r c h e , t h e o r l q u e e t a p p ! 1 q u 6 e , e n c o l l a b o r a -t l o n a v e c d e $ o r g a n 1 $ m e $ e x t 6 r 1 e u r s . ^

D a n $ l e c a d r e d u S I C 0 6 , $ o n t p r 6 $ e n t 6 $ d e u x t h 6 m e $ d e r e c h e r c h e q u l o n t a b o u t l 1 d e $ r 6 $ u 1 t a t $ e x -o 1 o 1 t a b l e $ .

C e $ d e u x r e c h e r c h e s $ o n t m e n 6 e $ c o n j o l n t e m e n t p a r l e C E D I J e t 1 ' I N S T N ( C E A ) , d a n $ 1 e c a d r e d e V E R A n * 4 3 0 d u C N R S . L e u r o b j e c t l f e s t d e c o n t r l b u e r 1 1 ' a u t o m a t l $ a t l o n m a x l m u m d u p r o c e s s u s d e t r a l -t e m e n t d e s t e x t e $ , n o t a m m e n t e n c e q u l c o n c e r n e 1 a s a l s l e , 1 ' 6 d 1 t 1 o n , 1 ' I n d e x a t l o n e t 1 ' 1 n t e r r o -g a t l o n .

L e s t r a v a u x e n t r e p r l s o n t 6 t 6 e x p 6 r 1 m e n t 6 $ $ u r 1 e $ t e x t e $ J u r 1 d 1 q u e $ , u n e t e l l e a u t o m a t l $ a t l o n * ' y r 6 v 6 1 a n t p a r t l c u l 1 6 r e m e n t n 6 c e $ $ a 1 r e .

L a d 6 t e c t 1 o n e t 1 a c o r r e c t l o n a u t o m a t l q u e d ' e r -r e u r s t y p o g r a p h l q u e s « t l e s y s t 6 m e d o c u m e n t a l r e s t a t l s t l q u e I I n d e x a t l o n a u t o m a t l q u e e t I n t e r r o -g a t l o n e n l a n g u e n a t u r e l l e s o n t l e $ d e u x p r o -d u l t s q u 1 f o n t 1 ' o b j e t d ' u n e d e m o n s t r a t l o n .

I - D E T E C T I O N E T C O R R E C T I O N A U T O M A T I Q U E 0 ' E R R E U R S T T P O G R A P H I Q U E S .

S 1 l e s e r r e u r s t y p o g r a p h l q u e s n ' o n t d e c o n $ 6 -q u e n c e $ n 6 f a $ t e $ q u e $ u r 1 ' e $ t h 6 t 1 q u e d e $ t e x t e $ 1 m p r 1 m 6 $ , e 1 1 e $ p e u v e n t e n a v o l r d e d a n g e r e u $ e $ d a n $ 1 e $ $ y $ t 6 m e $ d o c u m e n t a 1 r e $ u t l l l s a n t 1 e $ t e x t e s c o m m e s o u r c e d ' 1 n f o r m a -t l o n . E 1 1 e $ $ o n t « n e f f e t d e n a t u r e I p r o v o -q u e r d e $ " $ 1 1 e n c e $ " ( d o c u m e n t s p e r t l n e n t $ n o n f o u r n l $ e n r 6 p o n $ e p a r 1 a m a c h 1 n e ) a u m o m e n t d e 1 1 1 n t e r r o g a t l o n .

L a d 6 t e c t 1 o n - c o r r e c t 1 o n d ' e r r e u r s , p r o o o s 6 e a u c o u r s d e 1 a d 6 m o n $ t r a t t o n , a o o u r b u t d e t r a l t e r 1 e $ e r r e u r $ q u 1 d e m a n d e n t 1 a p l u s g r a n d e a t t e n t i o n a u x c o r r e c t e u r s h u m a i n s . U n t e l s y $ t 6 m e e $ t d o n c d e n a t u r e 1 l e s s o u -l a g e r d ' u n e t l c h e a $ t r e 1 o n e n t e e n l e u r p e r -m e t t a n t d e c o n c e n t r e r l e u r s e f f o r t s s u r l a c o r r e c t i o n d e f a u t e s p l u s s u b t i l e s d o n t 1 a d e t e c t i o n p a r l e s y s t e m e s e r a i t t r o p c o u t e u s e .

e r r e u r s q u e o e u t c c m m e t t r e p a r f d s l e s v s t e m e a u t o m a t i q u e .

L E S Y S T E M E O O C U M E N T A I R E S T A T I S T I Q U E A I N O E -X A T I O N A U T O M A T I Q U E E T I N T E R R O G A T I O N E N L A N -G U E N A T U R E L L E .

L e s y $ t 6 m e p r 6 s e n t 6 e n d 6 m o n $ t r a t 1 o n e s t i ' e -1 6 m e n t d e b a s e d ' u n s y s t 6 m e d o c u m e n t a i r e e n -t 1 6 r e m e n t a u t o m a t i s e . 1 1 1 n t e g r e r a p r o g r e s s i -v e m e n t t o u s l e s t r a l t e m e n t s 1 i n g u l s t i q u e s q u i o n t e t e m i s a u p o l n t p a r a l l l e u r s .

L e s y s t e m e e s t c o n s t r u l t s u r u n m o d 6 1 e m a t h e -m a t l q u e S a y e $ 1 e n q u l a 6 t 6 m o d i f i e p o u r e t e -b l l r 1 a r e l a t i o n e n t r e f r 6 q u e n c e e t s 6 m a n t i -q u e . L e f o n c t l o n n e m e n t e n e s t 1 e s u i v a n t :

. L e s y s t 6 m e d ' I n d e x a t l o n e t a b l l t p o u r c h a q u c d o c u m e n t d e 1 a b a s e d e d o n n 6 e s 1 a l i s t e d e < u n i t e s 1 1 n g u 1 $ t 1 q u e $ d l s c r i m l n a n t e s , a s s o -c 1 6 e s 1 d e s d o n n 6 e $ s t a t l $ t i q u e s , q u 1 s e r v r o n t I 1 ' I n t e r r o g a t l o n .

. L e $ y $ t 6 m e d ' 1 n t e r r o g a t 1 o n c o n s 1 d 6 r e 1 a q u e s t l o n c o m m e u n d o c u m e n t ; 1 1 1 ' I n d e x e e t e t a b l i t u n e d 1 s t a n c e e n t r e e 1 1 e e t 1 e s d l f f 6 r e n t $ d o c u m e n t s d e l a b a s e . L a r 6 p o n s e e s t c o n s t l t u 6 e p a r 1 e l l s t e d e s d o c u m e n t s c l a $ $ 6 s p e r o r d r e d e p r o x l n i t e a v e c 1 a q u e < t l o n . M e $ t e n s u i t e p o s s l b l e d e v i s u a l i s e » l e s d o c u m e n t $ s u r 6 c r a n , a f l n d e v 6 r i f 1 e r l a p e r t l n e n c e d e s r e p o n s e s .

E n f l n , o n p e u t p o s e r u n " d o c u m e n t - r 6 p o n s e ' e n q u e s t l o n , c e q u 1 s i m u l e d ' u n e c e r t a i n e m a n 1 6 r e 1 « n o t l o n d ' a $ $ o c i a 1 1 o n d ' i d 6 e s , e t e s t p a r t i c u 1 i S r e m e n t u t i l e d a n s c e r t a 1 n « r e c h e r c h e s e x h a u s t i v e $ , p a r e x e m p l e , e n J u r i s p r u d e n c e .

V

Page 44: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

SYSTEME DE L'INSTN(CEA)/CEDIJ -

flo 4«1&L CU CtAv*.vct <xc< CO -PUA I <Uv O»S

<1$. } «T ei ULI <V icJ~t'o /i H6u'o» dLe_ tp*.'cj'a

HHLADIE

c f . noi> c -Al-W(4)

S ANATOMIE PATOOLOGIE

wrene

PFOTOPLASMA

\ INFLAWATIOfJ

CHimiHOIB

MWd, JU- a«. kWM - yWK^- *t <&1 poAflju.-b.' ^'n^ckcy^..

- aynenyale ohaap edmentique du concept cbaap atfeentique S. du concept C • J S1 S. O S . S S alors C, /v U .

J i j 1 J

e* en • une relation de aynonymie.

epdciflcitj-g<ndrlett< Chaap etfmantique S^ du concept C Chenp ajmantique S du concept C

parenttf a4mantique

nlora C^ eat terme ap<ciflque de C^

Chanp a<mantique S^ du concept C^ Chaap e^mantique 3 du concept C » J Cj et Cj «ent dane une relation de parent4 enr S^n / f . cl .nA

Page 45: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

V» 3 PIAFDOC

L® ayetdme PIAF (Programmea Iateractlfe d'Aaalyee du Fraaqale) a 6t6 61abor6 A Qrenoble* par l»6qulpe "Intelllgence arti-tldelle" de 1'IMAQ, qul travaille actuelleaent A la aiee au poiat de eott applicatio» - eoue le nom de "PIAFDOC" - eur la baee dee "d6p8chee de preeee" de la Docuaentatioa fraageiee» en liaieon avee le loglciel d'interrogation MISTRAL<1).

«latdme, qui fonctionne eur le mode convereationnel» traite lee informatione en laague naturelle (11 e'aglt A la foie dee docu-mente et dee queetione) en effectuant t

ua contr6le de eaieie» avec d6tection de fautee d«orthographe et poeeibilit6 de correction iaa6diate

~ iedexatlon automatlque aeeiet^e* pour 11 extraction de mots-d6s.

II aaeocie (2) d'une part dee *fcodulee de programmee" (6diteur, compoaante linguietique - ou "Analyeeur morphologiqne» -, compoeante documenteire - ou N06n6rateur de mote-cl6e«) et, de 1'autre, dee param6tree linguietiquee (dictionnaire de racinee, euffixee et ter-minaieone, grammaire oompoe6e de rdglea d'6tata finid et de moddlea).

Le"fichier dictionnaire" ae compoee d'informationa eoue forme de ehafnee de caractiree aeeoci6ee A dee pointeure ehaque chalne eet euivie d'un moddle morphologique et d*un ou plueieure poimteure

(1) voir p. 1 dee ech6mae (2) cf• QRANDJEAN (Projet PIAF) (3) voir p. 4 dee echdmae : extrait d»un 6tat du dictionnaire

Page 46: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

36,

- eu iadieatware - eulvaate t

(0) mot vide exeaplae t de (0) le (0) (•*) chaine ind6coupable POMMB DB TBRRB (*) <-) eot A relier (6l6aent de mot compoe6) PBOJBT (*)(-) (S) exietence de eynonymee SANS IMPLOI (-»)(S) (D) d6tail PHOJBT DB HBFOHMB (*)(D) (?) mot multieene CX)NCOBDB (•) (?)

Un indicateur ep6cial, i*indicateur de rdmanence", qui n*exiete qUiea eode imterne» eet deetin6 A all6ger le dialogue lore dee demandee de ehoix dane la meeure oft 11 m6aoriee lee choix qui omt 6t6 feite une foie pour un oae d*homographie ou de polye6mie (1).

Lee homographee, ainei que lee diffdrentee racinee d'un verbe irstgulier» eont ohaimAe entre eux.

Lea "MOTS MULTISENS" eomt suivie de parenthdeee explicativee qui eont num6rot6ee lore d'une imterruptiom r6clamamt un choix de 1'analyetei par exanple z

CONCOHDB (?) 1 CONCORDE (LA PLACB) 2 CONCORDE (AVION) 3 CONCOHDE (HOTEL) 4 00NC0RDE (PAIX)

A ehaque entr6e de phraee, le eyetdme met en route 1'enalyeeur morphologique qui provoque dee interruptione :

/ eoit loreque lee cheinee ne eomt pae reconnuee, ce qui ee produit en cae de fante d«orthographe» ou A la rencontre d»un mot nouveau

/ eoit en cae de polye6miee ou homographiee; on obtient alore la liete dee diff6rentee eolutione poeeiblee.

(1) cfe QRANDJEAN (Projet PIAF) : on tient compte du fait que le contexte eet g6neralement conetant dane un document - et om euppoee 6galement "une certaine continuit6 dee 6venemente relat6e dane la baee" (p. 23)

Page 47: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

37

B*ae lea deux cas, 1 'analyete prend. une d6cieion; 11 pour cel* de diff6rentea coaaande» lui peraettant *

- dee corrections (ORTHO)

— 1'intredttction de aote nouveaux (DICT)

- le choix d'une dee eolutione propos6es (MCL suivi du nua6ro de la eolntiLon choisie)

— 1'ajout d*un coapl6aent A un mot-d6 (ou 4 une chalne) ou bien dane le texte atme d*entr6e (MCL • suivi du coapl6aent, ou TBXT +)

Lorsque la phraee eet entidr«nent analysde, il reete A valider (ou 4 refueer de velider ei 1•on eouhaite apporter dee aodificatione) lee mote-cl6e propos6e par le eyettae*

L•in.terrogation ee fait en langue naturelle par le logiciel HISTRAL ? doat lee perforaancee eoat cependant aa61ior6ee, puisqu'il n'est plue n6ceesaire z . d«op6rer eur dee troncaturee (on a une r6duction antoaatique

dee aote 4 leur "modile" par le prograaae) • d«utiliser lee op6rateure bool6ene pour reconetituer lee aote

coapoe6e • d'utilieer lee indicateure de dietance» en cae de recherche eur

critdree eecondairee.

Lee exp6riaentatione ee heurtent actuell«nent au probldae de la reconnaieaance dee mote compoe6e non oonnexee (exeeple : "projet tr6e controvere6 de r6forae"), ainsi qu'A celui, plue g6n6ral, de la tendance & la aultiplication dee aote compoeds» ce qui aboutit • 61argir coneid6rableaent le dictionaaire et alloage lee ternpe d'indexatiOB et de recherche.

Page 48: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

58 -

L*s recherches actuellee (1) s'orlentent en particullen

™ vere la rAalieation d'algorithmes permettaat de lever automati-queaeat lee honographiee

• vere la d6finition de clsuseee - et donc d*une grammaire - de mote compoe6e

- vere la r6alisation d«un» analyee eyn.ta*ique dee queetione - ce qui devrait permettre une comparaieon avec lee structure» eyn*^ quee dee documemte e61eetiona£e» pour une meilleure addquation dee rtponeee.

PIAFDOC» enfin» est pr6eent6 comme un eyettoe ayant "un taux de rappel 61ev6« $),

(1) ef. QRANDJEAN (Projet PIAF) (2) cfe QRANDJEAN (communication IRIA - atelier SESORI)

Page 49: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

! ^°8rMmB8_Interacti£g d^Mttlyse du Prancais acoliaugs 6 la Dociifientation - «O DOcumentation fran;aise Equipe intelligence artificielle. IMAG. Grenoble.

* PIAFDOC- 1

Aftftfisr Qg F6*ct>ettve hsmt of t* >' f»vy»#iwr rr

*e*«A*|*N6 T»4e»«dN*<i„ tofltmjTw--ntnu{ *Q4atnT PablicirfAM» L*h

tofltmjTw--ntnu{ *Q4atnT PablicirfAM»

Dae>M»4W-t»K» AecKc-rchc antbmetiee.

Mtse 1 J>v»

<H>*iwr«rn4W»r»

"JM»# g" gimtwnntTiw»

Vw-fnpers

ffidHw t 'fcWw —i )

jk Fl &• 4s IWSWN'*

3*Sff HL Otft

#AlM«r

T>*a*iv%.

*— Pe* Tt

Pi XJ r»

fV~efci'w fi Calltcktas Pkafafm.-

JrnBCfLimr. CMANIM*

rwo.V_

I flAFDOC ;

• un programme interactif de saisie ivec : . d6tection de fautes d'orthographe et possihilitd de les corriger immddiatement . demande d'assistance lorsqu'un mot i sens mul-tiple a besoin d'une indication de contexte . controle de 1'indexation d6s sa crtation • un programme d*indexation automatique permet-tant :

. le reperage des mots-cles (y compris les mots composes)

• I icriture du mot-cle sous une forme normalis6e • 'a substitution d'un mot-cle non retenu par un mot-clc apyartenant au thdsaurus • 'a surindexation d'un mot-cle non introduit dans le th£saurus par son glnlrique y figurant.

ulteneurement :

• un programme d'analyse automatique des varian-tes syntaxiques (mots disjoints par exemple) et des contextes

Mitw PIARDC

ccmpossnt» lingutstique

coaposantc doajmentation

DOOXENTALISTE

DiaiONWIRE

GRAWiURE

• un programme d'analyse automatique des ques-tions qui seront posees par 1'utilisateur.

Page 50: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

PIAFDOC- 2.

^io .gra.rv%f»\a . c<u S ^ e» P <* Aj f j j /*

ACTIVATIOH PROGRAMME

LECTURE DES OONNEES (phrase)

E/S a i Termlnal Formak 11bre

Crtation et alse 1 jour de la grammalre cr6at1on et

•1$e 8 Jour du dlctlonnalre

Mode autooatlqi IOE DOC

Arrtt Phrase

OEMANDE OE PARAMETRES : E/S au Termlnal ou Flchler Formats 1Ibres ou Mlstral Mode de fonctlonnement (Arrfit Phrase)

KRITURE des tESU-TATS fbt Cl6 et teite

- ContrOle de salsle (Analyse Morphologlque) - Recherche Mot cl6, Mot compos6, Synonyae,

Inflnltlf, Cholx, AJoflt, Mot vlde. - Afflchage des rtsultats

Dlalogue utlllsateur (Perfo ou DocumentalIste) construction lnteractive du champ "Mot cl6"

Comnandes posslbles : ORTHO OICT GRAM MORPHO SAUVER (Olct.Gram) TEXTE s

Interrogatlons possibles : - Analyse Imposslble (ortho, Dlct, Gram, R.C.) - Cholx Homoqraphe (MCL : n) - Cholx PolysSme (MCL : n) - Ajout d'Informatlons (MCL+, TXT+)

Sc^e<v»g_ onc-f» 'o »Ae. |

<Ac$. m o dL ix U s.

d «-* ploi4»4i'on da.

CflBpiUieur

cnelne de caracttres • references

PHRASE /• identiflcetlon g6n6ration de MCL identiflcetlon g6n6ration de MCL

X analyseur de foraes

fMrateur de foraes

analyseur de foraes

fMrateur de foraes

compilateur lncrtiaentiel

decJarations

Page 51: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

PIAFDOC - S

Cowatruci i 'on tnl fe .racf '1 /g . otu- c^is G L < Z S

. <i «tneUm t Wwim fWwHi Km«..

Melfse Wer*olegigw m$ Foim Identlflcattea 4M 8M1MI (eet, «r)

tqw U •tlflir Nst psii

toclw de Mt Itaptt UCIM I«K lyoofljm Mflmtiil ti»r**«1«n lodacmptbU IKIH de Mt »1d*

Riclne Cltwit de Nst eeepe»*

Het eeapet*

Elllpse Moa Pnjprt Pilyttai Hwgrephei

OXD ta» etn«r»l ! 1 Hnt cll 1 «crlre «J® »>

W

(I) m m

Pluileur» Met» clt l<*rl^>

MHtT pour Inforgiatloni conpitnnuiret ou choli d'im Mot cl»

PM de forae Identlflh I *mlyn lape»»lble WIICT

Pluileuri foreei de leiwueur dlfftrente Identlfltei ARHtT

Ecrlre Ridne Not coflpoii Tantque (D) Appel Ure Rtctne (flll) Ecrlre Ricfne

• AJout d'un aet cl( ceepe»* NCL* chalne - AJout d*Inforaatlon» Coapltentalre* dani le tente TxT* chalne

Imprenlon et che Not cll (nuelro)

HCUft

Faute d'orthographe ORTHO Olct ou Oraomalre Incoplet $aut de la chalne 8.C.

• Otctlomalre Inceeplet (•) OICT NO>

AJeut d'«n »ot Cl4 lur ARRtT (gLt

_ [Verbe ®U CsUgerte «VPartlclpe pml

iParttctpa prtient

Alorj Slntratton Inflnttlf

@51 Synonyee (S) Aler» Appel Synonjee

L\.

cic COAC> E. TV^O-RADOO- •. e pWm-Ses. + rv^ffWcli^ (i

s LES PROUETS DE LOI ADOPTES PAR L'ASSEM8LEF NATIONALE | 1 ADOPTER 2 ADOPTION (VOTE) 3 ADOPTION (FAMILLE) CHOIX POLYSEME ? (MCL: N)

fncle 2 • PROJET DE L0I5AD0PTI0N (VOTE)$ASSEMBLEE NATIONALE$ | $

• LES ORGANISATIONS SYNDICALES TIENNENT COMPTE PU RECENT PROUET DE LOI SUR LA FOR ATION | 1 FORMER 2 FORMATION AJOUT ? (MCL+ OU TXT+ ...))

mcl+ permanente —• ORGAfJ ISATION SYNDI CALE$SYND ICATSTENIR COf'PTE$r.ECENT$PP.OJET DE L0l$F0RMATI0N PER

ANENTE$ 1$ *

• ,L A FAIT APPROUVER DIFFERENTS PROJETS DE DECRETS • FAIRE APPROUVER$DI FFERENT$PP.OJET OE DECRETS |$

f rJ SMNDde-f# )

Page 52: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

42 PIAFDOOt

£^ra"v4—a'u>> QAAgfrQ. (c/. U UL*mAx>te <L. $'2**$ .C\tt>oU*)

FILE: FltE SV$WI*T Pl CAMBRICGE FCNI TOR SYSTEM

ZABANOON(* I/HOHNE/48 4NOONN/ / Afl ANHflNN /POS/AB ANDQN/ /ABATTAGEI•)/HflMWE/ /A8ATTE>*ENT (•l/HOHME/ /A8ATT0 IF/HOHME/ /ABATTOIRS DOUX (»)(S)/YEUX /ALSTHQM-CGE / /ABPOMEN/HQNME/ /ABELIN 10) (S)/CARNQT /ABELIN PIERRE / cVoZv^. /ABELIN PIERRE <»)/C4RN0T /ABELIN / Airya\u<M ^ /AB6RWATI0N/V0ITURE/ ~ A. /ABONNEMENT(*)/HOHFE/ /A80RP/PQS/ CU»T" ' /ABOUT1/FINI/ /ABOUTISSEMENT(»1/H£MH|/ /ABRIT(• ) /PQS/ /ABSENC F t•)( )/VOITURE/ABSENT/ /ABSENCE CE V0T6 (•)(S)/SOIF /ABSTENTIONNISME / /ABSENT(•)(0)(S)/VRA1/ABSENCE/ /ABSOLU(^)/GRANC/ /A8S0LUMENT (•)IO)/HIER / /ABSOLV/ABSOLV/ABSOVS/ /ABSOU/A6S0U/ABS0LV/ /ABSOUS/ABSOUS/A6SOU/ /ABSTENTION/VOITURE/ /ABSTENTIONNISME (•)/OEIL /ABSENCE OE VOTE / /ABUS (• )/NEZ / /ABUSl(•)/NEU/ /ACAOEM!Em(_l/V< /VOITURE/ /ACAOENIE OES SCIENCES («I /SOIF /ACAOENIE FRANCAISE ( • l /SOIF / /ACCEO( • ) /Pf lS_/

/RE FONT t ( • ) /VOITURE^/ /REFttRMm/P0?7 /REFORMATEUR(•)<$) /HOHME/MOUVEMENT REFORHATEUR / /PEFORMF <•) ( ) /VOlTUPF/ /REFORME CONSTITUT1CNNE1LE(») /VOITURE/

OE L•ENSEIGhEMENT SUPERIEUR ( • 1/FOIS / L «ENTREPRISE ( • ) /SOIF / L•OFFICE ( • ) (0) (S) /SO IF /REFORME CE L *ORTF L«ORTF ( • ) /SO IF /RFFORME OE L'OFFICE / LA SOCIETF ( • ) /S01F /

STATU1S ( • ) /SOIF / / ( •1 /SOIF /

/REFORMF •REFORMF /REFORMF /RFFORMF /REFORME /RFFORME /REFORME /RFFORME /REFORME /REFORFE /REFCRFE

DE D E DE D E O E S OU n i V O R C E ( • ) /FOIS DU SERVICE NATIONAL __ FONClER(D)/GRAND/ FCNTANET(D)7S97? / PENITENTIAIRE(^) /VOITURE/

/REFUGIEL_)/HCMME/ /REFUGIE POLITIOUE(•)/HOMME/ /REFUS(• ) (0)(S)/POS/RE?ts™7 /RFFLS /F^EZ /REFUS / /REGARP/TQT/

Page 53: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

1» k OOHDOB <•)

COHDOR «et 6gal«ient u» eyettoe do»t 1 'objeetif eat de r6duire en aaxiBUB toute manipulatioa - aannelle ou itttelleetuelle -dee iBfomatione» etruetur6ee ou non etructur6ee»

Soa amTaition eet dfaboutir & 1 'automatieatiou de la chaine docu-•eataire eempl6te (collectet description, reoherche et traiteoent), de r6alieer !• "effaeeaent dee barr!6ree eatre 1'homue et le eye-ttoe" e» 6taat le plue "confortable11 poeslble pour 1'utillsateur et, eefin» d»ltre un eyetdme "hautement adaptatlf».

Le projet, eubventiona* depuie 1973 P«r le Miniet6re allemand de la Beeherehe» eet mea6 dane le cadre de la Soei6t6 filemene oH H aetuellement en "phaee pilote* (1)* U d6veloppe deux eyet6mee de traitement t

* 1'ua pour lee informationa etruetur6ee

- 1'autre» dont il eera eurtout queetion par la euite, pour lee informatione textuellee en langage naturel„ avec lee 6tapee euivantee t

• eaieie direete de dona6ee et de textee par dee proc6d6e de leeture optique

. analyee» deecription et claaeification automatiquee dee textee

. proceeeue de recherche guld6e * travere un dialogue, en partant de queetione formul6ee en langage naturel.

(1) cf. TAEUBER

(+) "Coooualcation en langue naturelle avec dee systdaes de recherohe documeataire orlentes vers le mode coavereationael»

Page 54: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

w -

Le aeeond eystdme, qul eet dAcrlt plue pr6cle6aent eoue le nOB de e8TBINAnLKR" (1), r6allee l'«malyee du langage naturel A partlr d*un lexlque r6duit dee mote-outlle (envlron 800 entr6ee r6unleeant pr6poeltlone, pronome, artlclee, rerbee auxlllalree...) et d*un algorlthme d'analyee dee homographee (2).

Pule 11 opdre 1'extractlon dee raclnee dee mote et 1'analyee dee d6rlv6e> pour aboutlr A une llete de deecrlpteure potentlele. II cr6er en parallile* un theaaaree de cee radnee.

Lee raclnee eont eneulte pond6r6ee, eulvant leur forme morpho-leglque et leur fonctlon dane la phraee, & partlr de la etructure trouv6e pour la phrsrne (arbre de etructure obtenu aprAe analyees dee groupee verbanx r dee groupee noalnaux, dee pr6poeltlone et dee conjonctlone)*

Lee "deecrlpteure" eont alore r6partle en "claeeee de prlorlt6e" par dee op6ratlone etatletlquee eur 1'eneeable dee documente* pule tralt6e A l'lnt6rleur de chacune dee claeeee (module IKPHIOR) o4 lle eont regroup6e par 6chelo»e - mlee en 6vldence dee relatlone llnguletlquee entre lee deecrlpteure.

Lee dlff6rente regroupemente eont enfln "nle en r6eeau" (module Z1PRI0R).

Le nombre dee claeeee, qul repr6eentent en falt dee hl6rarchlee d6pend du nombre dee documente et de la dletrlbutlon dee concepte dane le fonde documentalre.

On etocke alnel A la fole lee concepte et lee relatlone entre lee concepte, oe qul devrelt augmenter netteaent le tenx de pr6clelon.

(1) cf» PANTR - dont le d6veloppement elgnlfle t "lndexatlon etatletlque de textee et claeelflcatlon documentalre automatl-que, an vu de r6eultate llnguletlquee" - volr aueel le ech6ma.

(2) cf, HALLBR et WIELAND

Page 55: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

• w •

traltement» linguletlquee, et uotamment 1'analyee eyntaxique, qui permettent d»6tablir lee relatione eatre lee concepta, eoat eneore dane une phaee de teete; il coavient de lea dftvelopper et de lee dlargir avant de peuvoir eep6rer aboutir A 1* er6ation autoaatique de r6eeaux e6aantiquea pour une grande quantit6 de textee (1),

Deux autree directiOM d*6tude eont lt d6veloppeaent d'un eyettee peur la eaiaie et la atructuration de grandee quantit6e de textee et l*6tude d*exteneione poeeiblee & d*antree languee.

Ce dernier point en particulier devrait Stre facilit* par le fait que la programmation ee veut adaptative (c»eet A dire fle^elle ee coapoee de a6thodee d'apprentiaeage A partir de r6eul-tate corrig6e), ee qui entratne - il faut le reaarquer - dee per-foraancee faiblee au d6but, aaie trde avantageueee & long terme.

(1) cf. HALLER et WIBLAND

Page 56: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

COmmunication in Naturlicher Sprache mit Dialog Orientierten Retrieval Systemen Societfi Siemens . & _ CONDOR - j

yoitc+1 onAct de{ l~alL du. -rt «<**<»</lu

*4i

INPRIOR - Opefationen L

i

4 *

•3 < H *

l a 4 4 I 1

v

* 4 e n

$

STEINADLER

ANetysr . £.INQUI%TI <pl|g"

1 I

I/trfj vcrfe'en tMfr+icpim. C o*t-k+v*-i o* <#«, -Huuat, ra%

II. ^ot tyiecfioi <fes C£4SSex Ps~ffr\opiTB

— pouaL. nrh'o>* eiai ocm &jsi%

III. INPRIOR-»l/> w/Uo,<6, o+* c6l

cu°e"lJ Cka^ua. c/ou, ^ -rforth -mm?~ «wusJZo* 0 1 1 '*«»" OM II erojAoHt a~cU. „***. jf. U. -n*,teuA*~L

IV. ZWPRIOR - wtee ei /#ArAr Ol /|<W» f>art*r difJiWtthv efa»4« * fhpntk.' ZWPNETZ - WZ„

rv

OQ m

*7 fi «7

WT «r

A» )( B»

MI0 ?S)ff INPRtOR - Operetieti II.

|N>l)-te/ Pr-Kl VJ(A)

IN.II Pr-Kl

P»-KI IK.LM)

(N-l>-Pr-Kl Ptr.z

I(K.LM)IJ(K.LcM)3 Jikum): J (N.P.L) pt-Ki OOQo

(H.J)I (H.J)2 (H.J)3 // (K.L.MH /

(N-IJ-lty^N Pr-KI K^J _ (T.S)l (U)l (U)2 (U)3 (S) (XVZ)l (XV7.)1

fteseriu. dn- cJ.a.ii',^:cecUor\

i(c.n

r-KL. Pnoritluklu*

ZWPRIOR «a n.Qoko*$

. fwyt)

Page 57: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- w? -CONDOR -

Nr KurzformZErkliirung Beltpiel(e)

01 NOM Nomen nominales Adjektiv nominaler Infinitiv Eigenname

02 ATT attributiv verwendetes — Adjektiv — Partizip Prasens — Purtizip Perfekt

03 VRB finites Vollverb 04 INF Infinitiv Vollverb 05 PAB Partizip Perfekt als Teil

einer Verbalphrase 06 ADV unflektiertes Adjektlv

oder ParUzip in pradika-tiver oder adverbialer Verw.

07 2AN Zahl in nominaler Verwendung

08 ZAT Zahl in attributiver Verwendung

06 DET Determinator (nominal-gruppeneinleitender Artikel. Quantor etc.)

10 REL Relativpronomen 11 QAT Quasiattribut (Quantor

etc m attributiver Ver-wendung)

12 NML Nomtnal (Quantor etc. in nominaler Verwendung)

13 PRN Pronomen- (durch „Sub-kategonsierung" unter-halb der Wortklassenebe-ne unterschieden in:) — — Pers Pron — Demonstr Pron

14 VBH fimtes Hi1fsverb(sein/ haben)

15 VBM finites Modalverb (mussen etc)

16 INH Infinit Hilfsverb 17 INM Infinit Modalverb 18 PRP Praposition 19 POP Postposition 20 PAl Prapositionaladjunkt I 21 PA2 PropOMtmnaladjunkt 2 22 AIT Advcrbmlpartike! 23 VAD VerbaHjunkt 24 KON Konjunktion (ni*ben-orrincnd) 25 NRS Subjunktion 26 FAV Funktionsadverb

27 IPA Infinitivp»rtikel

2R NKG Nvgation

•'1 SAZ Saubfgrenzer

(<o>M'it von Scgmentie-rung aU solt hc erkimnt) 12 SH7 Subsatzbvgrvnrrr 31 HHZ HvrvorhcbunR«.7f»i then

das Erlebnls. der Baum das Schbne das Erleben

Friu

das schone Erlebnis die scFwpigende Mehrheit das gcglurktv fTxperiment sie gingtm narh Hause sie versprachen zu gvhen sie sind gcgangen

das Erlebnis ist schon nach Hause kommend/ gekommen. sagte er...

17. siebzehn

17 M&nner

die/einige/alle Manner

das Erlebnis, das schon ist dievielen Blumen

Einijge der Besten gpwan-nen

Er kam PTeser kam. Er ist gekommen

Er wird/will kommen

Er muB gekommen sein Er wird geschlagen werden Er kam nach Munchen meiner Meinung nach Er kam bis nach Munchen Er kam von Munc hen her Er war ru/sehr sihon Er machte div Tur ?u Er kam und ging

Da es rpgnet werde ich naD Heute/moglicherweise komme icn ~ Es ist deutlirh zu svhvn nicht J V V J ,

w-"/ etc

»l»suin-e 31 nosse 07 51 3* 93 Ot 0$ 9« 33 06 05 3» 96 07 0 6 39 )t 3» 10 11 10 11 09 10 1$ 3* 3$ 06 05 36 07 06 3 r 31 39 )§ 09 10 3* 10 11 10 1 1 . 1? I I 1? 11 14 1 1 14 11 16 1 1 16 11 16 17 1 1 17 II 1 1 16 I t II 11 II 11 M I 7 73 1« n 71 77 71 77 71 II 71

*06 T t e i

»11 «14 ••$€!* VBI *C ei te I *9 •»«

11 I «1 • •IIVSATI ATFT »6 ecT» i n ••f iMt Nl

m

U»i

I « I | | (1 ••AttUTSf I Atr i I El ••AUTOIUTIICN « n i

*2 • •LiaSUIITIICN e iTt I «9

•I I 11 i m

Mff l «n ••rui m »f ra I iii»

«« m I 81 irri

•< ••S|»»ltTl«UllS

IITl I 19 ••!(• •K •« I *1 ••Piestfa «irt

vaoo I tw*t f » I L I «3 ••«UIIAUCHCN ItftJ I «6 I t i te I I • me I i« I •! ••MOIU" L«»P

rs

I «11 •••!| *C ecrt I «9 • • •«• *e

I n AT I • • 4 • • v r e « « F i n u « (

ec te I eme m

m I «i • r r e

'7 • • t tot t

t teru p/e. d a r dU <s.~fru cl~*Ast_

( • y AJr uJ I tT <L A fV \) )

Page 58: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

CONCLUSION - TABLEAUX SYNOPTIQUES

Page 59: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 48 -

VI ESSAI DE CONCLUSION ET TABLEAUX STNOPTIQUES

Dane le cas de ayetdme» documentalree, lea probldaee de tralteaent dee langues qul ee poeent eont ceux :

- de 1'expreeelon du contenu dee docuaente

- de 1'expreeeion du contenu dee queetlone

- dee dlff6rente tralteaente poeelblee entre cee deux typee d'expree-elons, pour arrlver A la mellleure ad6quatlon dee r6poneee.

Dane la plupart dee grand eyetdmee automatle6e op6ratlonnele k 1'heure actuelle, lee deuxprealere aepecte eont tralt6e "en-de-hore du eyetfae"» et eeul le trolel6ae aet en oeuvre dee tralte-•ente, plue ou aolne eophletlqu6e, entre lee dlff6rente contenue dee docuaente entr6e et dee queetlone, exprla6e g6n6raleaent eoue forae denaote-cl6flfou de tleecrlpteurflP •

Cette proc6dure eet bae6e eur 1'exletence de langagee coabl-natolree - ou theeaurue; elle eet orlent6e eurtout vere 11automa-tleatlon de la recherche.

On pourralt coneld6rer que l*6tape eulvante eet celle o4 eont lntrodultee dee relatlone entre lee teraee. C'eet le cae dee deux prealere aepecte trait6e dane cette note, avec toutefole entre eux une dlff6rence d'objectlf, puleque lee eyetdaee OLPI, NEPHIS, RELATIONAL INDEXINQ et PRECIS aboutleeent elapleaent A dee 6dltlone d'lndex permut6e, alore que SATIN 1 et TITUS II peu-vent fttre envleag6e coaae dee eyetdmee documentalree "coaplete".

Page 60: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- 49

D«e» cee deux dernlere cae, lee contralntee augaentent, pulequ1!! £aut non eeulement reepecter un theeaurue» male eneore utilleer un mAtalangage tr6e rlgoureueeaent d6fini.

Cependant, lee critiquee prlncipalee faitee aux eyetdmee dlte "daeeiquee", qu'ile eoient d'dlleure automatie6e ou non - & eavoir : manque d'un±formit6, abeence d'objectivit6, fort taux de condeneation, reetent 6galement valablee pour cee eyetdmee, oft le "traitement intellectuel" ee fdt avant introduction des infor-matione.

Le traitement automatique du texte int6gral en langage naturd repr6eente une mani6re tout A fdt nouvelle d'aborder le probl6me du traltement de 1•information : en effet, 1'utllleatlon de proc6duree automatiquee et progremm6ee devient un garant d1 "obJectivlt6" et d'udformit6, et chacun dee eyetdmee pr6eent6e annonee dee pr6vieione de performancee accruee : eelon le cae, euppreedon totde du bruit documentalre, meill^uree r6poneee que dane un eyetdme index6 manuellement, taux de rappel 61ev6, augmenta-tion du taux de pr6cielon...

On peut peneer cependant que le probldme de fond n'a fait que ee d6placer et qu'il e'eet meme coneid6rablement compliqu6, dane la meeure o& 11 e'aglt d'introduire dane un ordinateur, avec toutee lee formalieatlone que cela euppoee en langage binaire, tout un eneemble d'lnformatlone - en particulier linguietiquee - euecep-tiblee de "traduire" une tr6e grande complexit*.

On trouve alore, comme pr61iminalree k la mlee en oeuvre de cee eyetdmee, la r6f6rence & dee th6oriee linguietiquee r6centes (1), 4 la peychologle» A la peycholinguietique et aux m6caniemee de la ' pene6e, ce qui donne une ld6e de 1'importance et de la vari6t6 du champ A couvrir...

(1) pour n'en dter que quelquee-une, on trouve eurtout lee nome de CHOMSKY, SALTON, F. de SAUSSURE, TBSNIERE ...

Page 61: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

50

0r Ott peut remarquer que lee traltemente actuellement r6alie6e eur le texte int6gral en langage naturel eoivent - k dee •ariantee pr6e - une progreeeion similaire dans.lee diff6rente eyetdaee, coneietant en particulier & reconnaltre dee formee (ana-lyeee morphologiquee) puie dee relatione (analyaee eyntaxiquee). Maie, ainnrt que le eignalait d6jA I. COURRIBB dane eon M6tat de la queetion" eur 1•indexation automatique (1), le v6ritable travail d' "extraction du eene dee documente" eemble fctre 1»ncore loin dee reali eatione".

Certee, certaine probl6mee e6mantiquee peuvent ttre r6eolue par le recoure A dee "lexiquee" plue ou moine 61abor6e (et 6volutife) - ce qui revient d'ailleure A r6introduire une forae plue perfor-mente de theeaurue, oil lee concepte (ou chalnee de caract6ree) retenue comme deecripteure (2) eont r6duite 4 leure racinee et oti l'on tient compte de formee grammaticalee vari6ee (eubstantife, maia aueai adjectife, verbee conJugu6e, etc.), maie ce n'eet qu'un aepect de la queetion, alore que le champ dee recherchee qui restent & mener dane le domaine e6mantique eet trde vaete.

L'on eeeaie 6galement de "traduire" lee relations entre lee teraee, ce qui peut conduire & divere typee de "r6eeanx" (r6eeau de queetione, comne dane STNTAXBMB, ou r6eeau de concepte et de "claeeee de priorit6", comme dane CONDOR).

Maie on peut coneid6rer que, dane le domaine du traitement automatique dee languee et en partioulier du langage naturel en documentation, lee recherches en eont encore plutdt A un etade ex-ploratoire; il euffit de remarquer, A cet 6gard, que lee eeeaie qui ee font concernent le plue eouvent des textee courte qui eont d6jA dee r6sultate d'une 61aboration (r6sum6e, abstracts, d6p8chee de presee) et non, en fait, un texte v6ritablement int6gral ...

(1) voir bibliographie p.3 (2) il e'agit eouvent de toutee lee "unit6e linguietiquee" obtenuee

apr6e filtrage k travere de lietee de mote videe ou de mots-outile

Page 62: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

51 -

On peut cependant e'attendre &, dee d6veloppeuente rapldee, due en particulier aux ae61ioratione technologiquee croissantes daas le doaaine de 1'inforuatique. Cela permet-il d»augurerf pour un avenir proche, dee r6alisations vraiment innovatricee ? La r6ponee d6pend encore beaucoup dee inveetieeemente mie dane la recherche...

TABLEAUX SYNOPTIQUES

On trouvera dane lee pagee euivantee troie tableeux qui tentent de raeeembler lee informations collect6ee en eituant lee systdaee ddcrite :

- d'une manidre g6n6rale, lee une par rapport aux autree

- poie, plue pr6cis6ment dane le cae de la miee en oeuvre d*op6ra-tiona linguietiquee, eelon que lee informatione d«entr6e eont pr6par6ee (utilieation d'un m6talangage) ou non

" •aln, en ce qui concerne le traitement du langage naturel, eelon lee diff6rents proceeeue utilie6e.

Page 63: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

T * <b C c A M 6, E A/fc /C A U

it i srki^**.» »- * .

ro^o^s ^^twvU n« >. — J r lf. ^s.

' \ t C rih t J.uvKtt, —

WOfA d u. £«^W+ t rwe.

Wo cW tk e_ i«(& i «_

(? im'&4 e<oc «. AIAIA -fiulaur*^

1 OL«.41- rw «-w"A-\ c 11* «A uiA v *-/t (VO-ctf •' n t.

i t3 r 0 fll uu«' -)-i -/^4- rUi_rf Ujl ^ 0U4 *viM eu.rt„

Pr e pa fa"V^"0 a

p ou.r

L1 «,'d i'"^> D IA

OL *> i roM/et^oh' O/KK.*. 1 ni rx i n'i "t e.« acl» n*p~f q. cie. S riadi ca^i jv»! <p( ozi cuo

^ « iA-Wi'a s iv*"t«-r Ai+i-o -

i

e cLi-^t'o ifx |

C^- \ irv <Le N- 0 M_

cJL Q_ CQL"^d-'Q<^v_£uS.

\ 1 p«_r rvxu-t t S-

Pr e pa fa"V^"0 a

p ou.r

L1 «,'d i'"^> D IA

IM E F H i s b 0 rd*4-d.e-u. fco WA*.4»e»etl pHvw. p

r\««N

i n'i "t e.« acl» n*p~f q. cie. S riadi ca^i jv»! <p( ozi cuo

^ « iA-Wi'a s iv*"t«-r Ai+i-o -

i

e cLi-^t'o ifx |

C^- \ irv <Le N- 0 M_

cJL Q_ CQL"^d-'Q<^v_£uS.

\ 1 p«_r rvxu-t t S-

Pr e pa fa"V^"0 a

p ou.r

L1 «,'d i'"^> D IA

ReloA 0h&\ *ih<Ui • t> o r «.o-u f-OVX aijoc.' cv4> o <• i ola. n*o~J~S.

/1 "t" «U- Co.f-B^-1'Otrt cL»_

<VO"^3 - 0u~A ^

i

e cLi-^t'o ifx |

C^- \ irv <Le N- 0 M_

cJL Q_ CQL"^d-'Q<^v_£uS.

\ 1 p«_r rvxu-t t S-

Pr e pa fa"V^"0 a

p ou.r

L1 «,'d i'"^> D IA f f? fc C iS U o r de r t*.u<

crer w4i4-ia-4> i

i/mu f V»*«'«-el1 uw "rttij«u«ri*fc

aijoc.' cv4> o <• i ola. n*o~J~S. /1 "t" «U- Co.f-B^-1'Otrt cL»_

<VO"^3 - 0u~A ^

i

e cLi-^t'o ifx |

C^- \ irv <Le N- 0 M_

cJL Q_ CQL"^d-'Q<^v_£uS.

\ 1 p«_r rvxu-t t S-

Jiesvfi p-4-i o ~ ' » i ' • *-«°a-b» rt« , a.

. 1 < O •'<*«• ck » IA r*v«L l»-Lo.iA^a

S f l T l K - f bo r da_r e.e»v. Tk«jau.oi4 a. •^-O O-tt o-V

el; ^.'(.VltJtS. 4r<\ " 4" fc-t- o c tCa <» cLa. i. «-e 6aA' or. s. 1 t Q 1 «l I3A IM 14 ^VL-IVk*. n

^rodujK. cW io *— -Kc'i cU V«-<J. 1 V £.

Jiesvfi p-4-i o ~ ' » i ' • *-«°a-b» rt« , a.

. 1 < O •'<*«• ck » IA r*v«L l»-Lo.iA^a "T i T U S Tl

-bo r cU-c e ®- iz«-- .tflui i»- pewklXU

p+f «tffcu odUeJ^ei

~TKt±au*\ui. tA i a flU»** a-A' n>\ au.-^ rv\c»rt-i' c^<-s4«_ -frtud- u. c4->' jw cw«-^-o rvsoj4.' - n

4 ' * » cJ ekitve» i /1t* A« <^u*i

S 0 «• s. cle U flo-^l CB.^, ei» plusia^xrt. (M>JUO.J,

^o-i. dL opir»^i«Ku; "A rtukVt prxe. ^ i*y\ la*^»<^p rxx^u^fxl

SynT^1,B K|£ Co»JtC-ia^ •&**»! (l t i 0|um fluj Pt. " MK. a-*|°UA. t^ClMjKtufwlV crAaf e/vx «.*•* c^*-i Gi'cu'io«i

^ ro- m fyxa-^ cu»-l a. $. r 0 cU.«_tcUjl ' ^ u.«'cLu«_ 11

€ «* I OLU-^ r\od"ia. rx I ^o-i. dL opir»^i«Ku; "A rtukVt prxe. ^ i*y\ la*^»<^p rxx^u^fxl

rNSTN/ceA-£eD'g cei»u «r^*-ke*w»il C-Ot• jfi /~U-h o /«

<s< ' UKl "f An..

c^o^-hroL djL ScUSlG— in dt> c*-Ai' ozx a-w^o n*orh Pj ha__ . '-(LolS » i ccut» 0 ia. <nxA-OfV<a 4-* oy-ML- (jt/r* ajf. )

i r b. r«-» ^'01« «_rv OcuA^c*. HT* /

(»-* ' ' '

o'u-^.'-V Jufku"t Jl. rtinhii i d aLat 11» iAi lk. oU. dU'pe<U«x ^a. p <TU«L J

? > Pi FLoc ceiMyui«L.lio*Kt.l Cc n t~y fu C.-A' o y\ dl U*. d iciionnat r e

co *i "/nO 4 <(<_ «Cct* JCn 1 /"AtityaVvo * a.urh /via-VVfvai.

i r t f /-0 < o.^n' ow ••A

^o-ia <o_«w. ^a.-fu rr / /a«A. H/jShKfltrL f J

(»-* ' ' '

o'u-^.'-V Jufku"t Jl. rtinhii i d aLat 11» iAi lk. oU. dU'pe<U«x ^a. p <TU«L J

C ONIiOft, Cflii I/U\1«-AO*K* \

c o aVru c.4> e •* ^ U H

d< c~b'Qt*mai re. »ltl nw<n «. S.

1 l^dLcfa 0>* CdAT^O /Vxci "A

c/«ti f^l'csi.-A'w\ *K"^o Z»x<i-^'«y«-uu—_

KcUvrc^u ^mt'<sUo- * j 4-rv L*.U-^Qt y IAO--4-KUVX 1

Page 64: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

<£ ? rtpo-ca -k cAo n»VO.VO L P OU-r Is, "^YOU OxJmA J^^OU £-/i"g|vJL^

N O M ck «A. C^r4 t iwa_

^ir<2 |>«U<^.4T?O»N ih-j-ori>s<*A*t>*r d 'e.A^e.

Coh 4IA,4» XI * de.-HA»X«vrik> dL'i v -

ru pk »»> bVWl cLtv -We^brn^e-^-t-v^ " l; v^*u> L.4~" O^NAAJ "

DO^MCJ. CO^TC .1- poi* D OLVA * p ro Jfr»vt*A KM.e'«. t

3fVT'fM -i

;,u.

14+' CI'CCI4TI' a r« o( 'utx.

MOCja.UudaU.rr -+ S»|IAUX*.

le>/*^u.«_ ev#c. CeJt'^ nez>

- Ui <Ve# clute*-* _ MM Ai'tVa»tl"'l#n /

OLU+.QH.SQ- .S«J |A"/*V '"«^V*-e 'o_yv ( pyouo°i^o-1*4 d*-, te j<-h> E i CX»L- c4' a-r-^u^.J

Ti T AT u

UK&Xa^OA o( <* • * -tl cL» f**

CE« U o ^ UUCL. (.t > i j<3 r

(iv<<^vu.i ^ LdiK^M«V> 4 U.K C CoJbt^i -CA^»' * T* *-«A

" (ei* jey - p>V»f

FOSTIKAIFCL At r«iv!e-

avi c. Cerret^ievi t•.

Me l

"t CohJM.G4«.-^'o^ d l\. I <st»'c - V >s r» «* du r» V €W4>«0. > OUUE.6*YYLA. /«JVUL

S4«E.K«L^E e*A (a**je-y - |»ive TR . au*fitw><. •f'-yOn'^r

^or^t dv-fc 1 9-ro.«U*-** y <=oHA*4 !4Lfcr>~ JU oU>Ae*"-«v^

- 4"5t *o It. (W N W VVAIVI ' > tvo trv «u*. V° v^o o*V )

_ ^ nxev »—ou K s pr^oy-ra tv "-V <*-)

SV N T^^EHE

OJUL.C U V\ 1

pvVpa-rtk^t

U u^ y .

JL eve<_ '' IVvCU o j 0w\-

It* r* /WK^OLL# ''

cLft . w. rvedu ^t*t*(VL i" V» J*»v>e »J- Afl. dL1*/*»' V+«*»0L

- 0Uu.aJL*<y\A. rvcx|»)"#£»^t'o^o— ^rvreil u. tA^ cfuvv» <-«—

H CLrdUt. ) _ ai^outuy^. AYV~-^-«.>-0|"-«-

Cnr*d*.U<°" %cU. *X ARIAO#W #-*!* } — ^~r*-v x 4-0 r/v-ecr u<y< ( e du ri o" <*-4>-

• L l v d > v | « n w i i + i u i K » i « a )

. *Y-FTT.\M.«U*A'RE. (_ RE C^I-dLx cuvv«JL«YVt^

JTNSTN f ceA) -C € 0 ' J

OJUL.C U V\ 1

pvVpa-rtk^t

U u^ y .

CZ€>*S-U -AA4>'0H O/ U V

-HVE* «UWU4<*

de4eckon-Cofftckovi dTetreur*.

— O/Vt cJUp*. I^Y — a«A<*fi>Yvi JL ce*X* yJ~

tr e TA<I**A ®<Vw Y(/ RVEUR^=U.''<J-> ct* k«'«" oy^-r y

— aL^iM +*. &jl rtSrv« u*v« A > a-i* e*- . , EU ^.CcL-ke^CJY^-""'77

— +• o w< c.-1-l o t» V A » p«i*ai 0«'N-e-*-fl

- (4'JTI <0» FE R/^_' U «U -I ° 1* £

- L« «. <5ui rv o"4i» v>* JLe.^

P JAf D o c

OJUL.C U V\ 1

pvVpa-rtk^t

U u^ y . x) ocevlouCa*r^. «.VeCu.41'^-

£cAa<n« i c / e . Cflj-aet <fre f. S>Ui U iC V eA* i v> <A Vcajteivfi.)

•CewireU. dj» &«*t i O. e u« c. _ oerrtcKovx

<klati''4+«i«Le. f fke i * <C I

— p ro ^ ro. Wi vu« a_ dUi

— auaC*^«. rve^ lo ^^-8— ^c(xbt.c4>ovt d ^ o rv»s ^ S<yv\ ( cL< pehjM'n*i*0 oH C<*-, c/ V<?f«Ko*«

- 0> 0CGL" r* oapU *\o*^ • U * djL rv •o"^S VA dU/» -< K mi f tArweuAj» f t - e sA-« c l *Ae^ .

® I*I"J - rv e oL£~ cit cX». n».4>' 0 hs

C oivj o

OJUL.C U V\ 1

pvVpa-rtk^t

U u^ y .

C.0k»i"k"U A VtH

~MA» MV\ UVO cU» ra. c-i K<-^

(hoh 1-t ' t i V»» J

-0W«C^4 ett CJLO tlu. *tv /V-O^ — E I~<*-L*VX cLs. A o »"OJr»* — t« "fveutA' ok\ ct\ f*. t>'«~. • — <TV e/jVr IZu4-.y at**.b>pt Syv>-*+.\*ej~x—(«*!}'-<

cLt- jA^A.<A-i«zug. djt (& pl*si+-->J) (o wu' I "Vfutl RVSSA . )

- UiVe <fOO /vo^-06t"« C%

Page 65: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

o^Ar Sa.lo «xv pv-oCc/r*-t^Jt <U ^ ifc V*- 4-. ^

fH o rys > / is u« >

r\o&*i 4«.*

<jwoy

As c.t

Je ' /»h4i <|vuu» ^ ^a |pocl^*o ^

l rauk n**-+~h> i •/». -£ i4 i uuuo

?

"» o •w O

1 "L C V

^ I

" . SYhfM HbHc

«TfV$TfVf6€ Aj -c e o / j

' P l f t P O O C

• C(9h/ o 0 R

. 5 y / V T f l y f h r

• t f v i T N C c e * ~ ) -c e o i ^

. c-o m Oo A

• rwvr/v; (c<i^ ) -c-e-oij

• O» M 0 0I<?

. i */ j t /v r r6>V -ceoig

. c e w o o ^

? <r

S |

^ A t w

. sy (UTrt X£T» te

• rA/ lTTV fcc XV) -£ £ 0 ' 3

cf l w Oo

• SKiVTA *£"*£" j

. I NS.TN fC<£A^ . C£-i>g

. c « w O o . COfV DO<^ • CTofv ooR

f?

« 1 ^ £ r

<-U

. X/V^Ttv ' (c t -KIJ , C-CO',%

„ C e tv 0 0 . CoWODft ,

. IWSTW^Cff l f l ) -cfO i 0

• c o h j o 0 £ .

. T f v y i T ^ r -c f o ; ^ )

. CoVDO^

1>

l l

• TM5T7V <f C < -c e o ; j

• C O M OO e COW 00 R

. X «VJTTVf C-CAj ~ C e O ^

. C O M O O ^

• T ws.TA/fce*)-Ce5/ j

. c orvDvG.

>e rw<V- >L ;V C.«WL

^U-» CUVM^'^»^ ^ Qrv^^ U.

Asv\.4 '^e- cL" 1 pO»«Uj «<0— h^L. 0 f~"V" (J>«T !>*• W 'C .

4t >f r*mA<y*-«- •

UL -p

>r, ^v.i ~ — t<7A»y^> <<-*>

g. /\ cljUuu* cxAX-«— Ctj*V. (P^« pl»-s. cLc—

^KoLCT/ve, - e((* l 'oCj»^ dlo . UCLVCAC {katsj !-*• d-te+r ftjrslct

c/~m .

^ (Vll/ ^LAA" ^

it t \-tl-S o uk.cLtQ_ ^-*b» pxe^g^Trv^ i &•*<'*>

-f «yv» ^W.f •' Y>> . » t* i £ j.yv vl vua. C<nA» ^ki d-«-^iJtajkfv^ ; ^'ouL^ e.Wir-x, Jul. /y^ve-oAf <^LL ,.?)

VI -p-

Page 66: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

B I B L I O G R A P H I E

Page 67: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- Bibliographie 1 -

B I B L I O G R A P H I E

remarque preliminaire :

La preeente bibliographie est k la fois plus restrictive et plus compldte que celle remiee au moment du Conseil de Perfectionnement du DESS :

elle est plus restrictive, dans la mesure oti un certain nombre de references (ou trop ge-nerales, ou trop specifiques ou encore corres-pondant & des documents que je n'ai pas pu consulter) ont 6te elimines.

Elle est plus complete, car j'ai recueilli, entre temps, des r6ferences compl6mentaires sur les systemes d6crits.

Page 68: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- Bibliographle 2 -

I REFERENCES GENERALES es=^=esBeses=es=85^^=^^^s^^^fc

/PRESENTATION DES LOQICIELS ET DES SYSTBIES DOCUMENTAIRES

- Logiciels et eystemes documentalrea/ Etude r6alisee par le CXP (Centre d,Exp6rimentation de Packagee).- Parie: ADBS, 1975 - 1976. 3 vol., 218 • 132 + 371 p.- (Les Cahiere de 1'ADBS)

/ OUVRAGES QENERAUX SPR LES PROBLEMES D'ANALYSE AUTOMATIQPE DES LANGPES EN DOCPMENTATION

- ANDREEWSKY A. Apprentiesage, analyee automatique da langage, application k la documentation.- Parle ; Dunod, 1973*- 275 p»

- BELY N. BORILLO A. SIOT-DECAPVILLE N. VIRBEL J. Procedures d'analyee sSmantique appliquees a la documentation ecientifique.- Parie : Gauthier-Villare, 1970.- 243 P*- (Docu-mentation et information)

- CHAUMIER J. Le Traitement linguietique de 1*information documentaire : 1'analyee documentaire.- Parie : Entreprise moderne d'6dition, 1977.- 126 p.

- COYAPD M. SIOT-DECAPVILLE N. L'Analyse automatique dee documente.- Parie; La Haye: Mouton, 1967.- 149 p«- (Informatique)

- TRYSTAM J.P. La Documentation automatique.- Parie : Dunod, 1971.- 124 p.-(Dunod 6conomie)

/ SEMINAIRES DONT SONT EXTRAITES CERTAINES DES REFERENCES CITEES PLPS LOIN

- COMMISSION DES COMMPNAPTES EUROPEENNES. Luxembourg. Franchir les barrieree linguistiquee : 3© congres europ6en eur lee eystdmee et reseaux documentairee, Luxembourg, 3-6 mai 1977.-Munchen: Verlag Dokumentation, 1977«- 2 vol., 730 + 180 p.

Page 69: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- Bibliographle 3 -

- INSTITUT DE RECHERCHE D'INFORMATIQUE ET D*AUTOMATIQUE. Rocquencourl Etat dee recherchee eur lee eyetemee d*inforaation documentaire, Saint-Vallier, 31 m«i-3 juin 1978.- Rocquencourt : IRIA, atelier SESORI.- Doeeier de communicatione.

/ ARTICLES ET TRAVAUX GEKERAUX SUR L'INDEXATION AUTOMATIQUE

- COURRIER Y. L *Indexation automatique : 6tat de la queetion et perspectivee d'avenir. Documentation et bibliothdquee. 23, 1977, n° 2 p. 59-72.

- GALLAND H. Les Broblemee d«indexation automatique & travere l'6tude de quel-quee eyetemee : Mietral, Piafdoc, Stairs, Golem-Paeeat.- Grenoble: 1977.- 75 p.- (Memoire de DEA» IMSS. 1977.)

- SPARK JONES K. Automatic indexing. Journal of documentation, 30, 1974» n° 4 p.393-432.

II L'EDITION AUTOMATIQUE D'INDEX

/ OLPI

- BASER KE. COHEN S. DAYTON L. WATKINS P. Online indexing experiment at Chemical Abstracte Service : algo-rithmic generation of articulated index entriee from natural language phraeee. Journal of chemical information and computer ecience. 18, 1978, n°l p. 18-25.

/ NEPHIS

- CRAVEN T. NEPHI6 : a neeted-phraee indexing eyetem. Journal of the American Society for Information Science, 28, 1977, n° 2, p. 107 - 114.

Page 70: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

Blbliographle 4 -

/ RELATIONAL INDEXINQ

- FARRADANE J. QULOTZAN P. A Teat of relational indexing integrity by convereion to a permu-ted alphabetical index. Intern. Claeslficat., 4, 1977» n°l p. 20 - 25.

/ PRECIS - A U S T I N ( D . ) P R E C I S : a m a n u a l o f c o n c e p t

- FERRIER A.M. analysis and subject indexing,- London: 1974^

Pr6sentation du eyateme d'indexation "PRECIS" d'aprd» 11experien-ce faite par le Departement des Arte du Spectacle de la Bibliothd-que nationale. Bulletin des biblioth&ques de France, 23, 1978, n°3 P» 161-169 Bulletin de la DICA. 2, 1977, n° 3^4 p. 17-21.

~ S0RENSEN J. PRECIS : un syeteme multilingue. ia : Franchir les barrieres linguistiques... vol. 1 p. 297-325 (1)

- VERDIER J. AUSTIN D. Recherche sur le potentiel translinguistique de PRECIS. in : Franchlr les barridres linguistiques... vol. 1 p. 327-344 (1)

III LES SISTEMES NECESSITANT UNE DESCRIPTION D•ENTREE ELABOREE (UTILISATION D'UN METALANGAGE) =====^======s=as=s

/ SATIN 1

- BOURELLY L. CHOURAQUI E. Le Systeme documentaire SATIN 1.- Parls : CNRS, 1974-1978.- 2 vol. / Description generale et manuel d'utilisation.- 1974.- 398 p. / Generation et aide k la mise au point.- 1978.— 397 p.

- BOUSELLT L. CHOURAQUI E. La Repr&sentation dee donneee documentaires : structure du mita-langage SATIN 1. Communication IRIA - atelier SESORI (2)

(1) voir r6f6rence complete en p. 2 (2) voir reference complete en p. 3

Page 71: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- Bibliographie 5 -

- BOURELLY L. CHOURAQUI E. La Deecription des donneee dans le eysteme documentaire SATIN 1. Automatisme, 22, 1977, n° 1-2 p. 27-39-

- BRANCA-LACOMBE Q. TOMASSON R. InterSt de la constitution de banques de donn6ee 6laborees dans le domaine biologique : utilisation du logiciel SATIN 1. Documentaliste, 15, 1978, n° 5-6 p. 3-10.

/ TITPS II

- DUCROT J*M. Le Syeteme TITUS II. Information et documentation, 1973» n° 4 p. 3-40.

- ZINGEL H.G. Experiences with TITUS II. Intern. Classificat.. 5, 1978, n°l, p. 33-37.

IV LES SYSTIMES DE TRAITEMENT DU TEXTE INTEQRAL EN LANGAGE NATUREL

/ SYNTAXEHE

- SOLET M. SYNTAXEME : un systeme de geetion de la connaissance du langage naturel adapte a la consultation documentaire. Documentaliste. 11, 1974» n° sp6cial p. 58-64.

- STEHLIN F. Analyse morphologique de textes en langue naturelle : application a un systeme documentaire r6alise pour la DRME : SYNTAXEME.- lb p. Communication IRIA - atelier SESORI (1)

/ INSTS (CEA) - CEDIJ

- ANDREEWSKY A. FLUHR C. Indexation automatique, maintenance et gestion d'un systeme documentaire : ldre partie, aspects theoriques.- Paris 1 CEA» 1973. 27 p.- (Note CEA-N—1694(1) ).

(1) voir reference complete en p. 3

Page 72: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- Blbliographle 6 -

- ANDREEWSKY A. FLUHR C. RAMBOUSEK J. Automatisation de 1'analyse discriminante, de 1 'indexation, de la recherche hierarchisee des documents et de 1'aide d. la d6cision,-Paris s CEA, 1973.- 56p,- (Note CEA-N- 1650)

- ANDREEWSKY A. FLUHR C. Indexation automatique, construction automatique des thesaurus, classification automatique.- Paris : CEA, 1975.- 36p.- (Note CEA-N- 1795)

- CENTRE D•INFORMATIQUE JURIDIQUE. Paris. [ Plaquette de prdsentation des travaux de recherche sur la detectio et la correction automatique d1erreurs typographiques et sur le systdme documentaire statistique A indexation automatique et in-terrogation en langue naturellej.- lp. + 2p. d^annexes.

- Besume des problemes de 1'indexation automatique tels qu'ils sont abordes par le groupe de recherche en linguistique automatique (A. ANDREEWSKY, F. DEBILI, C. FLUHR, Y. HLAL, L. NICAUD).- 5 p. suivi de :D6roulement dee exp6riences d'indexation automatique en cooperation avec le CEDIJ. - 2 p. Communication IRIA - atelier SESORI (1)

/ PIAFDOC

- CHARRON J. PIAF : Programme d'indexation automatique du frangais.- 4 p.

[compris dans la plaquette de presentation de la Banque d'Informa-tion Politique et d'Actualite.- Paris : Documentation frangaise, ed

- QRANDJEAN E. Application d'un systeme de traitement de langues naturelles pour 1'indexation automatique Eknploi du logiciel PIAFDOC .- 16 p. Communication IRIA - atelier SESORI (1)

- GRANDJEAN E.

Projet PIAF : application a la documentation automatique. Defini-tion et utilisation du produit-prototype PIAFDOC.- Grenoble: IMAG Equipe intelligence artificielle, 1978.- 40 p.

(1) voir reference compl&te en p. 3

Page 73: Traitement automatique des langues et documentation · dee phaeee de deecription ant6rieures, de l'6dition automatique d'index et des produits de la traduction automatique II semble

- Bibliogr&phie 7 -

/ CONDOR

- BANERJEE N. CONDOR - Communikation in natural language with dialog oriented retrieval eyetems. in : SCHNEIDER W. SAGWALL H.- Computational linguietics in medi-

cine,- Ameterdam; New York; Oxford: 1977 p.163-175.

- FISCHER M. Le Logiciel documentaire CONDOR.- Lyon: 1978.- 22p,- (Note de eynth6ee. DESS d'Informatique documentaire. 1978.)

- HALLER J. WIELAND U. Die Erechlieeeung natiirlichsprachlicher Information im Informatione Syetem CONDOR. Nachrichten fiir Dokumentation, 29, 1978, n° 4-5 p. 1?7-183.

- PANYR J. STEINADLER - ein Verfahren zur automatiechen Deekribierung und zur automatiechen thematiechen DokumentenKlaeeifikation. Nachrichten fur Dokumentation, 29, 1978, n° 4-5 p. 184-191

- PORT J. Probleme der maechinellen Sprachverarbeitung. Nachrichten fur Dokumentation, 29, 1978, n?l p. 8

- TAEUBER D. CONDOR : ein integriertee Datenbank und Informationeeyetea. Nachrichten fur Dokumentation, 29, 1978, n° 3 p. 127-130.