Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire...

47
Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire d’analyse de Données Textuelles (LADT) Université de Moncton www.umoncton.ca/fass/def/ladt Max Silberztein LASELDI, Université de Franche-Comté Journées INTEX, Sophia, mai 2003

Transcript of Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire...

Page 1: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Lexique-grammaire évolutif de l'acadien avec INTEX

Gisèle Chevalier, Sylvia Kasparian, Laboratoire d’analyse de Données Textuelles (LADT)Université de Monctonwww.umoncton.ca/fass/def/ladt

Max SilberzteinLASELDI, Université de Franche-Comté

Journées INTEX, Sophia, mai 2003

Page 2: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

L’ équipe de recherche

Sylvia Kasparian, Département d’études françaises, Université de Moncton, Directrice du Laboratoire d’analyse de données textuelles spécialiste en description informatisée des phénomènes de

contacts de langues et de description de l’acadien . Gisèle Chevalier Département d’études françaises,

Université de Moncton Directrice du Centre de recherche en linguistique appliquée. Spécialiste de la syntaxe-sémantique des constructions nominales

et de phénomènes liés aux procédés de modalisation en acadien (temps du futur, procédés expressifs, marqueurs discursifs).

Max Silberztein, LASELDI, Université de Franche Comté. Concepteur du Logiciel INTEX, spécialiste en informatique

linguistique et le traitement automatique des langues naturelles. 2/4 assistantes de recherches, étudiantes de 2e/ 3e cycles.

Page 3: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

L’acadien : les acadiens Ensemble de variétés de français en usage dans les Provinces

atlantiques du Canada :Nouveau-Brunswick, Nouvelle-Écosse, Île-du-Prince-Edouard,Terre-Neuve.

Repères historiques: Langue implantée en Amérique du Nord à partir du début du XVIIe; Colons venus principalement du Poitou (Nord-ouest de la France) Première colonie à Port-Royal (Baie Française) en Nouvelle-Écosse Dispersion vers le territoire actuel de Beaubassin (Nouveau-

Brunswick), Ile-Saint-Jean (Ile-du-Prince-Edouard), sous la pression des Britanniques qui disputent le territoire aux colons français.

Territoire cédé par la France au début du XVIIIe siècle Déportation des Acadiens vers la Nouvelle-Angleterre, l’Angleterre

et la France de 1755-1763 par le Régime britannique (Général Moncton). Épisode du “ Grand Dérangement ”.

Retour autorisé après la reddition du Canada à l’Angleterre (Traité d’Utrecht 1763).

Vocation : le pêche et l’agriculture

Page 4: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Situation linguistique actuelle des minorités francophones en Atlantique

Situation précaire à Terre-Neuve, Nouvelle-Écosse et Ile-du-Prince-Edouard.

Nouveau-Brunswick : province officiellement bilingue (anglais : 65%; français : 35%)

Les variétés de français en usage au Nouveau-Brunswick, très distinctives, les unes des autres, sont regroupées habituellement en trois zones géographiques: La région du Nord-Ouest La région du Nord-Est La région du Sud-Est

Page 5: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Les 3 régions

La région du Nord-Ouest partage une frontière avec le Québec et de l’État américain du Maine. 95% de la population est francophone dans le Madawaska, seulement 64,2% dans le Restigouche, région du centre-nord de la province. Le français du Madawaska est perçu comme très influencé par le français québécois.

La région du Nord-Est est bordée par la mer et sa population est majoritairement francophone (84%). Le français qu’on y parle est perçu par les Acadiens, comme le “ meilleur français ” de la province, le “ plus pur ”, le moins influencé par l’anglais.

La région du Sud-Est est entourée des régions majoritairement anglophnes et voit sa proportion de francophone réduite à 42,8% dans le Grand Moncton, malgré la forte population acadienne (78,6%) dans le comté rural de Kent. Leur langue est très influençée par l ’anglais. Vernaculaire particulier :le chiac.

Page 6: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Quelques particularités du chiac Langue dont la matrice est française et le lexique

généreusement “enrichi” de l’anglais. Emprunte le vocabulaire anglais, même si

l’équivalent français existe et reste disponible, grâce à l’instruction française.

Touche la langue à tous les niveaux de structuration : lexical, phonologique, morphologique et syntaxique.

Degré d’anglicisation de la langue variable selon les sujets et la situation de communication.

Décrit par les locuteurs comme “ moitié anglais-moitié français ” ou “ un mot français par ci, un mot anglais par-là ”.

Page 7: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Emprunts lexicaux( Tirés de tous les champs lexicaux et de toutes

les catégories grammaticales ) Noms : allowance, babe, babysit, babysitter, bag,

basement, bathroom, bike, blast, booze, contest, contract, credit, doctor, expense…

Adjectifs : awsome, baggy, bored, boring, bright, funny, fussy, good, great, pissed off…

Verbes : assist, barfé, beaté, behavent, joguer, kicker, minder, mover, phoner, stander, watcher

Adverbes : alright, anything, anyway, anyways, anywhere, barely, everywhere, everywheres (sic!), exactly..., exactly…

Marqueurs discursifs et interjections : well (ben), but (mais), so (ça fait que, alors), whatever , anyway(s), cool, O.K., yeah, wow, who cares

Jurons : Oh my god! godame! holy mac; holy sheet; fuck/frigs, shit/shoot, (à l’opposé des jurons québécois tirés de la liturgie)

Page 8: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Emprunts intégrés(Prononciation anglaise mais incorporés morphologiquement) 

Dérivations originales FREAK : freakant, freaké, freakée , freaker BORE : bored, boring CHUM : chum, chumer

Flexions françaises et acadiennes je mindais, je minderais alle a pas noticé (elle n ’a pas remarqué) ils wonderont (3e pers. pluriel en ‘vieil acadien’)

Page 9: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Emprunts intégrés(emplois conformes et originaux)

Adverbe d’instensité right (supplante ‘vraiment’ chez les jeunes) devant un adverbe :

right through, right there (emploi canonique en anglais)

devant adjectif : right cool; right cher; j’étais right stressée (anglais rétional)

devant nom ou SN : j’ai right faim, c’est right la fun (sic!), c’est right pas elle

Page 10: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Emprunt incorporé au français : Verbe anglais + flexion française

J’ai jamais watché ça ( watch = regarder)

il a fallé in love (fall in love = tomber en amour)

on a été gone (go=partir : verbe irrégulier en français emprunté tel quel)

Page 11: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Restructuration de la structure verbaleVerbe anglais + flexion française + particule verbale anglaise

j’ai freaké out (freak out ‘avoir peur’)

du stuff qui va on dans la vie (go on ‘se passer’)

tu peux pas driver up the wall (drive up smth ‘monter en voiture’)

mes enfants turnont out comme des bums (turn out ‘devenir’)

Page 12: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Création lexicaleVerbe français+ flexion française + particule verbale anglaise

il a timbé off la cliff fall off ‘tomber (en bas) de la

falaise’

il est revenu back à la maisoncome back ‘revenir’

il est back revenu à la maison

Page 13: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Restructuration du syntagme nominal

Matrice française à la source : le déterminant, maintenu, toujours français.

Tête nominale ou modificateur adjectival : en français ou en anglais. des bonnes movies intelligentes des awsome movies de ma whole life mon own château à moi,

l’adjectif anglais est antéposé; l’adjectif français conserve sa position normale;

le nom emprunté prend la morphologie française ou anglaise : [muvi]/[muviz]

Page 14: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Problèmes liés au traitement de l ’oral.

La phrase orale ne correspond pas à la phrase écrite:délimitation de la phrase par les pauses (barres obliques dans les texte) ou par des marqueurs comme ça fait que; pis, quand, de là, après ?

Corpus Péronnet-Kasparian : NIC-MO ... fait-que j'ai euh travaillé deux ans à la firme comptable après mon

bacc. / pis chuivais ces cours de correspondance-là / quand j'ai vu que ça marchait pas les cours / j'ai euh / appliqué à l'Université Laval pour la licence// j'ai faiT un an là pour euh obtenir ta licence pis là ton coaching de l'été qu(i) est de / juin/ juillet/ août / genre revue de tout c’que/ que t’as vu / euh de là / on fait note/ j'ai fait mon examen de comptable agréé // euhm // après mon / ma licence à Québec / là chuis déménagée à Montréal / pis j'ai travaillé pour une firme

Page 15: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Traitement de l ’oral

Les transcriptions de productions orales visent à reproduire le plus fidèlement possible les paroles énoncées, y inclus: les hésitations // euhm // les répétitions tout c’ que/ que t’as vu les mots omis (ça-)fait-que les élisions qu(i)est en juin; t(u)as vu;

not(r)e les ratées mon / ma licence

Les transcriptions visent à reproduire les particularités de prononciation à travers lesquelles les locuteurs reconnaissent leur usage, tout en préservant la lisibilité du texte. pis chuivais je suivais là chuis déménagée je suis

Page 16: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Phénomèmes liés à l’oral en français familier

1. Élision du “ e ” de je devant [s] et désonorisation j + s => ‘ch’

chus “je suis”cherais “je serais”ché pas “je sais pas”chavais “je savais”chta habituée “j’étais habituée”

hapax : ju “je suis”

Page 17: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Phénomèmes liés à l’oral en français familier

2. Métathèse de “ re ” en début de mot : re => er

- chus Erevenue à Edmunstonrevenue

- Eretourner sur le marché du travailretourner

- des belles choses qui Eressortent de tout çaressortent

Page 18: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Phénomèmes liés à l’oral en français familier

3. Élision de consonnes finales ble => b tre => t st => s

ensemb(l)e responsab(l)e formidab(l)e les artic(l)es êt(r)e l’aut(r)e patron mett(r)e sur pied touT les aut(r)es spécialis(t)e Bathurs(t) pos(t)e jus(t)e

Page 19: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Élision de consonnes finales

Page 20: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Demonstratif: CE et cas particuliers

4. Demonstratifs CE cte,ce.ms cte point là cta,ce.fs cta grille là ctés,ce.mp ctés gens là ctes,ce.mp ctes matins là

5. v =>m : - mas “ j’vas” - chuis menu “ venu” - je voulais m'emenir “ m'en venir”

Page 21: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Problèmes liés à la transcription : cas généraux

Absence de normalisation des conventions pour transcrire les particularités régionales ou particularités de registre avoir => aouèr, awèr, awér ici  => icitte, icite, iciT chiac => shiaque, shiac, chiak ces => ctés, ctes, ctès tout ce que tu as vu => tout c(e) que/ que t(u) as vu; touT c’que t’as

vu notre => not, note, noT, not(r)e

Usage de caractères typographiques réservés au langage d’exploitation: parenthèses, accolades, parenthèses carrées, sensibilité à la case, +, =, -, etc., les annotations entre parenthèses ...

Page 22: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Objectif

L’objectif de ce projet de recherche est de développer l’outil INTEX pour décrire les parlers acadiens et chiac, en particulier les transferts linguistiques entre le français acadien et l’anglais d’une part, et d’autre part, les transferts entre les variétés acadiennes et les variétés qui lui servent de référence, les français hexagonal et québécois.

Notre recherche vise également à faire la synthèse des travaux existants en description de différentes variétés de l’acadien et à consigner les résultats des descriptions anciennes et nouvelles dans INTEX.

Page 23: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Objectifs spécifiques Construire un lexique-grammaire informatisé des

parlers acadiens à partir de la recherche existante, de nouveaux corpus non exploités comme la presse et les œuvres littéraires, ainsi que de nouvelles descriptions ; Ce dictionnaire intégré dans INTEX comprendra des

dictionnaires lexico-sémantiques, des dictionnaires de graphes morphosyntaxiques, de graphes de désambiguïsation de mots, de graphes orthographiques.

Intégrer au dictionnaire les résultats des travaux existants

Créer les outils qui permettront une reconnaissance automatique de textes en acadien, notamment pour les phénomènes transcodiques en chiac.

Page 24: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Les corpus Des corpus acadiens informatisés (dictionnaires et textes) du

Centre d’études acadiennes de l’Université de Moncton, dirigé par Maurice Basque ;

Des corpus du sud-est du Nouveau-Brunswick sur le vieil acadien et le chiac déposés au Centre de recherche en linguistique appliquée (Gauvin et Chevalier 1994; Péronnet 1989; Roy 1979)

Le corpus sociolinguistique Beaulieu de l’acadien du nord-est du Nouveau-Brunswick ;

Le corpus de français standard Péronnet-Kasparian de trois régions linguistiques du Nouveau-Brunswick : Moncton (Sud-Est) , Bathurst (Centre-Nord) et Edmundston (Nord-Ouest) ; Corpus chiac Kasparian H99: Corpus de conversations ou entrevues.

Les corpus d’œuvres littéraires acadiennes, de discours officiels et d’enquêtes sociolinguistiques déposés au Laboratoire d’analyse des données textuelles du Département d’études françaises ;

Des corpus écrits, des journaux acadiens :

Page 25: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Variantes orthographiques

Présence de transcriptions des formes orales non conformes au français écrit standard. Ex:avoir = aouère, awère

Ces formes ne seront pas reconnues par INTEX. exemple du verbe aller: « il faut que j’ialle »

Les transducteurs finis nous permettent de lui faire reconnaître ces particularités

Page 26: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Transducteur des différentes graphies, du subjonctif présent du verbe aller, en acadien.

Que j’aille – que j’ialle

Que tu ailles – que tu ialles

Qu’ils aillent – qu’ils iallent

Page 27: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Transducteur des différentes formes graphiques du verbe aller, en acadien.

Page 28: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Application du delaf + delafc au corpus NIC.MO : mots inconnus alle amagamation assisais astêure aut aute autes bacc Brunswick capabe ch ché cherais chuis chuivais chum coaching comptabes

cte dansS décembe Dieppe douxième Dover ej enwèye enwèyes Eregarde Eremarque Eremet Eretourner euhm

fédérals Fredericton générals Gérard Halifax hey ieux juse Laval lè LeBlanc Malenfant Moncton Montreal Montréal Nadeau NICOLE Nicole octobe ok ouaye prêe provincials Québec queque queques Riverview Robertson Shediac slash St Stephens ti tite tou touTzfait vesais vesait

Page 29: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Dictionnaire de mots complexes : delafcAcadien.dic

nous aut.nous autres.PRO:P3mp,3fp

où-ce-que,où est-ce que.INTER

quand-ce-que,quand est-ce que.INTER

combien-ce-que,combien est-ce que.INTER

comment-ce-que,comment est-ce que.INTER

ieux-autres,eux.PRO:P3mp,fp

nous aut.nous autres.PRO:P3mp,3fp

nous-aut.nous autres.PRO comptable agréé,comptable

agréé.N:ms,fs ah well,ah well.INT+eng holy mac,holy mac.INT+eng oh my god,oh my

god.INT+eng young offernders,young

offender.N+eng.Jeune délinquant

Page 30: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Morphologie : 3e personne pluriel

appelont,appeler.V+prés.:3p disont,dire.V+prés.:3p écoutont,écouter.V+prés. enlevont,enlever.V+prés. étiont,être.V+prés.:3p habillont,habiller.V+prés.:3p jouont,jouer.V+prés. laisseriont.V+cond.:3p, metteront,mettre.V+fut:3p moquont,moquer.V+prés. prenont,prendre.V+prés.:3p

tournont out,tourner out.V+eng.+prés.:3p

venont,venir.V+prés. voulont,vouloir.V+prés. voyageont,voyager.V+prés.

Page 31: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Dictionnaire de mots anglais indépendant ou intégré au delaf?

Intégrer au dictionnaire Acadien ou constituer un dictionnaire différent?

Prendre pour lemme la forme anglaise (kick) ou acadienne (kicker)? allowance.N, allocations alright,alright.ADV, d’accord anyway, anyway.ADV. Peu importe anyways,anyway.ADV.Peu importe beaté,beat.V,battre. behavent,behave.V,se comporter bored,bore.V :K, ennuyé boring,boring.A,ennyuant bouncée,bouncer.V chumais,chum.V chumé,chum.V :K chums,chum.N:mp,fp dozais,doz.V+imp dozée,doz.V :K

Page 32: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Dictionnaire des noms propres : NpropresAcadien.dic

Dieppe,.N+Loc+ville+CDN Dover,.N+Loc+ville+CDN Fredericton,.N+Loc+ville+CDN Gérard,.N+prénom:ms Halifax,.N+Loc+ville+CDN Laval,.N+Loc+ville+CDN LeBlanc,.N+pers:s Malenfant,.N+famille:s Moncton,.N+Loc+ville+CDN Montreal,.N+Loc+ville+CDN+eng Montréal,.N+Loc+ville+CDN Nadeau,.N+pers:s Nicole,.N+prénom:fs Québec,.N+Loc+province+CDN:s

Riverview,.N+Loc+ville+CDN+eng:s

Robertson,.N+pers:s Shediac,.N+Loc+ville+CDN:s

Page 33: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Dictionnaire de mots simples acadiens : DelafAcadie.dic

alle,elle.PRO amagamation,amalgamation.N+f assisais,asseoir.V+se+i astêure,asteur.ADV bacc,baccalauréat.N:ms chum,chum.N+eng:ms coaching,.N+eng:ms cte,cette.DET+dem:fs cte,cette.DET+dem:ms enwèye,envoyer.V+t+i+p:P1s enwèyes,envoyer.V+t+i+p:P2s fédérals,fédéral.A:mp générals,général.A:mp hey,hey.INT juse,juste.ADV

ok,ok.INT ouaye,oui.INT provincials,provincial.A:mp queque,quelque.DET:ms queques,quelques.DET:mp slash,.N:ms ti,est-ce que.PartInter tite,petite.A:fs vesais,faire.V vesait,faire.V

Page 34: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.
Page 35: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Graphe global:trajets avant le verbe

sujet de P la négation ex:

 vous n’allez pas me dire que on y met des formes

le pronominal ex: Je m’en vas m’émoyer. 

chemin direct ex:  Le coffre allait devenir un oratoire 

suivi d’un verbe ex: La charrette de la Mort pouvait s’aller embourber dans les marais »

Page 36: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Graphe « sujet de P »

Page 37: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Transducteur du sous-graphe « Pronoms sujet de P »

Page 38: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Transducteurs des sous-graphes inclus dans « Pronoms sujet de P »

Page 39: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Graphe global:trajets avant le verbe

chemin direct ex: Allez-vous-en déterrer les squelettes des vaches marine 

prépositions ex: et plus fous que obtus pour s'en aller en plein jour éveiller l'ours qui dort

« se laisser » ex: Se laisser aller à sa mort, ce n’est pas se tuer 

Page 40: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Graphe global:trajets après le verbe

chemin direct ex: Fallait point de laisser le temps de nourrir des pressentiments.

Allez ! 

suivi de GP ex: par rapport que elle va sus ses vingt ans et sus sa vie de femme 

suivi d'un infinitif ex:  Bon, ça va faire. 

Page 41: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Transducteur du sous-graphe « GP » situé après le verbe

Page 42: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Plan de travail

Première phase la désambiguïsation des lexiques français; la construction de graphes pour résoudre la questions des graphies

multiples et de la variation morphologique des formes de conjugaison; l’intégration des éléments lexicaux non reconnus par INTEX aux

dictionnaires des mots simples, composés et des expressions figées; le recensement des travaux descriptifs sur l’acadien et l’intégration des

données pertinentes. Deuxième phase

Intégration des travaux accomplis et de nouvelles descriptions qui ressortent de l’application de nouveaux corpus;

des descriptions qui ressortent à l’application de nouveaux corpus comme la description de certaines classes de verbes tels les verbes supports, les verbes pronominaux et les constructions avec particules verbales (back, out, up) en chiac.

Page 43: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Plan de travail (suite)

Troisième phase la validation de nos travaux par le traitement de nouveaux

corpus de tous genres ; vérifications des entrées linguistiques auprès d’informateurs ; Évaluation des questions de recherche à prioriser.

Page 44: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Objectif :

Adapter les fonctionalités de l’analyseur linguistique INTEX pour le traitement automatique de corpi écrits et oraux en français régional, les variétés de français acadien parlées dans les provinces Maritimes.

Intégrer les descriptions des parlers acadiens disponibles et de décrire les aspects inexplorés.

Page 45: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Particularités des textes en français acadien

Langue oraleNon standardisée à l’écritArchaïsmesEmprunts à l’anglais et langues

amérindiennesLangue mixte

Page 46: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Particularités des textes en français acadien

Phénomènes orthographiques ou phonétiques ex: Tu m'avartiras (avertiras), mon houmme (homme) Phénomènes d’élision, ex: c’te (cette), c'ti-là (celui-là) Aouère, awère (avoir)

Phénomènes morphologique Flexions du verbe: J’avions (j’avais), Fallit (fallu), l'amenit (l’amène),

Phénomènes syntaxiques Ex: c’était très différent de qu’est-ce que je faisais

Variantes lexicales Ex: garrocha (lança), asteur (maintenant), bécosse (back house)

Expressions figées:   « aller sur ses 20 ans »

Page 47: Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Cas particulier du Chiac

État de langue mixte stabilisée avec des règles et une grammaire. « toi t’as des owsome parents » « c’est des cool movies intéressantes que j’ai

watché hier» « il est back revenu à la maison » « Je ne veux pas que mes enfants turnont out

comme des bums » « Anyways, on a été gone comme cinq

semaines » « moi j’étais comme, je minderais pas d’avoir

ça dans ma maison »