8 e Journées INTEX / NooJ La flexion des verbes acadiens en NooJ Michael LONG Univ. De Moncton,...

Post on 03-Apr-2015

104 views 1 download

Transcript of 8 e Journées INTEX / NooJ La flexion des verbes acadiens en NooJ Michael LONG Univ. De Moncton,...

88ee Journées INTEX / NooJJournées INTEX / NooJ

La flexion des verbes acadiens

en NooJ

Michael LONGUniv. De Moncton, Canada

Univ. du Nouveau-Brunswick, Canada

avec un soutien du Gouvernement du CanadaConseil de Recherche en Sciences Humaines

Verbes acadiens :Verbes acadiens :

1. Introduction - Le français acadien contexte et influences

2. Trois Groupes - VFS + VANG + VVF

3. VVF - Les défis

4. VVF - 2 approches pour l’identification- description flexionnelle - grammaires morphologiques

5. VVF - du nouveau

6. Conclusion

Introduction…Contexte et influencesContexte et influences

Le français acadien…– Langue parlé par le peuple acadien– La nature du « territoire » acadien– Selon la région …

… contexte de contacte étroit avec l’anglais … peu de contact avec l’anglais

Influences…– le français standard– l’anglais

Introduction…CorpusCorpus

Chiac Kasparian (1,988 ko – 317,662 mots)

Maillet (9,522 ko – 188,191 mots)

Malenfant (1,550 ko – 20,777 mots)

Nord-Est (2,806 ko – 54,671 mots)

Parkton (8.335 ko – 192,293 mots)

• Corpus oraux – 2 de plus, dont une région avec peu de contacte avec l’anglais.• Corpus lit. – Riche en vieux formes; étend la couverture par rapport aux régions.

773,594 mots

Trois Groupes – VFS + VANG + VVF

VFS - DELAF

VENG - « pis il dit, you know mémére, you need a boy » Contexte anglais …pas tellement traîtés encore

VANG - « ils allont runner out de prêtres » « …que mes enfants turnont out de même » - Contexte de phrase français - VANG conjuguer en français - description de l’an dernier tient

VVANGANG: : trois graphes suffisenttrois graphes suffisent

WorkerWork GiverGive SetterSet

Trois Groupes – VFS + VANG + VVF

VVF - « on a arrangé le bas pour que s’a saye chaud » … que ce soit

« c’est souvent qu’ils veniont toute la famille » … qu’ils viennent

« Le prêtre se gréyait dans ses pus belles hardes » … s’habillait

VVF – Les défisLes défis

• Terminaison « -ont », « -iont »ils parlont ils parlent Pils parliont ils parlaient Iils parliont qu’ils parlent S

• Régularisation de la racineils devenont ils deviennent Pils deveniont ils devenaient Iqu’ils deveniont qu’ils deviennent S

• Emplois variés du passé simple à l’oral« … fallit espérer après que le petit seyit au

monde. » « il a fallu / fallait attendre que le petit soit au monde. »

VVF – Les défisLes défis

• Transcriptions « fautives »- accents mére vs. mère- consonnes raccomoder vs.

raccommoder- voyelles supprimées décidra vs. décidera- pour souligner la prononciation?- forme voulu? - manque de cohérence dans la transcription?

• Substitution / inversion de sons.- il counnaît vs. il connaît - consarver vs. conserver- erssouder vs. ressouder

VVF – Deux approches Deux approches - (Flexion)- (Flexion)

Avoir = <E>/W

+ <BW> (ai/P+1+s … + ont/P+3+p)

+ <B3> (ais/I+1+2+s … + aient/I+3+p)

+ <BW> aur(ais/C+1+s … + aient/C+3+p)

+ <BW> arr(aient/C+3+p+acad + iont/C+3+p+acad)

+ <BW> (aie/S+1+s … + aient/S+3+p)

VVF – Deux approches Deux approches - (Flexion)- (Flexion)

Avoir = <E>/W

+ <BW> (ai/P+1+s … + ont/P+3+p + avont/P+3+p+acad)

+ <B3> (ais/I+1+2+s … + aient/I+3+p + iont/I+3+p+acad)

+ <BW> aur(ais/C+1+s … + aient/C+3+p + iont/C+3+p+acad)

+ <BW> arr(aient/C+3+p+acad + iont/C+3+p+acad)

+ <BW> (aie/S+1+s … + aient/S+3+p + ayiont/S+3+p+acad)

Avantage : Consolidation de la description

Contrainte : Description limitée à Avoir(pas un problème puisque nul autre verbe ne se conjugue selon cette description)

VVF – Deux approches Deux approches - (Flexion)- (Flexion)

Tenir = <E>/W

+ <BW> tiendre/W+acad + tchendre/W+acad

+ <B4> iens/P+1+s … + enons/P+1+p

+ <BW> tchens/P+1+s+acad …+ tchenons/P+1+p+acad

+ <B4> ienne/S+1+s …+ enions/S+1+p

+ <BW> tchenne/S+1+s+acad + tchenions/S+1+p+acad

VVF – Deux approches Deux approches - (Flexion)- (Flexion)

Tenir = <E>/W

+ <BW> tiendre/W+acad + tchendre/W+acad

+ <B4> iens/P+1+s … + enons/P+1+p

+ <BW> tchens/P+1+s+acad …+ tchenons/P+1+p+acad

+ <B4> ienne/S+1+s …+ enions/S+1+p

+ <BW> tchenne/S+1+s+acad + tchenions/S+1+p+acad

3 formes infinitifs

VVF – Deux approches Deux approches - (Flexion)- (Flexion)

Tenir = <E>/W

+ <BW> tiendre/W+acad + tchendre/W+acad

+ <B4> iens/P+1+s … + enons/P+1+p

+ <BW> tchens/P+1+s+acad …+ tchenons/P+1+p+acad

+ <B4> ienne/S+1+s …+ enions/S+1+p

+ <BW> tchenne/S+1+s+acad + tchenions/S+1+p+acad

formes multiples pour P

VVF – Deux approches Deux approches - (Flexion)- (Flexion)

Tenir = <E>/W

+ <BW> tiendre/W+acad + tchendre/W+acad

+ <B4> iens/P+1+s … + enons/P+1+p

+ <BW> tchens/P+1+s+acad …+ tchenons/P+1+p+acad

+ <B4> ienne/S+1+s …+ enions/S+1+p

+ <BW> tchenne/S+1+s+acad + tchenions/S+1+p+acad

formes multiples pour S

VVF – Deux approches Deux approches - (Flexion)- (Flexion)

Tenir = <E>/W

+ <BW> tiendre/W+acad + tchendre/W+acad

+ <B4> iens/P+1+s … + enons/P+1+p

+ <BW> tchens/P+1+s+acad …+ tchenons/P+1+p+acad

+ <B4> ienne/S+1+s …+ enions/S+1+p

+ <BW> tchenne/S+1+s+acad + tchenions/S+1+p+acad

Problème : Description fautive pour Venir qui se conjugue comme Tenir en français standard.

Besoin donc de multiplier les conjugaisons « modèles »

VVF – Deux approches Deux approches - (.nom)- (.nom)

On demande à NooJ de trouver la combinaison (Variable 1)ar(Variable 2)

VVF – Deux approches Deux approches - (.nom)- (.nom)

On lui met une contrainte, disant que s’il trouve « ér » ou « er » entre les même deux variables, et que ce mot est accompagné du code « V »…

VVF – Deux approches Deux approches - (.nom)- (.nom)

Il doit associer le lemme du mot trouvé dans la contrainte,ainsi que les informations flexionnelles, à la combinaison (Variable 1)ar(Variable 2)

VVF – Deux approches Deux approches - (.nom)- (.nom)

Il doit également lui associer une information « source ».

VVF – Deux approches Deux approches - (.nom)- (.nom)

Cette information « source », (inclus dans le fichier« properties.def ») apparaît alors dans le vocabulaire, etpermet de repérer la source d’une analyse donnée. Ce qui permet de vérifier l’efficacité du grammaire.

VVF – Deux approches

Transcriptions « fautives » .nom- accents mére vs. mère* consonnes raccomoder vs. raccommoder* voyelles supprimées décidra vs. décidera

Substitution / inversion de sons. .nom- il counnaît vs. il connaît - consarver vs. conserver- erssouder vs. ressouder

Terminaison « -ont », « -iont » .nom / .nodils parlont ils parlent

Régularisation de la racine .nodils devenont ils deviennent

VVF – Deux approches - résultatsrésultats

Corpus base Acad.dic ont.nom les deux

Chiac 4,841 5,261 4,858 5,273

1,108 994 1,092 982

Maillet 25,750 25,980 25,988 26,177

2,189 2,099 2,019 1,960

Malenfant 3,108 3,633 3,145 3,650

516 418 496 401

NE 4,849 4,980 4,878 5,004

250 218 225 197

Parkton 10,380 11,125 10,488 11,125

1,394 1,212 1,310 1,212

VVF – Deux approches - résultatsrésultats

Corpus base les deux + autres delta

Chiac 4,841 5,273 5,477 + 636

1,108 982 916 - 192

Maillet 25,750 26,177 26,648 + 898

2,189 1,960 1,717 - 472

Malenfant 3,108 3,650 3,697 + 589

516 401 387 - 129

NE 4,849 5,004 5,041 + 192

250 197 190 - 60

Parkton 10,380 11,125 11,307 + 927

1,394 1,212 1,105 - 289

VVF – Deux approches - résultatsrésultats

Corpus base les deux + autres delta

Chiac 4,841 5,273 5,477 + 636

1,108 982 916 - 192

Maillet 25,750 26,177 26,648 + 898

2,189 1,960 1,717 - 472

Malenfant 3,108 3,650 3,697 + 589

516 401 387 - 129

NE 4,849 5,004 5,041 + 192

250 197 190 - 60

Parkton 10,380 11,125 11,307 + 927

1,394 1,212 1,105 - 289

Tenir compte de la

réduction en termes

inconnu, plus que

l’augmentation de termes

connus (double analyses)

VVF – du nouveau…

Grammaire syntaxique qui comprend des éléments orthographique… qui permet de trouver des mots inconnus, qui terminent par « is / it / i », et qui sont précédés de <PRO>

VVF – du nouveau…

VVF – Deux approches - IntérrogationIntérrogation

Inclusion du standard et des variants en un dictionnaire+ permettra une ressource à base large+ minimisera les analyses fausses- implique redondance de paradigmes flexionnelles - travail de longue haleine

Inclusion des variants en .nom+ identification rapide de formes - multiplication de ressources - introduction d’analyses fausses

Autres possibilités…- maintien du DELAF et ajout de « filtre » Acad.dic- hiérarchie de « .nom » embriqués

Conclusion…

L’étude effectuée jusqu’à présent commence à permettre de repérer les verbes « non standards » en français acadien, avec des résultats encourageants. Le travail révèle que certains éléments pourraient améliorer et/ou rendre plus efficace le processus, dont…

• Inclure un élément journalistique dans le corpus- pour étendre la base- pour voir un français acadien dit un peu plus neutre

• Souligner l’importance d’ une transcription conséquente

• Trancher sur la question du dédoublement (dictionnaires ou morphologie?)

88ee Journées INTEX / NooJJournées INTEX / NooJ

La flexion des verbes acadiens

en NooJ

Michael LONGUniv. De Moncton, Canada

Univ. du Nouveau-Brunswick, Canada

avec un soutien du Gouvernement du CanadaConseil de Recherche en Sciences Humaines