Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

27
Comment optimiser l’aide à la rédaction? S. Verlinde KU Leuven - ILT

Transcript of Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Page 1: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Comment optimiser l’aide à la rédaction?

S. VerlindeKU Leuven - ILT

Page 2: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.
Page 3: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

enseigne- ment

temps

résultat

archivage

dicos grammaires

temps

résultat

apprentis- sage

Page 4: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Aide à la rédaction?

1 objectif – 2 composantes

o aide lors de la production du texte > predictive writing aid

o aide lors de la révision du texte > corrective writing aid(Ziyuan 2012)

3 langues – 1 site

o utilisabilité/ergonomie: efficacité, efficience et satisfaction

Page 5: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Démo: ‘predictive writing aid’

Page 6: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Démo: ‘corrective writing aid’

Page 7: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Traitement des données

Page 8: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Analyse: suites de caractères

… bien …

Mais aussi: avions, entreprises, …

Page 9: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Analyse: motifs

… Ver + Nom …

Ver + Det + Nom

Ver + Det + Adj + NomVer + Adv + Det + NomVer + Adv + Det + Adj + NomVer + Adv + Det + Adv + Adj + Nom…Nom + Ver

Page 10: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Analyse: parseur?

Selon un article ce qu'est publiée il y a quelques semaines, 66pour cent des étudiants travaille comme Jobiste pendant l'été.

http://alpage.inria.fr/parserdemo

http://beta.visl.sdu.dk/visl/fr/parsing/automatic/trees.php

http://www.latl.unige.ch/

Page 11: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Analyse: parseur?

Page 12: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Analyse: parseur? > Antidote 8

Page 13: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Analyse: analyse syntaxique de surface?

Ou analyse syntaxique superficielleshallow parsing

identification des constituants d’une phrase(groupes nominaux, verbe)

sans structure internefonctions dans la phrase

Page 14: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Enrichissement: ressources

• Ressources TAL: Lefff, Dela

• Résultats d’analyses de corpus: Google n-gram

92815 dictionnaire dictionnaire Nom:Mas+SG

Page 15: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Enrichissement: ressources

• Ressources lexicographiques

ex. verbes support

Page 16: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Enrichissement: ressources

• enseignement

Page 17: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Correcteur orthographique (nl.)

Page 18: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Comment s’y prendre?

• Ressources TAL/lexicographiques: listes de formes (768385)

• Données diverses: listes d’entités nommées, de sigles, …

• Listes d’erreurs fréquentes (enseignement)

• Règles d’orthographeex. régulier: peer > peren + sap > perensap

paardenbloem, depuis le 15.10.2005, auparavant: paardebloem

unique: maan > *manen + schijn > maneschijn

• ‘Règles’ de composition de mots (analyse de corpus)ex. apparaat + nom > 2: apparaatsnoer, apparaatskosten

nom + apparaat > +370 mots composésdefensie + nom > +110 mots composésnom + defensie > 1: milieudefensieaanbieding + nom > 0

• Préfixes et suffixes + leur longueur

• Néologismes: ‘mesttsunami’

Performances? Cf. Word

Page 19: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Correction d’erreurs lexicales: combinaisons de mots (fr.)

Page 20: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Comment s’y prendre?

• Détection d’erreurs

• Correction des erreurs

Espagne (Wanner, A. Ramos) Belgique

synonymestraductions1) mesure d’affinité2) mesure de contexte lexical3) mesure de paramètres contextuels

fonctions lexicales Mel’čuk

1) fréquence2) mesure d’association3) fréquence *

mesure d’association

Page 21: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Fonctions lexicales: verbes support

Page 22: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Fonctions lexicales

Page 23: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Démarche

inventaire verbes support (collocatifs - 233) + noms (bases - 673)

T. FontenelleDafles

Analyse de corpus 673 bases * 233 collocatifs: fréquence + mesure d’association

Analyse linguistiquestructure prédicative des 673 basesidentification de la fonction lexicale

Programmation PHP Intégration des données

Page 24: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

La touche finale…

Informations contextuelles

Google n-gram

Programmation PHP appariementbases + collocatifsinformations contextuelles

Programmation PHP Interface utilisateur

Page 25: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Et le résultat?

Page 26: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

Références bibliographiques

• Ferraro, G. - Nazar, R. - Wanner, L. (2011). Collocations: A Challenge in Computer-Assisted Language Learning.http://olst.ling.umontreal.ca/pdf/proceedingsMTT2011.pdf

• Heift, T. – Schulze, M. (2007). Errors and intelligence in computer-assisted language learning. Parsers and pedagogues. New York: Routledge.

• Leacock, C. - Chodorow, M. - Gamon, M. - Tetreault, J. (2010). Automated grammatical error detection for language learners. San Rafael : Morgan & Claypool.

• Verlinde, S. – Peeters, G. (2012). Data access revisited: The Interactive Language Toolbox. In S. Granger – M. Paquot (éds). Electronic Lexicography. Oxford: Oxford University Press.

• Wanner, L. – Alonso Ramos, M. – e.a. (2011). Annotation of collocations in a learner corpus for building a learning environment. http://www.dicesp.com/app/webroot/files/file/LCR2011_proceedings_wanner_leo_1_.pdf

Page 27: Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT.

http://ilt.kuleuven.be/inlato