Corpus d’apprenants et vocabulaire académique de...

69
Corpus d’apprenants et vocabulaire académique de l’anglais Sylviane Granger & Magali Paquot Sylviane Granger & Magali Paquot Centre for English Corpus Linguistics Université catholique de Louvain

Transcript of Corpus d’apprenants et vocabulaire académique de...

Corpus d’apprenants et vocabulaire académique

de l’anglais

Sylviane Granger & Magali PaquotSylviane Granger & Magali PaquotCentre for English Corpus Linguistics

Université catholique de Louvain

Plan

� Introduction� Corpus d’apprenants� Méthodes d’analyse

� Textes argumentatifs en anglais L2

2

Textes argumentatifs en anglais L2� Caractéristiques générales de l’interlangue� Utilisation du vocabulaire académique

�Extraction d’une nouvelle liste�Analyse contrastive L1 – L2

� Applications pédagogiques� Conclusion

Introduction

Corpus

� Ensemble de données langagières authentiques (écrites ou orales)

� Support électronique

4

� Support électronique� Critères de sélection explicites� Encodage standardisé et homogène

Corpus de langue maternelle et apprentissage des langues

� Avantages: description très précise desvariétés de langue; possibilité de distinguerles phénomènes linguistiques fréquents desphénomènes plus rares; remise en question

5

phénomènes plus rares; remise en questiondes descriptions/règles traditionnelles

� Lacunes: aucun renseignement sur le degré dedifficulté d’apprentissage des phénomèneslinguistiques (cf. Widdowson 1991: « frequencyprofiles do not of themselves carry anyguarantee of pedagogic relevance »

Corpus d’apprenants

� Ensemble de données langagières authentiques (écrites ou orales) sur support électronique

� Emanant d’apprenants de langue étrangère

6

� Emanant d’apprenants de langue étrangère ou seconde

� Critères de sélection explicites (hétérogénéité de l’interlangue)

Authenticité

“In a foreign language environment, what comes closest to naturally occurring texts in the strict sense are texts that are produced for pedagogical reasons and texts that are elicited for the corpus but that use procedures exerting very little control.” (Ellis & Barkhuizen 2005: 23)

7

� Productions libres ⇒ ‘clinical data’clinical data’ ⇒ données expérimentales

� “the use of tasks where learners are primarily concerned with message conveyance, need to utilize their own linguistic resources to construct utterances, and are focused on achieving some non-linguistic outcome” (ibid)

Données textuelles

� Discours continu (vs. phrases décontextualisées)� Permet d’étudier le lexique, la phraséologie, la syntaxe, le

discours, les registres et genres� Donne une meilleure idée des variétés avancées de L2

8

Donne une meilleure idée des variétés avancées de L2 dont les traits principaux “are not the –ing endings and third person-s we are familiar with, but involve more the areas of lexical expansion, genre diversification, and others yet to be identified” (Cobb 2003: 419)

� Constitue une base très riche pour l’étude du transfert de la L1

Critères de sélection

� En rapport avec l’apprenant : âge, langue maternelle, niveau, etc.

9

� En rapport avec l’activité : mode (oral/écrit), type de tâche, temps imparti, etc.

International Corpus of Learner English (ICLE) (Granger et al 2002)

� Apprenants d’anglais langue étrangère� Niveau intermédiaire à avancé (B2-C2)� Ecrits argumentatifs (+/- 700 mots par texte)

10

� Ecrits argumentatifs (+/- 700 mots par texte)� Plusieurs langues maternelles� Critères de sélection stricts

ICLE: variables

Learner variables Task variables

� Age� Learning context

Proficiency level

� Medium� Field

Genre

11

� Proficiency level� Gender� Mother tongue� Region� Other FL� L2 exposure

� Genre� Length� Topic� Task setting

� Timing� Exam� Reference tools

ICLE CD-ROM v2 (Granger et al 2009)

� 3.7 millions de mots� 16 langues maternelles

� allemand, bulgare, chinois, espagnol, finnois, français, italien, japonais, néerlandais, norvégien, polonais, russe,

12

italien, japonais, néerlandais, norvégien, polonais, russe, suédois, tchèque, tswana, turc

� Interface de recherche conviviale� Concordancier

�Etiquetage morphosyntaxique (CLAWS 7)�Requêtes simples et plus sophistiquées �Statistiques liées aux profils

Contrastive Interlanguage Analysis

CIA

13Granger (1996)

L1 > < L2 L2 > < L2

Contrastive Interlanguage Analysis

CIA

14Granger (1996)

L1 > < L2 L2 > < L2

L1 vs L2

L1 L2

15

L1 L2

Overuse / Underuse / Misuse

L1 vs L2: implications pédagogiques

L1 L2

Overuse / Underuse / Misuse

16

Learner needsTeaching objectives

Teachability

SELECT IGNORE

Contrastive Interlanguage Analysis

CIA

17Granger (1996)

L1 > < L2 L2 > < L2

L2 vs L2

L2 L2

18

L2L2

L1-related / developmental

Analyse comparative L2 vs L2

� Comparaison d’étudiants de même niveau mais de langues maternelles différentes ⇒caractéristiques propres aux différents niveaux d’interlangue (cf. Bartning 1997: niveau

19

d’interlangue (cf. Bartning 1997: niveau avancé)

� Distinction entre caractéristiques communes aux apprenants de langues maternelles différentes et celles qui sont propres à un groupe national donné (transfert)

Textes argumentatifs en anglais L2

Connecteurs� Mésusage: erreurs sémantiques, syntaxiques, stylistiques

� Raskolnikov differs from Onasis, of course. Onasis had everything. Raskolnikov, *on the contrary [by contrast ] had nothing. (ICLE-RU)

� Suremploi � Many people think that this is a waste of time …. So they want to

get rid of the military service (ICLE-DU).

21

get rid of the military service (ICLE-DU).� Spanish holds an important position in South America and

increasingly so in the United States, too . According to Crystal, it has little further potential outside Spain, though . (ICLE-FI)

� Sous-emploi� Connecteurs résultatifs (hence, therefore, thus) et contrastifs

(however, yet) (Altenberg & Tapper 1998 – apprenants suédois)� < > Milton (1999): apprenants de Hong Kong: suremploi de

therefore

Les verbes à haute fréquence

� Nesselhauf (2003, 2005)Collocations ‘verbe + objet’, apprenants allemands� Choix erroné du verbe

� *carry out races (enter, run)

22

� *carry out races (enter, run)

� Noms qui posent problèmes: action, aim, attitude, problem, question, statement, step, conclusion

� 56% des collocations erronées = potentiellement dues au transfert

Séquences récurrentes (De Cock 2003, 2004)

� Apprenants francophones� Sur-emploi

� that is to say, in order to, and so, in fact� I think, we can say that

23

I think, we can say that� as far as I am concerned� *according to me

� Sous-emploi de séquences récurrentes typiques du language scientifique� the issue of, a strong argument, opponents of, the effects

of, states that

Projet ARC: Apprentissage des langues étrangères : niveaux phraséologiques et discursifs (2003-2008)

� Objectifs: � théorique: étudier

� l’influence des facteurs développementaux et interlinguaux sur le processus d’apprentissage des langues étrangères

� deux domaines: phraséologie et discoursà des niveaux plus avancés d’apprentissage

24

� à des niveaux plus avancés d’apprentissage� méthodologique:

� démontrer l’importance d’une approche basée sur les corpus d’apprenants

� appliqué: � renforcer le lien entre théorie et pratique en

apprentissage des langues étrangères� Trois langues: anglais, français et néerlandais� Bolly, Klein & Lamiroy (2005); Granger & Meunier

(2008); Meunier & Granger (2008)

Utilisation du vocabulaire académique en anglais L1 et L2(Paquot 2007)� Corpus:

� Corpus académique en anglais L1 (sous-corpus du BNC –15 millions de mots)

� Divers sous-corpus d’ICLE (c. 1.2 millions de mots)

Objectifs:

25

� Objectifs:� Mettre en évidence les caractéristiques communes à

l’interlangue� Evaluer l’influence de la langue maternelle sur l’utilisation

du vocabulaire académique par les apprenants francophones

Lexique scientifique transdisciplinaire

� “Ce lexique [lexique scientifique transdisciplinaire],essentiel à l’expression de la pensée scientifique, côtoie la terminologie dans le discours. On considère que le LST transcende les domaines de spécialité et présente un noyau lexical commun significatif entre les disciplines . Le lexique

26

significatif entre les disciplines . Le lexique scientifique transdisciplinaire n’est pas saillant dans les textes scientifiques dans la mesure où, contrairement à la terminologie, il se rencontre également dans la langue commune . Par contre, il est au coeur même de l’argumentation et de la structuration du discours et de la pensée scientifique.” (Drouin 2007:45)

Exemples

� advocate, argument, by contrast, conclude, for example, investigate, issue, method, research, theory

>< Langue générale

27

>< Langue générale� the, of, be, time, work, people, house

>< Terminologie� Linguistique: morpheme, hapax legomena,

lemma, type, token, sense, reference

Quel vocabulaire académique?

� Coxhead’s (2000) Academic Word List (AWL)� 570 familles de mots� Ne faisant pas partie des 2.000 mots les plus

fréquents

28

fréquents�General Service List (GSL) (West 1953)

� Objectif: décodage�GSL + AWL + terminologie � 95% de mots compris à

la lecture = seuil critique pour la compréhension de textes (Nation 2001:197)

Une nouvelle liste académique

� The Academic Keyword List� 3 corpus d’1 million de mots

� Sciences humaines et sociales (articles et livres)� Sciences exactes (articles et livres)

29

� Textes d’étudiants britanniques

� Chaque corpus comprend 5 sous-corpus� Disciplines

� Etiquetage morphosyntaxique

Une combinaison de 3 critères

30

3 critères pour identifier des mots qui ….

… sont significativement plus fréquents dans des textes académiques que dans des textes non-académiques

Keyness

31

… sont distribués de manière égale à travers les différents corpus

Evenness of distribution

… apparaissent dans une large proportion des textes étudiés

Range

non-académiques

Fréquence de law vs. example

400500600700800900

LAWEXAMPLE

32

0100200300400

MC A

RTS M

C BEL

MC S

OC BNC H

UM

BNC PO

L BNC S

OC

MC S

C

MC A

PPSCBNC S

CBNC T

ECH

BAWE A

RTS

BAWE H

ISTORY

BAWE P

SYCHO

BAWE S

OC

LOCNESS

EXAMPLE

Un 4e critère: catégories sémantiques

5.6%

12%

44%

argue, claim, define,

amount, extent; high, large; increase

activity, circumstance; perform, cause; similarly

L: Language and

N: Numbers and measurement

A: General and abstract terms

338%

9%

7.7%

5.6%

whether, according to, moreover, thus

assumption, interpretation

facilitate, impose

argue, claim, define, suggest

Z: Names and grammar

X: Psychological actions, states and processes

S: Social actions, states and processes

L: Language and communication

Academic Keyword List

� 930 mots� however, as, therefore, such as , system, for

example , problem, development, case, provide, effect, between, use (v.), result, thus, group, example,process, argue, use (n.), value, different,

34

example,process, argue, use (n.), value, different, change, role, issue, develop, period, describe, base, structure, number, concept, condition, show, approach, difference, rather than , term, particular, consider, involve, include, significant, define, action, in terms of , evidence, common, type, produce, similar, practice, suggest, increase, relate, represent, basis, consequence

Academic Keyword List

40%

3%

35

57%

40%

GSL AWL off-list

Fonctions rhétoriques � Exemplifier: example, for example, for

instance, illustrate, exemplify, such as, notably, e.g.

� Résumer et conclure: summary, summarize, conclusion, conclude

36

conclusion, conclude

� Comparer et contraster: comparison, difference, contrast, parallel, to compare, to contrast, equally, similarly, conversely, unlike, contrary to, despite, as opposed to, rather than, versus, as well as, however, whereas, although, even though, etc.

Analyse des marqueurs en L1

� Les adverbes ne sont pas les marqueurs de cohésion par défaut dans le discours académique.

� Rôle discursif des noms, verbes, adjectifs et leur phraséologie

37

� Cause and effect� Noms [32.5%] : cause, factor, source, origin, root,

reason, consequence, effect, result, outcome

� Verbes [16%]: cause, bring about, contribute to, induce, lead to, prompt, provoke, result in, yield, derive, emerge, stem

Phraséologie du discours scientifique

� Discours scientifique: phraséologie spécifique� Extensions lexicales des mots académiques

� as discussed below; an example of … is …; the aim of this study ; it has been suggested …

38

aim of this study ; it has been suggested …� Séquences sémantiquement et syntactiquement

compositionnelles

� Pour une définition élargie de la phraséologie (cf. Granger et Paquot 2008a)

Idiom principle

� The principle of idiom is that a language user has available to him or her a large number of semi-preconstructed phrases that constitute single choices, even though they might appear to be analysable into segments. To some extent, this may

39

analysable into segments. To some extent, this may reflect the recurrence of similar situations in human affairs; it may illustrate a natural tendency to economy of effort; or it may be motivated in part by the exigencies of real-time conversation. (Sinclair 1991:110)

Textual phrasemes

� Structurer et organiser le contenu (information référentielle) d’un texte � Linking adverbials : in other words, by the way,

that is to say, as a result, in conclusion

40

that is to say, as a result, in conclusion� Textual sentence stems : the final point is …;

another issue is …; it will be shown that …; I will discuss …; as has been suggested by …

Analyse des marqueurs en L2

� Répertoire lexical limité� Registre inapproprié� Spécificités lexico-grammaticales et

41

Spécificités lexico-grammaticales et phraséologiques

� Erreurs sémantiques

Répertoire lexical limité: cause and effect

42

Registre inapproprié

� Suremploi d’items lexicaux typiques de la langue parlée� Le verbe say; l’adverbe though en fin de phrase;

la préposition like

43

� I am going to talk about; by the way; of course

� Sous-emploi des mots et phrasèmes typiques du discours académique � adverbe notably; verbes illustrate et exemplify� extensions lexicales: … is discussed in; as

suggested by….

Transfert

� Pas seulement sémantique� Autres types de transfert:

� phraséologique (collocations; séquences

44

récurrentes)� stylistique� fonctionnel/rhétorique � quantitatif

Suremploi de Let us / Let’s …dans ICLE-FRENCH

� To illustrate the truth of this, let us take the example of Britain ...

� Let us then focus on the new Europe as a giant whose parts are striving for unity.

45

whose parts are striving for unity. � Let us now turn our attention to the students

who want to apply for a job in the private sector. � Let us be clear that we cannot let countries tear

one another to pieces ...

En français …� Citons comme exemple le jugement difficile des autorités

françaises sur les activités du régime de Vichy dans le cadre du procès de Touvier.

� Envisageons tout d’abord la question économique.� Examinons quelques exemples pour tenter d’y voir plus

clair.

46

clair.� Et notons que ces réalisations nous inspirent des rêves

insoupçonnés jusque là, …� Considérons un instant le cinéma actuel.� Pensons , par exemple, à l’Espagne, qui, ….� Ainsi, supposons une personne de sexe féminin, habitant

Arlon, …� Voyons d’abord les effets que provoquerait un monde qui

Applications pédagogiques

Contribution aux outils pédagogiques

� Tous les outils pédagogiques� Ouvrages de référence

� Grammaires� Dictionnaires

48

� Manuels� Didacticiels (ALAO)

� Apport� Sélection des unités linguistiques� Ordre d’apprentissage� Feedback négatif

Lexicographie pédagogique

� Macmillan English Dictionary for Advanced Learners (2007)

� Collaboration Centre for English Corpus Linguistics – Macmillan Dictionaries

49

Linguistics – Macmillan Dictionaries� Analyse de ICLE pour produire

� Des notes d’erreurs basées sur des erreurs authentiques fréquentes

� Une section d’aide à l’écriture basée sur l’analyse de corpus académiques L1 et L2

‘Get it right’ boxes

50

Complexity and Fluency� Compenser la pauvreté lexicale

� recours systématique à des mots fréquents, neutres et “sûrs” (safe):� thing à la place de topic, issue, question, point

� Maîtriser les conventions académiques:

51

� Maîtriser les conventions académiques:� registre

� collocations, phraséologie� marqueurs du discours� colligation (position préférentielle dans la phrase,

etc.)

12 sections � Adding information� Comparing & contrasting� Exemplification� Expressing cause and effect� Expressing personal opinions

Expressing possibility and certainty

52

� Expressing possibility and certainty� Introducing a concession� Introducing topics and related ideas� Listing items� Quoting and reporting� Reformulation: paraphrasing and clarifying� Summarizing and drawing conclusions

350 items lexicaux de l’ AKL

� Donner des exemples: example, for example, for instance, illustrate, exemplify, such as, notably, e.g.

� Comparer et contraster: comparison,

53

� Comparer et contraster: comparison, difference, contrast, parallel, to compare, to contrast, equally, similarly, conversely, unlike, contrary to, despite, as opposed to, rather than, versus, as well as, however, whereas, although, even though, etc.

L’adverbe ‘yet’ dans le discours scientifique

54

La fréquence de however, nevertheless et nonetheless

55

Les difficultés des apprenants

� Fréquence (sur- & sous-emploi)� Registre� Sémantique

56

� Sémantique� Phraséologie� Position syntaxique

Expression d’une opinion personnelle: fréquence & registre

57

Expression d’une opinion personnelle: répertoire lexical

� Manières plus implicites d’exprimer une opinion personnelle:

� structures impersonnelles

58

� it is ADJ + to.. (it is reasonable to assume…)

� it is ADJ + that (it is significant that …)

� it is worth + V-ing (it is worth noting that…)

� adverbes d’évaluation

� Interestingly, … Surprisingly, …

Expression de la comparaison et du contraste: erreurs sémantiques

59

Expression de la conclusion: collocations

60

Exemplification: extensions lexicales

61

Expression de l’effet: colligation

� ‘The place in a sequence that a word or word sequence prefers (or avoids)’ (Hoey 2005.43)

therefore at the beginning of the sentence

62

0

50

100

150

200

250

300

350

Academic w riting Learner w riting

Fre

q. p

er m

illio

n w

ords

Expression d’une opinion personnelle: ‘Get it Right’ notes et ‘Collocation boxes’

Verbs frequently used in the structure it is worth + V-ing:asking, considering, emphasizing, examining, investigating, looking at, mentioning, noting, pointing out, quoting, recalling, remembering,

CollocationDon’t use the expressions according to me or according to my opinion when you give your opinion.���� According to me, the prison system is not outdated.

Get it right !

63

pointing out, quoting, recalling, remembering, repeating, stressing

outdated.����In my opinion, the prison system is not outdated.���� According to my opinion, women and men are equal.����In my view, women and men are equal.For more information on according to, see the writing section on “Quoting and Reporting”.

Conclusion

Corpus d’apprenants

� Les corpus d’apprenants constituent une fenêtre de premier choix sur l’acquisition des langues étrangères et secondes.

65

� Difficultés particulières liées au discours scientifique

Outils pédagogiques

� Tous les outils pédagogiques peuvent bénéficier des apports de ce type de corpus.

Discours scientifique

66

� Discours scientifique� Besoin d’outils d’aide à l’écriture fiables et

conviviaux� Répondant aux difficultés attestées des

différentes populations� Milieu académique et professionnel

Une première étape

� Macmillan English Dictionary for advanced learners

� Limites des sections au milieu du dictionnaire� Aucune certitude qu’elles sont employées

67

� Aucune certitude qu’elles sont employées� Aucun lien avec les entrées du dictionnaire

(cf. Granger et Paquot 2008b)

Deuxième étape …

� Dictionnaire / Aide à l’écriture électronique� Lexique scientifique transdisciplinaire� Phrases exemples dans une discipline spécifique

68

� Accès à des corpus� Commentaires pour l’apprenant sur des difficultés

attestées

� Interface web conviviale

Merci de votre attention !

[email protected]@uclouvain.be