Laboratoire Modèles, Dynamiques, Corpus

160
Laboratoire Modèles, Dynamiques, Corpus Unité mixte de recherche 7114 Responsable : Bernard Laks Départements : SHS et MPPU CNRS Université Paris 10 Université Paris 5 Rapport quadriennal 2005-2008 Projet 2009-2012 Volume 2/3 15 octobre 2007

Transcript of Laboratoire Modèles, Dynamiques, Corpus

Page 1: Laboratoire Modèles, Dynamiques, Corpus

Laboratoire

Modèles, Dynamiques, Corpus

Unité mixte de recherche 7114

Responsable : Bernard Laks

Départements : SHS et MPPU

CNRS Université Paris 10 Université Paris 5

Rapport quadriennal 2005-2008 Projet 2009-2012

Volume 2/3

15 octobre 2007

Page 2: Laboratoire Modèles, Dynamiques, Corpus

2

Table des matières

II. DOSSIER SCIENTIFIQUE ......................................................................................................... 4

1. Rapport scientifique concis et utilisation des crédits sur les quatre dernières années (comprenant l’organigramme de l’unité au contrat précédent) .............................................4

1.1. Organigrammes ..........................................................................................................4 1.1.1. Organigramme période 2005-2006.......................................................................5 1.1.2. Organigramme période 2006-2007.......................................................................6

1.2. Bilan scientifique - période 2004-2007....................................................................11 1.2.1. Composante Modèles..........................................................................................11

1.2.1.1. Phonologie de la syllabe et phonologie du français....................................14 1.2.1.2. Morphologie et Sémantique Lexicale ..........................................................19 1.2.1.3. Syntaxe et sémantique grammaticale descriptives du français (SSGDF) ...22 1.2.1.4. Modélisation de données linguistiques dans la perspective du traitement automatique des langues (METAL) .........................................................................28 1.2.1.5. Problèmes épistémologiques du TAL (PETAL) ..........................................35 1.2.1.6. Linguistique cognitive et microgenèse des formes sémiotiques ..................40

1.2.2. Composante Dynamiques ...................................................................................47 1.2.2.1 Appropriation du français et construction de connaissances en français L2 en situation diglossique ............................................................................................49 1.2.2.2. Représentation des événements : sémantique verbale, temporalité et développement des énoncés complexes ....................................................................52 1.2.2.3. Langage, langues et école : acquisition, interactions et construction des connaissances en langue de scolarisation (L1 ou L2) et autres langues .................55 1.2.2.4. Elaboration d’un glossaire de termes grammaticaux .................................57 1.2.2.5. Le style dans les dynamiques de la francophonie........................................61 1.2.2.6. Sociolinguistique variationniste et interprétative .......................................65 1.2.2.7. Equipe Acquisition du langage oral : fonctionnements et dysfonctionnements (ACQUOR) ..............................................................................66

1.2.2.7.1. Acquisition du langage oral .................................................................67 1.2.2.7.2. Pathologie de la communication verbale et non verbale .....................76 1.2.2.7.3. Socialisation langagière .......................................................................80

1.2.2.8. Equipe Activités Langagières, Médiations et Apprentissages (ALMA) .....87 1.2.2.8.1. Processus d’écriture .............................................................................87 1.2.2.8.2. Langue écrite ........................................................................................91

1.2.3. Composante Texte / Corpus................................................................................96 1.2.3.1. Aux origines de la linguistique des genres ..................................................98 1.2.3.1. Genres et linguistique de corpus ...............................................................101 1.2.3.3. Corpus oraux et écrits ...............................................................................109

1.3. Utilisation des crédits - période 2004-2007 ...........................................................115 1.3.1. Budget de l’unité : soutien de base, subventions exceptionnelles et ressources propres ........................................................................................................................115

Page 3: Laboratoire Modèles, Dynamiques, Corpus

3

1.3.2. Les ressources propres......................................................................................115 1.3.3. Le fonctionnement du laboratoire sur le plan budgétaire .................................118 1.3.4. Les dépenses .....................................................................................................118

1.4. La politique de formation vis-à-vis des doctorants ................................................122 1.4.1. Bilan doctorants................................................................................................123

1.4.1.1. La durée de la thèse : décisions de l’Ecole doctorale « Connaissance, langage, modélisation » ..........................................................................................123 1.4.1.2. Le financement des doctorants ..................................................................124 1.4.1.3. Les thèses en cotutelle ...............................................................................125 1.4.1.4. La direction de thèse..................................................................................126

1.4.2. Bilan docteurs ...................................................................................................127 1.4.2.1. La durée moyenne des thèses et leur financement ....................................127 1.4.2.2. Le nombre de soutenances par année ........................................................127 1.4.2.3. Le devenir des docteurs .............................................................................128

1.4.3. Liens avec l’Ecole doctorale 139 et l’Equipe de Formation Doctorale............129 1.4.4. Les CNRS et l’enseignement............................................................................131

1.5. Le travail des ingénieurs, techniciens et administratifs .........................................131 1.6. La politique de diffusion et de valorisation des connaissances..............................132

1.6.1. Les sites ............................................................................................................132 1.6.2. Le séminaire .....................................................................................................137 1.6.3. La revue CALaP ...............................................................................................137 1.6.4. Les journées d’études et les colloques..............................................................138 1.6.5. Le colloque jeunes chercheurs Coldoc .............................................................138 1.6.6. La politique de ressources ................................................................................138 1.6.7. MorDyCus ........................................................................................................140

1.7. Les responsabilités éditoriales et associatives des membres du laboratoire ..........140 1.8. Les responsabilités en matière d’administration de la recherche...........................142 1.8. Les collaborations nationales et internationales.....................................................142 1.9. Les effectifs du laboratoire.....................................................................................148

1.9.1. Période 2004-2007............................................................................................148 1.9.1. Période 2007-2009 et prochain quadriennal.....................................................149

2. Production scientifique - période 2004-2007.................................................................152 2.1. Production scientifique des membres du laboratoire : HAL-SHS - période 2004-2007...............................................................................................................................152 2.3. Production scientifique : bilan quantitatif - récapitulatif .......................................154 2.3. Production scientifique des docteurs ayant soutenu leur thèse dans le laboratoire - période 2003-2007 ........................................................................................................155

Page 4: Laboratoire Modèles, Dynamiques, Corpus

4

II. DOSSIER SCIENTIFIQUE 1. RAPPORT SCIENTIFIQUE CONCIS ET UTILISATION DES CREDITS SUR LES QUATRE DERNIERES ANNEES (COMPRENANT L’ORGANIGRAMME DE L’UNITE AU CONTRAT PRECEDENT) 1.1. ORGANIGRAMMES Nous présentons ci-dessous les deux organigrammes avec lesquels nous avons fonctionné : le premier couvre la période 2005-2006 ; le second la période 2006-2007. Le bilan scientifique est établi sur la base du second organigramme.

Page 5: Laboratoire Modèles, Dynamiques, Corpus

5

1.1.1. ORGANIGRAMME PERIODE 2005-2006

Modèles Dynamiques Textes / Corpus Ressources linguistiques

Phonologie de la syllabe Appropriation du français Genres et linguistique de corpus Grammaire de référence et phonologie du français en situation diglossique Denise Malrieu du français contemporain

Bernard Laks Colette Noyau François Rastier Annie Delaveau Philippe Gréa Maria Kihlstedt Catherine Boré Jacques Anis Marc Klein Carole Tisset Simon Bouquet Marianne Desmets

Atanas Tchobanov Evelyne Bourion Françoise Gadet Richard Walter Représentation des événements Danielle Leeman

Colette Noyau Communication électronique Morphologie et sémantique lexicale Maria Kihlstedt Jacques Anis Lexique syntaxique

Françoise Kerleroux Danielle Leeman Françoise Gadet Sylvain Kahane Sophie David Karine Baschung Sarah Leroy Apprentissage / enseignement précoce Ecrit et écriture scolaire Marcel Cori

Sergueï Sakhno des langues étrangères Catherine Boré Marianne Desmets Maria Kihlstedt Jacques Anis

Les connecteurs Jean-Jacques Briu Marie-Laure Elalouf Terminalf Danielle Leeman François Muller Richard Walter

Annie Bertin Colette Noyau Problèmes diachroniques Danièle Flament-Boistrancourt Sergueï Sakhno Annie Bertin

Françoise Gadet Jacques Anis Colette Noyau Didactique de la syntaxe Danielle Leeman

Danielle Leeman Isabelle Weill Modélisation de données linguistiques Marie-Laure Elalouf dans la perspective du TAL (METAL) Carole Tisset Edition scientifique de Charles Nodier

Marcel Cori Jean-François Jeandillou Marianne Desmets Elaboration d’un glossaire Karine Baschung de termes linguistique Métrique de l’alexandrin au tournant

Sophie David Jean-Jacques Briu des XIXe et XXe siècles Annie Delaveau Anne Trévise Jean-François Jeandillou

Françoise Kerleroux Danièle Flament-Boistrancourt Michel Arrivé Danielle Leeman Marie-Laure Elalouf

Anna Sörés François Muller Rémy Porquier Site PFC

Problèmes épistémologiques du TAL (PETAL) Sergueï Sakhno Bernard Laks, Richard Walter Marcel Cori Carole Tisset Sophie David infolang.u-paris10.fr/pfc

Karine Baschung La variation stylistique Marianne Desmets Françoise Gadet Site MoDyCo Claude de Loupy Danièle Flament-Boistrancourt Bernard Laks, Sophie David, Richard Walter Denise Malrieu Christine Pauleau Richard Walter infolang.u-paris10.fr/MoDyCo

Page 6: Laboratoire Modèles, Dynamiques, Corpus

6

1.1.2. ORGANIGRAMME PERIODE 2006-2007

Composante Modèles Coordination : Marcel Cori et Sylvain Kahane

Phonologie de la syllabe et phonologie du français Bernard Laks Pierre Encrevé Philippe Gréa Marc Klein Atanas Tchobanov Richard Walter Morphologie et sémantique lexicale Françoise Kerleroux Sophie David Sarah Leroy Sergueï Sakhno Syntaxe et sémantique descriptive du français Danielle Leeman Antoinette Balibar-Mrabti Annie Bertin Denis Le Pesant Modélisation de données linguistiques dans la perspective du TAL (METAL) Marcel Cori Marianne Desmets Karine Baschung Annie Delaveau Sylvain Kahane Françoise Kerleroux Anna Sörés Problèmes épistémologiques du TAL (PETAL) Marcel Cori Sophie David Karine Baschung Marianne Desmets Claude de Loupy Denise Malrieu Linguistique cognitive et microgenèse des formes sémiotiques Victor Rosenthal Sophie David Michel de Fornel Philippe Gréa

Page 7: Laboratoire Modèles, Dynamiques, Corpus

7

Composante Dynamiques Coordination : Françoise Gadet et Colette Noyau

Appropriation du français en situation diglossique Colette Noyau Maria Kihlstedt Représentation des événements Colette Noyau Maria Kihlstedt Langages, langue et école Catherine Le Cunff Jean-Jacques Briu Colette Noyau Didactique de la syntaxe Danielle Leeman Antoinette Balibar-Mrabti Danièle Flament-Boistrancourt Denis Le Pesant Elaboration d’un glossaire de termes linguistique Jean-Jacques Briu Anne Trévise Danièle Flament-Boistrancourt Marie-Laure Elalouf François Muller Rémy Porquier Sergueï Sakhno La variation stylistique Françoise Gadet Danièle Flament-Boistrancourt Catherine Le Cunff Christine Pauleau Sociolinguistique variationniste Pierre Encrevé Michel de Fornel Acquisition du langage oral : fonctionnements et dysfonctionnements (ACQUOR) Christian Hudelot Edy Veneziano Catherine Arabia Mireille Brigaudiot

Page 8: Laboratoire Modèles, Dynamiques, Corpus

8

Marie Carcassonne Claude Chevrie-Muller Laurent Danon-Boileau Helgard Kremin Marie Kugler-Lambert Marie Leroy Claire Martinot Christophe Parisse Christine Préneron Clara Romero Jean-Marie Vidal Activités Langagières, Médiations et Apprentissages (ALMA) Michael Baker Sylvie Plane Josiane Boutet Geneviève Calbris Danièle Cogis Colette Corblin Marie-Françoise Fradet Mireille Froment Jean-Pierre Jaffré Nathalie Lewi-Dumont Danièle Manesse Jean-Michel Pottier Marie-Christine Pouder Marie-Thérèse Vasseur

Composante Linguistique textuelle / Corpus Coordination : Simon Bouquet et Denise Malrieu

Genres et linguistique de corpus François Rastier Denise Malrieu Simon Bouquet Catherine Boré Ecrit et écriture scolaire Catherine Boré Jacques Anis Marie-Laure Elalouf Problèmes diachroniques Annie Bertin Jacques Anis Danielle Leeman Isabelle Weill

Page 9: Laboratoire Modèles, Dynamiques, Corpus

9

Edition scientifique de Charles Nodier Jean-François Jeandillou Métrique de l’alexandrin au tournant des XIXe et XXe siècles Jean-François Jeandillou Michel Arrivé Linguistique interactionnelle Michel de Fornel Jacques Anis Hillary Bays Pierre Encrevé CAN Richard Walter Denise Malrieu Jean-Luc Minel Atanas Tchobanov

Sites Site MoDyCo Bernard Laks, Sophie David, Richard Walter infolang.u-paris10.fr/MoDyCo Site Celith Julien Gavelle ehess.fr/centres/celith Site PFC Bernard Laks, Atanas Tchobanov, Richard Walter infolang.u-paris10.fr/pfc Site Lexsynt Bruno Guillaume, Sylvain Kahane http://lexsynt.inria.fr

Revue et Bulletin Cahiers d’Acquisitions et de Pathologie du Langage (CALaP) Christian Hudelot, Marie Kugler-Lambert L’édition des Cahiers d’Acquisitions et de Pathologie du Langage se poursuivra sous la forme d’une revue en ligne.

Page 10: Laboratoire Modèles, Dynamiques, Corpus

10

Bulletin Celith-EHESS Karine Paris

Page 11: Laboratoire Modèles, Dynamiques, Corpus

11

1.2. BILAN SCIENTIFIQUE - PERIODE 2004-2007 Avertissements - Le statut des personnes mentionnées est leur statut au 1/09/2007. - Les doctorants indiqués dans les opérations sont des doctorants inscrits en 2006-2007. - La production scientifique indiquée après chaque opération est celle des membres rattachés à titre principal et elle n’est pas exhaustive. Les références indiquées correspondent à des articles dans des revues avec comité de lecture, des communications avec actes, des directions d’ouvrages, des chapitres d’ouvrages et des ouvrages scientifiques. Seules quelques-unes correspondent à des communications sans actes. On se reportera au CD-ROM pour disposer de l’ensemble des références. - La plupart des membres du laboratoire n’ont pas rentré dans HAL les titres à paraître. - Nous avons associé à chacune de ces références leur identifiant HAL, ce qui permet de les retrouver facilement sur le CD-ROM ou sur le serveur de HAL. - Les références bibliographiques ayant servi à élaborer le bilan ne sont pas mentionnées dans le rapport. 1.2.1. COMPOSANTE MODELES Coordination : Marcel Cori et Sylvain Kahane La composante Modèles du laboratoire couvre l’ensemble des facettes d’un modèle linguistique, du son au sens : phonologie, morphologie, syntaxe et sémantique. Les aspects lexicaux comme grammaticaux sont pris en compte. Les études vont de la linguistique descriptive à la modélisation informatique en passant par la formalisation mathématique, la réflexion épistémologique, notamment en traitement automatique des langues, et l’interrogation sur la pertinence cognitive des modèles. La perspective modélisatrice se donne comme programme de recherche la description explicite et formalisée des langues, qui se réalise par la définition et l’exploration de différents plans organisationnels du langage (à tout le moins : phonologie, morphologie, syntaxe, sémantique) et par la découverte des relations de dépendance et d’autonomie de ces plans. En effet les différents chercheurs convergent sur le point de vue qui peut se résumer en la formule « le langage n’est pas un » ou « le langage est structuralement hétérogène ». La composante Modèles structure 6 opérations de recherche : (1) L’opération Phonologie de la syllabe et phonologie du français conjoint deux dimensions de recherche : une reconstruction des phénoménologies de la phonologie du français contemporain (projet PFC), et une construction de modèles dynamiques de la syllabe propres à prendre en compte ces phénoménologies (modèles DLM). Le réseau international du programme PFC comprend plus de 60 chercheurs de 15 pays. Le programme organise 2 colloques par an. Les phonologues de MoDyCo font aussi partie du Réseau Français de Phonologie.

Page 12: Laboratoire Modèles, Dynamiques, Corpus

12

(2) L’opération Morphologie et sémantique lexicale, à partir de nombreuses descriptions empiriques, vise à élaborer la problématique de l’analyse morphologique dans toutes ses dimensions, en insistant en particulier sur le système catégoriel et les types sémantiques, comme architecture sous-jacente du lexique, simplex et construit. Le travail a porté en particulier sur la caractérisation des unités accessibles aux opérations morphologiques, sur la polysémie des lexèmes et sur les questions de (dé)nomination et de lexicalisation. (3) L’opération Syntaxe et sémantique descriptive du français reconfigure l’opération Connecteurs (rapport 2003) et l’opération Didactique de la syntaxe dans la Composante Dynamique des langues (rapport 2005). Différentes raisons ont présidé à cette reconfiguration : la caractérisation des adverbes ou groupes adverbiaux, prépositions ou groupes prépositionnels, conjonctions et complémenteurs (et des phrases qu’ils introduisent) est étroitement liée à celle des verbes et donc des compléments ou ajouts verbaux - sans toutefois s’y borner. Cet infléchissement s’est trouvé conforté par les thématiques de recherche de D. Le Pesant (classements syntactico-sémantiques des verbes incluant la prise en compte de leur complémentation, en particulier prépositionnelle ou phrastique), mais aussi par la mise à disposition, pour les membres, du travail de Jean Dubois et Françoise Dubois-Charlier Les verbes français. La réflexion menée parallèlement sur le verbe dans le domaine didactique n’a fait que confirmer la nécessité d’une reconfiguration du projet. Cette opération a donné lieu à plusieurs journées scientifiques actées : « Semi-figement » (Linx 2006 : I), « La « cause » à travers les sciences » (Linx 2006 : II), « Classement syntactico-sémantique des verbes français » (Langue française 150, 2006). (4) L’opération Modélisation de données linguistiques dans la perspective du TAL [METAL] développe des travaux allant de la description des phénomènes linguistiques (morphologiques, syntaxiques et sémantiques) au traitement informatique des langues en passant par la formalisation des descriptions et l’élaboration de modèles mathématiques. L’opération a été enrichie par le rattachement en 2005 de S. Kahane au laboratoire MoDyCo. L’opération participe également à la normalisation et la diffusion des ressources lexicales informatisées à travers le projet LexSynt. (5) L’opération Problèmes épistémologiques du traitement automatique des langues [PETAL] a pour objectif de clarifier la nature des travaux actuels dans le domaine du TAL, et de faire le point sur les rapports du TAL à la linguistique, et plus spécialement à la linguistique formelle. On s’intéresse également aux outils d’aide à la navigation sur Internet, aux systèmes question-réponse, à la recherche d’informations. Enfin, la réflexion sur les méthodes d’évaluation est un des points importants sur lesquels est porté l’effort. L’usage sans cesse croissant des corpus en linguistique a conduit à se focaliser sur cette question, dans la mesure où les corpus ont partie liée aux recherches menées en traitement automatique des langues (numéro de Langages à paraître). (6) L’opération Linguistique cognitive et microgenèse des formes sémiotiques est une opération qui a débuté en 2005 lorsque V. Rosenthal et M. de Fornel ont rejoint le laboratoire MoDyCo. Cette opération se propose de réunir dans une même approche construction de théories et modèles affine aux linguistiques cognitives et aux courants dynamiques et ‘culturalisants’ des sciences cognitives et travail expérimental de type psycholinguistique. L’opération s’appuie sur deux séminaires de recherche qu’elle co-organise, et elle a organisé en 2006 la seconde édition de la conférence internationale Language and Culture Mind.

Page 13: Laboratoire Modèles, Dynamiques, Corpus

13

La composante Modèles pilote ou a piloté trois projets visant à la constitution de ressources pour la communauté scientifique francophone : 1) Le projet Phonologie du Français Contemporain (PFC), soutenu depuis 2003 par la DGLF, l’ILF et l’ANR, vise à construire une vaste base de données d’enregistrements sonores annotés pour des études à grande échelle en phonologie du français. 2) Le projet Lexiques Syntaxiques et Interface Lexique-Grammaire (LexSynt), soutenu depuis 2005 par l’ILF, vise à normaliser et fusionner des lexiques syntaxiques du français qui, interfacés avec une grammaire formelle, pourront être utilisés pour le traitement automatique des langues. 3) Le projet Grammaire de Référence du Français Contemporain, co-piloté par A. Delaveau (MoDyCo) et D. Godard (LLF) a été soutenu de 2003 à 2006 par l’ILF. Ce projet vise à concevoir un système grammatical qui tienne compte des savoirs acquis sur la langue française au cours des cinquante dernières années du 20ème siècle. Cette grammaire s’intéresse principalement à la description de la syntaxe : éclairée par des vues en phonologie, en morphologie, en sémantique, la description syntaxique constitue l’armature du projet. Les savoirs acquis relèvent de plusieurs approches théoriques, comme la grammaire générative, la grammaire syntagmatique, le lexique-grammaire, etc. Un des problèmes à résoudre est de construire un ensemble cohérent de descriptions : c’est une grammaire raisonnée. Un autre aspect central est de combiner cette approche raisonnée avec une description exhaustive des constructions du français. Si la phrase simple est relativement bien connue, il en va autrement des constructions complexes faisant intervenir crucialement la sémantique (par exemple, les circonstancielles,) ou la structure informationnelle et la prosodie (par exemple, les phrases disloquées, l’ordre des mots). Les apports de la linguistique de corpus peuvent et doivent être intégrés de façon éclairante aux descriptions particulières afin de surmonter les apories de l’attitude normative qui conduit à exclure de la description grammaticale des formes qui relèvent de l’hétérogénéité inhérente au fonctionnement linguistique. La grammaire prend en compte des français parlés hors de France (Belgique, Suisse, Amérique du Nord) dans la mesure où ils ont été documentés.

Liste des opérations 1.2.1.1. Phonologie de la syllabe et phonologie du français 1.2.1.2. Morphologie et sémantique lexicale 1.2.1.3. Syntaxe et sémantique descriptive du français 1.2.1.4. Modélisation de données linguistiques dans la perspective du traitement automatique des langues (METAL) 1.2.1.5. Problèmes épistémologiques du TAL (PETAL) 1.2.1.6. Linguistique cognitive et microgenèse des formes sémiotiques

Page 14: Laboratoire Modèles, Dynamiques, Corpus

14

1.2.1.1. Phonologie de la syllabe et phonologie du français 1. Membres de l’opération Membres rattachés à titre principal (6) Bernard Laks (responsable) Pierre Encrevé Marc Klein Anne Lacheret (depuis le 01/01/2007) Atanas Tchobanov Richard Walter Doctorants (11 dont 5 en cotutelle) Allahverdi Azari Nadjaf Evguenia Bestchastnova Twan Geerts Carolin Graml Maxence Lureau Géraldine Mallet Laurent Nkondo Katherine Ostby Gian Paolo Renello Omid Reza Taheri Patrick Tomatis Jeunes chercheurs associés (1) Claudine Pagliano (Post-Doc CNRS 2004-2006) Ali Tifrit (jusqu’en 2007) Chercheur associé (2) René Lavie Elissa Sobotta Collaborations extérieures (13) Pier-Marco Bertinetto (SNS Pise ; contrat université franco-italienne, 2007) Joaquim Brandao de Carvalho (Université Paris 8) Basilio Calderone (SNS Pise, doctorant, chercheur invité ; contrat université franco-italienne, 2007) Jean-Pierre Chevrot (Université de Grenoble ; contrat ANR 2008-2010) Gabriel Bergounioux (Université d’Orléans ; contrat ANR 2006-2008) Ernesto d’Andrade (Université de Lisbonne) Jacques Durand (Université de Toulouse ; contrat PI-TCAN Programme interdisciplinaire CNRS 2004-2006, Contrat ANR 2005-2007) John Goldsmith (Université de Chicago, chercheur invité - contrat CNRS, 2007) Haike Jacobs (Université de Nimègue) Noël Nguyen (Université de Provence ; contrat PI-TCAN Programme interdisciplinaire CNRS 2004-2006, Contrat ANR 2005-2007) Chantal Lyche (Université d’Oslo) Sophie Wauquier-Gravelines (Université Paris 8)

Page 15: Laboratoire Modèles, Dynamiques, Corpus

15

2. Problématique Bien que pratiquement inaperçue en France où les phonologies post-génératives classiques sont restées dominantes, et où même les phonologies optimalistes, ne se sont que très peu installées, le champ conceptuel de la phonologie contemporaine internationale a connu des changements récents très substantiels. La relation entre théorie et données, modèles abstraits et observables s’est totalement inversée. De modèles sous-déterminés par les données, ont est passé à des approches qui placent au premier plan les observables et les phénoménologies construites explicitement. Les approches quantitatives, statistiques et probabilistes se sont développées. Les grammaires de construction qui modifient profondément la conception que l’on peut avoir du stockage lexical, les modèles occurrentialistes qui accordent une importance centrale à la structure statistique des données, les modèles exemplaristes et leurs effet sur la conception de l’apprentissage, ont tous conjointement contribué à redonner aux données d’observation la place première qui étaient la leur dans les approches classiques. Dans ce contexte théorique international renouvelé, les opérations de phonologie du laboratoire MoDyCo ont visé à définir, modéliser et promouvoir une phonologie de corpus. 2.a. Actions L’opération Phonologie de la syllabe et phonologie du français a été poursuivie. Le programme « Phonologie du Français Contemporain » qui vise une reconstruction d’ensemble des phénoménologies de la phonologie du français s’est développé de façon considérable. Le réseau international du programme comprend plus de 60 chercheurs issus de 15 pays francophones. Deux colloques sont organisés chaque année. Le Bulletin interne du projet PFC en est à son numéro 6. La base de données atteint les 300 locuteurs et 600 heures d’enregistrements. Les premières analyses quantitatives et qualitatives ont été présentées en France et à l’étranger. L’équipe MoDyCo assure la coordination d’ensemble du projet et gère son financement. Elle assure également la coordination technique, gère et développe la base de données, les outils de fouille et la plate forme internet associée (http://www.projet-pfc.net/). Dans cette même perspective de phonologie de corpus, les travaux sur la modélisation dynamique et connexionniste de la syllabe ont été poursuivis, notamment en collaboration avec l’équipe du Professeur Bertinetto de SNS Pise avec laquelle nous partageons un contrat. Le développement de cette linguistique de corpus et les premiers résultats du projet PFC ont permis de proposer des analyses renouvelées de la liaison et du e muet en français. 9 thèses nationales ou en cotutelle internationale, de nombreuses conférences et publications ont illustré cette activité. Enfin, la mise en perspective historique et épistémologique de ces réorientations a été poursuivie dans un travail mené en collaboration avec John Goldsmith (Université de Chicago, poste rouge, chercheur invité à MoDyCo en 2006-2007), centré sur l’histoire des sciences cognitives et de la linguistique, avec une attention particulière à l’histoire critique de la phonologie au 20ème siècle. 2.b. Groupe de travail Le projet PFC a donné lieu à l’organisation régulière de plusieurs groupes de travail. Le pilotage du projet nécessite une vingtaine de réunions par année.

Page 16: Laboratoire Modèles, Dynamiques, Corpus

16

L’analyse de la liaison, du e muet et des autres phénomènes centraux de la phonologie du français a été conduite au sein d’un séminaire doctoral. Les travaux connexionnistes ont été encadrés par l’organisation de deux colloques, l’un à Pise et l’autre à Paris avec l’accueil à MoDyCo d’un chercheur de Pise. Enfin un groupe de travail d’histoire et d’épistémologie de la phonologie au 20ème siècle a été mis en place sur la base de réunions mensuelles (2006 et 2007). 2.c. Journées d’études, colloques Organisés ou co-organisés par des membres de l’opération :

1. 2004, Journées du GDR Phonologies : « La liaison en français : nouvelles approches », Paris, mars.

2. 2004, « Phonologie du français: Enjeux descriptifs et théoriques », Université de Calgary (Canada), juillet.

3. 2004, Journée d’études « Evolution et typologie des langues : la question indo-européenne », EHESS, novembre.

4. 2004, 2ème Colloque Franco-Norvégien : « Phonétique et phonologie du français : données et théories », Paris MSH, décembre.

5. 2005, 7ème colloque international du Réseau Français de Phonologie, Aix-en-Provence, juin.

6. 2005, Colloque CASTL, « Phonological variation : The case of French », Université de Tromso, août.

7. 2006, Journée de l’ATALA : « Phonétique et phonologie : état de l’art », ENST, janvier.

8. 2006, Université Internationale d’été, Atelier « Autour de la syllabe », Université de Paris 10, juin.

9. 2006, Corpora in phonological research. European Science Foundation colloquium, Amsterdam, Meertens Institut, 15-17 juin.

10. 2006, Colloque international : « La phonologie du français contemporain », Université Catholique de Louvain, juillet.

11. 2006, « Faire signe », Colloque international en hommage à Pierre Encrevé, EHESS, octobre.

12. 2007, « Incontro di phonologia” (progetto Gallileo dall Universita Italo-Francese), Scola Normale Superiore di Pisa, Pise, avril.

13. 2007, Université Internationale d’été, Journée « Modélisation en Sciences du Langage », Université de Paris 10, juin.

14. 2008, Premier Congrès International de Linguistique Française (comité d’organisation : Jacques, Durand, Benoît Habert, Bernard Laks)

2.d. Contrats et participation à des contrats

1. Contrat CNRS, projet Réseau de phonologie (2001-2004) : 10 000 euros 2. Contrats Institut de Linguistique Française, projet PFC (2002-2005) : 15 000 Euros 3. Contrats Ministère de la Culture (DGLFLF), projet PFC (2001-2005) : 55 000 Euros 4. Contrats Ministère de la Culture (DGLFLF), Projet Corpus Oraux / Colloque (2005-

2006) : 25 000 euros 5. Contrat TCAN (CNRS), projet VARCOM (2004-2005) : 4 500 euros 6. Contrat ANR, projet PFC (2006-2008) : 60 055 euros

Page 17: Laboratoire Modèles, Dynamiques, Corpus

17

7. Contrat Université Franco-Italienne (2006-2007) : 3 510 euros 8. Contrat ESF, Réseau Corpho, (direction Geert Kristofersen, Pr Université de Bergen,

2006-2007) : 10 000 euros 3. Thèses en cours (11 dont 5 en cotutelle)

1. Allahverdi Azari Nadjaf : La structure accentuelle du persan. Directeur B. Laks. 2. Géraldine Mallet : Phonologie de français : la liaison et l’enchaînement. Directeur

B. Laks. 3. Patrick Tomatis : Apprentissage phonologique et perception multimodale : le rôle de

l’oreille. Directeur B. Laks. 4. Katherine Asla Ostby : Le système vocalique du français parisien. Une étude

comparée dans le cadre du projet « Phonologie du français contemporain ». Directeur B. Laks, cotutelle avec Chantal Lyche, Université d’Oslo.

5. Omid Reza Taheri : Modélisation connexionniste de l’approche cognitive de la dénomination des objets. Directeur B. Laks.

6. Twan Geerts : Schwa en français et en néerlandais. Directeur B. Laks, cotutelle avec Haike Jacobs, Université de Nimègue.

7. Carolin Graml : "/r/ en romania : analyses synchroniques et diachroniques dans le domaine francophone et hispanophone. Directeur B. Laks, cotutelle avec Wulf Österreicher, Ludwig-Maximilians-Universität München.

8. Evguenia Bestchastnova : Y a-t-il un accent phonologique en français ? Directeur B. Laks, cotutelle avec Natalia Portnova de l’Université de Moscou.

9. Maxence Lureau : Le coaching : étude systémique des aspects cognitifs, sociolinguistiques, psycholinguistiques, phonologiques et communicationnels du métier de coach. Directeur B. Laks.

10. Laurent Nkondo : Le Nkuma, texte et hypertexte. Approche ethno-textuelle d’un corpus d’expressions proverbiales en Beembe (République du Congo). Directeur B. Laks.

11. Gian Paolo Renello : Traitement automatique du texte littéraire : le cas du sonnet. Directeur B. Laks, cotutelle avec Antonio Pietropaoli, Université de Salerne.

4. Thèses soutenues (4 dont 2 en cotutelle)

1. René Joseph Lavie : Le locuteur analogique : la grammaire remise à sa place, novembre 2003. Directeur B. Laks.

2. Ali Tifrit : Marque et syllabe : l’analyse des fricatives dans un modèle à contours, novembre 2005. Directeur B. Laks.

3. Conrad Johansson : La théorie de l’intégration conceptuelle et internet, mars 2006. Directeur B. Laks, cotutelle avec Kerstin Jonasson (Université d’Uppsala).

4. Elissa Sobotta : Variation phonologique et identité linguistique : le cas des Aveyronnais et des Antillais, juin 2006. Directeur B. Laks, cotutelle avec Thomas Krefeld (Ludwig-Maximilians-Universität München).

Page 18: Laboratoire Modèles, Dynamiques, Corpus

18

5. Production scientifique halshs-00131522, Klein M., Carvalho J., 2006, Le "fantôme dans la machine" : opacité,

variation et théorie de l’input, Baude, O., G. Bergougnioux, M. Fornel (de) & B. Laks (éds.), Faire signe: hommage à Pierre Encrevé, MSH.

hal-00123595, Lacheret-Dujour A., (à paraître), Petit parcours prosodique de Grenoble à Aix-en-Provence : pionniers, dissidents et fédérateurs, Abry Boé et al (éd.), Un siècle de phonétique expérimentale : Histoire et développement de Théodore Rosset à John Ohala, ENS Editions.

halshs-00166501, Laks B., 2007, Les hommes politiques français et la liaison (1908-1999), Luc Baronian et France Martineau (éds.), Modéliser le changement : les voies du français, Presses de l’Université de Montréal.

halshs-00116259, Laks B., 2007, Genetics and language : comparatism and genealogy in perspective, Bernard Laks (éd.), Origin and evolution of languages : approaches, models, paradigms, Equinox Publishers.

halshs-00116267, Laks B., Encrevé P., Cleuziou S., Demoule J.-P., 2007, Introduction, Bernard Laks (éd.), Origin and evolution of languages : approaches, models, paradigms, Equinox Publishers.

halshs-00116809, Laks B., 2006, Figement ou construction dans la phonologie de la liaison, Linx, 55.

halshs-00116958, Laks B., 2006, "Variatio omnibus": notes sur la variation linguistique et le changement, P.V. Moss (éd.), Zwischen Babel und Pfingsten: Sprachdifferenzen und Gesprächsverständigung in der Vormoderne, 1.

halshs-00116257, Laks B., Durand J., Lyche C., Mallet G., 2006, Le projet "Phonologie du Français Contemporain", bilan et perspective, Abécassis M. (éd.), French Phonology and variation, Publications de l’Université d’Oxford.

halshs-00114176, Laks B., Pagliano C., 2006, Mochet M.-A. et alii, Problématiques de la liaison dans l’analyse d’un corpus de français oral actuel, Le français fondamental, Colloque international Français fondamental, corpus oraux, contenus d’enseignement : 50 ans de travaux et d’enjeux.

halshs-00116209, Laks B., 2005, Continu et discontinu en phonologie, Balogh P. & Bardosi V. (éds.), Textes linguistiques d’auteurs français du XXème siècle, Presses de l’Université Lorand Eotvos.

halshs-00115925, Laks B., 2005, Approches cognitives de la phonologie, Phonologie et phonétique : forme et substance, Hermès.

halshs-00114110, Laks B., 2005, La liaison et l’illusion, Langages, 158, 101-126. halshs-00114286, Laks B., 2005, Phonologie générative naturelle et phonologie naturelle,

S. Auroux, K. Koerner, H-J. Niederehe, et K. Versteegh (éds.), Geschichte der Sprachwissenschaften, Walter de Gruyter.

halshs-00116091, Laks B., 2005, Continuités et ruptures dans l’histoire récente de la phonologie, Jacquet-Pfau C., Sablayrolles J.-P. (éds.), Mais que font les linguistes ? Les sciences du langage, vingt ans après, L’Harmattan, 45-73.

halshs-00116017, Laks B., Chevrot J.-P., Fayol M., 2005, La liaison de la phonologie à la cognition, Langages, 158, 3-8.

halshs-00114127, Laks B., Durand J., Lyche C., 2005, PFC : un corpus numérisé pour la phonologie du français, Williams G. (éd.), La linguistique de corpus, Actes des deuxièmes journées de la linguistique du corpus, Presses Universitaires de Rennes, 205-217.

Page 19: Laboratoire Modèles, Dynamiques, Corpus

19

halshs-00116244, Laks B., Goldsmith J., 2005, Generative Phonology and its successors, Waugh L.-R. & Joseph J.-E. (éd.), The Cambridge History of Linguistics, Cambridge University Press.

halshs-00116211, Laks B., Tifrit A., Tchobanov A., 2005, Les modèles dynamiques linéaires : la syllabe, Tyvaert J.-E (éd.), La syllabe dans l’identification des mots écrits, Presses de l’Université de Reims.

halshs-00114103, Laks B., 2004, Phonétique et phonologie du continu au discontinu, Cahiers de praxématique, 42, 145-175

1.2.1.2. Morphologie et Sémantique Lexicale 1. Membres de l’opération Membres rattachés à titre principal (5) Françoise Kerleroux (responsable) Didier Bottineau Sophie David Sarah Leroy Sergueï Sakhno Doctorants (2) Coralie Roger Sophie Saulnier Chercheurs associés (3) Peter Lauwers (Université de Leuwen) Claudine Pagliano (Université de Nice) Florence Villoing (Université Paris 8) Collaborations extérieures (4) Karine David (doctorante Nancy 2) Carmen Kelling (Université de Konstanz) Judith Meinschäfer (Université de Konstanz) Delphine Tribout (doctorante Paris 7) 2. Problématique La morphologie constructionnelle a pour objectif d’élaborer la grammaire des mots construits : description empirique des phénomènes et identification des unités et principes théoriques de l’analyse. Les unités prises en compte sont les unités multidimensionnelles du lexique : un lexème, signe linguistique, abstrait puisque hors emploi, est caractérisé par ses diverses propriétés (Anderson, 1992, Aronoff, 1994) : sa forme phonologique, sa catégorie, sa valence, son stock éventuel de radicaux allomorphiques ou supplétifs, son appartenance à une classe flexionnelle, sa représentation sémantique. Plus précisément, sur le plan sémantique, les approches développées ces trente dernières années (entre autres Katz 1972 ; Pustejovsky 1995 ; Godard et Jayez 1996 ; Cadiot et Nemo 1997), si elles se distinguent pour une part selon la manière de considérer (ou pas) et de traiter le sens référentiel, ont par ailleurs en commun de ne pas prendre en compte le calcul du sens dans les mots construits. Il importe cependant de les examiner en détail, afin de proposer à terme un modèle qui vaille pour les

Page 20: Laboratoire Modèles, Dynamiques, Corpus

20

mots simples et les mots construits. En liaison avec cet examen, on se pose la question de la représentation sémantique des noms propres. Il s’agit ainsi de chercher à caractériser quels aspects de la représentation sémantique d’un lexème sont exploités lorsqu’il est pris comme base d’une opération constructionnelle : (i) ainsi est-ce que les lexèmes pourvus d’une structure d’arguments la transmettent ? (ii) comment ces effets d’héritage sont filtrés ou modelés par l’appartenance catégorielle et par le type sémantique ? En parallèle, il s’agit (iii) d’examiner la question de l’identification catégorielle ; (iv) de rendre compte de la représentation sémantique des lexèmes et plus particulièrement des noms à l’aide d’une approche en termes de types ; (v) d’examiner en détail la question du nom propre sous toutes ses dimensions linguistiques. 2.a. Actions 1) Caractérisation des unités accessibles aux opérations morphologiques du point de vue catégoriel, sémantique et morpho-phonologique - Les unités pertinentes pour les opérations de construction morphologique : les phénomènes obligent à intégrer parmi les lexèmes fournisseurs de bases les noms propres, et les numéraux. - Les allomorphies radicales : on a examiné ici la pluralité des radicaux des lexèmes, leur mise en jeu à titre purement formel dans la dérivation (cf. Aronoff, 1994). - La pertinence de la notion de racine, plus particulièrement en russe. - La mise en œuvre des propositions de Croft (1991) à propos d’un corpus sur les odeurs. On montre l’intérêt de disposer d’un double système de fondation catégorielle (fonction pragmatique et types sémantiques), qui permet de rassembler des expressions (odeurs alimentaires et odeurs des aliments, par ex.) tenues séparées si on ne les envisage que dans un cadre traditionnel. 2) Polysémie des lexèmes - structure argumentale - représentation sémantique - Les manifestations morphologiques de la polysémie des lexèmes : pour une forme phonologique donnée, associée à une flexion, on constate le maximum de contrastes, à savoir la présence versus l’absence de certains types de constructions : par ex. les verbes de localisation ne fournissent pas de base à des nominalisations. - L’étude des noms propres modifiés interroge directement la possibilité de fournir une description unifiée des différents emplois (modifiés/non modifiés) du nom propre. On étudie ici les critères définitoires à partir desquels des classements ont pu être proposés. 3) Nomination, dénomination, lexicalisation Les travaux portent sur la production de sens du nom en discours, sur les processus de (dé)nomination et de lexicalisation. A partir de l’observation de dénominations éphémères ou d’emprunts en discours, et, pour le nom propre, l’observation des structures de comparaison et d’expression du parangon, on s’interroge plus spécifiquement sur les notions de figement, lexicalisation et catachrèse. 2.b. Groupe de travail Le groupe de travail en Morphologie, se réunit entre 6 et 9 fois par an, le vendredi, de novembre à juin. Les interventions sont annoncées sur le site. Voir la page du site de MoDyCo : http://www.modyco.fr/?events:groupes_travail

Page 21: Laboratoire Modèles, Dynamiques, Corpus

21

2.c. Journées d’études, colloques, séminaires

1. 1er avril 2005, Nanterre. Séminaire thématique de Morphologie (5 conférences). 2. 24 juin 2005, Paris. Journée d’études Conscila « Changements dans le lexique :

lexicalisation, figement, catachrèse » (5 conférences, suivies d’une publication). 3. 21 mars 2007, Nanterre. Séminaire de MoDyCo (2006-2007), Journée de Morphologie

(3 conférences). 4. 14-15 juin 2007, Caen. Journée d’études « La sémantique lexicale au regard des textes

et des corpus » (8 conférences). 3. Thèses en cours (2)

1. Coralie Roger : Sens et structure des verbes construits sur bases nominale et adjectivale. Directrice F. Kerleroux.

2. Sophie Saulnier : Les nombres : grammaire et lexique. Directrice F. Kerleroux. 4. Production scientifique halshs-00122236, Bonami O., Boyé G., Kerleroux F., 2007, L’allomorphie radicale et la

relation flexion-construction, B. Fradin, F. Kerleroux & M. Plénat (éds.), Aperçus de morphologie du français, Presses universitaires de Vincennes.

halshs-00122296, Bottineau D., 2007, Ergativité nominale et actance verbale en basque, Actes du 11e Colloque International de Psychomécanique du Langage.

halshs-00121221, Bottineau D., 2006, Les formes non finies du verbe basque, Blanvillain, O. & Guimier, C., Travaux linguistiques du Cerlico, 19, Les formes non finies du verbe -1-, Presses Universitaires de Rennes. [https://hal.ccsd.cnrs.fr/ccsd-00097953].

halshs-00133035, David S., Barkat S., Bensafi M., Rouby C., 2004, Catégorisation des odeurs en l’absence ou en présence des noms, Actes de la journée « Sensorialités et données verbales : quelles méthodes pour quels objectifs ? », 6-10.

halshs-00122232, Fradin B., Kerleroux F., Plénat M. (éds.), A paraître, Aperçus de morphologie du français, Presses Universitaires de Vincennes

halshs-00122240, Kerleroux F., 2007,Verb classes, morphological construction rules and gaps in the nominalizations, Lucia Tovena & Ph. Miller (éds.), Actes du colloque de Lille (sept. 2004).

halshs-00122242, Kerleroux F., 2007, Hommages en l’honneur de Marc Plénat, L. Labrune & E. Delais (éds.), Pêcheurs sous la glace.

halshs-00122238, Kerleroux F., 2007, Des noms indistincts, B. Fradin (éd.), La raison morphologique. Hommage à la mémoire de Danielle Corbin, Benjamins.

halshs-00122230, Kerleroux F., Fradin B., 2007, L’identité lexémique, B. Fradin, F. Kerleroux & M. Plénat (éds.), Aperçus de morphologie du français, Presses universitaires de Vincennes.

halshs-00122224, Kerleroux F., 2006, Les théories morphologiques à la fin du XXème siècle, S. Auroux, K. Koerner, H.-J. Niederehe & K. Versteegh (éds.), Manuel international d’histoire des études linguistiques des origines à nos jours, De Gruyter.

halshs-00122213, Kerleroux F., 2005, Nida, Eugene Albert (b. 1914), K. Brown (éd.), Encyclopedia of Language & Linguistics. Second edition, Elsevier Science.

halshs-00122212, Kerleroux F., 2004, Sur quels objets portent les opérations morphologiques de construction ?, Lexique, 16, 85-123.

Page 22: Laboratoire Modèles, Dynamiques, Corpus

22

halshs-00162108, Lecolle M., Leroy S. (dir.), 2006, Changements linguistiques : figement, lexicalisation, grammaticalisation, Cahiers de praxématique, 46, Publications Montpellier 3.

halshs-00085841, Leroy S., 2007, Des Vanessa, des José Bové : dénominations éphémères et dynamique de la lexicalisation, Revue Romane, 42-1, 65-82.

halshs-00162112, Leroy S., 2007, Les comparaisons comme SN exprimant le plus haut degré, Travaux de Linguistique, 54, 69-82.

halshs-00168425, Leroy S., 2007, Les noms propres et la dérivation suffixale, Neuphilologische Mitteilungen, 109.

halshs-00168424, Leroy S., Muni Toke V., 2007, Une date dans la description linguistique du nom propre : l’Essai de grammaire de la langue française de Damourette et Pichon, Lalies, 27.

halshs-00122038, Leroy S., 2006, « " Les prénoms ont été changés ". Pseudonymisation médiatique et production de sens des prénoms, Cahiers de sociolinguistique, 11, 28-40.

halshs-00098098, Leroy S., 2005, Sécurité, donc sûreté. L’emploi de donc comme marqueur de glose, Steuckardt A. & Niklas-Salminen A. (éds.), Les Marqueurs de glose, Publications de l’Université de Provence, 159-170.

halshs-00085840, Leroy S., 2005, Noms propres : la modification, Langue Française, 146, Larousse.

halshs-00088696, Leroy S., 2005, D’un torrent de larmes à un Himalaya de bêtise. Sur certains déterminants nominaux métaphoriques en français, Travaux de Linguistique, 50, 97-112.

halshs-00085760, Leroy S., 2005, L’emploi exemplaire, un premier pas vers la métaphorisation ?, Langue Française, 146, 84-98.

halshs-00084613, Leroy S., 2004, Le Nom propre en français, Ophrys halshs-00084621, Leroy S., 2004, De l’identification à la catégorisation L’Antonomase du

nom propre en français, Peeters. halshs-00090043, Leroy S., 2004, Entre reprise et conséquence : donc en coordination de

mots, Revue de Sémantique et Pragmatique, 15-16, 267-282. halshs-00088698, Leroy S., 2004, Extraire sur patrons : allers et retours entre analyse

linguistique et repérage automatique, Revue française de linguistique appliquée, IX-1, 25-43.

halshs-00131413, Sakhno S., 2006, Nom propre en russe : problèmes de traduction, META : Journal des traducteurs, 51, 4, 706-718.

1.2.1.3. Syntaxe et sémantique grammaticale descriptives du français (SSGDF) 1. Membres Membres à titre principal (9) Danielle Leeman (responsable) Didier Bottineau Denis Le Pesant François Muller Antoinette Balibar-Mrabti Carole Tisset (jusqu’en 2005) A partir de l’intégration du LEAPLE dans MoDyCo (2006), se sont adjoints au groupe : Danièle Cogis Jean-Pierre Jaffré

Page 23: Laboratoire Modèles, Dynamiques, Corpus

23

Claire Martinot Doctorants (8 dont 5 en cotutelle) Patrice Gourdet Patrick Harnay Yukiyo Homma Estelle Jouili Amadou Konté Jean-Christophe O’Brien Erika Saint-Jean Claudine Salinas-Kahloul Jeunes chercheurs associés (5) Badreddine Hamma (jusqu’en 2007) Sophie Hamon (jusqu’en 2006) Ichraf Khammari Belinda Lavieu Céline Vaguer Membres associés (6) Jean-Claude Anscombre (CNRS) Jean-Pierre Bruckert (Psychologie, Université Paris 10) Catherine Garitte (Psychologie, Université Paris 10) Pierre Patrick Haillet (Université de Cergy-Pontoise) Peter Lauwers (Sciences du langage, Université de Leuven) Christine Sanguin-Bruckert (Psychologie, Université Paris 10) Collaborations extérieures (13) Peter Blumenthal (Université de Cologne) Jean Dubois (Université Paris 10) Françoise Dubois-Charlier (Université Aix-en-Provence) Jacques François (Université de Caen) Geneviève Girard (Université Paris 3) Gerda Hassler (Université de Potsdam) Jean-Marie Merle (Université d’Aix-en-Provence) Emma Nardi (Sciences de l’éducation, Université de Roma Tre) Christine Onguene-Essono (Université de Yaoundé III) Jean-Christophe Pagès (Baho, Pyrénées Orientales) Pierre Péroz (IUFM Metz) Nigel Quayle (Université Lille 3) Max Silberztein (Université de Besançon) 2. Problématique L’axe directeur de l’opération a été défini en fonction des affinités théoriques et méthodologiques des membres du groupe de recherche (rassemblés essentiellement sur la base du structuralisme tel qu’initié par Saussure et spécifié par Harris), et son programme

Page 24: Laboratoire Modèles, Dynamiques, Corpus

24

scientifique a été circonscrit selon les manques qui leur paraissaient devoir être comblés à l’issue de leurs travaux antérieurs. En particulier : 1) La publication (de diffusion restreinte) du dictionnaire Les Verbes français de J. Dubois et F. Dubois-Charlier (Larousse-Bordas 1997) n’avait pas donné lieu à l’exploitation qu’on eût pu attendre après sa parution (cf. J. Dubois et F. Dubois-Charlier dans Langages 128 en 1997, A. Balibar-Mrabti dans Langue française 134 en 2002, D. Leeman dans Linx 50 en 2004) – or il s’agit du classement radicalement original d’un corpus constitué de l’ensemble des emplois de verbes tels qu’attestés dans les plus grands dictionnaires de langue. 2) Les Textes officiels centraient en 2002 sur le verbe et le nom le programme de grammaire à l’école élémentaire sans qu’en apparaissent renouvelés les outils d’enseignement ou d’apprentissage, ce qui rendait nécessaire une sorte de « mise à plat » des connaissances mises au jour par la recherche linguistique pour l’étude de leur transposition didactique et la mise au point de propositions pédagogiques innovantes – or les membres du groupe de recherche ont aussi en commun la conviction que le chercheur dans le service public doit avoir une utilité sociale (et non ses travaux ne servir qu’à sa propre gloire ni à la seule progression de sa carrière). 3) Les travaux antérieurs de D. Leeman sur les prépositions ne pouvaient compenser la relative mise à l’écart, dans la recherche contemporaine (cognitivisme et théorie de la grammaticalisation aidant), de leurs emplois non spatiaux, marginalisation qui engendre des résultats descriptifs péchant par leur caractère partiel : d’où la définition de sujets de recherche, pour les thèses de ses doctorants, essentiellement axés sur les prépositions afin de combler le manque observé dans la description du français. 4) Travailler sur la préposition conduit inéluctablement à rencontrer le domaine de la locution (les locutions valident-elles ou invalident-elles les hypothèses, avancées à partir de l’observation de leurs emplois libres, sur les prépositions qui en sont la tête) et celui de la traduction, en particulier dans le domaine de l’enseignement des langues aussi bien que dans celui du traitement automatique. Les emplois des verbes (cf. Action 1) et ceux des prépositions (cf. Action 2) sont loin d’avoir tous été inventoriés, d’une part, et une appréhension référentialiste de leur identité sémantique s’avère insatisfaisante pour en rendre compte, d’autre part (si l’on peut penser qu’un navire, c’est un bateau, on ne dit pas prendre le navire comme on dit prendre le bateau, et si un fleuve et une rivière sont tous deux des cours d’eau, on ne dit pas pêcher en fleuve comme on dit pêcher en rivière). Pour séduisants qu’ils puissent paraître a priori, un certain nombre de travaux s’avèrent ainsi peu utiles à la linguistique, a fortiori à la traduction ou au traitement automatique, voire dangereux sur le plan didactique ou pédagogique. Il s’agit donc de procéder à une description minutieuse des formes observables, seuls indices que livre la langue du fonctionnement de son système propre, pour tenter d’en inférer sa structure sémantique (laquelle ne peut être assimilée à (l’idée intuitive que l’on peut avoir de) la structure conceptuelle (ni à l’organisation du monde objectif lui-même) – ce que montre le classement syntactico-sémantique des emplois des verbes auquel aboutit l’ouvrage cité de J. Dubois et F. Dubois-Charlier (1997). Voir : J. François, D. Le Pesant, D. Leeman, dir. 2007 : Langue française 153 : Le classement syntactico-sémantique des verbes français, avec des contributions de : Antoinette Balibar-Mrabti, Iris Eshkol et Denis Le Pesant, Jacques François et Dominique Dutoit, Sophie Hamon et Danielle Leeman, Rolf Kailuweit, Danielle Leeman et Madona Sakhokia-Giraud, Morgane Sénéchal et Dominique Willems.

Page 25: Laboratoire Modèles, Dynamiques, Corpus

25

Voir également : D. Leeman, dir. 2007 : Modèles linguistiques 55 : De la préposition à la locution prépositionnelle, avec des contributions de Denis Le Pesant, Pierre Cadiot, Badreddine Hamma, Belinda Lavieu, Pierre Péroz, Max Silberztein, Céline Vaguer. Ou encore : D. Leeman, dir. 2008 : Langue française 157 (mars) : Enigmatiques prépositions, avec des contributions de Céline Vaguer, Peter Blumenthal, Ichraf Khammari, Christiane Marque-Pucheu, Hava Bat-Zeev Shyldkrot, Gerda Hassler (en cours de relecture anonyme). 2.a. Actions 1) Le verbe et les constructions verbales L’action 1 « Le verbe et les constructions verbales » se décline en deux sous-actions complémentaires, d’une part « Description linguistique des verbes français » (D. Leeman, D. Le Pesant, A. Balibar-Mrabti pour les membres à titre principal), d’autre part « Didactique de la syntaxe » (D. Leeman, D. Le Pesant, D. Flament, C. Tisset (jusqu’en 2005 inclus), (à partir de 2006) D. Cogis, J.-P. Jaffré, C. Martinot, (à partir de 2007) Didier Bottineau, pour les membres à titre principal). 2) La préposition, les locutions prépositives et prépositionnelles L’action 2 « La préposition » a constitué le programme scientifique de 2003 à 2005, et s’est réorientée en 2006 vers « les Locutions prépositives et prépositionnelles » (D. Leeman, D. Flament, D. Le Pesant, F. Muller, D. Bottineau pour les membres rattachés à titre principal). 2.b. Journées d’étude, colloques, ateliers Chaque journée d’étude ou colloque organisé(e) est préparé(e) par au moins deux ateliers d’une demi-journée ; le groupe s’est donc réuni au moins vingt fois en atelier dans la période 2004-2005-2006-2007 – soit en moyenne une vingtaine d’heures annuelles au minimum.

1. 2004 : Journée Le verbe dans tous ses états organisée par C. Vaguer et B. Lavieu à Paris 10, 29 janvier, actes parus aux Presses universitaires de Namur, coll. « Diptyque », 2004 (178 p.).

2. 2005 : Journée internationale De la langue au texte organisée par Céline Vaguer et Danielle Leeman à Paris 10, 14 janvier, actes parus aux Presses universitaires de Namur, coll. « Diptyque », 2005 (186 p.).

3. 2005 : Journée internationale Classement syntactico-sémantique des verbes français organisée par Sophie Hamon, Jacques François et Denis Le Pesant à Paris 10, 14 décembre, actes dans Langue française 153, mars 2007.

4. 2005 : Journée internationale Le semi-figement, organisée par Antoinette Balibar-Mrabti et Céline Vaguer à Paris 10, 25 mars, actes dans Linx 53, 2005 : 2.

5. 2005 : Journée « La cause à travers les sciences », organisée par Sophie Hamon et Mathieu Amy (éthologie) à Paris 10, actes dans Linx 54 : La cause : approche pluridisciplinaire, 2006 : 1.

6. 2006 : Colloque international « Les prépositions du français », organisé par Danielle Leeman à Florence, 5-6-7 avril, actes dans Modèles linguistiques 53 et 54 : La préposition en français, 2006 : 1 et 2006 : 2.

7. 2006 : Journée internationale Des savoirs savants aux savoirs enseignés, organisée par Céline Vaguer et Danielle Leeman à Paris 10, 29 mars, actes parus aux Presses universitaires de Namur, coll. « Diptyque », 2006 (166 p.).

Page 26: Laboratoire Modèles, Dynamiques, Corpus

26

8. 2007 : Journée « Locutions du français », organisée par Danielle Leeman et Françoise Dubois-Charlier à Aix-en-Provence, 27 janvier, actes (sous presse) dans Modèles linguistiques 55 : De la préposition à la locution prépositionnelle, 2007 : 1.

9. 2007 : Journée Orthographe : innovations théoriques et pratiques de classes, organisée par Céline Vaguer et Houda Ounis à Paris 10, 28 mars, actes à paraître aux Presses universitaires de Namur, coll. « Diptyque », décembre 2007 (soumis et accepté).

10. 2007 : Journée internationale « Locutions prépositives et prépositionnelles : français et autres langues », organisée par Danielle Leeman à Paris 10, 6 juillet, actes à paraître dans L’Information grammaticale, mars 2008 (projet soumis et accepté).

Les programmes détaillés sont disponibles sur le site de MoDyCo, dans le menu Evénements. En dehors des séminaires réguliers mentionnés précédemment, le groupe (avec d’autres membres de MoDyCo) a suivi une formation à NooJ (Max Silberztein, Besançon), organisée par Denis Le Pesant (8-9 juin 2006), destinée à lui permettre de se familiariser avec les procédures de traitement automatique des langues (en matière d’analyse syntaxique), de manière à développer à la fois les possibilités d’accès aux grands corpus existants et leur utilisation et à être en mesure de les alimenter par ses propres résultats. 2.c. Contrats

1. 2006 : Financement par l’ILF du projet « Locutions » (3 000 euros). 2. 2007 : Financement du projet « Locutions » par le Conseil scientifique de l’Université

de Paris 10 (8000 euros) et par l’ILF (2 000 euros). 3. 2007 : Financement par l’UFA (Université franco-allemande) du Collège doctoral bi-

national Paris 10/Potsdam « Locutions : les langues entre cultures et cognition » (dirigé par Danielle Leeman et Gerda Hassler, et impliquant au titre de Paris 10 A. Bertin, D. Le Pesant, F. Muller) pour une durée de trois ans, à hauteur de 5 658 euros en 2007, 9 816 euros en 2008, 9 816 euros en 2009, 4 158 euros en 2010.

4. 2007 : Financement par EGIDE du projet franco-coréen STAR (« Partenariat Hubert Curien ») défini au titre de MoDyCo par Denis Le Pesant avec l’Université Ajou (Corée du Sud). Intitulé « Recherches en lexicologie et enseignement du vocabulaire en didactique des langues étrangères », le projet est financé sur deux ans (2007 et 2008) à raison de 7 500 euros par an pour le côté français.

3. Thèses en cours (8 dont 5 en cotutelle)

1. Patrice Gourdet. Directrice D. Leeman, cotutelle avec Rome 3. 2. Patrick Harnay. Directrice D. Leeman, cotutelle avec Rome 3. 3. Yukiyo Homma. Directrice D. Leeman. 4. Estelle Jouili. Directrice D. Leeman, cotutelle avec Potsdam. 5. Amadou Konté. Directrice D. Leeman. 6. Jean-Christophe O’Brien. Directeur F. Muller, cotutelle avec Potsdam. 7. Erika Saint-Jean. Directeur F. Muller, cotutelle avec Potsdam. 8. Claudine Salinas-Kahloul. Directeur D. Le Pesant.

Page 27: Laboratoire Modèles, Dynamiques, Corpus

27

4. Thèses soutenues (6) 1. Badreddine Hamma (2005). Directrice D. Leeman. 2. Sophie Hamon (2005). Directrice D. Leeman 3. Ichraf Khammari (2006). Directrice D. Leeman. 4. Belinda Lavieu (2005) Directrice D. Leeman. 5. Houda Ounis (2006). Directrice D. Leeman. 6. Céline Vaguer (2004). Directrice D. Leeman.

5. Production scientifique halshs-00120896, Balibar-Mrabti A., 2007, Phrases simples et exemplification, Langue

Française, 153. halshs-00120902, Balibar-Mrabti A., 2005, Semi-figement et limites de la phrase figée, Linx,

53, 35-54. halshs-00120904, Balibar-Mrabti A., 2004, Lexique-grammaire et extensions lexicales : note

sur le semi-figement, Ch. Leclere (ed.), Syntaxe, Lexique et Lexique-grammaire/ Syntax, Lexis & Lexicon-Grammar, Papers in honour of Maurice Gross, J. Benjamins Publishing.

halshs-00122295, Bottineau D., 2007, La coordination en basque, L. Beggioni, N. Quayle & A. Rousseau (éds.), La coordination.

halshs-00122307, Bottineau D., 2007, The Cognemes of the Spanish Language: towards a Cognitive Modelization of the Submorphemic Units in the Grammatical Words of the Spanish Language, The Public Journal of Semiotics, 2, 50-74, [http://www.semiotics.ca/issues/pjos-1-2.pdf].

halshs-00122300, Bottineau D., 2007, Personne de langage et personne de langue en basque, Actes du colloque Les représentations linguistiques de la personne.

halshs-00122291, Bottineau D., Roulland D., 2007, Le problème de la réflexivité en basque, D. Bottineau, D. Roulland & A. Rousseau (éds.), L’énoncé réfléchi, 205-228.

halshs-00122294, Bottineau D., 2006, Terminologie, terminographie et métalangue guillaumienne : problèmes actuels, Syntaxe et Sémantique, 7, 39-55.

halshs-00121220, Bottineau D., 2006, Le cognème, marque linguistique de la présence de l’auteur dans les grammèmes anglais, Bottineau D., 2006, D. Banks (éds.), Les marqueurs linguistiques de la présence de l’auteur, 143-164.

halshs-00132100, Eshkol I., Le Pesant D., 2007, Trois petites études sur les verbes de communication, Langue Française, 153, 20-32.

halshs-00147542, François J., Le Pesant D., Leeman D., 2007, Le classement syntactico-sémantique des verbes français, Langue française, 153, Larousse, Armand Colin.

halshs-00147545, François J., Le Pesant D., Leeman D., 2007, Présentation de la classification des "Verbes français" de Jean Dubois et Françoise Dubois-Charlier, Langue Française, 153, 3-19.

halshs-00117350, Leeman D., 2006, "Je" ou la première personne appréhendée d’un point de vue phénoménologique, D. Ducard & C. Normand (éds.), Antoine Culioli. Un homme dans le langage, Ophrys.

halshs-00117325, Leeman D., 2006, L’absence du sujet en français contemporain: premiers éléments d’une recherche, L’information grammaticale, 110, 23-30.

halshs-00117349, Leeman D., 2006, La préposition française: définition syntaxique de la catégorie, Modèles linguistiques, 53, T. XXVII-1, 1, 2006, 7-18.

halshs-00117343, Leeman D., Vaguer C., 2006, La préposition en français II, Modèles linguistiques, 54, TXXVII-2, Ed. du Dauphin.

Page 28: Laboratoire Modèles, Dynamiques, Corpus

28

halshs-00117340, Leeman D., Vaguer C., 2006, La préposition en français I, Modèles Linguistiques, 53, Tome XXVII-1, Ed. du Dauphin .

halshs-00117246, Leeman D., 2005, La préposition "jusque", P. Dendale (éd.), Le mouvement dans la langue et la métalangue, Université de Metz

halshs-00117270, Leeman D., 2005, Un nouvel auxiliaire: "aller jusqu’à", H. Bat-Zeev Shyldkrot & N. Le Querler (éds.), Les périphrases verbales, John Benjamins, 361-377.

halshs-00114527, Leeman D., 2004, Les déterminants du nom en français : syntaxe et sémantique, Presses Universitaires de France.

halshs-00114533, Leeman D., 2004, Les aventures de Max et Eve, j’ai aimé : à propos d’un COD "Canada Dry", Ch. Leclere (ed.), Syntaxe, Lexique et Lexique-grammaire/ Syntax, Lexis & Lexicon-Grammar, Papers in honour of Maurice Gross, J. Benjamins Publishing.

halshs-00117216, Vaguer C., Leeman D. (dir.), 2005, De la langue au texte, Le verbe dans tous ses états (2), Presses Universitaires de Namur & CEDOCEF.

halshs-00117205, Leeman D., 2004, Hypothèse d’une autonomie du nom et du verbe morphologiquement apparentés, Modèles linguistiques, T.XXV: 1/2, 129-138.

halshs-00132085, Le Pesant D., 2006, Esquisse d’une classification syntaxique des prépositions simples du français, Modèles linguistiques, T.XXVII-1, 53, 51-74.

halshs-00162287, Le Pesant D., 2006, Les verbes de relation cause-conséquence. Une délimitation linguistique, Des savoirs savants aux savoirs enseignés. Diptyque, 8, Presses Universitaires de Namur, 61-78.

halshs-00132104, Le Pesant D., Tisset C., 2005, Recherches en lexicologie et didactique du vocabulaire. L’exemple des verbes de déplacement, C. Vaguer & D. Leeman (dir.), De la langue au texte. Le verbe dans tous ses états (2), 103-131.

halshs-00126227, Martinot C., 2006, Grammatical role of French first verbs, Studies in theoretical psycholinguistics, 33, 297-318.

halshs-00122290, Rousseau A., Bottineau D., Roulland D. (éds.), 2007, L’énoncé réfléchi, Presses Universitaires de Rennes.

1.2.1.4. Modélisation de données linguistiques dans la perspective du traitement automatique des langues (METAL) 1. Membres de l’opération Membres rattachés à titre principal (7) Marcel Cori (responsable) Marianne Desmets (responsable) Karine Baschung Annie Delaveau Sylvain Kahane Françoise Kerleroux Anna Sörés Doctorants (3) Eliane Cheung Anne Lablanche Marie-Pierre Sales Jeune chercheur associé (1) Fabrice Delumeau

Page 29: Laboratoire Modèles, Dynamiques, Corpus

29

Collaborations extérieures (6) Bernard Fradin (LLF, CNRS) Kim Gerdes (Université Bordeaux 3) Hi-Yon Yoo (Université Paris 7) François Lareau (Université de Montréal/ Université Paris 7) Jean-Marie Marandin (LLF, CNRS) Alain Polguère (Université de Montréal) 2. Problématique Le programme se décompose en les diverses sous-tâches complémentaires caractéristiques du TAL - à savoir le niveau descriptif de recueil et de systématisation des données, le niveau de la modélisation théorique, et enfin le niveau des spécifications linguistiques formelles en vue d’une implémentation. L’hypothèse de travail sous-jacente, contrairement à la plupart des approches dites « robustes », est qu’il y a fortement intérêt à se doter d’un niveau de représentation symbolique et d’opérations sur ces symboles - en d’autres termes, que jusqu’à preuve du contraire c’est une bonne théorie linguistique qui reste susceptible in fine de produire une bonne technologie. Il s’agit entre autres : 1) de produire des descriptions linguistiques qui soient susceptibles d’être représentées dans des modèles formels ; 2) d’examiner les limites formelles précises des systèmes morphologiques, une fois que le modèle classique de concaténation segmentale a été récusé ; 3) d’étudier des problèmes généraux posés par les représentations syntaxiques (discontinuité, phénomènes à distance, sous-catégorisation, etc.) ainsi que la possibilité d’en rendre compte dans les formalismes existants ; 4) de comparer les formalismes selon les possibilités qu’ils offrent et de tenter d’en dégager certaines propriétés ; Les formalismes étudiés particulièrement sont HPSG, GAP et GUST. 5) d’envisager les extensions, restrictions ou modifications des formalismes existants afin de les rendre plus adéquats à la représentation des phénomènes linguistiques et au traitement informatique ; 6) d’aborder l’écriture des algorithmes et des programmes qui découlent de ces recherches théoriques. Le projet LexSynt (Lexiques syntaxiques et interface lexique-grammaire, http://lexsynt.inria.fr), coordonné par Sylvain Kahane, est un projet coopératif (12 équipes participantes) dont l’objectif est de mettre à disposition des lexiques du français qui puissent être utilisés comme composante lexicale d’un modèle syntaxique à large couverture. 2.a. Actions Les différents travaux se placent aux différents échelons de la chaîne des traitements définie dans la problématique. Plusieurs de ces travaux reprennent différentes sous-tâches. 1) Travaux de description linguistique 1a) Les travaux de Anna S�rés dans le domaine de la syntaxe portent d’une part sur les constructions passives, d’autre part sur les constructions impersonnelles, dans l’objectif de produire des descriptions linguistiques. En ce qui concerne le passif en hongrois, Alberti (1998, voir Bibliographie de S�rés 2006), dans le cadre de LFG propose une analyse identique à deux phrases correspondant respectivement à (a) ‘La chambre est louée’ et (b) ‘La

Page 30: Laboratoire Modèles, Dynamiques, Corpus

30

Tisza est gelée’. Alberti considère les deux cas de figure comme la formation du passif, qui consiste en la « suppression d’un argument ». Après une analyse détaillée du phénomène, A.S. arrive à la conclusion que cette explication est plausible pour la phrase (a) qui contient un verbe transitif dont un argument peut être supprimé. Toutefois, on ne peut pas l’accepter pour la phrase (b) où le verbe est intransitif : la suppression de l’argument unique donnerait comme résultat une phrase agrammaticale, le verbe intransitif ne peut rester sans argument. La description du passif en hongrois peut en même temps être intégrée dans une analyse de prototype, proposée par Shibatani (1986). Le domaine de « l’impersonnel » a été développé sur un nombre considérable de langues lors d’un colloque organisé par l’Université d’Angers en 2006. Le travail comparatif (S�rés et Hevér) a porté sur le hongrois, le finnois et le mordve erzya. Ce sujet a un intérêt particulier pour la description, puisque dans les grammaires de ces langues ce terme n’est pas utilisé pour décrire le même phénomène que dans les langues indo-européennes. Ainsi, pour pouvoir examiner les trois langues, nous avons proposé un critère unique, à savoir l’invariance en personne. Nous avons observé la présence ou l’absence d’arguments, sachant que dans ces langues il n’y a pas de « sujet postiche ». Pour le sujet, nous avons accepté de raisonner en prototype : agent, topique, a un référent animé et est exprimé par un cas non marqué. Les résultats montrent que seulement deux sur sept sous-classes verbales n’acceptent pas de sujet, alors que les autres acceptent un sujet non prototypique et/ou un ou deux autres arguments. Ceci permet supposer que le concept « impersonnel » doit être mis en rapport avec les propriétés que l’on attribue à la fonction « sujet ». Les phénomènes décrits suggèrent que c’est la structure argumentale du de verbe plutôt que la notion de la personne qui constitue le noyau du problème. 1b) Un travail de description du créole guadeloupéen en vue de la génération automatique d’énoncés en créole à partir d’énoncés en français a été conduit à son terme. Ce travail a donné lieu à plusieurs publications (Delumeau 2004, 2005a, 2005b) et à la soutenance d’une thèse en février 2006. Un programme informatique, écrit dans le langage Java, de traduction phonologique du français vers le créole guadeloupéen a été réalisé par Héléna Ragot, en stage au laboratoire de juin à septembre 2004. 1c) Différents travaux de description du français sont menés. Le travail de thèse de Marianne Desmets (Typage de la phrase en HPSG : le cas des phrases en « comme », déc. 2001) a été poursuivi et enrichi. Un premier axe de travail s’est développé autour de l’analyse des relatives sans antécédent du français. Cette recherche a donné lieu à deux communications, dont l’une réalisé en 2004 à l’occasion d’un travail en commun avec A. Kupsc (Académie des Sciences de Pologne) sur l’importabilité en LKB de l’analyse de M. Desmets (projet de recherche sur conventions internationales du CNRS n° PCCBO74734 avec la Pologne (Polska Akademia Nauk, Varsovie). Un article long est en préparation. Un deuxième axe de travail s’est mis en place depuis mi-2005 autour de l’identité sémantique de l’unité comme et des constructions comparatives, tout d’abord via une collaboration régulière avec des chercheurs de GRAM-m (groupe de recherche en syntaxe et sémantique des mots grammaticaux—EA 4089 Sens Texte Histoire - Université Paris IV Sorbonne) qui donnera lieu à un numéro de Linx (n°57, mars 2008) ; puis avec Estelle Moline (Université du Littoral-Côte d’Opale et Grammatica, Université d’Artois) avec qui plusieurs travaux sont en cours (dont une communication à une conférence internationale en août 2007, un article

Page 31: Laboratoire Modèles, Dynamiques, Corpus

31

accepté pour un numéro de Langue française, et un article accepté pour un numéro de Travaux linguistiques). Le travail sur les constructions infinitives d’Anne Lablanche a été prolongé en direction des adjectifs, notamment parce que les adjectifs peuvent introduire des infinitives (Paul a été très content de te voir). A noter un travail comparatif entre les infinitives en français et les complétives en créole guadeloupéen (Delumeau et Lablanche, 2004, 2006). 2) Sur la formalisation en syntaxe et en morphologie 2a) Les travaux de Marianne Desmets ont porté essentiellement sur la modélisation en HPSG, et notamment la modélisation des relatives en français. En parallèle au travail descriptif mené par deux doctorantes de Danielle Leeman, Belinda Lavieu et Sophie Hamon, dans le cadre de leur recherche, une réflexion autour de la formalisation des données linguistiques a été effectuée en collaboration avec Marianne Desmets. 2b) Une modélisation dans le cadre des Grammaires d’arbres polychromes est poursuivie, notamment dans le cadre des travaux d’Anne Lablanche sur les propositions infinitives. Une réflexion sur les fonctions grammaticales a été menée par Marcel Cori (2005). Cette réflexion fait un lien entre les recherches en intelligence artificielle sur la représentation des connaissances qui datent des années 1970 et les formalismes de représentation syntaxique. Une proposition de description des fonctions grammaticales dans le cadre des grammaires d’arbres polychromes est avancée. 2c) Sylvain Kahane, qui a rejoint MoDyCo le 1er janvier 2005, poursuit ses travaux en modélisation des langues et notamment le développement de la Grammaire d’Unification Sens-Texte [GUST] démarré en 2001. Kahane 2006a propose un nouveau formalisme, les Grammaires d’Unification Polarisées [GUP], permettant d’écrire des grammaires basées sur la combinaison de structures mathématiques diverses, la saturation des structures finales étant contrôlée par une polarisation des objets en ressources et besoins. La plupart des formalismes symboliques peuvent être plongés dans GUP et notamment HPSG, LFG et TAG. Kahane et Lareau (2005a et 2005b) montrent comment une grammaire GUST très modulaire peut être écrite en GUP et comment la polarisation multiple des objets permet d’assurer de façon efficace et élégante l’interface entre les différents modules du modèle. Kahane (2007b et c) montre comment un formalisme similaire peut être utilisé pour traiter les restructurations syntaxiques dans un modèle à transfert en traduction ; ce formalisme permet là aussi d’avoir une architecture très modulaire, avec un lexique bilingue minimal, des lexiques monolingues riches et une grammaire universelle pour les restructurations, l’interface entre les différents modules étant assurée par l’utilisation de fonctions lexicales syntaxiques. Kahane 2005 montre comment combiner, au sein d’une même représentation sémantique présentée sous forme de graphe hiérarchisé, les relations prédicat-argument entre sémantèmes et les relations de portée d’une représentation logique traditionnelle ; ce travail permet d’intégrer le traitement des phénomènes de portée des quantificateurs en GUST. Différents fragments d’une grammaire GUST du français ont été développés : GUST est un des formats cible du projet LexSynt (voir ci-dessous) qui fournira ainsi une ressource lexicale à large couverture. Les articles et divers emplois de DE sont décrits dans Kahane 2007c, l’extraction a été décrite dans de nombreux travaux antérieurs en GUST, la grammaire flexionnelle des verbes est étudiée dans la thèse de F. Lareau codirigé par S. Kahane et I. Mel’cuk (cotutelle Paris 7 - Université de Montréal).

Page 32: Laboratoire Modèles, Dynamiques, Corpus

32

GUST a été implémenté en milieu industriel par la société VirtuOz qui développe des agents conversationnels virtuels présents sur les sites de Voyages-sncf.com, Neuf Telecom ou La Poste, ainsi que par un élève ingénieur (Pierre Lison. « Implémentation d’une interface sémantique-syntaxe basée sur des grammaires d’unification polarisées ». Mémoire de Master, Université Catholique de Louvain, Louvain-la-Neuve (Belgique), 2006). 3) L’ordre des constituants Le thème de l’ordre des constituants et par conséquent celui de l’ordre des mots a donné lieu à trois types d’approches. 3a) Éliane Cheung, dans le cadre de son travail de thèse, essaye de caractériser tous les phénomènes que l’on peut regrouper sous le terme de discontinuité. Elle focalise son attention sur une représentation de la syntaxe de l’allemand, proposant des solutions dans le cadre des grammaires d’arbres polychromes. 3b) Une étude a été produite par Françoise Kerleroux et Jean-Marie Marandin (2004) sur l’ordre des constituants dans l’énoncé. L’étude vise à montrer que les différents phénomènes (placement relatif, placement fixe, adjacence) constituent un type d’organisation purement formel : aucune naturalité ne lui est attachée, il est de nature arbitraire, comme le rapport entre le signifiant et le signifié des morphèmes. Dans ces conditions, l’« ordre des mots » n’est pas susceptible d’être l’objet d’une comparaison entre langues, puisqu’il n’est pas susceptible d’être détaché d’aucune des constructions où on l’observe. 3c) Sylvain Kahane développe depuis 2001, avec Kim Gerdes, une modélisation formelle de l’ordre des mots basée sur le traditionnel modèle topologique. Cette approche a déjà été appliquée à l’allemand, le grec, le coréen, l’arabe et le français. Gerdes, Kahane et Yoo (2005) fait la synthèse de ces travaux et montrent comment construire dynamiquement la structure topologique d’un énoncé en prenant en compte plusieurs types de contraintes (syntaxiques, prosodiques, communicatives). Gerdes et Kahane 2007 est un article de fond justifiant l’introduction d’un niveau de représentation de la phrase intermédiaire entre le niveau phonologique et le niveau syntaxique, appelé niveau topologique ; les auteurs tentent de prouver l’existence de constituants topologiques, qui, comme l’amas verbal en allemand, ne sont pas toujours des constituants syntaxiques (au sens de projection d’un tête). Gerdes et Kahane 2006a postule l’existence d’un amas verbal dans la topologie du français et montre l’avantage de cette hypothèse pour la description de l’ordre des mots en français, notamment dans le placement des clitiques et l’inversion du sujet. Gerdes et Kahane 2006b propose un algorithme polynomial pour les grammaires topologiques et fait le lien entre cette approche et d’autres approches comme LFG ou HPSG. Les grammaires topologiques ont été implémentées par K. Gerdes (DepLin ; http://erssab.u-bordeaux3.fr/kim). Kahane 2007c décrit la distribution des articles du français, à la fois les distributions complémentaires des articles et notamment le rôle joué par DE dans la construction de l’indéfini, du partitif et de la négation et la distribution linéaire de chaque article en proposant une topologie du groupe nominal en français. 4) Le projet LexSynt Le projet LexSynt (Lexiques syntaxiques et interface lexique-grammaire, http://lexsynt.inria.fr), coordonné par Sylvain Kahane, est un projet coopératif, soutenu par l’ILF, dont l’objectif est de mettre à disposition des lexiques du français qui puissent être

Page 33: Laboratoire Modèles, Dynamiques, Corpus

33

utilisés comme composante lexicale d’un modèle syntaxique à large couverture. La première manifestation du projet LexSynt a été une journée Atala organisée par S. Kahane en 2005 (Interface lexique-grammaire et lexiques syntaxiques et sémantiques ; http://www.atala.org/article.php3?id_article=240, 13 communications, 70 participants). Le projet rassemble aujourd’hui une trentaine de participants de 12 équipes : 6 équipes rattachés à l’ILF (MoDyCo, Atilf, ERSS, IGM, Lattice, LPL), 4 équipes INRIA (Atoll, Calligramme, Langue et Dialogue, Signes), 2 équipes étrangères (AKV à KULeuven, OLST à l’Université de Montréal). Le projet a favorisé le développement et la mise en ligne de 3 ressources : le Dicovalence (bach.arts.kuleuven.be/dicovalence), le Lefff (www.lefff.net) et les tables du lexique-grammaire, dont l’intégralité devrait bientôt être disponible. Un projet, GrammoFun, avec S. Kahane comme coordinateur, a été soumis en 2006 à l’ANR Blanc. Une refonte du projet, intitulée LOF et portée cette fois-ci par Laurence Danlos, a été soumise en 2007 à l’ANR Corpus. L’une des contributions de Sylvain Kahane au projet a été le travail de normalisation et de modélisation objet du dictionnaire de collocations développé à l’Université de Montréal par A. Polguère et I. Mel’cuk et le développement d’un site d’interrogation de ce dictionnaire (Steinlin, Kahane et Polguère 2005 ; dictionnaire consultable à http://olst.ling.umontreal.ca/dicouebe). Alain Polguère a été professeur invité à l’Université Paris 10 en janvier-février 2005. Sylvain Kahane co-encadre avec Alain Polguère 3 étudiantes qui travaillent sur le lexique, entre Lattice à l’Université Paris 7 et l’OLST à l’Université de Montréal : Lucie Barque (Formalisation des liens de polysémie du français, thèse commencée en 2003), Anne-Laure Jousse (Modèle évolutif d’un lexique informatisé dans une perspective de transformation et de consultation des données lexicales, thèse commencée en 2005) et Sara-Anne Leblanc (Modélisation de la phraséologie en français, thèse commencée en 2006). Lexique et grammaire Marie-Pierre Sales, qui fait une thèse sur la syntaxe et la sémantique sur du pronom ça, s’est intéressée, dans Sales 2005, aux différents niveaux de figement des constructions avec un sujet ça (cf. les contrastes entre ça ne craint pas vs. *ça ne barde pas ; tout ça craint vs. *tout ça barde). Kahane et Mel’cuk 2006 propose une description linguistique des emplois de verbes du français dont le sens contient un sens de causation. Les auteurs distinguent les verbes de causation proprement dits (comme CAUSER, POUSSER [à], PROVOQUER, ENTRAINER, ...), qui n’expriment que la causation comme telle, et les verbes causatifs (comme CONSTRUIRE, CUIRE, BRISER, ....), dont le sens inclut l’effet produit par la causation. L’article propose une description de deux sens ‘causer’, des sens ‘agir’ qu’ils contiennent, ainsi que de différents verbes causatifs et de causation. Le travail explore ainsi, sur des sémantèmes particulièrement complexes, les limites du modèle de description formelle du sens lexical élaboré par l’école de Moscou et notamment Apresjan, Zolkovskij et Mel’cuk. 2.b. Groupes de travail Un séminaire de travail s’est tenu très régulièrement. En 2004 et 2005, les séances ont consisté à exposer un certain nombre de modèles formels, et à engager la réflexion sur ces modèles. En 2006 et 2007, il s’est agi de confrontations en syntaxe, en 2006 les thèmes

Page 34: Laboratoire Modèles, Dynamiques, Corpus

34

abordés étant les fonctions grammaticales et en 2007 la subordination. Un article en collaboration est envisagé à partir des travaux de 2007. Il y a eu par ailleurs une participation régulière (Eliane Cheung, Marcel Cori, Sylvain Kahane) aux séances de travail de l’Action de recherche coordonnée de l’INRIA Mosaïque sur les modèles syntaxiques de haut niveau. 2.c. Contrats Le projet LexSynt est soutenu par l’ILF de 2005 à 2008 (10 000 � en tout). 3. Thèses en cours (3)

1. Eliane Cheung. Formalisation de la discontinuité syntaxique. Directeur M. Cori. 2. Anne Lablanche. Développement d’un fragment de grammaire hiérarchisée du

français. Directeur M. Cori. 3. Marie-Pierre Sales. Influence du lexique et de la syntaxe sur la reprise pronominale en

français : exemple de ça. Directeur S. Kahane. 4. Thèse soutenue (1)

1. Fabrice Delumeau. Présentation des problèmes liés à la génération automatique d’énoncés en créole guadeloupéen. Directeur M. Cori (14 février 2006).

5. Production scientifique halshs-00169657, Cori M., 2007, Quelle formalisation pour les fonctions grammaticales ?,

Les fonctions grammaticales : histoire, théories, pratiques, 1-20. hal-00170523, Desmets M., Abeillé A., 2006, Le développement des alternatives à la

grammaire générative transformationnelle, Auroux Sylvain, Koerner E.F.K., Niederehe Hans-Josef, Versteegh Kees (éds.), History of the Language Sciences / Geschichte der Sprachwissenschaften / Histoire des sciences du langage An International Handbook on the Evolution of the Study of Language from the Beginnings to the Present / Ein internationales Handbuch zur Entwicklung der Sprachforschung von den Anfängen bis zur Gegenwart, Mouton de Gruyter.

hal-00170537, Gerdes K., Kahane S., 2007, Phrasing It Differently, L. Wanner (éd.), Selected lexical and grammatical issues in the Meaning-Text Theory, Benjamins.

halshs-00120415, Gerdes K., Kahane S., 2006, A polynomial parsing algorithm for the topological model - Synchronizing Constituent and Dependency Grammars - Illustrated by German Word Order Phenomena, Coling-ACL, 8.

halshs-00120385, Gerdes K., Kahane S., Yoo H.-Y., 2005, Claims and litigation of the descriptive adequacy of topology, Proceedings of the second international conference of the Meaning Text Theory (MTT2005), 1.

hal-00170538, Kahane S., 2007, Traduction, restructurations syntaxiques et grammaires de correspondance, Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles, 123-132. [http://www.irit.fr/~Dominique.Longin/TALN2007/volume2.pdf]

hal-00170539, Kahane S., 2007, A formalism for machine translation in MTT, including syntactic restructurings, Third International Conference on Meaning Text Theory (MTT). Wiener Slavistischer Almanach, 69.

Page 35: Laboratoire Modèles, Dynamiques, Corpus

35

halshs-00120412, Kahane S., 2006, Polarized Unification Grammars, Coling ACL, 8. halshs-00120495, Kahane S., 2006, La distribution des articles du français, M. Charolles, N.

Fournier & F. Lefeuvre (éds.), Mélanges offerts à Pierre Le Goffic. halshs-00120468, Kahane S., 2006, On the status of Phrases in Head-driven Phrase Structure

Grammar - Illustration by a Totally Lexical Treatment of Extraction, A. Polguère (éd.), On the Status of Phrases in Head-driven Phrase Structure Grammar - Illustration by a Totally Lexical Treatment of Extraction, J. Benjamins Publishing Company.

halshs-00122211, Kerleroux F., Marandin J.-M., 2004, L’ordre des mots, B. Cassin (éd.), Vocabulaire européen des philosophies, Le Seuil/ Le Robert.

halshs-00120418, Gerdes K., Kahane S., 2006, L’amas verbal au coeur d’une modélisation topologique de l’ordre des mots, Linguisticae Investigationes, 29 : 1, 75-89.

halshs-00120451, Kahane S., Mel’Cuk I., 2006, Les sémantèmes de causation en français, Linx, 54 : 1, 40.

halshs-00122215, Kerleroux F., 2006, Sur un sous ensemble de Noms déverbaux non-suffixés du français, K. Carmen, J. Meinschäfer & K. Mutz (éds.), Morphologie und romanistische Sprachwissenschaft, 111-123.

halshs-00120399, Kahane S., Lareau F., 2005, Meaning-Text Unification Grammar: modularity and polarization, Proceedings of the second international conference of the Meaning Text Theory (MTT2005), 1.

halshs-00120407, Kahane S., Lareau F., 2005, Grammaire d’Unification Sens-Texte : modularité et polarisation, Actes TALN (Traitement Automatique du Langage Naturel), 23-32.

halshs-00120402, Kahane S., 2005, Structure des représentations logiques, polarisation et sous-spécification, Actes TALN (Traitement Automatique du langage naturel), 153-162.

halshs-00114199, Sörés A., 2006, Le hongrois dans la typologie des langues, Lambert-Lucas. halshs-00114204, Sörés A., Marchello-Nizia C., 2005, Typologie diachronique: une nouvelle

hypothèse pour le changement de type "OV" > "VO", Linguistique typologique, 261-287. halshs-00114203, Sörés A., 2005, La structure informationnelle du hongrois, Les langues

ouraliennes aujourd’hui. Approche linguistique et cognitive, 517-533. halshs-00114202, Sörés A., 2005, La place de l’adjectif épithète dans les langues, Approche

typologique, L’adjectif en français et à travers les langues, L’adjectif en français et à travers les langues, 89-103.

halshs-00120390, Steinlin J., Kahane S., Polguère A., 2005, Compiling a "classical" explanatory combinatorial lexicographic description into a relational database, Proceedings of the second international conference of the Meaning Text Theory (MTT2005), 1.

1.2.1.5. Problèmes épistémologiques du TAL (PETAL) 1. Membres de l’opération Membres rattachés à titre principal (6) Marcel Cori (responsable) Sophie David (responsable) Karine Baschung Marianne Desmets Claude de Loupy Denise Malrieu

Page 36: Laboratoire Modèles, Dynamiques, Corpus

36

Collaborations extérieures (8) Muriel Amar (BPI) Jean-Christophe Binetti (Consult et Marketing GmbH) Jean-Daniel Gronoff (UMR 8557 CNRS - EHESS) Jacqueline Léon (HTL, CNRS UMR 7597 et Université Paris 7) Rachel Panckhurst (Praxiling - Université Montpellier 3) Lisa Whistlecroft (Université de Lancaster) Entreprise Synapse Développements Entreprise Sinequa 2. Problématique Il nous a paru important de lancer un travail de réflexion sur l’épistémologie du TAL, et ce pour des raisons de deux ordres différents. Tout d’abord parce que le domaine, relativement jeune, peine à se définir et à se donner des délimitations. Les désaccords sur ce qu’il couvre sont nombreux. Les positionnements par rapport aux théories linguistiques apparaissent divers, voire contradictoires. Ensuite parce que la réflexion épistémologique déjà engagée sur le domaine montre peu de systématicité (du côté des champs couverts mais aussi du côté des acteurs qui l’ont menée). Dans le même temps, le contenu de cette réflexion n’a pas fait émerger de lignes directrices, elle a plutôt mis en avant des positionnements divergents et des tensions. Les lieux de visibilité (communications et publications) sont restés quant à eux faiblement organisés, excepté dans le domaine de l’évaluation de logiciels. Ce projet a donc pour objectif de clarifier la nature des travaux actuels dans le domaine du TAL, et de faire le point sur les rapports du TAL à la linguistique, et plus spécialement à la linguistique formelle. On s’intéresse également à différents outils (outils d’aide à la navigation sur Internet, systèmes question-réponse, outils d’aide à la recherche d’informations), de même qu’à leur évaluation (mise en place de méthodologies, analyses critiques, productions d’évaluations). 2.a. Actions 1) TAL et linguistique formelle Depuis 2003, la réflexion s’est engagée autour de la question des (grands) corpus et de leur traitement. Elle va déboucher sur l’édition scientifique d’un numéro de Langages intitulé (provisoirement) « Construction des faits en linguistique : la place des corpus » (Cori, David, Léon (éds), parution prévue 2008). La contribution de Marcel Cori « Des méthodes de traitement automatique des langues aux linguistiques de corpus », cherche dans une première partie à mettre en évidence l’opposition entre deux grands types de méthodes en TAL, méthodes que l’on peut regrouper sous les étiquettes de « TAL robuste » et de « TAL théorique ». Dans un second temps, il examine les méthodes stochastiques en essayant d’en dégager les présupposées sous-jacentes et d’en mesurer les corollaires théoriques possibles. La contribution de Marcel Cori et Sophie David « Les corpus fondent-ils une nouvelle linguistique ? » s’attache à reconstituer la cohérence de ce courant en présentant et en examinant les principaux arguments qu’il développe, afin d’en déterminer le degré de validité.

Page 37: Laboratoire Modèles, Dynamiques, Corpus

37

2) TAL robuste Le travail a porté ici sur la mise au point d’outils issus du TAL robuste et de ressources utilisables dans un cadre de recherche d’information. Dans un deuxième temps, il s’agira de porter un examen critique sur ces outils. 2a) Etude et développement de ressources et d’analyseurs morpho-syntaxiques pour le danois, le finnois, le grec, le portugais, le russe et le suédois (Loupy et al. 2003). La littérature du domaine porte souvent sur les travaux d’analyse dans une langue particulière. Or, chaque langue apporte des difficultés et des spécificités qui impliquent de nombreuses contraintes pour le développement d’un analyseur morpho-syntaxique multilingue. Une analyse de telles différences ainsi que des propositions de normalisation ont en particulier été réalisées au cours du DEA de Frederik Cailliau sous la direction conjointe de Claude de Loupy et Adeline Nazarenko. Ces travaux ont donné lieu à un sujet de thèse sur lequel travaille toujours Frederik Cailliau. Le but est de proposer une structure UML pour l’encodage des informations lexicales, y compris au niveau sémantique. De plus, des outils d’aide au linguiste pour la création de telles ressources sont en cours. Enfin, Claude de Loupy encadre actuellement un stage de DEA (en collaboration avec Anne Vilnat du LIMSI) sur la création d’un analyseur morpho-syntaxique robuste permettant d’effectuer, en un minimum de temps, à la fois un étiquetage statistique et l’application de règles linguistiques. Le premier élément permet d’obtenir très rapidement un analyseur performant et rapide tandis que le second permet de corriger les erreurs habituelles et « stupides » des analyses syntaxiques en se basant sur une vision critique d’un linguiste. 2b) Développement de grammaires locales et application dans des outils de gestion de l’information (moteurs de recherche pour l’aide à la navigation par extraction et visualisation d’entités nommées ; systèmes de question/réponse pour l’analyse de questions, la reformulation des questions en phrases « à trous » et la recherche de phrases correspondantes dans un corpus afin de trouver la réponse), (Loupy et Crestan 2004a et 2004b, Crestan et al. 2004). Un travail portant spécifiquement sur la désambiguïsation sémantique a été mené (Crestan et al. 2003). 2c) Projet OuRAL. Claude de Loupy est par ailleurs responsable du projet OuRAL dont l’un des buts est le développement d’un parser mixant les approches probabilistes et déterministes afin de donner la main de manière simple et efficace aux linguistes via des automates pour leur permettre de facilement modifier le comportement de l’outil (voir notamment http ://www.technolangue.net/article79.html) 3) Evaluation de logiciels et de méthodologies Nous avons regroupé les travaux portant sur l’évaluation de logiciels, qu’il s’agisse de mise en œuvre d’évaluations ou de réflexions sur les types d’évaluation mises en œuvre. 3a) Programme européen Trust (Text Retrieval Using Semantic Technologies) : évaluation de la précision sémantique d’un moteur de recherche par les protocoles SHEP. TRUST est un projet européen IST (Information, Societies Technology), qui vise à mettre en commun les techniques et les ressources de quatre partenaires européens pour quatre langues, le français, l’italien, le portugais et le polonais, et ce afin de réaliser un moteur de recherche unique multilingue. La performance de ces moteurs repose sur la capacité à prendre en compte l’analyse syntaxique de la question posée en langage naturel. C’est la mesure de l’efficacité de l’analyse syntaxique qui est l’objectif principal des tests que nous avons commencé à mettre en place.

Page 38: Laboratoire Modèles, Dynamiques, Corpus

38

Notre travail concerne la SHEP.BetaVersion (évaluation des réponses du moteur de recherche TRUST sur deux romans français Un barrage contre le Pacifique et L’amant de la Chine du Nord (respectivement 634 Ko et 372 Ko). Les développements déjà réalisés ont permis de comparer de façon automatique les réponses du moteur aux bonnes réponses définies a priori par l’expert, de fournir les statistiques sur le taux de bonnes réponses et les rangs des bonnes réponses parmi les réponses données par le moteur, qu’elles correspondent à celles trouvées a priori par l’expert ou validées a posteriori par lui. Les résultats ont montré des performances assez contrastées selon que le corpus comporte des textes fortement structurés (normes ISO, bibliographies) ou pas (articles de journaux, romans) et selon les langues. Ils ont montré la nécessité que le moteur sache prendre en compte la structure hiérarchique du texte, des problèmes concernant l’ontologie universelle du moteur et de synonymie trop lâche. Le traitement des anaphores, important pour le roman, s’avère particulièrement prometteur. Le rapport final intitulé « Result SHEP NOVEL FR » constitue un chapitre du rapport final de TRUST. Il est consultable sur demande. 3b) Evaluation de logiciels. On considère ici logiciel pris dans une acception très large. Les travaux qui ont été menés portent aussi bien sur des logiciels, des moteurs de recherches et des systèmes de question/réponse. - L’activité d’expertise menée par Sophie David de 1998 à 2005 pour le concours européen de logiciels EASA (European Academic Software Award), a conduit à mener une réflexion sur la méthodologie utilisée par ce concours (sous la forme d’un bilan prenant en compte toutes ses facettes dans Panckhurst et al. (éds), 2004 ; en établissant plus spécifiquement un bilan critique de la procédure et des grilles utilisées (David et Panckhurst 2004). Suite à ces travaux, Sophie David, Rachel Panckhurst et Lisa Whistlecroft ont été chargées par l’association EKMA (European Knowledge Media Association) de produire une nouvelle procédure (il y a eu constitution d’un groupe de réflexion international et production d’un rapport). Les résultats de ces travaux ont été diffusés dans deux colloques internationaux (David et al. 2005a et David et al. 2005b). - Claude de Loupy a participé au projet EQueR, dont l’objectif est d’évaluer des systèmes de question/réponse. 3c) Méthodologies d’évaluation. En parallèle avec les travaux précédemment cités, le travail a porté sur une réflexion critique sur les méthodologies d’évaluation utilisées. - Un premier travail a porté sur une proposition de classement méthodologique (et non conceptuel) des approches couramment utilisées. Si depuis longtemps des descriptions foisonnent (approches développeur, approches dans le cadre de compétition (TREC, MUC par exemple), approches centrées sur l’usage/l’usager, approches comparatives, approches boîte noire/boîte transparente, approches avec/sans référentiels, approches avec/sans experts, etc., voir notamment pour un bilan Chaudiron 2004 ; Nübel et Seewald-Heeg 1998 ; Sparck-Jones et Gallier 1996), il est apparu que les lieux d’opposition demeuraient peu clairs, les étiquettes caractérisant les approches renvoyant à des options méthodologiques ne se situant pas au même niveau. Le classement proposé permet de rendre compte des approches couramment utilisées. Il fait apparaître aussi clairement que (i) les objets à évaluer ne déterminent que partiellement les approches évaluatives ; autrement dit retenir telle ou telle approche est toujours un choix de la part de l’évaluateur ; (ii) toute évaluation construit son propre objet d’évaluation. Ce travail a fait l’objet d’un rapport de recherche (David et Panckhurst 2004).

Page 39: Laboratoire Modèles, Dynamiques, Corpus

39

Le travail se poursuit autour de deux thèmes avant d’envisager une publication : justification d’une approche méthodologique et non conceptuelle ; « test » du classement proposé sur d’autres approches non prises en considération. - Un second travail a porté sur la mise en œuvre d’une méthodologie d’évaluation des moteurs de recherche faisant intervenir le temps et donc l’efficacité de l’utilisateur. Cette évaluation a permis de montrer l’efficacité de méthodes d’aide à la navigation basées sur des analyses linguistiques (grammaires locales en particulier) (Crestan et Loupy 2004). En outre, un travail critique a été mené sur la méthodologie d’évaluation mise en œuvre dans TREC. Ce travail a été prolongé dans le cadre du projet AudioSurf à l’aide à la navigation dans des bases de documents oraux (émissions de radio). La robustesse des outils d’aide à la navigation a été étudiée afin d’évaluer l’impact des erreurs de transcription provenant des outils d’analyse de la parole (Cailliau et al., 2007). 2.b. Participation à des contrats Claude de Loupy est impliqué dans les contrats suivants : 1) TextCoop (RNTL 2005) 2) Blogoscopie (ANR-RNTL 2006) 3) Piithie (ANR-RNTL 2006) 3. Production scientifique hal-00159142, Cailliau F., De Loupy C., 2007, Aides à la navigation dans un corpus de

transcriptions d’oral, Actes de la 14e conférence sur le Traitement Automatique des Langues Naturelles. TALN 07, 143-152.

halshs-00170023, Cori M., David S., Léon J., (à paraître), Présentation : Eléments de réflexion sur la place des corpus en linguistique, Langages.

halshs-00170021, Cori M., David S., (à paraître), Les corpus fondent-ils une nouvelle linguistique ?, Langages.

halshs-00168479, Cori M., 2007, Des méthodes de traitement automatique aux linguistiques fondées sur les corpus, Langages, 1-20.

halshs-00133033, David S., Panckhurst R., Whistlecroft L., 2005, Revising the Evaluation Procedure of the European Academic Software Award, Actes du colloque EUNIS 2005 : Leadership and Strategy in a Cyber-Infrastructure World, 1-7.

halshs-00084158, David S., Panckhurst R., 2004, Questionnaire Results from the Competitors’ Point of View, Panckhurst, R., David, S., Whistlecroft, L. (éds), Evaluation in E-learning : the European Academic Software Award, Presses universitaires de Montpellier 3.

hal-00174045, De Loupy C., Crestan E., 2004, Systèmes de recherche d’information, Majid Ihadjadene (dir.), Traitement automatique des langues et systèmes de recherche d’information, Hermès, 143-152.

halshs-00133032, Panckhurst R., David S., Whistlecroft L., 2004, Evaluation in E-learning : the European Academic Software Award, Presses universitaires de Montpellier 3, ,

Page 40: Laboratoire Modèles, Dynamiques, Corpus

40

1.2.1.6. Linguistique cognitive et microgenèse des formes sémiotiques 1. Membres de l’opération Membres rattachés à titre principal (5) Victor Rosenthal (responsable) Sophie David Guillaume Desagulier Michel de Fornel Philippe Gréa Doctorants (3) Julien Gavelle Vincenzo Raimondi Kadriye Ramazanoglu Membres associés (3) Jean-Claude Anscombre (CNRS) Emmanuel Désveaux (EHESS) Yves-Marie Visetti (CNRS, CREA) Collaborations extérieures (10) Carlos Cornejo Alarcon (Université de Santiago, Chili) Patrizia Bisiacchi (Université de Padoue) Neiloufar Family (Université Paris 8) Charles Goodwin (Université de Californie à Los Angeles) Jean Lassègue (CREA, CNRS) José Rodriguez (EHESS) Eve Sweetser (Université de Californie à Berkeley) Grazia Tiezzi (EHESS) Maud Verdier (EHESS) Emmanuelle Vernadakis (EHESS) 2. Problématique On se propose de réunir dans une même approche construction de théories et modèles affine aux linguistiques cognitives et aux courants dynamiques et ‘culturalisants’ des sciences cognitives et travail expérimental. Il s’agit notamment de : (1) modéliser les principes topologiques et dynamiques qui sous-tendent les concepts microgénétiques de différenciation, déroulement, anticipation / catégorisation, germe ; (2) étudier le caractère physionomique du langage et de la perception à travers : (a) la dynamique concrète des verbes de mouvement ; (b) le geste co-verbal ; (c) la structure synesthésique et intersensorielle des formes sémantiques et des percepts ; (3) poursuivre les travaux sur la polysémie et la métaphore à partir des concepts d’instabilité et de formes en sémantiques opérant simultanément sur plusieurs régimes de sens ; (4) étudier (et modéliser) l’émergence de diverses formes et activités symboliques au cours de l’hominisation ; (5) évaluer la possibilité d’un lien constitutif entre le monde visuel et le langage.

Page 41: Laboratoire Modèles, Dynamiques, Corpus

41

2.a. Actions 1) Les locutions au {centre / milieu} de dans leur acception spatiale Dans cet article, nous nous proposons de montrer que les locutions prépositionnelles au milieu de / au centre de, dans leurs acceptions spatiales, mettent en jeu la notion de délimitation. Pour le justifier, nous étudions le comportement de ces locutions dans différentes distributions. Nous abordons successivement la question du pluriel (interprétation distributive ou collective), des noms de collection et des massifs pour montrer que la locution au centre de impose une délimitation à son complément, alors que au milieu de n’en spécifie aucune. Nous proposons finalement une modélisation de ces prépositions dans le cadre théorique de la grammaire cognitive, en montrant que chaque préposition peut se caractériser par un profilage différent (Langacker 1987, 1991). Gréa, 2005). 2) Construction spécificationnelle et grammaire phraséologique Les processus de fixation langagière dans la compétence discursive sont le plus souvent perçus comme des phénomènes inhérents soit aux lexèmes (lexicalisation), soit aux grammèmes (grammaticalisation). L’objectif est ici de montrer, à la suite d’autres analyses, qu’il est concevable de considérer certaines séquences syntaxiques (supérieures au syntagme) comme des cas d’unités figées, « fixées » dans notre savoir discursif, douées de caractéristiques sémantiques ou pragmatiques spécifiques. L’exemple étudié dans le cadre de cet article est celui des énoncés spécificationnels du type : [N est que / N, c’est que + P] et [N est de / N, c’est de + INF]. (D. Legallois et P. Gréa, 2006). 3) La notion d’entrenchment dans le cadre des grammaires cognitives Ce travail est une présentation de la notion d’entrenchment dans les linguistiques cognitives anglo-saxonnes. Le terme n’ayant pas de traduction satisfaisante en français, on en montre les spécificités et on l’illustre par de nombreux exemples. L’originalité de la notion tient dans le fait qu’elle présente trois faces distinctes : une mesure statistique (la fréquence d’occurrence), la notion d’unité linguistique, et un processus cognitif de stockage (storage) de l’information. Elle s’applique aussi bien aux unités qu’aux règles. En cela, elle ne peut être réduite à la notion de figement. (Gréa, 2006). 4) Geste co-verbal et intégration conceptuelle On a poursuivi l’étude du geste co-verbal dans des interactions ethnographiquement situées, en explorant avec les outils de la théorie de l’intégration conceptuelle (Fauconnier et Turner) la dynamique conversationnelle de la construction du sens. On a traité des phénomènes d’intégration conceptuelle dans une série de consultations médicales visant à la prise en charge des pathologies douloureuses chez l’enfant multi-handicapé et non parlant. Lors de ces séances, les médecins et l’entourage de l’enfant sont amenés à collaborer pour établir un diagnostic d’une douleur. On a étudié la façon dont le personnel soignant évoquait sur le plan gestuel les symptômes de l’enfant et en particulier à l’alternance entre un point de vue « externe» (les mains représentant la personne dont on parle, ou une action de cette dernière) et un point de type « interne » (le corps mimant cette personne). Après avoir expliqué les caractéristiques iconiques de ces deux formes de gestes co-verbaux, on a montré que le passage entre les deux points de vue, loin d’être arbitraire, servait à mettre en valeur des aspects différents de la douleur. (Fornel et Gavelle, 2006). On s’est par ailleurs intéressé à la question du « parler-chanter », avec pour objectif d’approfondir le lien entre prosodie et action conversationnelle, à partir de l’étude de diverses

Page 42: Laboratoire Modèles, Dynamiques, Corpus

42

formes d’improvisations orales, en particulier les joutes poétiques dans plusieurs communautés. (Fornel et Tiezzi, 2007). Un autre volet de recherche a porté sur le rythme et les temporalités dans la communication électronique à travers des interactions médiatisées par internet. On a coordonné avec Hillary Bays une recherche dans le cadre du programme TCAN CNRS sur les pratiques linguistiques et sociales émergentes dans plusieurs communautés virtuelles diverses (chat, échanges visiophoniques, environnements graphiques, jeux en réseaux, forums dans le cadre de l’éducation à distance…), au sein de diverses communautés (interactions verbales en anglais, français, japonais, malgache), et qui sont modelées aussi bien par les contraintes temporelles que par les implicites socioculturels et socio-cognitifs de chacun des internautes. (Fornel, Bays, Verdier, 2007). 5) L’hypothèse Sapir-Whorf revisitée L’entreprise butte sur le fait qu’à première vue la carte de la distribution linguistique, établie sur des bases généalogiques, et celle des cultures ne correspondent pas du tout. On est confronté à un double phénomène de morcellement et d’harmonisation. Il est apparu dès lors qu’en réalité les langues, à l’instar des mythes, des rites, des organisations sociales, des nomenclatures de parenté et des techniques étaient susceptibles d’être envisagées comme entretenant des rapports de transformation entre elles. L’hypothèse de travail réside sur l’hypothèse d’un fondement sémantique des syntaxes amérindiennes — l’inspiration due à Sapir et Whorf — pour autant qu’il s’appuie sur des gammes d’inversions harmoniques entre langues distinctes — la dimension lévi-straussienne. La recherche a franchi une étape décisive : en effet, on est parvenu à établir le rapport de transformation qui lie deux langues, l’ojibwa et le dakota-lakhota, qui appartiennent respectivement aux familles linguistiques algonquine et sioux. Dès lors, l’idée due à Sapir et à Whorf d’une correspondance entre langue et traits culturels s’avère juste pour autant que l’une et l’autre soient prises pareillement dans le vaste système transformationnel panaméricain dont Lévi-Strauss avait commencé à démontrer l’existence à propos du mythe, mais dont la pertinence embrasse l’ensemble des faits humains observables produits par le Nouveau-Monde autochtone. (Fornel et Désveaux, 2006). 6) Sémantique cognitive des langues amérindiennes On s’est attaché à élucider les décisions conceptuelles qu’engage l’adoption d’une hypothèse sur les relations entre langues et cultures, et sur les écueils qu’il convient d’éviter. Le principal est sans doute de rapporter directement des traits culturels d’une société à des caractéristiques grammaticales ou lexicales ponctuelles. La thèse de Whorf a donc sa pertinence : ce sont les « covert catégories » qui organisent en profondeur le système grammatical d’une langue. On a montré que dans le cas de l’Amérique du Nord le rapprochement des configurations sémantiques complexes appartenant au domaine de la langue et à celui de la culture fait d’autant plus sens qu’il s’assortit de la mise au jour de rapports transformationnels parallèles entre langues d’une part et cultures d’autre part. L’enquête a porté sur les relations entre langues algonquines et langues sioux, nous avons fait l’hypothèse qu’il existe du côté de l’objet un axe transformationnel opposant l’hypertransitivité de l’ojibwa à la quasi-disparition de la transitivité du dakota-lakhota. Si l’ojibwa choisit de se focaliser exclusivement dans la chaîne transitive sur le contact avec l’objet, le dakota-lakhota, d’une part choisit de mobiliser l’objet par d’autres voies que la

Page 43: Laboratoire Modèles, Dynamiques, Corpus

43

transitivité, d’autre part privilégie la façon dont l’objet fait retour sur le sujet. (Fornel et Lemieux, 2007). 7) Microgenèse des formes sémiotiques On aborde dans ce cadre la dynamique synesthésique du développement microgénétique qui avec la gestualité interne du corps et ses dynamiques kinesthésiques-émotionnelles donne à l’expérience son caractère physionomique. Objets, scènes, configurations, paysages sont ainsi perçus comme manifestant une intériorité animatrice, au même titre que les physionomies, les expressions faciales, les gestes, et plus généralement les conduites des êtres vivants. Loin de relever d’une projection empathique en direction de l’objet, ou de la saisie d’une analogie, ces caractères expressifs procèdent des dynamiques de constitution des configurations perceptives qui font de l’expérience l’expression de son propre processus de constitution. (Rosenthal 2005a, b.) 8) Sensibilité à la structure indexicale et lecture agrammatique On analyse le cas d’une patiente dont la lecture à haute voix de mots isolés est deep dyslexique et la compréhension en lecture silencieuse, agrammatique. On étudie (i) la relation entre identification des lettres, paralexies sémantiques et capacité de lire les non mots, (ii) le caractère différentiel des tâches de lecture silencieuse et à haute voix, (iii) une possible dépendance des déficits de compréhensions observés d’une modalité spécifique. On évalue la sensibilité à l’ambiguïté nom – verbe, et la compréhension des structures indexicales liées à l’accord en nombre et aux relations temporelles et prépositionnelles. Les résultats indiquent une sensibilité de la patiente à certaines dimensions de ces catégories linguistiques, montrent une base partiellement correcte des réponses incorrectes, et favorisent l’hypothèse d’un déficit de compréhension lié à la saisie de la structure indexicale. (Rosenthal et Dési, 2005). 9) Les contingences sensorimotrices de l’enaction On met en cause l’internalisme en raison du rôle causal dévolu au cerveau, pris comme une base minimale mais suffisante de l’explication cognitive, du type d’analyse structurelle et fonctionnelle préconisé, et de son représentationnalisme, comprenant la valeur de ces structures et processus internes sur le modèle d’un renvoi véridique en direction d’une extériorité séparément objectivable. C’est dans un rapport singulier à un environnement, qu’il configure en même temps qu’il s’y forme que l’être vivant se détermine. L’explicitation de ce rapport ne se conçoit pas hors des modalités herméneutiques, instrumentales, pragmatiques, de nos interventions. Et cela vaut tout autant pour l’observation des conduites et la description des situations (externalisme), que pour les « états » du cerveau (internalisme). Individuer et catégoriser de tels « états » implique de les rapporter à l’extériorité où le corps se meut, et à ce qu’il y fait. Mais cette extériorité, ne se détermine pas hors de perspectives de sens qui ne relèvent seulement ni d’un intérieur, ni d’un extérieur. (Visetti et Rosenthal, 2006). 10) Le pratique et le mythique dans l’évolution du langage et des activités symboliques L’évolution en direction des langues modernes est intimement liée à l’émergence de systèmes sociaux et symboliques, incarnés dans de nouvelles pratiques. Les dimensions pratiques et mythiques sont imbriquées et difficilement discernables si l’on s’en rapporte à la constitution narrative-prescriptive du genre humain. Les structures fondamentales d’adressage, propres à chaque société, ne pourraient pas émerger et évoluer en l’absence de cette imbrication du pratique et du mythique. Le « symbolique » n’est pas ce qui advient une fois que la pensée logico-conceptuelle et causale a échoué. Il est ce qui fait advenir ces modalités de la pensée.

Page 44: Laboratoire Modèles, Dynamiques, Corpus

44

Le « symbolique » ne relève pas d’une compétence privée engendrée par une capacité cérébrale et des contraintes environnementales : il repose intrinsèquement sur une activité sémiotique publique. (Lassègue, Rosenthal et Visetti, 2006). 11) Emergence d’une économie Symbolique Il s’agit de comprendre l’émergence des langues en corrélation avec celle de valeurs et d’activités symboliques à partir de l’analogie de la monnaie et du langage. Ce projet d’épistémologie expérimentale (théorie + modélisation + épistémologie) est motivé par la recherche des conditions de l’évolution de présumés « proto-langages » en langues proprement dites, dans les phases récentes de l’hominisation. Il se propose d’y voir un problème de synergie entre plusieurs formes et activités symboliques (FAS). On vise à :

• construire un modèle intégrant une division de la société en sous-groupes symboliquement identifiés, et co-existants à travers des protocoles de don, échange/coopération, alliance, sanction

• figurer l’émergence de valeurs opérant dans le cadre de ces transactions, à travers la formation concomitante d’un médium permettant d’afficher, assigner et transmettre les valeurs en cause

• clarifier au plan théorique les homologies entre les formes et les valeurs modélisées, et certains traits pertinents des langues et du langage

• évaluer un tel paradigme d’économie symbolique, relativement à des problématiques directement utilitaristes ou cognitivistes

(Lassègue, Rosenthal, Visetti, 2007). 2.b. Séminaires, journées d’études, colloques

1. Le séminaire-atelier « Indétermination du champ visuel, anticipations catégorielles et thématisation » (2004-2006) organisé par Olivier Gapenne (Université de technologie de Compiègne) et Victor Rosenthal a reçu le soutien du Réseau de sciences cognitives d’Île-de-France (RESCIF). Il s’agissait de faire intervenir diverses disciplines (psychologie expérimentale et écologique, neuropsychologie, phénoménologie, neurosciences, robotique) de façon à rassembler les observations et les propositions théoriques concernant les diverses formes d’indétermination du champ visuel, en privilégiant les conceptions qui permettent de penser l’intégration du jeu catégoriel et de la thématisation à la constitution du champ perceptif.

2. Le séminaire Formes Symbolique co-organisé par Jean Lassègue, Victor Rosenthal et Yves-Marie Visetti à l’ENS rue d’Ulm. Le point de vue général que ce séminaire entend se donner est celui d’une anthropologie sémiotique au croisement des sciences de la culture et des sciences cognitives. On y présente des travaux théoriques et empiriques, non seulement en sciences du langage et en sciences cognitives, mais plus fondamentalement dans les diverses sciences de la culture qui en forment l’horizon déterminant : notamment, anthropologie, paléoanthropologie, éthologie, archéologie, linguistique historique et comparée.

3. Organisation à Paris du 17 au 20 juillet 2006 de la Seconde Conférence Internationale Language, Culture and Mind (LCM 2) avec environ 140 participants (organisateurs locaux et membres du comité scientifique : Victor Rosenthal, Jean Lassègue et Yves-Marie Visetti).

Page 45: Laboratoire Modèles, Dynamiques, Corpus

45

2.c. Contrat/Financement 1. Financement du séminaire-atelier Indétermination du champ visuel, anticipations

catégorielles et thématisation par le Réseau de sciences cognitives d’Île-de-France (RESCIF 2004-2006).

2. Programme blanc de l’ANR [ANR-06-BLAN-0281] : Perception sémiotique et socialité du sens : formes, sens commun, activités symboliques. Ce projet dont V. Rosenthal est le coordinateur implique trois équipes partenaires dont celle du laboratoire MoDyCo UMR -7114 (responsable : V. Rosenthal), celle du CREA UMR -7656 (responsable : Y.-M. Visetti) et celle du Laboratoire de Physiologie de la Perception et de l’Action au Collège de France UMR – 7152 (responsable J.-L. Petit).

3. Thèses en cours (3)

1. Julien Gavelle. Directeur M. de Fornel. 2. Vincenzo Raimondi. Directeur M. de Fornel. 3. Kadriye Ramazanoglu. Directeur M. de Fornel.

4. Production scientifique hal-00171316, De Fornel M., Lemieux C., 2007, Naturalisme vs Constructivisme, Raisons

Pratiques, 17. hal-00171306, De Fornel M., Tiezzi G., 2007, Approccio sequenziale al duello verbale,

Comunicazione parlata, DVD-Rom. hal-00171297, De Fornel M., Désveaux E., 2006, De l’ojibwa au dakota : pour une analyse

transformationnelle des langues amérindiennes, Journal de la Société des Américanistes, 92, 1 & 2, 165-201.

hal-00173275, Desagulier G., (à paraître), Cognitive Arguments for a Fuzzy Construction Grammar, Actes du colloque “Du fait grammatical au fait cognitif”, Presses Universitaires de Bordeaux.

hal-00173274, Desagulier G. 2007, Figures et forces en linguistique cognitive : pour une redéfinition du concept de représentation dans une Grammaire de Constructions Floue, TLE (Théorie, Littérature, Enseignement), 24.

halshs-00111642, Gréa P., 2006, La notion d’entrenchment dans le cadre des grammaires cognitives, Cahier du Crisco, 21.

halshs-00162631, Gréa P., 2005, Les locutions au {centre / milieu} de dans leur acception spatiale, Revue de Sémantique et de Pragmatique, 18, 87-112.

halshs-00111639, Gréa P., 2004, Logique de conformité et logique d’intégration, La métaphore : regards croisés, Artois Presses Université, 101-122.

halshs-00125782, Lassègue J., Rosenthal V., Visetti Y.-M., 2006, The practical and the mythical in the evolution of language and symbolic activities, Proceedings of Second Language, Culture and Mind Conference, 77-79.

halshs-00160742, Legallois D., Gréa P., 2006, L’objectif de cet article est de... Construction spécificationnelle et grammaire phraséologique, Cahiers de praxématique, 46, 161-184.

halshs-00125699, Rosenthal V., 2006, On the proper treatment of microgenesis, Proceedings of Second Language, Culture and Mind Conference, 2006, 117-118.

halshs-00120724, Rosenthal V., Dési M., 2005, From deep dyslexia to agrammatic comprehension on silent reading, Acta Neuropsychologica, 3, 4.

Page 46: Laboratoire Modèles, Dynamiques, Corpus

46

halshs-00120723, Visetti Y.-M., Rosenthal V., 2006, Les contingences sensorimotrices de l’enaction, Intellectica, 43, 1, 105-116.

halshs-00125700, Visetti Y.-M., Rosenthal V., 2006, Microgenesis of Semantic Forms and Cognitive Linguistics, Proceedings of Second Language, Culture and Mind Conference, 134-136.

Page 47: Laboratoire Modèles, Dynamiques, Corpus

47

1.2.2. COMPOSANTE DYNAMIQUES Coordination : Françoise Gadet, Colette Noyau La composante Dynamiques est concernée par la façon dont les locuteurs se saisissent du langage pour communiquer. Ces recherches prennent pour point de départ, pour la critiquer, la réduction de l’objet à laquelle procèdent les principales modélisations du langage et des langues en tant que systèmes, avec le postulat d’états de langue stabilisés homogènes. Elles tiennent compte de la variabilité des systèmes linguistiques à travers le temps, l’espace, les stratifications sociales et les interactions, et rendent compte de la façon dont les locuteurs s’approprient une langue pour des visées communicatives concrètes. Ces variations sont à l’origine de mouvements dans les systèmes linguistiques. Qu’il s’agisse de complexification et de convergence vers la langue ‘cible’ dans les processus d’acquisition, de changements dus aux contacts de langues, d’évolutions intergénérationnelles, ou de fluidité interactionnelle, ces dynamiques sont soumises à des forces spécifiques. Elles n’en demeurent pas moins l’expression de processus généraux, comme la grammaticalisation. Enfin, ces hétérogénéités, mouvements, différences sont particulièrement saillants pour les sujets parlants, devenant objets d’activité réflexive et enjeux dans les rapports de force symboliques entre locuteurs. La prise en compte des usages et des dynamiques contribue à la modélisation de la langue comme système. La variation et la pluralité des lectes s’inscrivent dans la grammaire. De même, les études récentes sur l’acquisition et l’interaction montrent comment la grammaire se construit dans et pour les activités discursives, et comment les fonctions des formes se mettent en place ou se déplacent dans une compétition entre fonctions sémantiques et discursives. Les dynamiques des langues sont envisagées selon trois angles principaux : 1) celui des processus acquisitionnels ; 2) celui des représentations que les locuteurs se font de la langue ou des langues, particulièrement celles induites ou construites dans les situations didactiques ; 3) et celui de la sociolinguistique. Ce qui détermine trois axes de recherche se donnant des objets spécifiques et recourant à des méthodes particulières, mais aussi des actions impliquant plusieurs sous-secteurs ainsi que d’autres partenaires. Les opérations menées ont porté de façon générale sur des dynamiques affectant ou impliquant le français dans différentes situations de francophonie et de contacts de langues, l’acquisition du français, ou l’acquisition d’autres langues par des sujets francophones. Cependant la dimension typologique est considérée, pour rendre compte des contacts entre langues ou variétés, pour départager processus généraux et problèmes acquisitionnels spécifiques, enfin pour l’adéquation du transfert de notions métalinguistiques entre langues.

Page 48: Laboratoire Modèles, Dynamiques, Corpus

48

Liste des opérations 1.2.2.1. Appropriation du français et construction de connaissances en situation diglossique 1.2.2.2. Représentation des événements : sémantique verbale, temporalité et développement des énoncés complexes 1.2.2.3. Langage, langues et école : acquisition, interactions et construction des connaissances en langue de scolarisation (L1 ou L2) et autres langues 1.2.2.4. Elaboration d’un glossaire de termes grammaticaux 1.2.2.5. Le style dans les dynamiques de la francophonie 1.2.2.6. Sociolinguistique variationniste et interprétative

La composante Dynamiques comprend aussi les travaux des deux équipes issues du LEAPLE.

1.2.2.7. Equipe ACQUOR 1.2.2.8. Equipe ALMA

Pour des raisons de clarté, nous présentons ici les travaux des deux équipes ACQUOR et ALMA selon le projet d¹intégration, tel qu¹il avait été préparé en 2005 et a été rendu effectif au 01/01/2006. Pour l’équipe ACQUOR, le bilan est établi sur une période de 4 ans, qui couvre aussi la période 2004-2005. Pour l’équipe ALMA, dont la fondation est issue des perspectives ouvertes par la restructuration envisagée en 2005, le bilan ne porte que sur les deux années où cette équipe, créée en 2006, a effectivement fonctionné. Depuis le 01/01/2006, de nombreuses collaborations ont été nouées. La partie « Projet scientifique 2009-2012 » en témoigne.

Page 49: Laboratoire Modèles, Dynamiques, Corpus

49

1.2.2.1 Appropriation du français et construction de connaissances en français L2 en situation diglossique 1. Membres de l’opération Membres rattachés à titre principal (3) Colette Noyau (responsable) Françoise Gadet Maria Kihlstedt Doctorants (3 dont 1 en cotutelle) Olivia Binganga Karine Bouchez Julie Peuvergne Collaborations extérieures (10) Ufoalè-Christine Afola (thèse soutenue à Paris 10 en 2002) Kossi-Souley Gbeto (thèse soutenue à Paris 10 en juillet 2007) Cécile Vigouroux (Université de Vancouver, thèse soutenue à Paris 10 au printemps 2003) • Equipe de chercheurs de l’Université de Lomé, Togo : Edith Bedou-Jondoh Alilou Cissé Issa Takassi Komla Amegashie (doctorant) • Equipe de l’ACI Cognitique de C. Noyau, dirigée par Denis Legros (IUFM de Créteil et Université Paris 8) Yann Hoareau (doctorant, La Réunion) François Sawadogo (doctorant Burkina Faso) 2. Problématique Ce projet a étudié l’appropriation et l’utilisation du français langue seconde au Togo au long de la scolarisation depuis l’entrée à l’école jusqu’à l’issue de la classe de 3ème- d’où doivent sortir de jeunes adultes bilingues, parallèlement au développement des capacités langagières en langue première, et a analysé les processus de construction de connaissances via le français langue de scolarisation en diverses matières. Les résultats acquisitionnels ont porté sur plusieurs domaines privilégiés : la représentation des procès (développement du lexique verbal en L2), la temporalité lexicale, discursive et morphologisée, la représentation des entités participant aux procès (développement du SN), les énoncés complexes (développement des formes syntaxiques de la parataxe et de l’hypotaxe et de leur usage fonctionnel selon les genres discursifs (ils sont détaillés dans le rapport à mi-parcours de décembre 2005, section 2.1.2.1). Ces résultats, ainsi que les analyses de pratiques pédagogiques dans des séquences de classe au primaire et au collège, de l’input linguistique fourni par les maîtres, et les représentations de l’enseignement de la langue sollicitées dans des entretiens métalinguistiques et pédagogiques avec des maîtres, ont permis de repenser le démarches pédagogiques et de faire des propositions d’optimisation sur plusieurs aspects de l’environnement éducatif d’acquisition du français L2 : les manuels, les pratiques d’interaction en classe, la place de la L1 dans le développement cognitif et la progression scolaire de l’enfant, la double focalisation langue - contenus scolaires dans diverses matières,

Page 50: Laboratoire Modèles, Dynamiques, Corpus

50

les pratiques et normes d’évaluation certificative et le rôle de la langue française dans ces certifications. 2.a. Actions - Direction d’un numéro de la revue Langage & Société, en collaboration avec Gabrielle Varro (N° 116, Le ‘scandale’ du bilinguisme) - Rapports de fin de contrats pour les organismes ayant soutenu le projet (AUF, MAE programme Campus, ACI Ecole et sciences cognitives). - Communications des membres du projet dans diverses rencontres internationales : Neuchâtel 2004, Ouagadougou 2004, Moncton 2005, Montréal 2006, Brazzaville 2007, et nationales : IUFM de Montpellier 2006, ENS-SHS de Lyon 2005. - Reste à réaliser un colloque de synthèse national à organiser par nos partenaires de l’Université de Lomé à destination de la société civile et des enseignants togolais, sur les implications éducatives du projet, avec l’appui de l’équipe de Paris 10. - Noyau Colette (éd.), « Appropriation du français et construction de connaissances en situation diglossique», ouvrage multimédia sur Cédérom, février 2007, Service COMETE Université Paris 10 : Actes du colloque international de Nanterre de février 2005, 43 communications + autres textes + documents iconographiques, sonores et vidéo. 2.b. Groupe de travail Réunions mensuelles le samedi, animées par C. Noyau. 2.c. Journées d’études, colloques, ateliers Organisation du colloque international tenu à Nanterre en février 2005 sur : « Appropriation du français langue de scolarisation et construction de connaissances en situation diglossique », avec le soutien de l’AUF, du MAE, du Conseil Général du 92, du CS et de l’ED-CLM de Paris 10. Les Actes, après révision et sélection par un comité éditorial, ont constitué un ouvrage multimédia sur CD-ROM édité par le service COMETE de l’Université Paris 10, paru en février 2007. 2.d. Contrats ACI ‘Ecole et science cognitive’ 2002-2005. 3. Thèses en cours (3 dont 1 en cotutelle)

1. Olivia Binganga : Appropriation du français en situation diglossique : comparaison des productions narratives orales et écrites d’élèves en français L2 au Togo et au Gabon. Directrice C. Noyau.

2. Karine Bouchez : Education bilingue: enseignement des disciplines non linguistiques, construction des connaissances, construction d’une compétence bilingue disciplinaire. Directrice C. Noyau.

3. Julie Peuvergne : Pratiques et représentation du français au Cameroun. Directrice F. Gadet, cotutelle avec Stefan Pfänder, Université de Fribourg-en-Brisgau (Allemagne).

Page 51: Laboratoire Modèles, Dynamiques, Corpus

51

4. Thèse soutenue (1)

1. Kossi-Souley Gbeto : Les discours procéduraux et explicatifs en L1/L2 et le développement des énoncés complexes. Directrice C. Noyau, juillet 2007.

5. Production scientifique halshs-00131852, Avolonto A., Kihlstedt M., 2006, Les étapes de l’acquisition du français et

du développement bilingue des enfants, Noyau C. (dir.), Actes du colloque international "Appropriation du français et construction de connaissances via la scolarisation en situation diglossique", Université de Paris-X-Nanterre, COMETE, CD-Rom.

halshs-00114319, Gadet F., Varro G., 2006, Le « scandale » du bilinguisme » : introduction, Langage et société, 116, 9-28.

halshs-00114390, Gadet F., 2004, Quelle place pour la variation dans l’enseignement du français langue étrangère ou langue seconde, Pré-textes franco-danois.

halshs-00120869, Noyau C. (dir.), 2006, Actes du colloque international "Appropriation du français et construction de connaissances via la scolarisation en situation diglossique", Université de Paris-X-Nanterre, COMETE, CD-Rom.

halshs-00120870, Noyau C., 2006, Regards croisés sur l’appropriation du français et la construction de connaissances via la scolarisation en situation diglossique, C. Noyau (éd.), Actes du colloque international « Appropriation du français et construction de connaissances via la scolarisation en situation diglossique », Université de Paris-X-Nanterre, COMETE, CD-Rom.

halshs-00120862, Noyau C., 2006, Linguistique acquisitionnelle et intervention sur les apprentissages : appropriation de la langue seconde et évaluation des connnaissances à l’école de base en situation diglossique, Bulletin VALS/ASLA, 83/1, 93-106.

halshs-00120866, Noyau C., 2006, Le langage des maîtres comme français de référence : rôle de l’école dans la transmission de la langue (Togo), Le Français en Afrique, 21, 339-350.

halshs-00120800, Noyau C., 2005, Comparaisons acquisitionnelles dans l’étude du français langue seconde, K. Ploog & B. Rui (éds.), Appropriation en contexte multilingue - Eléments sociolinguistiques pour une réflexion didactique à propos de situations africaines, Presses de l’Université de Franche-Comté, 33-57.

halshs-00120772, Noyau C., Gbeto K.-S., 2004, Les conceptions de l’intelligence dans la culture éwé (Togo) : analyse sémantique des expressions du domaine cognitif, Congrès de l’ARIC (Association pour la Recherche InterCulturelle) 2004, [http://www.unifr.ch/ipg/sitecrt/ARIC/XeCongres/communication.html]

halshs-00120782, Noyau C., Koudossou S.-G., 2004, Rôle des pratiques d’enseignement et des modalités d’évaluation dans l’appropriation du français langue "seconde " à l’école : le français face aux autres disciplines au Togo, Marges Linguistiques.

halshs-00120797, Noyau C., Vellard D., 2004, Construction de connaissances mathématiques dans la scolarisation en français langue seconde, Cahiers du Français Contemporain, 9, 57-76.

Page 52: Laboratoire Modèles, Dynamiques, Corpus

52

1.2.2.2. Représentation des événements : sémantique verbale, temporalité et développement des énoncés complexes 1. Membres de l’opération Membres rattachés à titre principal (2) Colette Noyau (responsable) Maria Kihlstedt Doctorants (4) Lamia Allal Olivia Binganga Guilhem Florigny Jia Tan Francesca Zirpoli Chercheurs associés (2) Jin Nam Choi (Université Autonome de Barcelone) Gema Sanz Espinar (Université Autonome de Madrid) Collaborations extérieures (4) Ake Viberg (Université d’Uppsala) sur la typologie du lexique verbal Christine Dimroth (Max-Planck Institut für Psycholinguistik, Nimègue), coordinatrice du « European Network on Comparative Study of Second Language Acquisition » Giuliano Bernini (Université de Bergame), coordinateur du projet « Development of verbal lexicon », « European Network on Comparative Study of Second Language Acquisition » Karine Duvignau (Laboratoire J. Lordat, Toulouse), responsable scientifique de l’ACI-JC « Architecture structurale et fonctionnelle du lexique verbal : La flexibilité sémantique comme principe fondamental de la cognition humaine et artificielle », pour laquelle le laboratoire effectue un volet ‘Langue seconde’ 2. Problématique L’étude des contenus sémantiques mobilisés dans les productions en L2 permet de rendre compte des processus cognitifs de conceptualisation et de lexicalisation de procès sous-jacents chez les sujets. Nous avons exploré ces caractéristiques du traitement des langues en situation d’acquisition et de contact de langues (plurilinguisme émergent ou stabilisé) à partir de domaines privilégiés constituant ensemble la représentation des événements et leur placement dans le temps : temporalité dans le récit ; grammaticalisation de l’information temporelle ; sémantique des procès (développement du lexique verbal pour les événements, granularité temporelle et sémique) ; développement de la cohérence et de la connexité (relations temporelles, causales, téléologiques entre événements) et développement des énoncés complexes (condensation de l’information dans le discours). Les travaux coordonnés sur la granularité et la condensation ont permis d’aboutir à un important article de synthèse collectif en anglais dans un volume international (Noyau et al. 2005) sur les phénomènes de condensation dans le discours (recours à des énoncés pluri-propositionnels) – et sur les phénomènes de granularité qui relèvent de la conceptualisation et de la sémantique des procès et qui sont vus comme associés dans la production de textes. Ces deux dimensions de la conceptualisation des procès évoluent au fil des étapes du développement langagier, et permettent un profilage pertinent des stades acquisitionnels

Page 53: Laboratoire Modèles, Dynamiques, Corpus

53

atteints et franchis par l’enfant bilingue dans chacune de ses langues ou par l’apprenant dans l’acquisition d’une L2 (Noyau et al. 2005). Pour ce qui est de la lexicalisation des procès, les travaux ont permis de confronter input lexical et développement du lexique verbal, et de mettre en évidence d’une part le rôle clé des verbes de base ou nucléaires (cf. Viberg 2002) aux étapes précoces de l’acquisition, et d’autre part l’influence importante, et persistante jusqu’aux étapes avancées de maîtrise de la langue, des schèmes de lexicalisation des procès (Talmy 1986) préférentiels de la L1 sur la production discursive en L2 (cf. (Noyau 2003a, 2005, 2007c, à par., Kihlstedt 2005). Enfin un ensemble coordonné d’expérimentations sur la lexicalisation des procès de séparation en français, coréen et suédois comme L1 et L2 (dans le cadre de l’ACI-JC dirigée par K. Duvignau ‘Architecture structurale et fonctionnelle du lexique verbal : La flexibilité sémantique comme principe fondamental de la cognition humaine et artificielle’) est en cours d’exploitation et fera l’objet en 2008 d’écrits monographiques puis d’études comparatives selon les âges et les groupes de locuteurs. Voir le site http://colette.noyau.free.fr, pages Projets. 2.a. Actions - Initiative du Workshop Lexical typology, lexicalization and language acquisition, 2-3 avril 2007 à l’Université d’Uppsala, avec le Pr A. Viberg, et conférence invitée. - Communication à la table ronde de Bergame du ‘European Network on Comparative Study of Second Language Acquisition’, 13-14 avril 2007. - Etude pilote en collaboration avec des chercheurs de l’université de Lund, Suède (cf. Granfeldt, Schlyter, Arapian et Kihlstedt, comm. 2007) auprès des enfants du Lycée Français de Stockholm, comparant trois modes d’acquisition chez trois groupes d’enfants : l’acquisition du français en tant que langue première (L1), l’acquisition simultanée des deux langues dès la naissance (2L1) et l’acquisition précoce (entre 4 et 6 ans) d’une L2 (enfant L2). Il s’agit de voir si les enfants L2 se comportent de la même manière que les monolingues et les bilingues simultanés et si oui, pour quels phénomènes linguistiques (domaines examinés : pronoms clitiques (forme et position), genre, morphologie verbale et temporelle). - Intervention de M. Kihlstedt à la journée d’étude de la composante Dynamiques sur Locuteur quasi-natif ou apprenant très avancé : regards croisés de sociolinguistique et d’acquisition (Paris X, le 19-20 octobre 2006), sur l’emploi de l’imparfait chez des apprenants avancés avant et après un séjour en milieu francophone. 2.b. Groupe de travail Réunions mensuelles le samedi, animées par C. Noyau. 2.c. Journées d’études, colloques, ateliers Journée d’étude « L’acquisition des langues, une interdisciplinarité nécessaire : entre typologie des langues, linguistique textuelle et psycholinguistique », Université Paris 10, ED-CLM 2006, Programme et résumés sur le site http://colette.noyau.free.fr et sur le site du laboratoire. Actes prêts pour mise en ligne.

Page 54: Laboratoire Modèles, Dynamiques, Corpus

54

2.d. Contrats Volet d’une ACI JC pilotée par K. Duvignau (par convention avec l’Université de Toulouse 2) sur la flexibilité sémantique des verbes dans l’acquisition L1 et L2 et les dysfonctionnements du langage. Paris 10 effectue les études concernant les coréanophones en L1 et en L2, et les suédophones en L1 et L2. 3. Thèses en cours (4)

1. Olivia Binganga : Appropriation du français en situation diglossique : comparaison de productions narratives orales et écrites d’élèves en français L2 au Togo et au Gabon. Directrice C. Noyau.

2. Guilhem Florigny : Appropriation du français et représentation des langues chez des enfants plurilingues mauriciens. Directrice C. Noyau.

3. Jia Tan : Acquisition de la spatialité en français par des étudiants chinois au long de leur apprentissage du français à Pékin : étude longitudinale. Directrice C. Noyau.

4. Francesca Zirpoli : Les outils de cohésion syntaxique dans le récit oral des apprenants italophones avancés du français langue étrangère. Directrice C. Noyau.

4. Thèses soutenues (3 dont 1 en cotutelle)

1. Chiraz Anane : Appropriation du discours narratif en langue maternelle et en français par des élèves tunisiens appartenant à deux environnements d’apprentissage. Etude longitudinale. Directrice C. Noyau.

2. Maria Elena Villecco : Développement des capacités narratives et acquisition des moyens linguistiques de la temporalité en français chez des élèves argentins en milieu isolé. Directrice C. Noyau, mars 2005.

3. Nora Vera de Tamagnini: Influence de la représentation de la relation L1/L2 sur l’acquisition du lexique des procès. Le cas des apprenants argentins de français en milieu institutionnel isolé. Directrice C. Noyau, mars 2007.

5. Production scientifique halshs-00131850, Kihlstedt M., 2005, Stratégies compensatoires dans l’emploi du lexique

verbal en français, F. Grossman, G. Petit & M.-A. Paveau (éds.), Didactique du lexique : langue, cognition, discours, ELLUG, 85-105.

halshs-00120799, Noyau C., 2005, Le lexique verbal dans l’acquisition d’une langue seconde : verbes de base, flexibilité sémantique, granularité, F. Grossmann, M.-A. Paveau & G. Petit (éds.), Apprentissage du lexique : langue, cognition, discours, ELLUG, 65-84.

halshs-00120847, Noyau C., De Lorenzo C., Kihlstedt M., Paprocka U., Sanz G., Schneider R., 2005, The structure of learner language, H. Hendriks (éd.), Two dimensions of the representation of complex event structures : granularity and condensation. Towards a typology of textual production. “Studies on Language Acquisition”, 28, De Gruyter, 157-202.

halshs-00120857, Noyau C., Takassi I., 2005, Catégorisation et recatégorisation : les constructions verbales sérielles et leur dynamique dans deux familles de langues du Togo, G. Lazard & C. Moyse-Faurie (éds.), Linguistique typologique, Presses du Septentrion, 207-240.

Page 55: Laboratoire Modèles, Dynamiques, Corpus

55

1.2.2.3. Langage, langues et école : acquisition, interactions et construction des connaissances en langue de scolarisation (L1 ou L2) et autres langues 1. Membres de l’opération Membres rattachés à titre principal (2) Catherine Le Cunff (responsable) Colette Noyau Doctorants (3 dont 1 en cotutelle) Francesca Caetano-Rousselot Lionel Toti Antonia Xenaki 2. Problématique La langue est présente dans tous les temps d’apprentissage à l’école mais les interactions dans la classe méritent d’être davantage explorées par la linguistique. La dimension réflexive de l’apprentissage langagier, l’interaction langagière pour construire la communauté discursive classe (notion en émergence), comme l’articulation entre l’oral et l’écrit dans la construction des savoirs langagiers, doivent être travaillées d’un point de vue linguistique, mais aussi en ayant en vue les directives européennes et leur définition du plurilinguisme et de la citoyenneté européenne. La parole de l’enseignant est également un objet linguistique peu décrit, sauf pour l’enseignement des langues étrangères. Des comparaisons ont été menées entre les classes françaises et des classes au Québec, en Afrique subsaharienne, pratiquant l’enseignement de la langue ou des langues intégré aux enseignements disciplinaires 2a. Actions Trois axes ont été développés : 1) Interactions entre pairs en classe de langue Le déroulement interactif des échanges entre apprenants français du portugais langue étrangère dans l’accomplissement des tâches en binôme est étudié dans une perspective néo-vygotskienne centrée sur l’ « étayage » construit par les apprenants dans la résolution d’une tâche complexe. La construction des connaissances linguistiques et la relation de pouvoir que cela entraîne entre les apprenants sont montrées à partir de données de la production orale d’étudiantes en classe de troisième dans un lycée de Nancy. 2) L’inscription de soi et de l’autre dans les interactions entre pairs Les interactions entre pairs dans la classe, espace social d’apprentissages effectués en commun, portent la marque du contexte, de l’extérieur de la classe. Mais les échanges oraux de la classe ont aussi une spécificité : le partage de la parole est inégal dans l’espace sonore de la classe : une partition entre parleurs et silencieux se fait spontanément, reflet d’habitus et de cultures plus ou moins partagées avec l’univers de l’école. Dans le groupe, les postures et la partition restent sensiblement identiques si l’action de l’enseignant ne vise pas à modifier l’état spontané pour instaurer un partage différent de la parole. La recherche s’est intéressée aux marques linguistiques de l’interaction entre pairs, en particulier à la prise en charge de son discours face à celui de l’autre, des autres, et à l’inscription du discours de l’autre dans son propre discours : reprises, reformulation de ce discours autre pour en dire quelque chose.

Page 56: Laboratoire Modèles, Dynamiques, Corpus

56

Ces marques linguistiques sont la trace de l’évolution dans les rapports entre élèves : au delà d’une communauté d’apprenants, se constitue sous l’effet de l’action de l’enseignant sensibilisé à cette problématique, une communauté discursive, générant un climat davantage favorable aux apprentissages. 3) Les échanges question-réponse et la caractérisation de la situation acquisitionnelle en classe) La nature et la dynamique des échanges question-réponse constituent une entrée décisive pour comprendre le fonctionnement d’une interaction en contexte didactique. Ce qui a été exploré le plus en profondeur de ce point de vue, ce sont les échanges Maître-Elève. Un examen attentif de ces modules binaires ou ternaires dans le polylogue de la classe aide à diagnostiquer le placement respectif des acteurs de la classe au sein de l’ensemble, les fonctions qui leur sont assignées ou qu’ils s’assignent, les buts de chacun dans l’interaction, et la gestion des rôles et des buts par chaque participant. Il permet aussi d’analyser le rapport aux savoirs en circulation et en construction, et en particulier le rapport aux savoirs langagiers et à leur élaboration à travers la parole des enfants et de l’enseignant. Lorsque la langue d’enseignement n’est pas la langue première des apprenants (langue de scolarisation d’élèves exogènes en France, programmes d’immersion, enseignements disciplinaires en langue étrangère, langue seconde de scolarisation en Afrique francophone), ce qui se lit à travers cet observable, c’est aussi la tension constante entre acquisition de la langue et construction des savoirs, cette double focalisation – inévitable et constitutive de ces situations -- pouvant se résoudre de différentes façons. 2.b. Groupe de travail Constitution d’une équipe interdisciplinaire Sciences du langage - Sciences de l’Education - Psychologie (Université Paris 10) sur les interactions langagières dans le groupe et les apprentissages (InterGAp), pour développer la problématique des apprentissages / interactions entre pairs dans le groupe, qui s’est réunie en séminaires réguliers InterGAp 4-6 fois par an en 2006 et 2007. 2c. Journées d’études, colloques, ateliers - Journée d’études « Interactions dans le groupe et apprentissages scolaires », organisée par C. Le Cunff, Université Paris 10, 9 février 2007 (Actes en ligne d’ici fin 2007). - Journée d’études de l’AFLA « L’apprentissage et l’enseignement des langues vivantes à l’école : Impacts sur le développement de la langue maternelle », co-organisée par C. Le Cunff (Université Paris 10, 16 novembre 2006), Actes : ouvrage en préparation. 2d. Contrats Financement par le Conseil Scientifique de l’Université Paris 10 (action blanche BQR) 2006. 3. Thèses en cours (3 dont 1 en cotutelle)

1. Francisca Caetano-Rousselot : Approche constructiviste et socio-interactionniste du phénomène interactif « échafaudage » : étude contrastive chez les apprenants brésiliens de FLE et d’apprenants français de portugais LE. Directrice C. Le Cunff

Page 57: Laboratoire Modèles, Dynamiques, Corpus

57

2. Lionel Toti : Les enfants bilingues : la langue parlée à l’école et la langue parlée à la maison ; le cas des enfants d’origine ivoirienne nés et scolarisés en France. Directrice C. Le Cunff

3. Antonia Xenaki : L’évaluation en FLE. Directrice C. Le Cunff, cotutelle avec Michel Kassotakis (Université d’Athènes)

4. Production scientifique halshs-00132226, Lafontaine L., Le Cunff C., 2006, Les représentations de l’enseignement de

l’oral chez des enseignants québécois et français de la maternelle au secondaire, Québec Français, 141, 87-89.

halshs-00132229, Lafontaine L., Le Cunff C., 2005, Recherche comparée sur la prise de parole de certains élèves du préscolaire au primaire en français langue maternelle en France et au Québec : analyse méthodologique, Education canadienne et internationale, 34, 2, 72-97.

halshs-00132240, Le Cunff C., 2007, Enseigner ce que parler veut dire, Actes du colloque ACFAS "La place des savoirs oraux dans le contexte scolaire d’aujourd’hui", Presses Universitaires de Montréal.

halshs-00132239, Le Cunff C., 2007, Reformuler pour apprendre, apprendre à reformuler : usages didactiques de la reformulation en FLM, Actes du colloque "Les voies de la reformulation", Presses Universitaires de Rennes.

halshs-00132242, Le Cunff C., 2007, L’apprenant comme personne globale, Actes du colloque ACFAS "La littératie en contexte d’inclusion et de transition", Presses Universitaires de Montréal.

halshs-00132237, Le Cunff C., 2006, Speech, the project : socialisation and entry into writing, Grotlüschen & Linde (éds.), Literalität, Grundbildung, Lesekompetenz ?, Waxmann.

halshs-00132151, Le Cunff C., 2005, De l’usage des corpus en didactique de l’oral : recherche et formation, Williams G. (éd.), La linguistique de corpus, Actes des deuxièmes journées de la linguistique du corpus, Presses Universitaires de Rennes, 397-406.

halshs-00132208, Le Cunff C., 2005, Ecolier à deux ans en France, Education et francophonie, XXXIII, 2, 247-258.

halshs-00132195, Le Cunff C., 2005, La prise de parole en classe : construction progressive d’un modèle, F. Morandi & J.-C. Sallaberry (éds.), Théorisation des pratiques, 23-33.

halshs-00132186, Le Cunff C., 2005, Le débat en classe : parler pour se construire comme acteur dans la cité, Le P. Marillaud & P. Gauthier (éds.), Rhétoriques des discours politiques, 225-236.

halshs-00120763, Noyau C., 2004, Appropriation de la langue et construction des connaissances dans l’école de base en pays francophone : du diagnostic aux actions, Penser la francophonie. Concepts, actions et outils linguistiques, Ed. des Archives Contemporaines/AUF.

1.2.2.4. Elaboration d’un glossaire de termes grammaticaux 1. Membres de l’opération Membres rattachés à titre principal (7) Anne Trévise (responsable) Jean-Jacques Briu (responsable) Marie-Laure Elalouf

Page 58: Laboratoire Modèles, Dynamiques, Corpus

58

Danièle Flament-Boistrancourt François Muller Sergueï Sakhno Carole Tisset (jusqu’en 2005) Doctorants (10 dont 2 en cotutelle) Mekioussa Ait-Saada Laetitia Constant Juliette Delahaie Khadija Elkandoussi Carole Faivre Agnès Muller Jean-Christophe O’Brien Erika Saint-Jean Théodora Vonitsanou Alexandra Vraciu Chercheurs associés (2) Catherine Camugli Christine Hénault-Sakhno Collaborations extérieures (1) Carole Tisset (IUFM Versailles), à partir de 2006 2. Problématique Les représentations métalinguistiques concernent plusieurs niveaux : elles peuvent être celles des linguistes, celles des enseignants en classe ou transcrites dans des manuels et celles des apprenants. Leur étude implique donc deux étapes : - Une première étape explore un domaine syntaxico-sémantique et les métalangues existantes de description en linguistique générale et des langues considérées (anglais, allemand, français langue maternelle, français langue étrangère, italien et russe), à la recherche d’une métalangue descriptive juste et cohérente. - Une étape ultérieure consiste en une recherche complémentaire sur les représentations métalinguistiques des manuels, des enseignants et des apprenants (langue maternelle et langues étrangères) aboutissant à des applications didactiques de ces recherches, et notamment en un répertoire de métatermes opératoires fondé sur une problématique et des représentations métalinguistiques cohérentes en termes d’invariants cognitivo-sémantiques. Ont été successivement étudiés :

• l’hypothétique ; • l’hypotaxe et la parataxe (étude syntaxique portant sur plusieurs langues, syntaxe de la

“ subordination ”, ou de la “ coordination ”, des liens entre leurs configurations notamment, et étude de la sémantique des repérages énonciatifs effectués) ;

• le thème et la thématisation ; • le sujet ; • le pronom ; • l’adjectif ; • le déterminant.

Page 59: Laboratoire Modèles, Dynamiques, Corpus

59

Le projet s’articule autour de la constitution progressive d’un glossaire (partiel) de métatermes linguistiques de description du langage et des langues, adapté donc à la description de plusieurs langues, dont le russe, l’allemand, l’anglais et le français. Les objectifs conduisent aux possibles applications didactiques, à la formation des enseignants, notamment à travers la remise en cause de certaines catégories et étiquettes traditionnelles ; la confrontation de plusieurs approches théoriques ; des définitions de plusieurs niveaux : recherche, formation des enseignants, didactisation (pour les apprenants de différents niveaux). Durant les quatre dernières années, rédaction des points déjà travaillés par l’équipe et addition de quelques nouvelles entrées, en cours : rédaction des notes concernant la didactisation. 2.a. Groupe de travail Le groupe se réunit tous les premiers lundis du mois : exposés des participants, rédaction des entrées du glossaire, discussions. 2.b. Journées d’études, colloques, ateliers - Journée du 11 juin 2004 : Thème et thématisation : Questionnements réciproques entre linguistique et didactique : 1) Les marques formelles de la thématisation dans les langues ; 2) Thématisation et dynamiques discursives - Journée d’études du 2 juin 2005 : L’adjectif dans le groupe nominal : problèmes terminologiques et théoriques à la lumière de plusieurs langues - Journée du 6 juin 2007 : Les déterminants : approches linguistiques et didactiques. 1) Les déterminants dans les productions orales et écrites : quelques questions d’acquisition, d’apprentissage et d’enseignement ; 2) La détermination dans les langues et les déterminants dans l’analyse linguistique : quelques questions théoriques issues d’un questionnement didactique. Une description détaillée et les programmes sont disponibles sur le site du laboratoire. 3. Thèses en cours (10 dont 2 en cotutelle)

1. Mekioussa Ait-Saada : La contribution de l’étude de textes littéraires à une didactique de l’anglais langue étrangère. Directrice A. Trévise.

2. Laetitia Constant : Parataxe, hypotaxe et construction du sens en anglais contemporain. Directrice A. Trévise.

3. Juliette Delahaie : Contribution à partir du corpus différentiel Lancom à la construction d’une grammaire communicative du français. Directrice D. Flament-Boistrancourt.

4. Khadija Elkandoussi : Etude du fonctionnement du connecteur BUT en contexte. Directrice A. Trévise.

5. Carole Faivre : Onomastique et art culinaire. Directeur F. Muller. 6. Agnès Muller : Une approche de l’ordre des mots et de la thématisation en anglais

contemporain. Directrice A. Trévise. 7. Jean-Christophe O’Brien : Formes de la répétition du sens (syntaxe, sémantique,

rhétorique). Directeur F. Muller, cotutelle avec Gerda Haßler (Université de Postdam).

Page 60: Laboratoire Modèles, Dynamiques, Corpus

60

8. Erika Saint-Jean : Le latin, un pré-requis pour l’apprentissage du français en Allemagne ? Directeur F. Muller, cotutelle avec Gerda Haßler (Université de Postdam).

9. Théodora Vonitsanou : Quelle approche de la grammaire du français L2 pour des apprenants grecs : diagnostic, hypothèses interprétatives et propositions didactiques. Directrice D. Flament-Boistrancourt.

10. Alexandra Vraciu : Apprentissage de la cohésion discursive en langue étrangère. Hypotaxe et parataxe. Directrice A. Trévise.

4. Thèse soutenue (1)

1. Abdelfattah Mazari : Analyse d’erreurs dans l’apprentissage de l’anglais par des locuteurs arabophones. Directeur F. Muller, juin 2006.

5. Production scientifique halshs-00134619, Briu J.-J., 2007, Dans la première moitié du XIXe siècle, des savants

allemands s’intéressent à des langues d’Orient : promesses et faiblesses de leur procédé comparatiste, Alexandre & Grimm-Hamen (éds.), L’influence de l’Orient sur la culture allemande aux XVIIIe et XIXe siècles, Presses Universitaires de Nancy

halshs-00134618, Briu J.-J., 2007, Les marques formelles de la thématisation dans les langues flexionnelles, le cas de l’allemand, Elalouf M.-L. (dir.), Linx, 55.

halshs-00134620, Briu J.-J., 2007, L’apport des stylistiques à la norme idéale de l’enseignement de l’allemand (1785-1943), Formes et fonctions de l’Idéal. Actes du congrès AGES.

halshs-00134617, Briu J.-J., 2007, Origine des langues, origine des peuples, Sens public. Revue électronique internationale, [http://www.sens-public.org]

halshs-00134616, Briu J.-J., 2005, "Stilistik" [Stylistique] : contribution à l’histoire d’une notion anthropologique, I. Behr & P. Henninger (éds.), A travers champs : études pluridisciplinaires allemandes. Mélanges pour Nicole Fernandez-Bravo, L’Harmattan, 213-225.

halshs-00134613, Briu J.-J., 2004, Contribution à l’histoire du Pronom : étude de vingt-cinq grammaires du français du XVIIIe siècle, Hassler G. & Volkmann M. (éds.), History of linguistics in Texts and Concepts - Geschichte der Sprachwissenschaft. Texten und Begriffen, Nodus Publikationen, 215-224.

halshs-00134614, Briu J.-J., 2004, L’exclamation : quelques repères historiques entre l’Antiquité et le début du XXe siècle, hors les grammaires, Nouveaux Cahiers d’Allemand, 22, 1, 89-101.

halshs-00126886, Flament-Boistrancourt D., 2007, Entrée thème/rhème du glossaire Comenius, Linx.

halshs-00126896, Flament-Boistrancourt D., Anscombre J.-C., 2007, Déterminants et noms de pays en français : morphophonologie ou sémantique ?, Evrard & al. (éds.), Travaux de linguistique.

halshs-00132850, Flament-Boistrancourt D. (dir .), 2006, Apprendre les langues étrangères : tendances actuelles, Revue française de Linguistique appliquée, XI/1, Editions De Werelt.

halshs-00126881, Flament-Boistrancourt D., 2004, Quelle contribution un corpus natif/ non natifs est-il susceptible d’apporter à la linguistique et à l’enseignement du français L2 : le cas de LANCOM ?, Pré-textes franco-danois, IV, 45-69.

Page 61: Laboratoire Modèles, Dynamiques, Corpus

61

halshs-00126537, Muller F., 2007, Heurs et malheurs de l’étymologie, Elalouf M.-L. (dir.), Linx, 55.

halshs-00126526, Muller F., 2005, Le groupe relatif, I Behr & P. Henniger (éds.), A travers champs. Etudes pluridisciplinaires allemandes. Mélanges offerts à Nicole Fernandez-Bravo, L’Harmattan, 241-255.

halshs-00131414, Sakhno S., 2006, « Peuple », « nation » et « ethnos » dans le discours russe, Strates : Matériaux pour la recherche en sciences sociales, 12, 119-131.

halshs-00131419, Sakhno S., 2005, 100 Racines essentielles du Russe : Découvrir les trésors des mots, Ellipses Edition Marketing S.A.

halshs-00084618, Trévise A., Constant L., 2007, Asyndète et construction du fictif dans certaines variétés d’anglais, A. Celle, S. Gresset et R. Huart (éds.), Les connecteurs, jalons du discours, Peter Lang, 71-94.

halshs-00107480, Trévise A., 2006, Pondérations qualitatives et quantitatives : le cas de now and then et de every now and then, Le qualitatif. Cycnos, 23, 2, 259-272.

halshs-00107467, Trévise A., 2004, Quelques jeux du present perfect avec les déterminations spatio-temporelles quantitatives et les spécifications qualitatives, J.-M. Merle et L. Gournay (éds), Contrastes : Mélanges en hommage à J. Guillemin-Flescher, Ophrys, Numéro spécial, 235-246.

1.2.2.5. Le style dans les dynamiques de la francophonie La collecte de corpus dans des situations diversifiées de la francophonie (entraînées surtout par la diversité des thésards intéressés par le projet), et le constat d’extrême diversité des données ainsi obtenues, a peu a peu amené à reconfigurer l’opération, y compris au niveau de son titre : on est passé de la « La variation stylistique » au plus circonscrit « Le style dans les dynamiques de la francophonie », qui incite à réfléchir au fait que ce n’est pas au niveau des langues, mais au niveau des communautés que se joue la diversité des organisations stylistiques. 1. Membres de l’opération Membres rattachés à titre principal (7) Françoise Gadet (responsable) Cécile Canut (délégation CNRS 2006-2007) Danièle Flament Catherine Le Cunff François Muller Colette Noyau Christine Pauleau Doctorants (13 dont 6 en cotutelle) Diana Balaci Jean-David Bellonie Sahar Benslimane Françoise Favart Wajih Guehria Danièle Josèphe Anna Makerova

Page 62: Laboratoire Modèles, Dynamiques, Corpus

62

Nicoletta Michelis Isabelle Mouclier Julie Peuvergne Larbi Rais Jamila Sebbar Baligh Sohbani Jeune chercheur associé (1) Emmanuelle Guérin Chercheur associé (1) Henry Tyne (Université de Southampton) Collaborations extérieures (10) Kate Beeching (Université de Bristol) Gaetano Berruto (Université de Turin) Paul Cappeau (Université de Poitiers) Enrica Galazzi (Université Catholique de Milan) Nathalie Guézennec (LACITO) Robert Nicolaï (Université de Nice et IUF) Stefan Pfänder (Université de Fribourg) Wulf Œsterreicher (Université de Munich) Cécile Vigouroux (Université de Vancouver) 2. Problématique L’angle d’attaque des faits de langue par le style tient compte de ce que la diversification stylistique est une propriété des langues en usage, et que le style est un phénomène définitoire des langues et de leurs dynamiques. Il permet d’organiser un point de vue sur la langue et les langues, en partant du locuteur et de la façon dont celui-ci met en œuvre ses ressources linguistiques et langagières. Le style est ainsi pris comme un indice privilégié de la diversité des façons de parler (Gadet & Tyne 2004, Gadet 2007, Gadet & Tyne à paraître), et cette problématique peut être étendue à l’ensemble de la francophonie. Le thème du style se situe au croisement de la sociolinguistique et de la didactique des langues (Gadet & Tyne à paraître), de la traduction, et de l’anthropologie linguistique (Guézennec 2005, Canut 2007) ; mais aussi des disciplines formalisantes, par l’intermédiaire des problématiques dites de l’usage. Les questions qui se posent à partir du style concernent en effet les langues et leurs frontières (notions de variation et de variétés), l’ensemble de la sociolinguistique, et la linguistique générale (rapports entre langues et locuteurs). L’empan du style est étudié à travers des objets et des terrains diversifiés, avec des questions, comme : la variation en général (Gadet 2004, 2007), oral/écrit (thèses Bellonie, Favart, Guérin, Josèphe), la maîtrise du style en L2 (thèses Tyne, Michelis, Guehria), simplification et pidginisation en français, la langue des jeunes (thèses Balaci, Bellonie, Makerova, Sohbani), le style dans différentes situations de francophonie (thèses Benslimane, Guehria, Peuvergne, Raïs, Sebbar) et professionnelles (thèse Mouclier).

Page 63: Laboratoire Modèles, Dynamiques, Corpus

63

2.a. Actions - Organisation à Paris 10 le 13 juin 2006 d’une journée d’étude des doctorants sur la langue des jeunes : confrontation entre nanterrois et thésards de Louvain-la-Neuve. Co-organisée par Emmanuelle Guérin (Paris 10) et Karolien Declercq (Louvain-la-Neuve). - Organisation d’un colloque à Paris 10, « Locuteur quasi-natif ou apprenant très avancé : regards croisés de sociolinguistique et d’acquisition », du 19 au 21 octobre 2006 par Françoise Gadet et Nicoletta Michelis (Paris 10) et Inge Bartning et Fanny Forsberg (Université de Stockholm), au croisement entre perspectives de sociolinguistique et d’acquisition. - Organisation de conférences à Paris 10, au cours de l’année 2006-07 : Zsuzsanna Fagyal (Université d’Urbana Champaign, Illinois, décembre 2006), Marie-Madeleine Bertucci (Université de Cergy-Pontoise, janvier 2007), Anne Knutsen (Université d’Oslo, mars 2007). Article-bilan, en collaboration entre Françoise Gadet et Henry Tyne, à paraître en septembre 2007 dans Pratiques. - Organisation d’une journées d’étude les 18 et 19 octobre 2007 : Etudes de syntaxe : français parlé, français hors de France, créoles par Françoise Gadet et Emmanuelle Guérin. 3. Thèses en cours (13 dont 6 en cotutelle)

1. D. Balaci : Les nouvelles stratégies d’écriture, avec les exemples de SMS en français et en roumain. Directrice F. Gadet.

2. J.-D. Bellonie : Typologie des erreurs de la graphie des élèves martiniquais au primaire apprenant le français : étude du passage du phonique au graphique. Directrice F. Gadet, cotutelle avec Wulf Œsterreicher (Université de Munich).

3. S. Benslimane : Pratiques langagières et stratégies d’insertion des jeunes issus de l’immigration marocaine. Directrice F. Gadet.

4. F. Favart : L’oral dans l’écrit - Représentation de l’oralité dans les écrits littéraires. Directrice F. Gadet, cotutelle avec E. Galazzi (Université de Milan).

5. W. Guehria : Les représentations sociolinguistiques et leurs effets sur l’apprentissage du français. Cas d’étudiants algériens en contexte formel. Directrice F. Gadet.

6. D. Josèphe : Les attitudes devant la langue d’écrivains francophones non natifs. Directrice F. Gadet.

7. A. Makerova : La langue des jeunes en France et en Russie. Directrice F. Gadet, cotutelle avec N. Popova (Université de Tcheliabinsk).

8. N. Michelis : Essai de caractérisation de la compétence sociolinguistique en situation de communication italo-française. Directrice F. Gadet, cotutelle avec M.-B. Vittoz (Université de Brescia).

9. I. Mouclier : Directrice F. Gadet 10. J. Peuvergne : Pratiques et représentation du français au Cameroun. Directrice F.

Gadet, cotutelle avec Stefan Pfänder, Université de Fribourg-en-Brisgau (Allemagne). 11. L. Rais : Analyse des interactions verbales dans des petits commerces marocains en

Ile-de-France. Directrice F. Gadet. 12. J. Sebbar : L’enseignement du FLE aux maghrébins adultes en France. Directrice F.

Gadet. 13. B. Sohbani : Pratique langagière collatérale : vannes et jurements chez les adolescents

français. Directrice F. Gadet.

Page 64: Laboratoire Modèles, Dynamiques, Corpus

64

4. Thèses soutenues (3) et membre de jury de HDR (1) 1. E. Guerin : Etude de certains phénomènes grammaticaux observables à l’oral à des

fins didactiques. Directrice F. Gadet, novembre 2006. 2. N. Guézennec : Mémoire et transmission de la tradition orale en Basse-Bretagne.

Approches ethno et sociolinguistiques de la littérature orale, de la mémoire, de l’oral et de l’écrit. Co-directeurs F. Gadet et Aurore Monod-Becquelin (Université Paris 10), mars 2004.

3. H. Tyne : La maîtrise du style en L2. Directrice F. Gadet, cotutelle avec Carol Sanders (Université de Surrey), novembre 2005.

Jury de HDR (1)

1. Mireille Bilger (décembre 2003) : Corpus et description grammaticale, avec une application à la coordination

5. Production scientifique hal-00171169, Canut-Hobé C., 2007, Une langue sans qualité, Lambert-Lucas. halshs-00121508, Canut Hobé C., 2006, Tsigani na sapon ! Tsigani na saturn ! Quelques notes

à propos des discours sur les Roms en Bulgarie, A. Viaut (éd.), Politiques linguistiques et frontières dans les pays de l’Est et de l’ex-Union soviétique.

halshs-00121484, Canut Hobé C., 2006, Construction des discours identitaires au Mali, Ethnicisation et instrumentalisation des senankuya, Cahiers d’Etudes Africaines, 184, Ecole des Hautes Etudes en Sciences Sociales.

halshs-00121479, Canut Hobé C., Smith E. (dir.), 2006, Parentés, plaisanteries et politique, Cahiers d’études africaines, 184, Ecole des Hautes Etudes en Sciences Sociales.

halshs-00121490, Canut Hobé C., Smith E., 2006, Pactes, alliances et plaisanteries, Pratiques locales, discours global, Cahiers d’Etudes Africaines, 184, Ecole des Hautes Etudes en Sciences Sociales.

halshs-00126885, Flament-Boistrancourt D., 2006, Formations en langues en entreprise à grande échelle : une réponse de type industriel, Revue française de linguistique appliquée, XI, I, 85-102.

halshs-00122427, Gadet F., 2006, Hier comme aujourd’hui. Quelques phénomènes de variation en syntaxe, Céline Guillot, Sergen Heiden, Sophie Prévost (éds.), A la quête du sens, ENS Editions, 191-198.

halshs-00114388, Gadet F., 2006, Sociolinguistics-Soziolinguistik, Ulrich Ammon, Norbert Dittmar, Klaus Mattheier, Peter Trudgill (éds.), An International Handbook of the Science of Language and Society, France/Frankreich, Walter de Gruyter, 1787-1792.

halshs-00114387, Gadet F., 2005, 1977 : sur un moment-clé de l’émergence de la sociolinguistique en France, Patrick Sériot (éd.), Un paradigme perdu : la linguistique marriste. ILSL, 20, 127-138.

halshs-00114384, Gadet F., 2005, Michel Pêcheux e a analise do discurso : uma rela�ao de nunca acabar, Freda Indursky & Maria Cristina Leandro (éds.), As mudanças discursivas no francés atual : pontos de vista da analise de descurso e da sociolingüistica, Claraluz, 51-74.

halshs-00114890, Gadet F., 2004, La signification sociale de la variation, Romanistisches Jahrbuch, 54, 98-114.

halshs-00114331, Gadet F., Tyne H. (dir.), 2004, Le style comme perspective sur la dynamique des langues, Langage et société, MSH.

Page 65: Laboratoire Modèles, Dynamiques, Corpus

65

halshs-00132168, Le Cunff C., 2005, Enseignement de l’oral, intégré aux apprentissages disciplinaires et socialisation, Actes du 9e Colloque international de l’AIRDF : "Le français : discipline singulière, plurielle ou transversale ?", [www.colloqueairdf.fse.ulaval.ca/fichier/Communications/c-LeCunff.pdf]

halshs-00120878, Noyau C., 2006, Les langues partenaires du français dans la scolarisation en francophonie subsaharienne? Atouts et obstacles pour leur mise en pratique, G. Chevalier (éd.), Les actions sur les langues : Synergie et partenariat, Ed. des Archives Contemporaines.

1.2.2.6. Sociolinguistique variationniste et interprétative 1. Membres de l’opération Membres rattachés à titre principal (3) Pierre Encrevé (responsable) Michel de Fornel Richard Walter Doctorants (2) Fatima Iazza Nadège Lechevrel Membre associé (1) Jean Sybille (Ministère de la Culture) Collaborations extérieures (11) G. Bergounioux (Université d’Orléans) O. Baude (Université d’Orléans) B. Cerquiglini (Université de Louisiana State, Bâton Rouge, Etats-Unis) J.-C. Chevalier (Université de Paris 8) G. Jetchev (Université de Sofia) W. Labov (Université de Pennsylvanie, Etats-Unis) G. Sankoff (Université de Pennsylvanie, Etats-Unis) T. Scheer (Université de Nice) J.-R. Vergnaud (Université de Southern California, Etats-Unis) S. Wauquier (Université de Paris 8) 2. Problématique On a engagé un travail de réflexion sur les recherches en sociolinguistique variationniste et interprétative réalisées les années précédentes, pour définir un programme de recherche permettant de lancer une nouvelle enquête en utilisant une précédente enquête comme point de comparaison, dans le cadre d’une collaboration avec le CORAL (UPRES -EA 3750) autour du projet ESCOL2 : ce Centre développe actuellement une démarche similaire avec un projet d’enquête sociolinguistique à Orléans, qui utilise comme terme de comparaison l’Enquête Socio-Linguistique à Orléans (ESLO) recueillie à la fin des années 60. La coopération s’effectue dans le cadre du projet financé par l’ANR : VARILING - Traitement des Variations Linguistiques dans les Corpus.

Page 66: Laboratoire Modèles, Dynamiques, Corpus

66

2.a. Actions 1) Définir la démarche sociolinguistique Cette recherche vise à intégrer l’hétérogénéité grammaticale (y compris dans les usages passifs de la langue) au cœur du dispositif linguistique et à mettre au jour ses prolongements potentiels dans le domaine des politiques linguistiques. Il s’agit de revenir sur les enjeux empiriques et théoriques du volet « sociopragmatique » de la sociolinguistique variationniste dont « l’acte de lancement » fut en 1983 la rédaction du texte « Le sens en pratique : construction de la référence et structure sociale de l’interaction dans le couple Question-Réponse ». Une nouvelle version considérablement étoffée paraîtra prochainement sous la forme d’un ouvrage. Dans cet article, nous avions étudié la construction de la référence dans un fragment de discours enregistré — une série d’interviews constituées de couples question-réponse — et fait la démonstration empirique, à propos d’un exemple précis, que la signification est inséparable de la référence et de l’usage social des mots dans le discours. Deux exemples de référence descriptive et ostensive ont été analysés, respectivement l’emploi du mot théâtre et des déictiques je/nous - on. L’examen des stratégies linguistiques en particulier métapragmatiques dans leurs liens aux différents habitus, et de la circulation de la parole entre les participants, a confirmé l’importance d’une saisie du sens comme sens en pratique, redevable d’une pragmatique sociolinguistique. 2) La dimension sociale La grande enquête sociolinguistique que nous avons menée au début des années quatre-vingt dans la ZUP de Lormont près de Bordeaux (Fornel, 1983) mérite d’être confrontée aux résultats de certains travaux récents sur la phonologie du schwa en français et plus généralement sur la variation phonologique (Durand et al., 2003). Cette confrontation fait apparaître les limites épistémologiques et théoriques auxquelles se heurtent ces études en négligeant la dimension sociale des phénomènes linguistiques, non seulement dans l’usage de la langue mais bien dans son intériorisation grammaticalisée par les locuteurs-auditeurs. 3. Thèse soutenue (1)

1. Lia Varela : Directeur P. Encrevé, janvier 2006. 4. Production scientifique hal-0017128, De Fornel M., L’ethnométhodologie : un regard épistémologique sur un courant

sociologique radical, Colloque ESSE "Rapports ambivalents entre les sciences sociales européennes et américaines", Liège, 16-18 février 2006. [ http://www.espacesse.org/fr/coll-9.html]

hal-00171285, De Fornel M., Giving Voice to the Pain of Communicatively Impaired Children, International Research Conference « Intersubjektive Konstruktion und sprachliche Kodierung von Schmerz » ; « The Intersubjective Construction and Linguistic Codification of Pain, Albert-Ludwigs-University of Freiburg, 13-15 Juillet 2006.

1.2.2.7. Equipe Acquisition du langage oral : fonctionnements et dysfonctionnements (ACQUOR) Responsables de l’équipe : Christian Hudelot et Edy Veneziano

Page 67: Laboratoire Modèles, Dynamiques, Corpus

67

L’équipe ACQUOR centre ses recherche sur le développement des la communication et du langage oral chez l’enfant. Composée de linguistes, et de psychologues elle regroupe trois opérations : 1) Acquisition du langage oral 2) Pathologie de la communication verbale et non verbale 3) Socialisation langagière 1.2.2.7.1. Acquisition du langage oral 1. Membres de l’opération Membres rattachés à titre principal (11) Christian Hudelot (responsable) Edy Veneziano (responsable) Catherine Arabia Mireille Brigaudiot Marie Carcassonne Claude Chevrie-Muller Marie Kugler-Lambert Marie Leroy Claire Martinot Christophe Parisse Clara Romero Doctorants (6) Nour Al Huda Al Awbali Naïma Benbourenane Blanca Bojaca Naziha Boukhelouf Hélène Kourouka-Mitsika Virginie Longechaud Membres associés (4) Sonia Gerolimich (Université de Trieste) Christelle Maillart (Université de Liège) Aliyah Morgenstern (ENS-LSH) Urzsula Paprocka-Piotrowska (Université catholique de Lublin) Collaborations extérieures (25) Amr Ibrahim (Université de Franche-Comté) Katsura Aoyama (Université du Texas) Tomislava Bosnjak (Université de Zagreb) Lilian Chur (Université de Munich) Eve Clark (Standford) Lélia Erbolato Melo (USP São Paulo) Ellen Herr-Israel (Rutger University) Pierre Jalenques (Université de Rouen) Jelena Kuvac (Université de Zagreb) Katrin Lindner (Université de Munich)

Page 68: Laboratoire Modèles, Dynamiques, Corpus

68

Susana Lopez Ornat (Université de Madrid) Ana Paula Machado Goyano Mac-Kay (PUC São Paulo) Sueli Cristina Marquesi (PUC São Paulo) Lorraine McCune (Rutgers University) Sonia Madrid Canovas (Madrid) Elisabeta Nicolescu (Université Spiru Haret de Bucarest) Silvia Nieva Ramos (Université de Madrid) Jacy Perissinoto (UNIFESP São Paulo) Ann Peters (Université d’Hawaii) Cecilia Rojas (UAM Mexico) Nathalie Salagnac (IUFM Gravelines) Anne Salazar Orvig (Université Paris 3) Martine Sekali (Université Paris 10) Elena Zaretsky (Université du Massachusetts, Amherst) 2. Problématique Centrées essentiellement sur l’acquisition du langage oral, les recherches de l’équipe ACQUOR couvrent les différents plans de l’organisation de la langue (de la relation phonético-phonologique à la maîtrise des genres discursifs en passant par les développements du lexique et de la morphosyntaxe). Bien que mettant en œuvre différents modèles d’analyse pour rendre compte du fonctionnement comme de l’acquisition du langage, ces recherches partagent (a) l’idée que l’on ne peut pas comprendre le développement du langage en se basant seulement sur le point d’arrivée que constituerait le système stabilisé de l’adulte, (b) la conviction que les données recueillies doivent être suffisamment abondantes et diversifiées pour produire des résultats probants, (c) que les modalité de sollicitation du langage enfantin, tant en milieu naturel que dans des situations à caractère plus expérimental constituent une variable essentielle. Ils sont convaincus enfin (d) de la nécessité de produire des outils d’analyse permettant de traiter les données recueillies en milieu naturel, en particulier dans les cas de pathologie de développement, avec une rigueur comparable à celle de la psycholinguistique de type expérimentale. Deux actions majeures structurent cette opération : 1) Développement des conduites linguistiques (de l’organisation phonologique à l’organisation textuelle) 2) Développement pragmatique et socio-cognitif, genres et apprentissages (modes d’intervention) 2.a. Actions 1) Développement des conduites linguistiques (de l’organisation phonologique à l’organisation textuelle) Les données concernant la prévalence des retards de langage chez l’enfant qui couvrent la période préscolaire, entre 3 et 6 ans, montrent que le nombre d’enfants ayant des troubles de développement du langage est assez élevé (7,4 % d’enfants d’âge préscolaire : Tomblin et al., 1997). La gravité de ces troubles est variable. Les troubles très graves, qu’on pourra appeler dysphasie de développement représentent environ 1 % de la population. L’origine de ces troubles, leur diagnostic et les techniques de rééducation les plus adaptés ne sont pas encore connus avec certitude. Les théories les plus diverses existent pour expliquer l’origine des troubles d’acquisition du langage (Bishop, 1992; Chiat, 2001; Leonard, 1998).

Page 69: Laboratoire Modèles, Dynamiques, Corpus

69

La cause première de ces troubles elle-même n’est pas connue et il a été proposé des causes aussi diverses que celles d’un déficit du traitement des sons de parole ou des sons rapides (de parole ou non), de difficultés dans la gestion de la boucle phonologique (notamment au niveau du cervelet), de problèmes de mémoire à court terme ou de mémoire à long terme, des problèmes de maturation cérébrale anormale, des difficultés de traitements syntaxiques spécifiques du langage ou non, des problèmes qui apparaissent lors de charges de traitement cognitif importantes. Cette énumération n’est pas exhaustive car elle ne tient pas compte des facteurs annexes qui, sans interdire le développement du langage, ont tendance à le perturber très fortement. Ainsi, en particulier, on trouve les problèmes de surdité, de retard mental et de fragilité du milieu social et de l’environnement. La grande hétérogénéité des théories sur les troubles du développement du langage est un révélateur des grandes interrogations théoriques (et pratiques) qui subsistent dans ce domaine. Tant qu’il n’existera pas une théorie reconnue par la grande majorité des chercheurs du domaine, on continuera d’avoir une telle variété de propositions théoriques. Même si, comme on peut le penser, il y a plus d’une origine possible dans les troubles du langage, on a montré qu’un seul type de ces troubles est rarement suffisant (Bishop, Carlyon, Deeks, & Bishop, 1999) pour interdire tout langage, à moins qu’il soit extrême. Même dans ce cas, on est la plupart du temps confronté à d’autres déficits connexes. Il faut donc mieux étudier l’articulation mutuelle des différentes composantes du langage. Il semble ainsi essentiel de travailler davantage sur la théorie de l’acquisition du langage et de ses troubles. Cette action s’est structurée autour de 4 axes : 1a) Phonologie et morphosyntaxe dans les dysphasies 1b) L’accès au lexique dans la dénomination d’images chez le sujet normal et pathologique 1c) Acquisition et reformulation 1d) L’enfant et l’image en milieu institutionnel 1a) Phonologie et morphosyntaxe dans les dysphasies L’interface entre phonologie et morphosyntaxe a été étudiée grâce aux types d’erreurs produites par les enfants dans des corpus de langage spontané. Pour tous ces corpus, un travail de phonologie a permis de décrire toutes les productions attendues des enfants dysphasiques ou contrôles. Puis on peut automatiquement comparer les performances des enfants avec et sans troubles, en phonologie comme en syntaxe. Les résultats obtenus montrent l’importance du facteur complexité en phonologie, à l’exclusion de presque tout autre facteur (Maillart et Parisse, 2006 ; Parisse et Maillart, 2005, 2007). Pour confirmer l’existence de stades progressifs allant du particulier vers le général, une expérience a mené en utilisant une tâche de répétition. Les enfants devaient reproduire à l’identique des énoncés contenant des erreurs grammaticales. On a pu constaté que les enfants dysphasiques avaient beaucoup plus de mal que les enfants contrôles à s’empêcher de redresser les énoncés erronés. Les résultats s’interprètent comme un indice que les connaissances des enfants dysphasiques et des enfants les plus jeunes sont figées. Ils n’ont pas encore assimilé les règles syntaxiques de leur langue. Ces résultats sont confirmés par le travail réalisé sur d’autres corpus d’enfants français, où on voit que l’utilisation des pronoms par les jeunes enfants n’est pas réalisée comme une règle syntaxique, mais traduit la présence d’automatismes de type lexical (Parisse, 2007). Cette épreuve peut représenter par sa sensibilité une manière efficace de diagnostiquer les troubles du langage (Parisse et Maillart, 2007).

Page 70: Laboratoire Modèles, Dynamiques, Corpus

70

Les travaux les plus récents (2007) visent à vérifier la spécificité des troubles de langage chez les enfants dysphasiques. De nombreux travaux envisagent une origine non linguistique des troubles du langage. Les propositions varient et les principaux candidats sont la vitesse de traitement, la perception catégorielle, une limitation de la complexité de traitement, la mémoire à court terme, la mémoire procédurale. Toutes ces propositions impliquent des mécanismes qui ne sont pas spécifiques du langage. L’intérêt de ces propositions, en dehors de leur nouveauté, est qu’elles donnent des indications sur des mécanismes neuronaux à étudier, ce que ne font pas les propositions spécifiquement linguistiques (comme par exemple la syntaxe). Ceci permet alors d’envisager des études neurologiques pour expliquer les causes physiologiques des troubles. Cet axe de recherche a été soutenu par deux mémoires d’orthophonie (mémoire de travail et mémoire procédurale). 1b) L’accès au lexique dans la dénomination d’images chez le sujet normal et pathologique La création d’une banque de données internationale pour l’étude de la dénomination d’images (PEDOI - cf. Kremin et al., 2003 ; Sirois, Kremin & Cohen, 2006) permet d’étudier les divers facteurs psycholinguistiques intervenant dans l’accès au lexique chez le sujet francophone. En fait, la difficulté de trouver le mot adéquat est une perturbation linguistique qui apparaît dans de nombreuses pathologies. Les facteurs susceptibles d’intervenir dans cette activité sont non seulement la fréquence des mots mais également l’âge moyen de leur acquisition et le degré de consensus en dénomination de même que de nombreuses autres variables psycholinguistiques (complexité visuelle, familiarité, « imageability » et longueur du mot cible; typicalité visuelle, typicalité sémantique et appartenance catégorielle des stimuli). Nous avons donc étudié le poids relatif de ces variables. Les analyses statistiques confirment que l’âge moyen d’acquisition constitue une variable cruciale dont la prédictivité est prédominante et constante. Par contre, l’effet du consensus semble être influencé par la présence/absence d’autres variables psycholinguistiques, la fréquence des mots jouant un rôle mineur. 1c) Acquisition et reformulation Le projet « Acquisition et Reformulation » concerne les acquisitions tardives dans différentes langues maternelles. Il a pour objectif d’établir des critères reproductibles permettant de distinguer différents stades acquisitionnels entre 4 et 10 ans. L’établissement de ces critères s’appuie sur un protocole expérimental commun qui avait déjà fait l’objet de deux mises à l’épreuve (travaux publiés en 2000 et 2003). L’analyse linguistique des données se fait dans un cadre transformationnel non générativiste (Harris, 1976, 1988 ; Gross 1975) qui s’articule à une théorie de l’acquisition fondée sur les procédures reformulatoires mises en œuvre par les enfants informateurs. Les données orales sont recueillies auprès de 15 sujets par tranche d’âge (4, 6, 8 et 10 ans). Les résultats obtenus ont permis de valider l’outil descriptif, l’analyse des reformulations, appliqué aux procès ou à la catégorie verbale en général, ainsi qu’aux noms locatifs et temporels, du point de vue notionnel et syntaxique mais ils ont également révélé que l’analyse des phénomènes d’acquisition doit porter sur des séquences prédicatives complètes et non sur des catégories isolées, qui ne peuvent en aucun cas, rendre compte de ce qui est essentiel dans l’acquisition de la langue, à savoir apprendre à construire le sens, autrement dit apprendre à construire des prédications simples, puis liées et enfin complexes. C’est cet aspect qui est maintenant l’objectif de notre recherche pour 2008-2011. 1d) L’enfant et l’image en milieu institutionnel

Page 71: Laboratoire Modèles, Dynamiques, Corpus

71

Cette action est en cours de clôture et comprend deux volets. Le premier constitue une extension d’une recherche conduite à la demande du Conseil général de Sine Saint-Denis par sur l’impact de l’image en crèche. 25 groupes de 4 enfants chacun ont été respectivement placés dans trois situation de réception différentes d’une même histoire diffusée sur un écran de vidéo, lue avec un livre ou en s’accompagnant de diapositives. L’analyse des conduites verbales et non verbales montrent que les enfants sont plus attentifs et moins dissipés dans la situation de lecture que de diffusion sur le petit écran. Une phase de restitution de l’expérience vécue par chaque groupe avec sa référente habituelle est en cours. Les premiers résultats montrent d’une part une grande diversité dans les modes de sollicitation des référentes et d’autre part une forte différence entre une restitution avec ou sans la présence du livre illustré. Le second la poursuite d’une étude entreprise par C. Hudelot et Denise Josse sur les interactions adulte enfants en crèche et en maternelle. Le projet visait à rendre compte des capacités communicatives mise ne œuvre par le jeune enfant deux contextes institutionnels contrastés, celui de l’école maternelle et celui du jardin d’enfant. Les analyses montrent que le type de tâche demandées (parler d’un poster que les enfants découvrent en même temps que l’adulte) l’asymétrie de la relation adulte enfants de 2 ;6 - 3 ans l’emportent dans le mode d’interlocution et de circulation des thèmes, maîtresses de maternelle et puéricultrices se distinguent sur la façon de gérer le groupe comme tel (maternel) ou de s’adresser plutôt aux individus enfants (crèches) 2) Développement pragmatique et socio-cognitif, genres et apprentissages (modes d’intervention) L’idée que l’acquisition du langage ne se limite pas à celle de son lexique et de ses structures phonologiques et/ ou grammaticale est aujourd’hui d. L’utilisation du langage dans des cotextes variés constituent un domaine de connaissances langagières à part entière et se doivent d’être pris en compte. C’est à l’intérieur de contextes discursifs particuliers que les mots et les structures prennent effectivement leur sens d’où il découle que les interlocuteurs recourent à des procédures spécifiques pour interpréter les paroles d’autrui au regard de l’a situation d’énonciation. Une des règles tacite est l’utilisation du langage de manière informative (dérivable de la maxime de quantité de Grice) : la mise en langage est censées apporter quelque chose à l’interlocuteur, que ce soit de l’information qu’il n’a pas dans son répertoire, que ce soit le point de vue du locuteur sur des connaissances que l’interlocuteur possède déjà, ou encore qu’il s’agisse de faire connaître les centres d’attention du locuteur, etc. Par ces utilisations de type ‘informatif’, l’interlocuteur devient attentif à quelque chose dont il est peut probable qu’il l’était avant (Lyons, 1977 : 33). Pour ce faire, le langage doit être utilisé de manière décontextualisée (le « displacement » de Hockett, 1958), ce qui permet d’évoquer le passé et de faire des récits, de parler du futur, d’événements absents ou imaginaires, de manifester des relations non directement observables, mais aussi d’exprimer un point de vue, que ce soit en terme évaluatifs ou argumentatifs, ou par la mise en relation entre événements ou de relations hypothétiques. Alors même que cette décontextualisation est la manière dont le langage est le plus souvent utilisé par le locuteur compétent, ça n’est pas la celle par laquelle débute l’enfant qui commence à parler. Cet axe de recherche a pour but d’étudier l’émergence et le développement de la capacité à utiliser le langage de manière décontextualisé en se centrant sur deux conduites centrales : les conduites narratives et les conduites explicatives/justificatives qui peuvent, en tant que « genre »discursifs », être mis l’un au service de l’autre et vice-versa. Leur caractère central

Page 72: Laboratoire Modèles, Dynamiques, Corpus

72

tient au fait que ce sont à la fois des conduites qui font partie intégrantes de conversations quotidien les plus banales, et en même temps qu’elles peuvent s’élever vers des conduites hautement savantes (la littérature et le raisonnement scientifique), d’où la place qu’on leur réserve dans les curricula scolaires. Mais l’intérêt d’étudier ces conduites ne se limite pas à cela. Concrètement, ce type d’études sur le développement ultérieur permet de cerner le long chemin développemental qui amène l’enfant de la maîtrise de savoirs faire communicatifs adaptés aux besoins d’un interlocuteur familier vers la capacité à produire des narrations dont les états internes des personnages constituent le sujet central. A la suite d’une action du programme cognitique école et sciences cognitives intitulée « Pragmatique et apprentissage de la langue maternelle à l’école élémentaire : Evaluation et remédiation des capacités orales chez l’enfant normal et dysphasique » (coordonné par Virginie Laval du LMDC de Poitiers – UMR 6215), un ensemble de recherches ont été conduites sur les capacités narratives chez des enfants à développement typique et chez des enfants présentant des troubles dysphasiques. Les études conduites par le groupe portent originellement sur deux récits distincts produits par une population de 80 enfants à développement typiques de 4 à 11 ans répartis également entre filles et garçon, et 40 enfants dysphasiques de 6 à 11 ans diagnostiqués comme présentant une dysphasie de type « phonologique-syntaxique ». Des travaux d’étudiants ont, depuis, permis d’enrichir ce premier corpus. La narration comme l’explication présentent cette particularité d’être à la fois des conduites langagières banales de la conversation quotidienne mais également des conduites des plus élaborées (dans le discours scientifique, comme dans la littérature). En outre, narration et explication ne sont pas nécessairement des conduites disjointes dans la mesure où la présence de mouvements explicatifs participe, au travers de ce qu’un auteur comme Labov a identifié sur le terme d’évaluation, à la complexification de la trame narrative. Les travaux produits dans le cadre de ce volet portent essentiellement sur le développement conjoint de cette composante dans une tâche de narration produite à partir d’une bande dessinée sans parole. Dans cette situation les enfants doivent interpréter les intentions du dessinateur et transformer une succession d’images en un récit conforme à un ensemble complexe de conventions socio culturelles. On sait que raconter une histoire à partir d’un support iconique suppose des capacités (mémorielles, cognitives, linguistiques, socio-pragamatiques, etc.) différentes de celles qui sont nécessaires à la relations d’une expérience personnelle. En outre, si l’enfant parvient dès 3-4 ans à raconter un récit présentant une trame narrative constituée d’événements successifs, les chercheurs du domaine s’accordent en général sur le fait que ce n’est guère qu’à partir de 8-9 ans que les enfants recourent aux états mentaux des personnages pour rendre compte des comportements ou des événements. On sait toutefois que les productions des enfants sont néanmoins sensibles aux mode de sollicitation des récits. Nos analyses ont alors porté sur les objets suivants. a) Emergence et développement des conduites narratives et explicatives et leur lien avec les débuts de la « théorie de l’esprit ». b) Développement ultérieur des conduites narratives et explicatives chez des enfants « normaux et dysphasiques et adaptation à l’interlocuteur : recueil en situation expérimentale c) Processus d’acquisition et méthodes d’intervention dans l’apprentissage des conduites narratives et explicatives ? d) Conduites narratives et explicatives à différents niveaux de « savoir » et relation avec le développement des « théories de l’esprit »

Page 73: Laboratoire Modèles, Dynamiques, Corpus

73

e) Conduites justificatives/explicatives et « théorie de l’esprit’ » chez des enfants autistes « de haut niveau ». De façon similaire à ce que l’on trouve dans d’autres études, nous trouvons que les états internes sont mentionnés rarement par les enfants avant 10 ans. Ainsi, le contenu de l’histoire de la pierre ne sollicite pas davantage de mentions d’états internes que ne le font d’autres histoires n’impliquant pas un malentendu. Toutefois, lorsqu’ils sont exposés à un étayage non intrusif qui attire leur les causes des évènements, on note qu’à partir de l’âge de 6-7 ans, les enfants accroissent considérablement leurs références à des états internes, y compris des états épistémiques, et, à partir de 8 ans, ils expriment verbalement les fausses croyances des personnages et trouvent les ressources langagières pour en exposer la rectification. Les enfants dysphasiques sont capables de produire des récits descriptifs mais seule une petite partie d’entre eux peuvent relier des évènements par des relations causales. Nos travaux montrent que sur un plan quantitatif, les enfants dysphasiques attribuent des états internes aux personnages de façon similaire aux enfants à développement typique lors de leur récit initial. Néanmoins, contrairement aux enfants à développement typique de même âge, ils ne présentent pas d’accroissement significatif après étayage, et leurs performances peuvent même diminuer. Les différences les plus marquées avec les enfants à développement typique concernent la fausse croyance et la réparation de la fausse croyance après étayage : les enfants à développement typique en accroissent considérablement l’expression alors que les enfants dysphasiques la diminueraient plutôt. Les effets immédiats de l’étayage sur les enfants à développement typique de 6-7 ans et plus mettent en question l’idée que les enfants qui n’expriment pas d’états internes ou ne les utilisent pas pour exprimer les évènements lors de leurs récits seraient incapables de le faire. Lorsqu’on attire leur attention sur les raisons des évènements qu’ils mentionnent dans leurs propres récits initiaux, la plupart des enfants à développement typique, peuvent, à partir de 6 ans, non seulement accroître leurs explications, mais également l’expression des états internes comme raison des évènements. A partir de 8 ans, ils expriment clairement la fausse croyance des caractères et sa rectification. Confrontés à la même procédure, les enfants dysphasiques ne bénéficient que faiblement de la procédure, quand ils ne régressent pas. En revanche, contrairement à ce qui se passe d’ordinaire dans le cas de l’identification des actant, par exemple, le statut de l’interlocuteur n’a que peu d’effet sur l’expression des relations explicatives. Lorsque l’on compare les récits d’enfants à développement typique entre 6 et 10 ans, on constate qu’effectivement les enfants recourent plus souvent à des constructions complexes pour identifier les personnages avec un interlocuteur naïf qu’avec l’interlocuteur avec qui il a discuté de l’histoire, mais le fait que les enfants fassent référence à la fausse croyance ou à sa résolution ne semblent pas lié à un éventuel savoir partagé avec l’interlocuteur. Les résultats s’accordent avec un modèle développemental de compétences. Surtout, les résultats montrent également L’efficacité de la procédure utilisée laquelle s’accorde avec la conception d’une zone proximale de développement qui permettrait à l’enfant de faire émerger des compétences quand on le lui suggère, pourvu qu’il ait effectivement des compétences à faire émerger. La nécessité d’évaluer les compétences des enfants de façon variées avant de tirer des conclusions sur leurs capacités effectives.

Page 74: Laboratoire Modèles, Dynamiques, Corpus

74

2.b. Groupe de travail De 2004 à 2006, l’ensemble des composantes de ACQUOR et ALMA s’est réuni dans un séminaire mensuel commun pour lequel chaque sous-équipe avait en charge la présentation de ses travaux. Dans le cadre du fonctionnement qui était celui du LEAPLE, chaque action a donné par ailleurs lieu à des réunions de groupes de travail spécifiques se réunissant régulièrement. Certaines actions ont donné lieu en particulier à des séances de travail faisant intervenir des collaborateurs étrangers, ce qui est le cas surtout pour la recherche portant sur les reformulations, celle centrée sur le développement pragmatique (collaboration avec le Brésil) et sur la dysphasie (collaboration avec la Belgique). 2.c. Journées d’étude, colloques, ateliers

2006. C. Martinot. Journées d’étude internationale Méthodologie dans les recherches sur les acquisitions tardives en langue maternelle. Paris, 3 et 4 juillet.

2006. C. Hudelot et E. Veneziano ont participé à la co-organisation par les laboratoires Théodile et MoDyCo de la journée d’études Evaluer des compétences narratives : Pourquoi ? Comment ? Paris, 11 septembre.

2006. C. Hudelot a participé à la co-organisation du Colloque International Interaction et pensée : perspectives dialogiques, Lausanne, 12-14 octobre.

2.d. Contrats 1) Accord CNRS / FNRS-CGRI 2007-09-17 Titre du projet n° 20185 « Troubles de développement du langage : les épreuves de répétition comme outils de recherche et de diagnostic ». Une partie du projet a été menée en collaboration avec une équipe de linguistes, orthophonistes et psychologues brésiliens dans le cadre du programme CAPES/COFECUB n° 452/04 : Développement des compétences pragmatiques chez l’enfant : enjeux cognitifs et interactionnels. 2) ANR Emergram. Responsable Edy Veneziano. 3. Thèses en cours (6)

1. Nour Al Huda Al Awbali. Directrice C. Martinot. 2. Naïma Benbourenane. Directeur C. Hudelot. 3. Blanca Bojaca. Directeur C. Hudelot. 4. Naziha Boukhelouf. Directrice C. Martinot. 5. Hélène Kourouka-Mitsika. Directrice C. Martinot. 6. Virginie Longechaud. Directeur C. Hudelot.

5. Production scientifique halshs-00133384, Bernicot J., Salazar-Orvig A., Veneziano E., 2006, Les reprises: dialogue,

formes, fonctions et ontogenèse, La Linguistique, 42, 2, 29-50

Page 75: Laboratoire Modèles, Dynamiques, Corpus

75

halshs-00121070, Carcassonne M., Servel L., 2006, Discours au travail : perspectives dialogiques, Carnets des Ateliers de Sociolinguistique, 1.

halshs-00121075, Carcassonne M., Froment M., Salagnac N., 2006, Restituer à l’oral les explications d’un conte moral en grande section de maternelle, Actes du colloque international "Interaction et pensée: perspectives dialogiques".

halshs-00162259, Chevrie-Muller C., 2007, Troubles spécifiques du développement du langage (TSDL) - " Dysphasies de développement", Chevrie-Muller C., Narbona J. (éds.), Le Langage de l’Enfant - Aspects normaux et pathologiques. (3ème édition révisée et augmentée), Elsevier Masson SAS, 361-419.

halshs-00162244, Chevrie-Muller C., Watier L., Dellatolas G., 2006, Difficultés de langage et de comportement à 3 ans et demi et retard en lecture au cours élémentaire, Revue d’épidémiologie et de santé publique, 54, 4, 327-339.

halshs-00162224, Chevrie-Muller C., Watier L., Arabia J., Arabia C., Dellatolas G., 2005, Repérage par les enseignants des difficultés de langage et de comportement chez 2059 enfants de 3 ans et demi, Revue d’épidémiologie et de santé publique, 53, 6, 645-657.

halshs-00126501, Martinot C., 2005, Comment parlent les enfants de 6 ans ? Pour une linguistique de l’acquisition, Presses Universitaires Franc-Comtoises.

halshs-00127013, Martinot C., 2005, Procédures d’appropriation de la langue chez des enfants de 10-12 ans en français langue étrangère et français langue maternelle, Acquisition et Interaction en Langue Etrangère, 23, 95-136

halshs-00126231, Martinot C., 2005, Qu’est-ce-que la Reformulation ? Nécessité d’une redéfinition, Roczniki Humanistyczne, LIII, 5, 5-13.

halshs-00128850, Martinot C., Ibrahim A. H., 2004, Les reformulations matricielles lacunaires des enfants, Travaux de Linguistique, 48, 21-40.

halshs-00127014, Martinot C., 2004, Comment les procédures de reformulation organisent-elles les textes ?, Sylvie Porhiel & Dominique Klingler (éds.), L’unité texte, 215-230.

halshs-00117355, Morgenstern A., Leroy M., 2005, Reduplication before two years old, Bernhard Hurch (éd.), Studies on Reduplication, Mouton de Gruyter, 478-494.

halshs-00167208, Parisse C., 2007, Left-dislocated subjects : A construction typical of young French-speaking children?, Guijarro-Fuentes, P., Larrañaga, P. and Clibbens, J. (éds.), First Language Acquisition of Morphology and Syntax : Perspectives across Languages and Learners, John Benjamins.

halshs-00167232, Parisse C., Maillart C., 2007, Phonology and syntax in French children with SLI : a longitudinal study, Clinical linguistics and Phonetics (sous presse).

halshs-00167230, Parisse C., Maillart C., 2007, The interplay between phonology and syntax in French-speaking children with specific language impairment, International journal of language and Communication Disorders. (sous presse).

halshs-00093744, Parisse C., 2006, Bilan morphosyntaxique, F. Estienne et B. Piérart (éds.), Les bilans de langage et de voix - fondements théoriques et diagnostiques, Masson, 66-87.

halshs-00091927, Parisse C., Maillart C., 2005, Interférences entre phonologie et syntaxe en pathologie développementale du langage, Le Langage et l’Homme, XXXX, 2, 127-147.

halshs-00090997, Parisse C., 2005, New perspectives on language development and the innateness of grammatical knowledge, Language Sciences, 27, 383-401.

halshs-00166172, Romero C., à paraître, Pour une définition générale de l’intensité dans le langage, Pascale Hadermann, Michel Pierrard, Dan Van Raemdonck (éds.), La scalarité : autant de moyens d’expressions, autant d’effets de sens.

halshs-00131545, Romero C., 2005, Les adjectifs intensifs, Jacques François (éd.), L’adjectif en français et à travers les langues, Presses Universitaires de Caen, 449-462.

Page 76: Laboratoire Modèles, Dynamiques, Corpus

76

halshs-00131533, Romero C., 2004, Plus ou moins ?! L’atténuation et l’intensification dans les langues romanes, Maria Helena Araújo Carreira (éd.), Nouvelles remarques sur l’hyperbole, 24, 265-282.

halshs-00131531, Romero C., 2004, Intensité, comparaison, degré, Florence Lefeuvre et Michèle Noailly (éds.), Intensité, valeur de vérité et univers de croyance, 1, 17, 309-322.

halshs-00134562, Veneziano E., 2007, L’émergence des explications de type "pourquoi" dans l’interaction naturelle mère-enfant avec attention particulière aux situations conflictuelles : méthodes d’analyse et un modèle d’acquisition, C. Hudelot, A. Salazar-Orvig & E. Veneziano (éd.), L’explication : enjeux cognitifs et communicationnels, Peeters Editions

halshs-00160787, Veneziano E., 2007, Le langage dans le jeu de fiction: une manière d’évaluer la théorie implicite de l’esprit chez le jeune enfant ?, TRANEL (sous presse.)

halshs-00134560, Veneziano E., Albert L., Martin S., 2007, Learning to tell a story of false belief : A study of French-speaking children, J. Guo, E. Lieven, S. Ervin-Tripp, N. Budwig S. Özçaliskan, & K Nakamura (éds.), Crosslinguistic approaches to the psychology of language : Research in the tradition of Dan Isaac Slobin, Mahwah, NJ : Erlbaum.

halshs-00134693, Veneziano E., Hudelot C., 2006, Etats internes, fausse croyance et explications dans les récits: Effets de l’étayage chez les enfants de 4 à 12 ans, Langage et l’Homme, 41, 2, 119-140.

halshs-00130611, Veneziano E., 2005, Effects of conversational functioning on early language acquisition : When both caregivers and children matter, B. Bokus (éd.), Studies in the psychology of child language. Essays in honor of Grace Wales Shugar, Warsaw : Matrix, 47-69.

halshs-00133389, Veneziano E., 2005, Langage dans le jeu de faire semblant: Une manière d’évaluer la théorie implicite de l’esprit chez l’enfant ?, Langage et Pratiques, 35, 5-15.

halshs-00134418, Veneziano E., 2005, Vers l’attention conjointe dans "l’ailleurs" et la prise en compte du mental d’autrui : une convergence de développements cognitifs, sociaux et langagiers, Scolariser la petite enfance ? Actes du 2e colloque "Constructivisme et Education", I, 303-318.

halshs-00130511, Veneziano E., 2004, The emergence of expressive options in early child language : a constructivist account, D. Ravid & H. Bat-Zeev Shyldkrot (éds.), Perspectives on language and language development : Essays in honor of Ruth A. Berman, Springer, Dordrecht, 203-218.

halshs-00133398, Veneziano E., Plumet M.-H., Cupello S., Tardif C., 2004, Pragmatic functioning in natural setting and the emergence of “theory-of-mind” in autistic and control children. A comparative study, Psychology of Language and Communication, 8, 1, 25-42.

1.2.2.7.2. Pathologie de la communication verbale et non verbale 1. Membres de l’opération Membres rattachés à titre principal (3) Laurent Danon-Boileau (responsable) Jean-Marie Vidal (responsable) Marie Leroy Doctorants (3) Carine Leibovici

Page 77: Laboratoire Modèles, Dynamiques, Corpus

77

Caroline Masson Florence Rouger Collaborateurs extérieurs (17) Jean-Louis Adrien (Université Paris 5) Catherine Barthélémy (INSERM) Marie-Michèle Bourrat (pédo-psychiatre, Limoges) Marie-Françoise Bresson (orthophoniste, Paris) Dorota Chadzynski (psychomotricienne, Centre de l’Evolution, Paris) Gisèle Danon (INSERM) Philippe Dardenne (Centre Hospitalier Guillaume Régnier, Université de Rennes 1) Gilles Dupont (Centre Médico Psychologique pour Enfant & Adolescents - Centre Hospitalier de Lannion) Maya Gratier (Université Paris 10) Paul Guillemot (Centre Hospitalier Guillaume Régnier, Université de Rennes 1) Anne Lainé (orthophoniste, Centre de Guidance Infanto-Juvénile Toulouse) Eric Lemonnier (Centre Ressource Autisme - Centre Hospitalier Universitaire, Brest) Mary-Annick Morel (Université de Paris 3) Anne Philippe (INSERM U781 et Département de Génétique, Hôpital Necker-Enfants Malades, Assistance Publique-Hôpitaux de Paris) Gérard Portier (Institut Médico-Psychologique, Saint-Brieuc) Sylvie Robel (orthophoniste, Paris) Colwyn Trevarthen (Université d’Edimbourg) 2. Problématique Deux thèmes structurent cette opération 1) Pragmatique des échanges avec des enfants dysphasiques ou autistes 2) Sémiologie des expressions autistiques : « appropriation » de la dimension symbolique par l’intermédiaire de « jeux de tiercéité » 2.a. Actions 1) Pragmatique des échanges avec des enfants dysphasiques ou autistes Deux axes sont rassemblés sous ce thème : pathologies de type autistique, dysphasie. Outre leurs options sémiologiques, les chercheurs de cette équipe partagent un certain nombre d’approches méthodologiques et théoriques : (i) D’un point de vue méthodologique - le recueil de données est établi dans un cadre d’observations cliniques participantes éventuellement enregistrées sur support vidéo ; - la perspective de travail et d’analyse procède par l’établissement de monographies (études de cas suivis au long cours). Ce qui n’exclut pas dans certains domaines privilégiés la réalisation d’études statistiques. (ii) D’un point de vue théorique, cette approche de type clinique dynamique s’appuie sur l’évolution observée chez les patients et ses limites pour tenter de dégager : - ce qui constitue le noyau spécifique et commun de leur pathologie ; - la détermination de sous-types au sein d’une pathologie large (sous catégorisation des enfants présentant notamment certains traits de la pathologie autistique) ; - leurs singularités et leur écart au type ;

Page 78: Laboratoire Modèles, Dynamiques, Corpus

78

- leur marge d’évolution possible et les signes pronostics de cette évolution. Il s’agit alors d’analyser la communication et le langage de différentes populations pathologiques (enfants dysphasiques ou autistes en interaction avec des soignants ou leurs parents). On tient compte des productions et des comportements de l’enfant mais aussi de ceux de l’adulte. La recherche procède par comparaison entre documents présentant des similarités au niveau du cadre, de la situation ou des participants. Les documents sont de deux ordres : - documents portant sur des situations peu standardisées: enregistrements familiaux, enregistrements d’entretiens thérapeutiques, enregistrements effectués en crèche. - documents portant sur des situations standardisés enregistrées en centre de Protection Maternelle et Infantile dans le cadre d’un test de suivi du regard. Un intérêt particulier est accordé aux commentaires intuitifs formulés par les soignants, les parents et les différents intervenants au contact des populations prises en compte. Le travail de l’équipe consiste ensuite à tenter de rapporter les considérations intuitives des différents intervenants à des signes objectivables. Il semble en effet que le contact quotidien avec une population pathologique dote les différents intervenants d’un savoir naïf que les études quantitatives, pratiquées par des chercheurs qui n’ont souvent que des contacts épisodiques avec les patients, ont du mal à acquérir. 2) Sémiologie des expressions autistiques : « appropriation » de la dimension symbolique par l’intermédiaire de « jeux de tiercéité » Notre analyse sémiologique des expressions verbales et gestuelles de personnes autistes (délibérément démarquée de quelque inférence étiologique) nous amène à caractériser leur pathologie comme « trouble envahissant de la dimension symbolique » et plus précisément comme trouble de la tiercéité en tant que celle-ci structure les représentations et les conduites (également symboliques) que les humains non autistes élaborent des Personnes, des Objets et des Signes. Cette même analyse s’étaye de la « Technique du jeu avec les Personnes » que nous avons mise au point et qui consiste à offrir aux patients autistes que nous rencontrons de s’approprier la décision d’inclure ou d’exclure une tierce personne dans des échanges préalablement établis en rencontres duelles. Technique dont nous évaluons les bénéfices et les limites avec le Groupe de cliniciens du CHGR de Rennes. 2.b. Groupe de travail Le Groupe de Recherche Sémiologiques se réunit 10 fois 3 heures par année (une fois par mois) autour de l’analyse des suivis des patients suivis – l’évaluation de leur progrès et de leurs points de butée. 2.c. Journées d’étude, colloques, ateliers Journée Autisme et Tiercéité, Fondation Bon Sauveur Bégard, 22 sept. 2006, Lannion. 2.d. Contrats Contrat de Collaboration de Recherche : Centre Hospitalier G. Régnier - CNRS Délégation Ile de France Est - Universités Rennes I & Paris V - (renouvelé chaque année sur rapports d’activités).

Page 79: Laboratoire Modèles, Dynamiques, Corpus

79

3. Thèses en cours (3)

1. Carine Leibovici. Directeur L .Danon-Boileau. 2. Caroline Masson. Directeur L .Danon-Boileau. 3. Florence Rouger. Directeur L .Danon-Boileau.

4. Thèses soutenues (2)

1. Véronique Boiron. Directeur L .Danon-Boileau. 2. Anne Lainé. Directeur L .Danon-Boileau. 3. Véronique Huau. Etude clinique et informatisée du langage et de la gestualité d’un

sujet psychotique avec traits autistiques. Directeurs J.-.M. Vidal et A. Lazartigues (Université de Brest), soutenue le 15 février 2006.

5. Production scientifique hal-00172049, Danon-Boileau L., 2007, De l’agir à la créativité, Revue Française de

Psychanalyse, LXXI-1, 233-247 . hal-00172051, Danon-Boileau L., 2007, Le sujet de l’énonciation, 2e édition augmentée,

Ophrys . hal-00172048, Danon-Boileau L., 2007 , Le récit de rêve en séance comme processus de

subjectivation de l’affect, B. Chervet, C. Jean-Strochlic (éds.), Le rêve et la séance, Presses Universitaires de France.

hal-00172045, Danon-Boileau L., Bourrat M., Leibovici C., Leroy M., Masson C., Morel M.-A., Rouger F., 2007, Early signs related to posture and communication – the child’s attitude, and the mother’s reaction, Danon-Boileau L. et al (éds.), Anglais Signs of Autism in Children and Adolescents, London: Karnac Books S. Acquarone.

hal-00172044, Danon-Boileau L., St. Clair C., Trevarthen C., 2007, Signs of autism in infancy : sensitivity for rhythms of expressions in communication, Danon-Boileau L. et al (éds.), Signs of Autism in Children and Adolescents, London: Karnac Books S. Acquarone

hal-00172043, Danon-Boileau L., 2006, L’intégrer ?, Scolariser pour intégrer. Le français Aujourd’hui, 152.

hal-00172042, Danon-Boileau L., Morgenstern A., Picchi V., 2006, Paul , un enfant difficile ou les cas difficiles existent-ils ?, Danon-Boileau L. et al. (éds.), Les cas difficiles. Cahiers du Centre Alfred Binet.

hal-00172047, Danon-Boileau L., 2006, C’est de mon nombril que je parle : à propos du transgénérationnel, M. Soulé (éd.), La vie de l’enfant, Erès, 137-143.

hal-00172046, Danon-Boileau L., 2006, La forme grammaticale des énoncés en analyse, révélateur de leur valeur psychique, R. Perron (éd.), Psychanalystes, qui êtes-vous ?, Dunod.

halshs-00125180, Leroy M., Danon-Boileau L., Morel M.-A., Philippe A., 2005, Symptômes précoces : la part du linguistique, Bernard Golse et Pierre Delion (éds.), Autisme : état des lieux et horizons, Erès, 175-181 .

halshs-00125210, Vidal J.-M., 2005, Modes d’investissements d’enfants autistes - approche sémiologique, M. Gayda (éd.), Les jeunes handicapés autistes - Vie affective et sexuelle, L’Harmattan, 33-43.

Page 80: Laboratoire Modèles, Dynamiques, Corpus

80

halshs-00125267, Vidal J.-M., 2005, De dérives scientifiques en dérives médiatiques !, à propos de "l’anomalie cérébrale qui empêcherait les autistes d’identifier la voix humaine", Le Carnet Psy, 97, 26-27.

halshs-00125230, Vidal J.-M., Tordjman S., 2005, Neurologie et psychopathologie de l’autisme - l’illusion étiologique, Neurological and psychopathological approaches of autism - the etiological delusion, Psychologie Clinique, 20, 143-156.

halshs-00125681, Vidal J.-M., 2004, Autisme : le sens des relations, Sciences humaines, Hors série 4, 27.

halshs-00125260, Vidal J.-M., 2004, Les relations triadiques : un support à la prise en charge de patients avec autisme, L’adulte avec autisme, 93-109.

halshs-00125244, Vidal J.-M., Lemonnier E., 2004, Appropriation of interpersonal triadic relationships by autistic children, International Journal of Psychology, 39, 395.

1.2.2.7.3. Socialisation langagière 1. Membres de l’opération Membres rattachés à tire principal (8) Mireille Froment (responsable) Christiane Préneron (responsable) Mireille Brigaudiot Marie Carcassonne Marie Kugler-Lambert Nathalie Lewi-Dumont Christophe Parisse Marité Vasseur Doctorant (1) Rosa Duarte Membres associés (2) Amina Bensalah-Poulain (orthophoniste) Aliyah Morgenstern (ENS-LSH) Collaborateurs extérieurs (17) Margaret Bento (Université Paris 5) Marica Bergès-Bounes (UPPEA : Unité de Psychopathologie de l’enfant et de l’adolescent de l’hôpital Sainte-Anne à Paris) Corinne Bernardeau (UPPEA) Alessandra del Re (Sao Paulo) Marie-Claude Devaux (UPPEA) Silvia Dinucci (Sao Paulo) Catherine Ferron (UPPEA) Rouba Hassan (Lille 3) Jocelyne Leber-Marin (Professeur des écoles) Gérard Lebugle (UPPEA) Evelyne Lenoble (UPPEA) Fatima Maya-Blot (Formatrice) Luce Monnier (UPPEA)

Page 81: Laboratoire Modèles, Dynamiques, Corpus

81

Junko Nishimura (Tokyo) Anne-Marie Pecarelo (UPPEA) Anne-Marie Picard (Université Américaine de Paris) Nathalie Salagnac (IUFM de Gravelines) 2. Problématique Cette équipe a pour objectif d’interroger les formes prises par les façons d’interagir dans la socialisation du jeune enfant. Il s’agissait à la fois de procéder à une analyse de corpus naturalistes et d’en forger les outils d’analyse. Considérant que la socialisation constitue un mode d’entrée dans une culture donnée, les recherches menées concernent des milieux francophones de classe moyenne dans des contextes variés : familiaux, scolaires, enfants tout venant, enfants présentant des troubles d’apprentissage. Trois axes ont plus spécifiquement travaillés : 1) Interactions familiales et socialisation 2) Interactions scolaires et socialisation 3) Subjectivité langagière, continuité discursive et troubles d’apprentissage : échecs en lecture versus échecs en mathématiques Dans les deux premiers axes où les données recueillies sont de type naturaliste, l’interaction (enfants/parents, enfants/maîtres) constitue l’observable essentiel et la question de la socialisation de l’enfant est ainsi indissociable de celle d’interaction langagière. Les analyses nous ont conduites par ailleurs à associer les notions d’interaction et de style et à faire émerger la notion de stylistique interactive qui apparaît comme déterminante pour rendre compte d’une socialisation langagière. 2.a. Actions 1) Interactions familiales et socialisation 1a) Individuation et socialisation langagière. Développement chez le jeune enfant de 18 mois à 5 ans en famille Portée par une approche socio-interactionniste de la socialisation telle qu’elle se constitue au cours des échanges avec autrui (Bruner 1983, Snow 1986, Stern 1985, Vygotski 1986, Wertsh 1991), la recherche se donnait pour objectif d’identifier et de décrire des styles interactifs dans les échanges parents/enfants autour de l’interdiction et de la sanction. Les données sont constituées par des enregistrements vidéo de situations quotidiennes auprès de 2 familles francophones (enfants âgés de 1 à 5 ans ). Ces familles ont été suivies une fois par mois sur une période de quatre ans. Cette description de styles interactifs intègre des comparaisons intra et interfamiliales, prenant en compte les différents énonciateurs et les différents allocutaires. L’analyse du style interactif est médiatisée par celle d’acte de langage, ici, l’interdiction ou la sanction, dont l’identification associe une analyse syntaxique et une analyse prosodique (logiciel Signalyse) à celle de ses modalités d’ancrage dans le contexte d’énonciation. En nous situant ainsi dans le cadre des interactions interdictives, il apparaît que la mise en place de la socialisation par le langage s’y effectue explicitement au cours d’enchaînements discursifs dont le déroulement varie selon de multiples facteurs mais principalement selon l’interprétabilité des actes interdictifs, interprétabilité dont la variation détermine les modalités de la forme prise par l’échange (spécificité des modes d’enchaînement,

Page 82: Laboratoire Modèles, Dynamiques, Corpus

82

continuations et déplacements). Cette interprétabilité, nous l’avons désignée par le terme de clarté langagière. Nous avons ainsi pu conclure d’une part à des styles interdictifs plus ou moins clairs en désignant par clarté langagière la possibilité variable pour une interdiction d’être interprétée comme telle. Les résultats permettent d’interroger l’impact de cette dimension sur la construction de l’adaptation du sujet aux normes sociales ainsi que sur son développement cognitif. Ils ont également permis d’observer une socialisation différenciée chez un même interlocuteur selon l’allocutaire enfantin. 1b) Développement de l’autonomisation de l’enfant dans et par le langage La recherche ici poursuivie concernait un autre type d’interactions, celles centrées autour d’une autonomisation de l’enfant. L’autonomisation est partie prenante de la socialisation et c’est au mode de circulation des significations en tant qu’il facilite, encourage, parfois entrave la dynamique de l’autonomisation que nous nous sommes intéressées. Nos observations ont porté sur différentes séquences s’inscrivant dans des scripts de la vie quotidienne et concernant toutes un « savoir faire seul » comme par exemple se laver, s’habiller, aller aux toilettes… Les données sont les mêmes que celles de la recherche de l’axe I et nous avons ici comparé les deux familles sur une période d’une année. A la différence de la recherche précédente, il s’agit d’interactions dont l’enjeu est l’acquisition d’un savoir-faire. Et si la poursuite de l’objectif se fait en partie grâce au langage, la relation du discours à l’activité doit faire l’objet d’une adaptation constante à la progression en cours. Dans ces contextes, une stylistique interactive inclue la dimension des conduites d’action en l’articulant à celle des conduites langagières. Le style interactif réside aussi dans cette articulation quantitative et qualitative des conduites langagières et des conduites d’action. La construction de l’autonomisation est une co-construction où la spécificité de l’interaction sociale, tendant plus ou moins vers une routinisation du cadre de celle-ci, va constituer des formats intériorisables constitués d’événements, d’actions, de paroles et d’affects variés. Et l’analyse d’interactions autonomisantes où l’apprentissage du savoir-faire se conjugue à celui du savoir faire tout seul permet de rendre compte, aussi bien dans les modalités de mise en route de l’interaction que dans la variation des engagements mutuels des interactants, de la diversité de ces formats. Nous avons ainsi pu observer des styles interactifs différenciant nettement entre elles les séquences autonomisantes analysées et une analyse quantitative des récurrences associée à une description de l’atmosphère générale dans laquelle se déroulent ces séquences pourrait compléter l’analyse clinique que nous avons conduite. Toutefois, les variables situationnelles (enfant unique vs fratrie, en particulier) sont pour une part déterminantes dans le style d’interaction adopté dans l’autonomisation. Pour autant, dans chacune de ces familles, nous avons pu observer plusieurs styles d’interaction même si l’un est plus particulièrement privilégié par chacune d’entre elles. Dans ces interactions, nous nous sommes également intéressées à la façon dont les mises en mots placent l’enfant à différents plans de la dimension temporelle de l’autonomisation. Cette temporalité de l’autonomisation ne renvoie pas seulement à l’idée d’une place sur ce que serait un axe temporel de l’autonomisation mais aussi à une place dialogique qui se négocie hic et nunc dans l’interaction. Les modalités de négociation de cette place sont partie intégrante d’une stylistique de l’interaction autonomisante.

Page 83: Laboratoire Modèles, Dynamiques, Corpus

83

1c) Socialisation langagière et diversité culturelle dans les dialogues adultes-enfants d’une famille bilingue, franco-anglaise L’objectif retenu était ici de préciser le rôle de l’explication en tant que conduite interactive socialisante. Dans l’optique d’une comparaison des interactions de l’enfant avec le père et avec la mère, nous avons recueilli et analysé les explications et les demandes d’explication des parents et des enfants surgissant au cours des dialogues dans une famille bilingue. La famille se compose d’une mère anglophone, d’un père francophone et de deux enfants : une fille âgée de 4 ans 4 et 4 ans 5 et un garçon âgé de 13 et 14 mois dans le corpus étudié (2 enregistrements à un mois d’intervalle). Les explications fournies à l’enfant sont autant maternelles que paternelles. Une de leurs différences concerne l’atmosphère culturelle qui les enveloppe. Ainsi les explications maternelles sont factuelles, mais elles transmettent, en particulier au travers des reprises correctrices, un savoir vivre bien spécifique, celui des bonnes manières d’une classe sociale « moyenne/supérieure ». Une norme sociale en effet transcende et cadre ses explications. Quant aux explications du père, elles sont également factuelles et se concentrent sur les enchaînements de causalité pour eux-mêmes, mais, en même temps, elles s’inscrivent dans un univers ludique qui confère un caractère nettement plus gai à la transmission de ce même savoir. Au sein de cette famille, les types de relations maternelles et paternelles impriment des orientations différentes aux conduites explicatives mais sans doute leur complémentarité impulse-t-elle une certaine dynamique d’acculturation différenciée. Les explications se présentent donc, non seulement comme des conduites permettant aux enfants de comprendre leur environnement, mais aussi comme un mode d’entrée dans une culture donnée. 2) Interactions scolaires et socialisation Deux axes ont été plus spécifiquement travaillés : 2a) Acculturation, socialisation et appropriation du français langue 2 chez les enfants de CLasse d’INitiation 2b) Dialogue, accordage et temporalité dans le dialogue scolaire 2a) Acculturation, socialisation et appropriation du français langue 2 chez les enfants de CLasse d’INitiation Socialisation et apprentissage du français langue 2 chez les enfants nouvellement arrivés en France (ENAF) L’objectif initial global (cf. rapport UMR 8606, 2004) était de se demander comment des enfants non francophones scolarisés dans un établissement français s’appropriaient le français, La recherche vise à questionner ce que l’on appelle « apprentissage d’une langue étrangère ». Elle prend pour objet les interactions verbales maître-élèves et élèves-élèves dans les CLIN (Classes élémentaires d’Initiation au français) de l’école élémentaire. Le cadre théorique général, rapprochant ce travail de la collaboration entretenue avec C. Préneron sur la socialisation langagière dans la famille, se réclame d’une part des anthropologues comme Ochs et Schieffelin qui parlent dès 1995 d’écologie communicative, et d’autre part des interactionnistes et des analystes de la médiation des apprentissages dans le dialogue exolingue/interlingue (notamment Bruner 1983, Bange 1992, Frawley & Lantolf 1985, Nussbaum 1999, Pekarek 2000). D’où la centration sur la localisation discursive des apprentissages. La diversité des formats discursifs, et plus particulièrement le nombre et la variété des initiatives verbales prises par les élèves dans les diverses activités de la CLIN observées à

Page 84: Laboratoire Modèles, Dynamiques, Corpus

84

différents moments de l’année nous entraînent loin d’une conception linéaire et strictement linguistique de l’appropriation (Vasseur 2003, 2005). Qu’il s’agisse de maîtriser les structures de la langue, les comportements et rituels scolaires, l’habileté technique des activités pratiques ou de la maîtrise de ses émotions par exemple, l’analyse des discours de la classe nous montre que l’initiative de l’élève dans l’interaction, son mode d’engagement (Vasseur 2004), la constance et la continuité de cet engagement sont des clés pour l’appropriation de cette compétence globale qui inclut la compétence linguistique, mais dont il serait assez malaisé, compte tenu de la dynamique globale, de retracer une ligne unique de développement pour chaque compétence concernée (Vasseur, sous presse). 2b) Dialogue, accordage et temporalité dans le dialogue scolaire Dans le cadre global de l’organisation de la parole en interaction dans le contexte scolaire, on s’était proposé d’analyser la spécificité des interactions maître –élèves et/ou élèves-élèves, du point de vue de la temporalité du discours d’un sujet dans sa relation à la temporalité du discours d’un autre sujet (d’autres sujets) et en tenant compte des aspects non verbaux (posturo mimo gestuels). Il s’agissait d’aborder cet aspect de l’interaction par le biais du lien subjectivité et temporalité. La temporalité du discours d’un sujet dans sa relation avec celle du discours d’un autre : temporalité du discours de la maîtresse en relation avec la temporalité du discours des élèves, temporalité du discours d’un élève en relation avec celle d’un autre élève et/ou des autres élèves. Les données ont été recueillies dans une classe de CP (Enregistrements avec caméscope de deux séances de lecture, livre de lecture Livre de lecture : Gérard Chauveau, Catherine de Santi-Gaud, Mireille Usseglio, Mika, Retz) et une première analyse a été conduite pour rendre compte des différentes temporalités et de leurs mouvements. En considérant la première partie d’une séance de lecture, au cours de laquelle la maîtresse demande de résumer le texte lu lors de la séance précédente, nous avons ainsi dégagé deux principes d’analyse : la position et le scénario. La position : nous avons déterminé cinq « positions » de la maîtresse (en fonction de sa place dans la classe, de la posture, du regard). Le scénario renvoie à l’enchaînement de ces positions dans la succession des moments de l’échange. Nous avons ainsi dégagé un « scénario » dans lequel les trois moments de l’échange (questionnement, attente et réception de la réponse de l’élève, évaluation) sont ponctués par trois attitudes qui se différencient par le regard, la position du corps et le contraste entre corps en mouvement et corps statique. Ce scénario de base se modifie et/ou se complexifie en fonction du contenu et/ou de la relation réponse des élèves - horizon d’attente de la maîtresse, et de même, sa durée évolue. Mais cette étude est restée limitée d’un point de vue quantitatif et dans une perspective prospective, nous souhaitons étendre nos analyses à l’ensemble des données recueillies tout en affinant une méthodologie d’analyse corps-parole. 3) Subjectivité langagière, continuité discursive et troubles d’apprentissage : échecs en lecture versus échecs en mathématiques L’hypothèse centrale de ce projet réside dans l’interrogation que nous souhaitons mener du maniement du langage oral par des enfants présentant des troubles d’apprentissage contrastés (lecture vs mathématiques), ceci afin d’établir si chaque groupe, avec des variations individuelles probables, peut néanmoins se caractériser par un profil particulier et lequel. La notion de profil de sujet langagier est à considérer dans sa complexité et son hétérogénéité

Page 85: Laboratoire Modèles, Dynamiques, Corpus

85

comme une constellation de façons d’être, de raconter et d’interagir langagièrement qui présente des caractéristiques communes ou analogues ou à l’inverse opposées du point de vue de la subjectivité langagière dans des conduites et des situations diversifiées. De premiers résultats permettent d’émettre une hypothèse sur des caractéristiques langagières différenciées selon que l’enfant présente des troubles d’acquisition de la lecture ou du calcul dans le cadre de l’activité narrative au protocole. Les récits d’enfants en difficulté de lecture se caractérisent par un effacement de la subjectivité langagière alors que ceux des enfants en difficulté en mathématiques présentent au contraire un « trop plein » presque envahissant de cette énonciation de la subjectivité. La population étudiée à ce jour est composée de 2 groupes de 6 enfants tous venus consulter à l’UPPEA (Unité de Psychopathologie de l’enfant et de l’adolescent de l’hôpital St Anne): six enfants présentant des troubles de l’apprentissage des mathématiques et six enfants présentant des difficultés d’apprentissage de la lecture. Les compétences de ces enfants ont été comparées à celles d’un groupe contrôle composé de dix enfants tout-venant (enfants tout-venant). Dans les quatre ans à venir, nous envisageons d’étendre notre étude à 30 enfants de chaque groupe et de les comparer à 30 enfants tout-venant. 2.b. Groupe de travail - Le groupe de travail « Développement de l’autonomisation de l’enfant dans et par le langage » Coordinatrice : Christiane Préneron. Il s’est réuni 6 à 8 fois par an pendant 4 ans à Paris-Descartes. Il s’est agi de visionner les enregistrements vidéo d’enregistrements naturalistes en famille, d’y sélectionner les interactions relevant de la socialisation et de l’autonomisation et d’y construire les outils d’analyse de ces interactions. - Groupe de travail mensuel à Paris 5 : AADL2 (Atelier d’Analyse des Données en L2) dirigé par Marité Vasseur 2.c. Journées d’étude

Journée d’étude « L’interaction verbale, entrée dans la langue-culture de l’autre », organisée à Angers le 19 juin 2004, par D. Morsly et M.-T. Vasseur.

Journée d’étude internationale « De l’autonomisation du jeune enfant dans et par le langage, en famille et à l’école », à l’Amphithéâtre Durkheim, Paris-Descartes, le 18 juin 2005, présidée par Christian Hudelot (avec la participation des membres du groupe de travail « Dada » ainsi que celle d’Alessandra del Re, de Silvia Dinucci, de Frédéric François, d’Agnès Salinas et de Bernard Golse).

3. Thèse en cours (1)

1. Rosa Duarte. Université Paris 5. Directrice M. Vasseur. 4. Production scientifique halshs-00121046, Carcassonne M., Heberlé-Dulouard B., 2006, Temporalité affective,

temporalité de l’interaction, temporalité de l’autonomisation, Cahiers d’Acquisition et de pathologie du langage (CALaP).

Page 86: Laboratoire Modèles, Dynamiques, Corpus

86

halshs-00132410, Froment M., 2006, "Un joli garage bien en bordel", est-il "un joli garage bien en désordre" ? ou comment rendre compte de récits de fiction en classe ?", Recherches en didactique du français langue maternelle. Repères, 33.

halshs-00132406, Froment M., 2005, Quatre interprétations d’une consigne dans l’élaboration de textes écrits en classe de CM2, Langage et société, 111.

halshs-00114457, Kugler-Lambert M., Préneron C., 2005, Subjectivité langagière, Continuité discursive et Troubles d’apprentissage en lecture vs Echecs en mathématiques, Les séminaires du Mardi du Centre Référent pour le diagnostic et la prise en charge médicale des troubles spécifiques du langage oral et écrit, Hôpital Sainte-Anne, 19-24.

halshs-00123472, Lewi-Dumont N., 2006, Apprentissage de la lecture chez les enfants déficients visuels et littérature de jeunesse, La nouvelle revue de l’adaptation et de la scolarisation, 33, 2006, 242-250.

halshs-00123490, Lewi-Dumont N., Benoit H., 2006, Présentation du dossier "Adaptations didactiques 2 : langue française, éducation littéraire, humaine et artistique ", La nouvelle revue de l’adaptation et de la scolarisation, 35, Editions de l’INS HEA.

halshs-00117315, Morgenstern A., Brigaudiot M., 2004, L’altérité dans l’identité: quand l’enfant parle de lui à la deuxième personne, Identités, 183-193.

halshs-00117993, Morgenstern A., Préneron C., 2004, La justification dans la négociation parents/enfants: un exemple de médiation discursive, La médiation, 329-339.

halshs-00171474, Préneron C., Vasseur M., 2007, En quoi et comment l’explication participe de la socialisation de l’enfant par le langage?, Christian Hudelot, Anne Salazar-Orvig et Edy Veneziano (éds.), L’explication : enjeux cognitifs et communicationnels, Francke Verlag, 99-111.

halshs-00114508, Préneron C., 2006, Distúrbios da linguagem oral e da comunicação na criança, Aquisição da linguagem : uma abordagem psicolingüistica, Editora Contexto, Editora Pinsky Ltda, 63-73.

halshs-00114456, Préneron C., 2004, Sanction et Construction de la personne : une démarche dans la socialisation en famille - quelques observations, La sanction, 45-52.

halshs-00133150, Vasseur M.-T., 2007, Interaction, circulation de la parole et socialisation dans une Classe d’Initiation au Français, M. Auzanneau (éd.), Langues, cultures et interaction, L’Harmattan.

halshs-00133114, Vasseur M.-T., Préneron C., 2007, In what and how does explanation participate in the socialization of a child through parents/ child interactions: the exemple of a bilingual family ?, Proceedings of the 7th congress of the International Association of Applied Linguistics.

halshs-00133147, Vasseur M.-T., 2006, Aquisição da L2 : compreender como se aprende para compreender o desenvolvimento da competência em interagir em L2, Alessandra Del Ré (éd.), Aquisição da linguagem : uma abordagem psicolingüistica, Editora Contexto, 85-111.

halshs-00133118, Vasseur M.-T., 2005, Rencontres de langues. Questions d’interaction, Didier.

halshs-00133144, Vasseur M.-T., 2005, Peut-on localiser l’appropriation de la langue seconde ? le cas de la CLIN, J.-F. Halté & M. Rispail (éd.), Le langage oral de l’enfant scolarisé, L’Harmattan, 283-294.

halshs-00133056, Vasseur M.-T., Arditty J., 2005, Interaction et diversité des conduites d’apprentissage de la L2, AILE, Acquisition et Interaction en Langue Etrangère n° 22, Association Encrages.

Page 87: Laboratoire Modèles, Dynamiques, Corpus

87

1.2.2.8. Equipe Activités Langagières, Médiations et Apprentissages (ALMA) Responsables : Michael Baker et Sylvie Plane Les recherches d’ALMA sont centrées sur l’étude de la langue écrite et de la production verbale écrite, et traitent des processus d’apprentissage associés à l’écriture de textes et l’acquisition de l’orthographe. Les travaux menés par ce groupe associent des observations in situ réalisées sur le terrain de l’école, l’élaboration de méthodes d’analyse des activités langagières complexes, et la construction de modèles théoriques. Les recherches entreprises s’organisent en deux opérations intitulées respectivement : 1) Processus d’écriture ; 2) Langue écrite. 1.2.2.8.1. Processus d’écriture 1. Membres de l’opération Membres rattachés à titre principal (8) Michael Baker (responsable) François-Xavier Bernard Colette Dudon-Corblin Isabelle Dumez-Féroc Nathalie Lewi-Dumont Marie-Christine Pouder Sylvie Plane Jean-Michel Pottier Doctorants (5) Florence Charles Marie-Françoise Fradet Bernadette Lafourcade Fabienne Rondelli Michelle Ros-Dupont Collaborations extérieures (6) Jerry Andriessen (Université d’Utrecht) Jean-Jacques Girardot (Ecole Nationale Supérieure des Mines) Maria Beatrice Ligorio (Université de Salerne) Vittorio Scarano (Université de Salerne) Claire O’Malley (Learning Sciences Research Institute, Université de Nottingham) Michiel Klønhammer (ICATT Interactive Media, Amsterdam) 2. Problématique Les recherches menées dans le cadre de ce volet « Processus d’écriture » portent sur l’analyse des effets des différentes médiations qui interviennent sur le processus d’écriture lorsque celui-ci est mis en œuvre à l’occasion de situations d’apprentissage. On s’intéresse donc à la fois au jeu de ces médiations sur le processus d’écriture lui-même et au rôle que l’activité langagière joue dans l’acquisition de connaissances.

Page 88: Laboratoire Modèles, Dynamiques, Corpus

88

Par médiation on entend : a) la manière dont les éléments préconstruits fournis par la langue, les organisations linguistiques et les opérations langagières interviennent dans la structuration des objets de connaissance et dans leur appropriation ; b) l’influence exercée sur la production langagière et sur les apprentissages par le recours à des technologies d’écriture et en particulier les technologies informatiques ; c) l’influence sur les apprentissages notionnels et linguistiques du mode d’intervention et de guidage de l’enseignant, envisagé dans ses aspects langagiers ; d) les effets des configurations d’échanges langagiers sur la nature de la production elle-même. Au-delà des actions de recherche spécifiques, contribuant à son thème général, les travaux ont été menés autour d’un projet collectif, portant sur l’étude des situations de rédaction conversationnelle de textes au sein de petits groupes à l’école, impliquant une médiation forte (de l’outil informatique et/ou de l’enseignant). Les analyses se sont focalisées autour des objets d’étude suivants : - étude comparative des registres de l’oral et de l’écrit dans des interactions en co-présence, et dans des interactions médiatisées par ordinateur (Baker 2006 ; Baker & Dumez-Féroc 2006) - comparaison entre l’écriture de différents genres textuels (Pottier 2005 ; Plane & François 2006 ; Corblin, Boré et al. 2005b ) - étude des processus d’élaboration des notions disciplinaires véhiculées par la langue (Plane 2007 ; Plane & Grossmann 2007) - étude des effets du médium sur le processus scriptural (Plane 2006a, 2006b ; Plane & Alamargot, 2007) - étude des effets des interactions de tutelle sur le processus d’apprentissage (Baker et al. 2006 ; Baker, Molinari et al. 2005 ; Corblin 2006 ; Corblin, Boré et al. 2005a ; Fradet 2006) 2.a. Actions Les travaux menés en commun par l’équipe se sont déroulés selon les étapes suivantes : 1) Recueil de données en situation écologique cadrée : constitution de corpus de rédactions conversationnelles consacrées à l’élaboration de synthèses portant sur des notions d’histoire ou d’ECJS par des élèves de l’enseignement primaire (2 classes) et secondaire (2 classes). 2) Elaboration d’une méthode d’analyse intégrée permettant de traiter les différentes activités langagières en jeu dans les situations complexes. 3) Recueil de données en situation expérimentale : rédaction conversationnelle médiée par ordinateur combinant les échanges oraux in praesentia et les échanges écrits transmis par voix informatique. Ces actions ont été menées en relation étroite avec le travail du projet européen LEAD. Le projet contribue au travail collectif de l’équipe ALMA sur le plan méthodologique (constitution d’un corpus d’étude collective, élaboration et expérimentation de logiciels d’écriture collective) et théorique (élaboration de modèles de co-construction de connaissances). Le but du projet est d’élaborer des outils informatiques et pédagogiques qui favorisent le travail de groupe à l’école secondaire. Les situations d’étude ont la particularité de faire travailler les élèves ensemble (sous le guidage de leur professeur) sur des ordinateurs reliés par un réseau Intranet, alors qu’ils se trouvent tous dans la même salle de classe. Dans ce cas, un des objets de recherche est la distribution de l’activité (non-)communicative à travers les deux canaux de communication de la communication parlée en face-à-face et de la communication écrite à travers le réseau. Le laboratoire MoDyCo est responsable dans le cadre du projet pour le développement de méthodes d’analyse des interactions entre élèves, adaptées aux enjeux des situations d’étude (comparables) dans les différents pays. Le travail

Page 89: Laboratoire Modèles, Dynamiques, Corpus

89

du projet a été très favorablement évalué par les experts de la commission européenne en mars 2007. Un premier article de recherche issu du projet a été publié dans les actes d’un colloque international (Dumez-Féroc & Baker, 2006). 2.b. Groupe de travail Le groupe de travail s’est réuni en séminaire six fois par an. 2.c. Journées d’études, colloques, ateliers

1. Organisation d’une école thématique du CNRS en collaboration avec le GDR CNRS 2657 « Production verbale écrite » : « Analyses pluridisciplinaires de l’écriture : convergences et débats » MSHS de Poitiers 4-8 juillet 2005.

2. Organisation d’une journée d’étude : « Hétérogénéité linguistique et observation réfléchie de la langue. Des langues des élèves à la langue de l’école ». IUFM de Paris 10 et 11 janvier 2006.

2.d. Contrat Projet européen LEAD : « Technology-enhanced learning and problem-solving discussions : networked learning environments in the classroom », 2005 - 2008 (responsable scientifique : Michael Baker). 3. Thèses en cours (5)

1. Bernadette Lafourcade : « Traitement des contraintes formelles liées au genre de discours et au médium de production par des scripteurs novices – Étude didactique ». Directrices S. Plane et M.-E. Plagnol.

2. Marie-Françoise Fradet : « La construction de la fiction dans l’écriture de textes narratifs à visée littéraire à l’entrée au collège : quand le dialogue pédagogique interfère avec le dialogue intérieur chez le jeune scripteur ». Directrices S. Plane et M.-E. Plagnol.

3. Fabienne Rondelli : « L’écriture de textes narratifs à l’école élémentaire : traitement des contraintes et problèmes de cohérence ». Directrice Sylvie Plane.

4. Michèle Ros-Dupont : « Acquisition de la segmentation graphique en langue française : étude longitudinale des marques de segmentation, des procédures et stratégies d’enfants de l’école primaire ». Directrice Sylvie Plane.

5. Florence Charles : « La recherche du « mot juste » : enseignement du lexique et pratiques scripturales au cycle 3 de l’école élémentaire ». Directrice Sylvie Plane.

4. Production scientifique hal-00103625, Baker M., 2006, Rôle et usage des modèles en Environnements Informatiques

pour l’Apprentissage Humain, Actes du Colloque IC’2006 « Ingénierie des Connaissances », 1 – 4.

hal-00103588, Baker M., Bronner A., Léhuen J., Quignard M., 2006, Gestion de l’interaction et modèles de dialogues, M. Grandbastien et J.-M. Labat (éds.), Environnements Informatiques pour l’Apprentissage Humain, Lavoisier / Hermès Science Publications

Page 90: Laboratoire Modèles, Dynamiques, Corpus

90

halshs-00131960, Dudon-Corblin C., 2006, Evaluations et commentaires en narration : effets sur des écrits du cycle 3, Recherches en didactique du français langue maternelle. Repères, 33, 105-122.

halshs-00131966, Dudon-Corblin C., Dumez-Féroc I., Baker M., 2006, Réécrire à deux : la synthèse comme aide à la réécriture, Mohamed Sidir, Eric Bruillard, Georges-Louis Baron (éds.), Actes du Colloque international : Premières Journées Communication et Apprentissage Instrumentés en Réseau (JOCAIR’ 2006), 342-356.

halshs-00131956, Dudon-Corblin C., Voltz F., 2005, Quel français pensent-ils enseigner ?, M.-M. Bertucci & V. Houdart (éds.), Situations de Banlieues, Enseignement, langues, cultures.

halshs-00131970, Dudon-Corblin C., Bertucci M.-M., 2004, Quel français à l’école ? Les programmes de français face à la diversité linguistique, L’Harmattan.

hal-00103639, Dumez-Féroc I., Baker M., 2006, Des dispositifs de communication multicanaux au service de l’apprentissage collaboratif en classe : le projet LEAD, Mohamed Sidir, Eric Bruillard, Georges-Louis Baron (éds.), Actes du Colloque international : Premières Journées Communication et Apprentissage Instrumentés en Réseau (JOCAIR’ 2006), 342 – 356.

halshs-00134599, Dumez-Féroc I., 2005, Les sites Web d’école et les journaux scolaires sur Internet : fonctions et motifs de la publication scolaire en ligne, Les Cahiers du CREDAM, 5, 145-153

halshs-00134601, Dumez-Féroc I., 2004, Usages et représentations d’Internet par les jeunes européens : quelles perspectives comparatistes possibles ?, Actes du XIVe Congrès de la Société française des sciences de l’information et de la communication (SFSIC) « Questionner l’internationalisation. Cultures, acteurs, organisations, machines », 285-291.

hal-00103640, Molinari G., Baker M., Séjourné A., Lund K., 2005, Les graphes argumentatifs interactifs sur Internet : sont-ils plus efficaces comme média du débat ou comme moyens de le représenter ?, Actes du colloque EIAH 2005, 201-211.

halshs-00124326, Plane S., 2006, Singularités et constantes de la production d’écrit - l’écriture comme traitement de contraintes, Laffont-Terranova J. & Colin D. (éd.), Didactique de l’écrit. La construction des savoirs et le sujet-écrivant, Presses Universitaires de Namur, 33-54.

halshs-00117507, Plane S., 2006, L’écriture de fiction existe-t-elle?, Repères, 33, 7-19. halshs-00124311, Plane S., François F. (éds.), 2006, La fiction et son écriture, Repères, 33,

INRP. halshs-00117506, Plane S., 2005, Les activités définitionnelles au service des apprentissages

lexicaux, Pratiques, 125-126, 115-138. halshs-00117505, Plane S., 2005, Fiction, utopie et représentation du monde et de l’école dans

des écrits sur le collège rédigés par des élèves en difficulté, Langage et société, 108, 119-148.

halshs-00117509, Plane S., 2004, Quelques éclaircissements sur un malentendu : les technologies informatisées et l’apprentissage de l’écriture, Annie Piolat (éd.), Ecriture. Approches en sciences cognitives, Presses Universitaires de Provence.

halshs-00124324, Plane S., Lafourcade B., 2004, Contextes, démarches, supports, pour une approche discursive de l’apprentissage du lexique : les activités définitionnelles, Calaque E. & David J. (éd.), Didactique du lexique, De Boeck.

halshs-00139587, Pottier J.-M., 2006, "Une façon de manifeste", Rosny aîné et le Manifeste des Cinq, Histoires littéraires, 27, 99-111.

Page 91: Laboratoire Modèles, Dynamiques, Corpus

91

halshs-00139585, Pottier J.-M., 2006, « Comment j’ai fait mes romans sociaux », une conférence inédite de Rosny aîné, Les Cahiers Naturalistes, 80, 133-166.

halshs-00139608, Pottier J.-M., 2005, Naoh et Rahan, frères des âges farouches : "La Guerre du feu" pour les enfants, Actes du Colloque International « L’édition pour la jeunesse : entre héritage et culture de masse ».

hal-00165246, Pouder M.-C., (à paraître), Formes de langue et genres discursifs mis en ouvre par l’utilisation des nouvelles technologies en contexte scolaire et périscolaire, Actes du colloque « Formes de langue et genres discursifs mis en ouvre par l’utilisation des nouvelles technologies en contexte scolaire et périscolaire ».

hal-00114783, Pouder M.-C., 2004, Les "culs-de-sac" de la grammaire enfantine, Actes du XXIIIème colloque de la SILF.

hal-00103534, Puustinen M., Baker M., Lund K., 2006, GESTALT : a framework for redesign of educational software, Journal of Computer Assisted Learning, 22, 1 – 13.

hal-00103646, Séjourné A., Baker M., Lund K., Molinari G., 2004, Schématisation argumentative et co-élaboration de connaissances : le cas des interactions médiatisées par ordinateur, Actes du colloque international « Faut-il parler pour apprendre ? », 1-14.

1.2.2.8.2. Langue écrite 1. Membres de l’opération Membres rattachés à titre principal (3) Jean-Pierre Jaffré Danièle Cogis Danielle Manesse (jusqu’en juin 2006) Collaborations extérieures (6) Catherine Brissaud (IUFM Grenoble) Michel Fayol (LAPSCO, Université de Clermont-Ferrand) Pierre Largy (Université Toulouse le Mirail) Marie-Pierre Thibault (orthophoniste, Union Nationale pour le Développement de la Recherche et de l’Evaluation en Orthophonie (UNADREO)) Philippe Vauchel (IEN, Saint-Valéry-en-Caux) 2. Problématique Les activités menées dans le cadre de ce volet, regroupées autour de deux thèmes majeurs, sont centrées sur la dimension orthographique de la langue. Les différents programmes associent des observations de terrain (chez des enfants de maternelle, du primaire et du secondaire), et la construction de modèles théoriques, dans le domaine de l’acquisition de l’orthographe et dans celui plus général de la linguistique de l’écrit. Deux actions : 1) La variation orthographique chez les élèves de 10 à 16 ans (scolarité obligatoire) 2) Linguistique génétique de l’écrit 2.a. Actions 1) La variation orthographique chez les élèves de 10 à 16 ans (scolarité obligatoire) Trois axes ont été plus spécifiquement travaillés :

Page 92: Laboratoire Modèles, Dynamiques, Corpus

92

1a) Dynamique d’acquisition de l’orthographe 1b) Etude comparative du niveau orthographique des élèves de 1987 et 2005 1c) Gestion des contraintes orthographiques en production écrite 1a) Dynamique d’acquisition de l’orthographe Dans le domaine de l’acquisition du langage écrit, les recherches portent sur l’acquisition de la morphographie (genre, nombre, marques verbales) dans le cadre du système orthographique du français décrit par Nina Catach et redéfini par Jean-Pierre Jaffré dans une tension entre principe phonographique et principe sémiographique. Il s’agit de décrire les processus de production des marques grammaticales au cours de la scolarité obligatoire, en situation de production écrite effective ou d’analyse explicite de la langue, en liaison avec la construction des notions linguistiques impliquées, parallèlement à l’élaboration du métalangage. L’objectif est de proposer un modèle qui rende compte des procédures orthographiques des scripteurs entre 6 et 16 ans, des représentations sous-jacentes, des obstacles et de leur résolution, de la dynamique d’acquisition. Le recueil de données s’effectue soit au cours d’entretiens menés par le chercheur sur les graphies produites par un élève dans un écrit, soit au cours des activités menées par l’enseignant de la classe. Le modèle, provisoire, postule quatre procédures fondamentales articulées aux composants linguistiques sur lesquelles le scripteur s’appuie pour résoudre un problème morphographique. La mise au jour des conceptions des scripteurs permet de moduler certains résultats avancés par la psychologie cognitive, qui tendent à établir une maîtrise relativement précoce des marques de nombre et imputent à la limite des ressources cognitives l’origine des erreurs. Les retombées didactiques sont importantes à l’heure où les réponses sociales aux difficultés avérées dans le domaine de l’écrit à l’issue de la scolarité obligatoire sont toujours envisagées en faisant l’impasse sur les représentations et l’activité métalinguistiques des élèves. Elles permettent d’expérimenter en situation écologique des pratiques d’enseignement-apprentissage susceptibles de faire évoluer les conceptions orthographiques des élèves qui sont à l’origine de nombreuses erreurs persistantes. Certains aspects de cette action rejoignent le travail mené dans l’opération de la composante Modèles « Le Verbe et les constructions verbales », coordonnée par Danielle Leeman, volet « Didactique de la syntaxe ». 1b) Etude comparative du niveau orthographique des élèves de 1987 et 2005 Cette recherche est une étude descriptive et comparative de la variation orthographique chez des élèves de 10 à 16 ans (scolarité obligatoire) et de son évolution en vingt ans. Elle a pour but de contribuer à décrire le niveau réel des compétences orthographiques des élèves à l’école et au collège. L’étude reconduit à l’identique une étude comparative du niveau orthographique des enfants et adolescents de 10 à 16 ans, qu’avaient conduite André Chervel et Danièle Manesse il y a près de vingt ans sur deux corpus importants, datant l’un de 1877, l’autre de 1986. Cette recherche avait alors fait l’objet de deux publications (Calmann-Levy et INRP) qui ont contribué à éclairer le débat sur l’évolution du niveau des élèves. Cette comparaison avait, à l’époque, pu faire la preuve d’une amélioration quantitative de la maîtrise de l’orthographe à un siècle de distance (1877-1987), mais inégale selon les domaines (orthographe lexicale/orthographe grammaticale) : du point de vue qualitatif, des déplacements des zones de turbulence dans la maîtrise de l’orthographe par les élèves entre la fin du XIXe et la fin du XXe siècle avaient pu être alors montrés.

Page 93: Laboratoire Modèles, Dynamiques, Corpus

93

Depuis l’enquête de 1987, la baisse du niveau orthographique des élèves a été souvent dénoncée, sans avoir été établie objectivement. L’enquête de 2005 apporte la preuve d’une baisse correspondant à deux années de scolarité, met en évidence le secteur critique que constitue l’orthographe grammaticale, mais montre également une diminution régulière du taux moyen d’erreurs du CM2 à la troisième, contribuant ainsi de nouveau à éclairer la question de l’apprentissage de l’orthographe. 1c) Gestion des contraintes orthographiques en production écrite Recherche pluridisciplinaire menée dans le cadre du GDR « Production Verbale Écrite » (2003-2007), renouvelée avec l’intitulé « Pratiques de production Verbale Écrite » (2007-2011) Responsable du GDR: Denis Alamargot, MC IUFM Poitou-Charentes, Laboratoire LaCo-CNRS : Gestion des contraintes cognitives et linguistiques. La recherche vise à évaluer l’impact des contraintes graphiques et orthographiques sur le processus de production écrite, en croisant les approches cognitives et linguistiques. Il s’agit notamment de préciser l’impact des traitements graphomoteurs et orthographiques en fonction des limites des ressources cognitives ou des limites de la conceptualisation des notions grammaticales et orthographiques. 2) Linguistique génétique de l’écrit Dans le projet quadriennal 2004-2007, le projet sur la linguistique génétique de l’écrit a regroupé deux actions : 2a) Sémiographie 2b) Vulgarisation 2a) Sémiographie La première action a porté sur la sémiographie, c’est-à-dire sur la représentation graphique des signes linguistiques. Les travaux ont prolongé - et clos - une série d’études empiriques et théoriques menées au LEAPLE d’abord, à MoDyCo ensuite. La part essentielle des travaux les plus récents s’est déroulée dans le cadre d’un projet sur l’acquisition de la morphologie flexionnelle. Cette recherche pluridisciplinaire, coordonnée par Pierre Largy (Université Toulouse Le Mirail), a permis d’étudier l’acquisition précoce de connaissances lexicales relatives au lexique orthographique du français, dans le domaine de la morphologie du nombre nominal. Le questionnement psychologique s’est accompagné d’une réflexion linguistique : dans la sphère alphabétique, en effet, l’orthographe du français est l’une de celles dont la morphologie de l’écrit, part de la sémiographie, est la plus riche et, en tout cas, la plus spécifique. 2b) Vulgarisation Cette action souhaite mettre à la disposition du plus grand nombre – communauté scientifique mais également public averti – des informations scientifiques réservées de fait aux seuls spécialistes. Les lecteurs francophones sont en effet le plus souvent privés d’une information publiée exclusivement en anglais. Cette opération comporte deux volets. Le premier est une synthèse des travaux sur le fonctionnement et l’acquisition des orthographes qui devrait être publié en 2008 dans un ouvrage co-écrit avec M. Fayol et publié aux Presses Universitaires de France. Le second volet de ce projet de vulgarisation concerne les orthographes inventées. Initié dans les années 70 par des chercheurs anglo-saxons, ce concept a été étendu depuis à différentes orthographes, spécialement celle du français. Il montre qu’avant toute instruction

Page 94: Laboratoire Modèles, Dynamiques, Corpus

94

formelle, de très jeunes enfants sont en mesure de produire des tracés graphiques non aléatoires. Ces travaux, dont les textes officiels tiennent désormais compte, devraient faire l’objet d’une publication chez un éditeur qui reste encore à définir. 2.b. Groupe de travail et participation dans des projets - Participation au projet « Acquisition de la morphologie flexionnelle : étude longitudinale d’enseignement / apprentissage de l’accord en nombre des noms (dir. Pierre Largy, Université de Rouen) / ACI « La dynamique des apprentissages : des fonctions cognitives à l’élaboration des connaissances ». - Participation au GDR 2657 « Approche pluridisciplinaire de la production verbale écrite » (resp. Denis Alamargot, LaCo-CNRS - Université de Poitiers) / co-direction de l’axe « Analyse des unités de traitement : normal et pathologique ». 2.c. Journées d’étude, colloques, ateliers

1. Séminaire international « Orthographes et acquisition », Villejuif, décembre 2005. 2. Journée d’étude « Orthographe : innovations et pratiques de classe », Université Paris

10, Nanterre, mars 2007, avec l’opération Syntaxe et sémantique grammaticale descriptives du français.

2.d. Contrat Coordination du projet « Approches pluridisciplinaires de la morphologie du français : le cas des homophones verbaux », ACI « Apprentissages des langues; dysfonctionnements et remédiations », Ministère de la Recherche / École & Sciences cognitives. 3. Production scientifique halshs-00132632, Brissaud C., Cogis D., 2004, Pour un réexamen des relations entre

grammaire et orthographe : l’exemple de la notion de sujet, C. Vargas (éd.), Langue et études de la langue. Approches linguistiques et didactiques, 247-256.

halshs-00132645, Cogis D., 2006, Une acquisition conceptuelle continue, Cahiers Pédagogiques, 440, 21-23.

halshs-00132487, Cogis D., 2005, Pour enseigner et apprendre l’orthographe. Nouveaux enjeux - Pratiques nouvelles. Ecole/Collège, Delagrave.

halshs-00132640, Cogis D., 2004, Une approche active de la morphographie. L’exemple d’une séquence sur l’accord de l’adjectif, LIDIL, 30, 73-86.

halshs-00132608, Cogis D., 2004, Dire l’orthographe pour l’acquérir, E. Nonnon (éd.), Actes du colloque international "Faut-il parler pour apprendre ?", CD-Rom.

halshs-00132597, Cogis D., 2004, Les verbalisations métagraphiques : une médiation pour les marques de genre à l’écrit ?, R. Delamotte-Legrand (éd.), Les médiations langagières. Des faits de langue aux discours.Actes du colloque international "La médiation : marquages en langue et en discours", 1, 359-369.

halshs-00103232, Jaffré J.-P., 2006, Du fonctionnement des orthographes à leur acquisition. Effets psycholinguistiques sur une linguistique de l’écrit, C. Gruaz (éd.), A la recherche du mot : De la langue au discours, Lambert-Lucas, 99-116.

Page 95: Laboratoire Modèles, Dynamiques, Corpus

95

halshs-00115664, Jaffré J.-P., 2006, Homophonie et hétérographie : un point nodal de l’orthographe, R. Honvault (dir.), La question de l’orthographe. Dyalang, 145-168.

halshs-00107352, Jaffré J.-P., 2006, Pourquoi distinguer les homophones ?, Langue Française, 151, 25-40.

halshs-00089954, Jaffré J.-P., 2006, La réforme de l’orthographe allemande, Cahiers Pedagogiques, 440, 25-26.

halshs-00089952, Jaffré J.-P., 2006, L’orthographe aujourd’hui, Les Cahiers Pédagogiques, 440, 11-13.

halshs-00089951, Jaffré J.-P., 2006, Petite genèse de la morphographie : Le cas de l’orthographe du français, Rééducation Orthophonique, 225, 19-37.

halshs-00089948, Jaffré J.-P., 2006, Orthographes et litéracies : les particularités du français, Les Cahiers du CENTAL, 1, 55-68.

halshs-00103233, Jaffré J.-P., 2006, L’orthographe du français est-elle une bonne orthographe ?, Enseigner la langue : orthographe et grammaire, Observatoire National de la Lecture, 13-37.

halshs-00089947, Jaffré J.-P., 2006, La mixité orthographique : le cas du japonais et du français, Langue, lecture et école au Japon, Observatoire National de la Lecture, 19-41.

halshs-00089946, Jaffré J.-P., 2006, Écritures et structures linguistiques. Propos sur un éternel conflit, Écriture chinoise. Données, usages et représentations, CRLAO, École des Hautes Études en Sciences Sociales, 241-271.

halshs-00107353, Jaffré J.-P., Brissaud C. (dir.), 2006, Morphographie & homophones verbaux, Armand Colin.

halshs-00132494, Manesse D., Cogis D., 2007, Orthographe : à qui la faute ?, ESF Editeur.

Page 96: Laboratoire Modèles, Dynamiques, Corpus

96

1.2.3. COMPOSANTE TEXTE / CORPUS Coordination : Catherine Boré, Denise Malrieu Cette composante regroupe des travaux ayant en commun de se situer dans une linguistique de la parole, partageant une notion de la langue non pas « une et unique », mais constituée par l’ensemble des textes qui l’attestent, textes oraux ou écrits, qui forment l’unité d’analyse, en tant qu’unité signifiante. La langue s’élaborant et évoluant, comme tout système sémiotique, au sein de pratiques sociales différenciées à l’intérieur de domaines et de champs de pratiques, le genre apparaît comme un concept nécessaire à cette démarche, car il est le lieu où s’articulent les contextes d’énonciation et les normes langagières, le lieu où s’explicitent les jeux de différentes sémiotiques qui informent le texte et contraignent les dimensions cognitives de l’interprétation. Les aspects diachroniques et épistémologiques constituent un axe fortement charpenté dans la composante : deux projets contribuent en effet à l’histoire de la linguistique textuelle et l’épistémologie des genres : celui de J.-F. Jeandillou consacré à l’édition des textes théoriques de Charles Nodier linguiste, et celui de S. Bouquet dans son épistémologie d’une linguistique des genres depuis Schleiermacher. Un des points qui rassemblent les travaux et les différents projets est la conviction que l’approche et la typologie textuelles peuvent apporter de nouvelles données à la morphologie et à la syntaxe, que ce soit en synchronie ou en diachronie, et que le développement d’une linguistique de corpus autorisera une observation raisonnée, quasi expérimentale des productions. Aussi la composante a-t-elle au cours de ces dernières années créé ou utilisé des corpus d’étude importants soit de textes littéraires (roman contemporain, poésie, nouvelles, contes) soit de textes des sciences humaines (philosophie, articles de linguistique, corpus de questions parlementaires), de même que le projet « Genres scolaires et linguistique textuelle »1 a constitué des corpus de textes littéraires prescrits, dans les manuels scolaires notamment, ainsi que des corpus de productions d’élèves en rapport avec ces prescriptions. Enfin, la notion de corpus, par son étendue comme par ses différentes utilisations possibles, nécessite une approche tant conceptuelle que technique. Les bouleversements engendrés par la numérisation à grande échelle des textes et leur mise à disposition sur Internet, nécessitent en effet d’interroger les concepts de Texte, de représentation du texte, de lecture d’un texte, et débouchent sur de nouveaux outils de recherche et d’étude en linguistique textuelle. Le passage à l’échelle et la modélisation des connaissances mobilisées par l’étude des grands corpus constituent les enjeux actuels des travaux de J.-L. Minel, plus spécifiquement, le concept de navigation textuelle dans les textes. La composante est donc fortement identifiée par la problématique fédératrice des genres de textes et des corpus. Elle se distribue en trois opérations de recherche distinctes, mais non étanches.

��Ce titre se substitue désormais à celui de « Ecrit et écriture scolaire » : la composante « Ecrit » était représentée par J. Anis, décédé en décembre 2005 ; avec l’arrivée de deux nouveaux membres MoDyCo, spécialistes de linguistique textuelle et d’analyse de discours, le groupe a redéfini plus explicitement sa problématique autour des genres scolaires prescrits et produits par l’école, et de leur description.

Page 97: Laboratoire Modèles, Dynamiques, Corpus

97

Liste des opérations 1.3.1. Aux origines de la linguistique des genres 1.3.2. Genres et linguistique de corpus 1.3.3. Corpus oraux et écrits et navigation textuelle

Page 98: Laboratoire Modèles, Dynamiques, Corpus

98

1.2.3.1. Aux origines de la linguistique des genres 1. Membres de l’opération Membres rattachés à titre principal (5) Jean-François Jeandillou (responsable) Michel Arrivé Simon Bouquet Annie Bertin Isabelle Weill Doctorants (4 dont 2 en cotutelle) Asma Doukhar Julie Glikman Françoise Nore Evgueny Shochenmaier Jeune chercheur associé (1) Dana Sleiman Collaborations extérieures Jean-Louis Aroui (Université Paris 8) Daniel Bilous (Université de Toulon) Benoît de Cornulier (Université de Nantes) Jacques-Philippe Saint-Gérand (Université de Clermont) Daniel Sangsue (Université de Neuchâtel) 2. Problématique Les réflexions sur l’épistémologie de la linguistique (S. Bouquet Introduction à la lecture de Saussure) renouvelées par la découverte des nouveaux manuscrits saussuriens des Ecrits de linguistique générale conduisent à se préoccuper de l’articulation d’une linguistique de la langue et d’une linguistique de la parole, dont Saussure a énoncé le programme et que le Cours de linguistique générale a occultée. Dans la mesure où le Nachlass saussurien ne permet pas de poser cette articulation sur des bases philosophiques et épistémologiques suffisamment explicites, le propos est de compléter le programme esquissé par Saussure (1) par une philosophie du langage propre à étayer a priori cette articulation, (2) par la clarification d’une systématique épistémologique et par des analyses empiriques susceptibles de la justifier a posteriori. L’opération s’est ainsi donné un programme épistémologique fondamental en repartant des fondations d’une linguistique des genres. Les programmes d’actions, par le bais de recherches diachroniques descriptives sur corpus, contribuent à un renouvellement de l’histoire des idées linguistiques sur les typologies et les genres. Les études précises, conduites sur des objets linguistiques différents, participent d’ une même investigation descriptive, théorique et épistémologique. Cette opération est structurée par 3 actions : 1) Recherche épistémologique pour une linguistique des genres 2) Charles Nodier et la typologie des genres - Edition scientifique de Charles Nodier 3) Etudes diachroniques prenant en compte le genre

Page 99: Laboratoire Modèles, Dynamiques, Corpus

99

2.a. Actions 1) Recherche épistémologique pour une linguistique des genres Dans la recherche d’une philosophie du langage directement productive d’une épistémologie linguistique on est amené à revisiter l’Herméneutique de Schleiermacher, les derniers travaux de Bakhtine et l’œuvre du « second » Wittgenstein. Le fil directeur de cette recherche est la comparaison des concepts de « genre » (chez Schleiermacher et Bakhtine) et de « jeu de langage » (chez Wittgenstein) dans la perspective du programme saussurien. Les travaux empiriques concernent, entre autres, une grammaire de la parole du français oral et des textes littéraires, notamment poétiques. 2) Charles Nodier et la typologie des genres - Edition scientifique de Charles Nodier Initialement engagé dans le cadre de l’Institut universitaire de France, poursuivi depuis 2004 au sein du laboratoire MoDyCo, le programme d’édition scientifique des écrits linguistiques de Charles Nodier entre en relation avec l’actualité des recherches sur l’origine des langues (CNRS, notamment), sur l’histoire de la linguistique naturaliste au XIXe siècle (Desmet 1996), sur le développement de la dialectologie et de la lexicographie (ou dictionnairique ; cf. Vaulchier 1984 et Pruvost 2006). Il s’inscrit en complément de l’édition en cours des Œuvres de Nodier (Les Belles-Lettres), qui laisse de côté les écrits techniques et scientifiques. Il a donné lieu à une trentaine d’articles et conférences ainsi qu’à l’édition scientifique de trois volumes (listés ci-après). Se trouve par là établie la base d’un corpus d’analyse particulièrement précieux quant à la typologie des genres métadiscursifs et métalinguistiques au début du XIXe s. Peuvent être désormais comparées la classification des genres élaborée par Nodier dans les Questions de littérature légale avec, d’une part, les typologies de son temps, d’autre part les recherches linguistiques développées dans ses Questions de littérature verbale, regroupant des travaux sur l’onomatopée (Dictionnaire 1808-1828) et l’histoire des langues mais aussi les Notions élémentaires de linguistique (1834). 3) Etudes diachroniques prenant en compte le genre 3a) Métrique de l’alexandrin au tournant des XIXe et XXe siècles Il s’agissait d’examiner les contraintes majeures régissant la versification des alexandrins, dans la production poétique française, au tournant des XIXe et XXe siècles. En s’appuyant notamment sur la méthode métrico-métrique de Cornulier (principalement exploitée, jusqu’à présent, pour la littérature classique et les années 1810-1880), on a procédé spécialement à l’analyse des textes signés par Raymond Roussel entre 1897 et 1917 (soit près de trente mille vers). Grâce à la numérisation des textes et au codage métrico-métrique du corpus, on a pu commencer à exploiter des bases de données et faire un repérage statistique des marques CPMFs6 / CPMF12 et des distributions syntagmatiques (à la fin de chacun des deux hémistiches). L’analyse quantitative des résultats ouvre donc sur divers prolongements aussi bien stylistiques, génériques que théoriques. 3b) Etudes diachroniques de la subordination Fondée sur des corpus d’états anciens du français, la recherche, à travers des descriptions lexicale, morphologique, syntaxique, sémantique, vise à mettre les méthodes et théories linguistiques contemporaines (morphologie dérivationnelle, sémantique guillaumienne, linguistique de l’énonciation, grammaticalisation, par exemple) au service d’un approfondissement de la connaissance d’états anciens du français et d’une réflexion

Page 100: Laboratoire Modèles, Dynamiques, Corpus

100

épistémologique sur la productivité des cadres théoriques utilisés. On voudrait contribuer à une double réflexion : 1) sur le changement linguistique 2) sur ce que peut apporter le point de vue dynamique à l’étude linguistique. A partir des corpus, une réflexion est menée sur le changement linguistique, en relation au social, au cognitif et au genre textuel. Ce travail a donné lieu à une collaboration avec l’ATILF (Nancy 2) dont l’objet est la production d’un dictionnaire du français moyen. De plus, la participation à l’Atelier « Corpus » (A. Bertin et D. Sleiman) a conduit à élaborer un premier projet autour de la constitution d’un corpus étiqueté interrogeable à partir de traductions intralinguales (13e-16e-20e siècles) (D. Sleiman). 3. Thèses en cours (4 dont 2 en cotutelle)

1. Asma Doukhar : L’évolution du système des indéfinis en français - le paradigme de quelque et aucun en ancien et moyen français. Directrice A. Bertin.

2. Julie Glikman : La parataxe en ancien et moyen français. Directrice A. Bertin. 3. Françoise Nore : Morphologie dérivationnelle et diachronie - Etudes du langage

argotique de Chéreau et Péchon de Ruby (16e et 17e siècles). Directrice A. Bertin, cotutelle avec Gerda Haßler (Université de Potsdam).

4. Evgueny Shochenmaier : Sémantique et onomastique : normativité dans la langue, variabilité dans la parole. Directrice J.-F. Jeandillou, cotutelle avec Nikolay Chekhtman (Université pédagogique d’Orenbourg).

4. Thèses soutenues (3)

1. Dana Sleiman : L’absence d’article en français - Etude diachronique et sémantique. Directrice A. Bertin, décembre 2006.

2. Solange Gularté : Lire les textes littéraires. Aspects historiques et références théoriques des discours sur l’enseignement de la littérature. Directeur J.-F. Jeandillou, novembre 2006.

3. Hui-Teak Kim : La Circulation du texte. Valeur énonciative et communication. Directeur J.-F. Jeandillou, juin 2007.

5. Production scientifique halshs-00122246, Arrivé M., 2007, A la recherche de Ferdinand de Saussure, Presses

Universitaires de France. halshs-00121713, Arrivé M., 2007, Qu’en est-il de l’inconscient chez Ferdinand de

Saussure ?, Langage et inconscient 3, Lambert-Lucas, 19-32. halshs-00122251, Arrivé M., 2006, Le "T"emps dans la réflexion de Saussure, D. Bertrand &

J. Fontanille (éds.), Régimes sémiotiques de la temporalité, Presses Universitaires de France.

halshs-00121699, Arrivé M., Vilela I. (dir.), 2006, Linguistique et psychanalyse. Langage et inconscient, 1, Lambert-Lucas.

halshs-00121722, Arrivé M., Vilela I., 2006, Rudolf Engler, le grand maître du saussurisme, Semiotica, 1/4, 160, 173-183.

halshs-00121752, Arrivé M., 2005, Verbes sages et verbes fous, Lambert-Lucas.

Page 101: Laboratoire Modèles, Dynamiques, Corpus

101

halshs-00121745, Arrivé M., 2005, Langage et psychanalyse, linguistique et inconscient. Freud, Saussure, Pichon, Lacan, Lambert-Lucas.

halshs-00121631, Arrivé M., 2004, Freud et l’autonymie, Marges Linguistiques, 7, 52-62. hal-00173287, Bouquet S., 2004, Saussure unfinished’s semantics, C. Sanders (éd.), The

Cambridge Companion to Saussure, Cambridge University Press. hal-00171450, Bertin A., 2004, Le Discours rapporté dans tous ses états, J.M. Lopez Munoz,

S. Marnette, L. Rosier (éds.), La mise en scène de la parole dans le Roman de Renart, L’Harmattan, 222-233.

hal-00171456, Bertin A., (à paraître), Récrire en françois au XVe siècle : variation et/ou changement ?, Verbum. Actes de DIACHRO – 2.

hal-00160059, Jeandillou J.-F., 2007, Dictionnaire raisonné des onomatopées françaises, de Charles Nodier (1808, 1828), Droz.

hal-00111016, Jeandillou J.-F., 2007, Effets de texte, Lambert-Lucas. hal-00160057, Jeandillou J.-F., 2007, Problèmes métrico-syntaxiques pour le codage de

l’alexandrin classique, Linx, 93-108. hal-00160068, Jeandillou J.-F., 2007, Lector in stabula, N. Preiss (éd.), Mélire ? Lecture et

mystification, L’Improviste, 49-64. hal-00111015, Jeandillou J.-F., 2006, L’Analyse textuelle, Armand Colin. hal-00111011, Jeandillou J.-F., 2006, Parodies de presse, pastiches de genre, C. Dousteyssier-

Khoze & F. Place-Verghnes (éds.), Poétiques de la parodie et du pastiche, de 1850 à nos jours, Peter Lang, 275-288.

hal-00111017, Jeandillou J.-F., 2005, L’ordre des mots, Laseldi. hal-00111014, Jeandillou J.-F., 2005, Notions élémentaires de linguistique, de Charles

Nodier, Droz. hal-00110997, Jeandillou J.-F., 2005, "L’art des transports de l’âme est un faible interprète" :

l’ordre des mots dans les Élégies d’André Chénier, L’information grammaticale, 107, 48-52.

hal-00111007, Jeandillou J.-F., 2005, La rime féminine : paroles et musique, Michel Murat (éd.), Poétique de la rime, Honoré Champion, 253-274.

hal-00111006, Jeandillou J.-F., 2004, De "l’étymologie immédiate" selon Charles Nodier, Gerda Hassler (éd.), Geschichte der Sprachwissenchaft in Texten und Konzeptzen, Nodus Publikationen, 589-600.

hal-00172392, Weill I, 2006, ”Un “résumé” et une “suite” d’Auberi le Bourgoin dans le Charlemagne de Girart d’Amiens”, Dominique Boutet, Camille Esmein-Sarrazin (éds.), Palimpsestes épiques. Récritures et interférences génériques, Presses de la Sorbonne, 115-127.

hal-00172391, Weill I., 2006, ”La Cronica du frère Salimbene de Adam : une vision joachimite de l’histoire”, Danielle Buschinger (éd.), Médiévales 40, Presses de l’Université de Picardie, 88-98.

1.2.3.1. Genres et linguistique de corpus 1. Membres de l’opération Membres rattachés à titre principal au laboratoire (8) Denise Malrieu (responsable) François Rastier (responsable) Jacques Anis (jusqu’en 2005) Catherine Boré

Page 102: Laboratoire Modèles, Dynamiques, Corpus

102

Simon Bouquet Evelyne Bourion (jusqu’en 2005) Marie-Laure Elalouf Caroline Facq-Mellet Doctorants (2) Smail Djaoud Rossitza Kyheng Membres associés (4) Driss Ablali (Université de Besançon) Frédérique Sitri (Université Paris 10 et équipe Syled) Pascale Hannoun(ENS Cachan) Nicole Marty (IEN) Collaborations extérieures (9) Bénédicte Pincemin (ICAR) Mathieu Valette (ATILF) Jean-Michel Baudouin (Sciences de l’Education, Université de Genève) Kjersti Fløttum (Université de Bergen, dépt d’études romanes et KIAP project, www.hit.uib.no/kiap : Cultural Identity in Academic Prose : national versus discipline-specific, Dépt Romance Studies, Université de Bergen, avec le concours du Research Council of Norway) Christian Bouillon (IUFM de Versailles) Eduardo Calil (Université fédérale d’Alagoas, Brésil) Sylviane Joly-Ahr (IUFM de Versailles) Loïc Martin (IEN) Fatima Maya-Blot (Formatrice) 2. Problématique La sémantique des textes numériques allie les savoirs traditionnels des « arts et sciences des textes » (philologie, herméneutique, en particulier) à des méthodes récentes, permises par les NTIC. Elle étend les principes du comparatisme aux discours, genres et textes, tout d’abord en perspective unilingue, puis multilingue (la théorie comparative des genres est cruciale pour la traduction). Conduits au cours des années 1990, les travaux d’approfondissement théorique ont commencé par (i) une critique des théories récusant la typologie des textes ou la déclarant impossible ; (ii) la proposition de catégories descriptives (les composantes textuelles : thématique, dialectique, dialogique, tactique) ; (iii) la (re)définition en termes linguistiques d’unités textuelles restées intuitives (les thèmes, notamment) ainsi que de méthodologies de construction de ces thèmes. La perspective sérielle adoptée impose la constitution et l’exploitation de corpus numériques, qui soient assez étendus pour se prêter à des méthodes quantitatives. En l’absence de corpus français disponibles et surtout constitués selon une déontologie philologique, nous avons dû constituer des corpus. Les domaines choisis relèvent des Lettres et Sciences humaines. Ils l’ont été pour diverses raisons, notamment l’accessibilité (relative) des textes, et les liens interdisciplinaires que leur

Page 103: Laboratoire Modèles, Dynamiques, Corpus

103

étude permettent de nouer avec les disciplines concernées, la philosophie par exemple, enfin les débouchés didactiques des recherches (ex. enseignement du français). Cette opération est structurée en 3 actions : 1) Travaux de sémantique lexicale sur les concepts en sciences humaines 2) Recherche empirique sur les genres mettant en œuvre une méthodologie de corpus balisés 3) Genres scolaires et linguistique textuelle 2.a. Actions 1) Travaux de sémantique lexicale sur les concepts en sciences humaines Les méthodes de la thématique assistée sur corpus numériques peuvent s’appliquer aux discours théoriques, qu’ils soient scientifiques ou philosophiques. Comment les concepts se lexicalisent-ils ? Leur lexicalisation s’accompagne-t-elle d’un appauvrissement de leur richesse contextuelle ? L’étude diachronique et comparative (dans diverses disciplines : philosophie, linguistique, sociologie, politique) tient compte des différences notables des « concepts » (répartitions et contextes) selon les genres (article, traité, essai, etc.) et les discours, y compris à l’intérieur d’œuvres singulières (ex. Guillaume et Deleuze). Les retombées de cette recherche intéressent l’extraction assistée de concepts, la représentation des connaissances, et permettent de cerner certaines difficultés repérées dans les alignements de corpus. Nous avons comparé-conjugué la méthode d’extraction de candidats termes par patrons constructionnels et la méthode des corrélats statistiques par écart réduit, cela dans un corpus d’articles de linguistique et un corpus de textes de philosophie. Applications : profilage de textes, extraction de concepts, typologie narratoriale. Les travaux déjà conduits ont donné lieu à divers contrats, notamment Princip, contrat européen sur la caractérisation et détection automatique de sites racistes (2002-2004 ; consortium INALCO, Lip6, Université de Dublin, Université de Magdebourg). Corpus impliqués dans le projet : - Corpus Philosophie (Sylvain Loiseau) : Deleuze, Macherey, autres philosophes du XXe, numérisé. - Corpus Linguistique (Céline Poudat) : 250 articles de linguistique francophones, corpus comparable sur des revues de linguistique anglophones, numérisé. - Corpus Nouvelles (Rossitza Kyheng) : 360 nouvelles en français, bulgare, russe numérisées ; corpus à enrichir. - Corpus Sociologie (G. Hazem). - Corpus Histoire (S. Djaoud). - Corpus Critique littéraire (D. Ablali). 2) Recherche empirique sur les genres mettant en œuvre une méthodologie de corpus balisés Depuis trois ans, nous avons développé une méthodologie qui vise à intégrer la qualification d’un corpus, d’un texte de ce corpus dans sa structure (utilisation d’XML et de la TEI), et l’exploration des variations tant morpho-syntaxiques que lexicales en fonction de ces différents niveaux de localité.

Page 104: Laboratoire Modèles, Dynamiques, Corpus

104

2a) Méthodologie de balisage Le balisage est devenu incontournable dans les linguistiques de corpus, et plus généralement dans le traitement des données culturelles. Une première étape consiste à définir des traits de genres et à les attribuer aux textes du corpus; puis à baliser la structure hiérarchique du texte et les segments graphiquement marqués. Pour ce faire il faut définir une typologie des marquages (qui connaissent des variantes selon les genres, les éditions et les périodes) et développer des routines de balisage automatique adaptées à cette typologie. Une seconde étape concerne la génération de variables qui qualifient le texte et la définition de leur mode de représentation en vue de leur intégration dans la représentation XML/TEI du texte. Une troisième étape concerne l’intégration de l’étiquetage de l’analyseur et des statistiques sur les variables dans le corpus. 2b) Approche quantitative et la définition des variables morpho-syntaxiques pertinentes Dans le travail antérieur sur une analyse morpho-syntaxique différentielle des genres, les résultats obtenus (Malrieu & Rastier 2001 ; Malrieu 2002) par traitement de 250 variables morpho-syntaxiques fournies par Synapse montraient de fortes différences entre domaines, champs génériques et certains genres et nous ont confirmés dans l’intérêt d’approfondir l’approche morpho-syntaxique des genres. Cependant les résultats obtenus et l’examen des variables nous ont amenés aux conclusions suivantes : a) le traitement statistique de textes non balisés peut entraîner des biais statistiques en cascades ; b) l’absence d’un parcours méthodique des dimensions de variation fait que des catégories sont redondantes, d’autres manquantes. Notre choix est donc de nous rendre autonomes par rapport aux variables statistiques fournies par Cordial et de parser les sorties étiquetées. Cette redéfinition est en chantier sur trois fronts : 1) Repérer dans les sorties de l’analyseur les étiquettes non fiables. Un descriptif des erreurs repérées dans les sorties de l’analyseur a été défini en format XML. 2) Redéfinir des variables comme objets linguistiques : Environ trois cents variables soit existantes soit dérivables des sorties de l’analyseur ont été pour l’instant définies. 3) Définir leur mode de représentation formelle en XML pour faciliter leur traitement en aval et leur manipulation dans la description du corpus. Ces avancées devraient prendre forme grâce au projet ANR piloté par S. Heiden et B. Pincemin (ICAR, Lyon). 2c) L’approche qualitative : comment articuler les niveaux de contraintes pour la désambiguïsation ? Si l’approche purement quantitative peut aider à la classification des textes, et si les variations de corrélations de certains morphèmes selon les domaines et genres peuvent être des indices de valeurs sémantiques divergentes, leur spécification passe par une analyse des contraintes portées par le genre à des paliers inférieurs du texte. Il paraît donc utile d’associer à une approche purement quantitative sur les textes globaux, une approche qui prend en compte les spécificités du genre dans son mode énonciatif et dans la structure du texte. Ce travail se fonde sur une analyse des propriétés énonciatives du genre ou des séquences à l’intérieur du texte. Deux terrains d’études sont en chantier : i) Typologie des narrateurs : ce travail, qui met en jeu le balisage des discours rapportés à l’intérieur du roman permet de mettre en évidence les corrélats structurels (en particulier usage et poids des différents discours rapportés) et morphosyntaxiques des types de narrateurs (ce travail entre en écho avec le groupe de travail sur les discours rapportés, cf. plus bas). ii) Les usages de on et genres textuels : le terrain choisi est celui du réglage des usages de on par les genres et de montrer que la désambiguïsation du morphème passe par l’interprétation

Page 105: Laboratoire Modèles, Dynamiques, Corpus

105

de l’énoncé dans son genre. Les valeurs référentielles de on sont définies dans une grammaire différentielle liée au paradigme des pronoms personnels, en collaboration avec S. Bouquet. L’analyse sur corpus revient à projeter cette arborescence de la grammaire différentielle sur un corpus lui-même défini par une hiérarchie de traits de genres différentiels. Cette analyse s’appuie sur la constitution préalable d’un corpus XMLisé avec balises conformes à la TEI; le genre prend en compte : la nature du support, le contexte énonciatif et mode de communication, le type de publication, le domaine, le type d’élaboration (critique vs œuvre littéraire), le champ générique, le genre littéraire, sous-genres. De plus le balisage des discours rapportés à l’intérieur des textes permet de situer toute occurrence dans l’univers de discours représenté. 2d) Recherches sur les liens entre typologie des textes et variables linguistiques - Les travaux de S Loiseau et C. Poudat sur la présence de l’auteur selon les genres (usages du « je » et du « on ») chez Deleuze ou dans les articles de linguistique ont donné lieu à publication. - Un travail plus approfondi sur l’analyse des corrélations entre temps et personne a été mené, qui montre bien des systèmes d’opposition des temps différents dans deux corpus contrastés (genres narratifs vs articles de linguistique). - Les variables morpho-syntaxiques : un tableau de 300 variables morpho-syntaxiques a été défini; la formalisation des modes de reconnaissance ou de calcul n’est pas terminée. - Les statistiques morpho-syntaxiques issues de textes narratifs balisés : poids des différents types de discours rapportés et types de narrateurs. - Les formes d’indexicalité de on selon les genres textuels. 3) Genres scolaires et linguistique textuelle Avertissement préalable : Ce groupe de recherche s’était constitué originellement autour d’une opération dénommée « Ecrit et écriture scolaire », dont l’initiative revenait à Jacques Anis, professeur à l’Université Paris 10. Cette opération était étroitement liée à l’opération « Communication Electronique » que dirigeait J .Anis, dont on rappelle ci-dessous les grandes lignes : « Le projet contribuera au développement des recherches linguistiques sur la communication électronique, au sein d’un champ pluridisciplinaire. Il se fixe non seulement de cerner les spécificités de la communication électronique à partir de plusieurs disciplines des sciences du langage, notamment la sémiolinguistique de l’écrit, la linguistique discursive, la sociolinguistique, la didactique des langues, mais aussi d’affiner certains concepts des disciplines grâce à l’analyse des corpus. On en attend aussi l’élaboration de méthodologies et d’outils de traitement » Les membres restants ont poursuivi le travail commencé pour « Ecrit et écriture scolaire » et l’ont réorienté en le resserrant autour d’une problématique des genres scolaires, en accentuant ses liens avec les phénomènes textuels propres à l’écriture scolaire. La description qui suit tient compte de cette réorientation. L’objectif à long terme de ce projet est de mieux caractériser l’écriture scolaire et les genres de discours par lesquels elle s’exprime. Le texte scolaire constitue un type de texte intermédiaire. De nombreux chercheurs en didactique et linguistique comme Bernié (2001), s’appuyant sur les travaux de Bakhtine mettent en évidence l’existence de genres « intermédiaires », genres « secondaires » pour Bernié qu’il définit comme « des textes composites d’un point de vue générique mais

Page 106: Laboratoire Modèles, Dynamiques, Corpus

106

discursivement organisés à partir d’un principe de coordination qui transmute leurs composantes ». Inspirés de Bakhtine (1984) et de Vygotski ([1936]1997), ces travaux se fondent sur les thèses génériques du premier (associées à ses théories de l’hétéroglossie) et sur l’interactionnisme social du second pour proposer un modèle de la production écrite construit sur les interactions langagières. Notre recherche a permis de circonscrire deux types de problèmes : 3a) Extension et définition de la notion de « contexte », liée à la production de types de textes scolaires Le contexte n’est pas seulement issu des transcriptions d’oraux de classe plus ou moins directement liés à la production des textes (cf. Rabatel dir. 2004). Il est aussi constitué par les textes de référence : il s’agit de recenser les genres prescrits, à la fois comme l’institution les code, dans les Instructions Officielles par exemple, et comment elle les exemplifie dans les manuels et listes de textes prescrits pour la lecture. A terme, des corpus génériques « officiels » se constituent, qu’il est possible de décrire. A cet égard, un inventaire des textes lus, prescrits par l’institution (extraits, textes intégraux, appartenant à la littérature de jeunesse ou à la littérature générale), se constitue comme l’arrière-plan générique auquel il est constamment référé pour la production des écrits scolaires. Cet ensemble apparemment hétéroclite n’en obéit pas moins à des traditions scolaires historiques vivaces, sur lesquelles travaillent plusieurs membres du groupe. La numérisation de ces textes est en cours : les contes au programme de CM2 et de 6ème (respectivement 35 et 28 ouvrages) ont fourni la base à partir de laquelle un logiciel d’analyse textuelle (Tropes) examine certaines caractéristiques des contes : connecteurs, temps verbaux, personnes. 3b) Analyse des « genres scolaires » produits Nous disposons actuellement de trois corpus génériques homogènes qui ont été réunis en classe de 6ème et fin d’école primaire de « l’état naissant » à la copie finale. Ces corpus répondent une conception du texte ouverte et évolutive selon laquelle l’écriture est envisagée comme processus observable et comme pratique sociale contextualisée (cf. ci-dessus). Il apparaît que la modélisation de Bronckart (1985) issue du « fonctionnement des discours » articulant référent et situation et, plus encore, l’approche énonciative qu’il a développée en 1996, inspirent la construction des indicateurs que nous avons commencée à titre d’hypothèse pour caractériser les productions scolaires. Un balisage a été tenté et exploité (CORDIAL) sur un fragment de corpus scolaires avec la collaboration de D. Malrieu. 2.b. Groupe de travail - Sur les genres scolaires, séminaire mensuel de 2004 à 2006 (puis Journée d’études et publication des Actes, voir ci-dessous). - Exposé des résultats du groupe de recherche sur les « genres scolaires » au séminaire du Laboratoire le 7 décembre 2005. - Création d’un groupe de travail « Discours rapportés », depuis janvier 2007, avec D. Malrieu, Catherine Boré, C. Facq-Mellet, F. Sitri.

Page 107: Laboratoire Modèles, Dynamiques, Corpus

107

2.c. Journées d’études - Journée d’études organisée avec J. Anis, en 2004. Publication des Actes de la journée dans un numéro spécial de Linx n° 51 en novembre 2004 « Théories de l’écriture et pratiques scolaires » (Anis et Boré éds). - Organisation d’une journée d’étude sur Sémantique des textes théoriques. Association Conscila Confrontations en sciences du langage, vendredi 2 décembre 2005, Institut d’Anglais de l’Université Paris 7. - Développement d’un outil d’exploitation de corpus xmlisé : S. Loiseau a développé dans son CorpusReader une méthodologie d’analyse des contextes de noms candidats-concepts permettant d’étudier leur évolution selon les textes et périodes. - Organisation des Journées d’études à Nanterre les 15 et 16 Novembre 2005 « Corpora et questionnements du littéraire » en collaboration avec le Séminaires franco-italien Si@t. Ces journées avaient pour objectif une réflexion collective sur les outils disponibles et les besoins de nouveaux outils pour le balisage XML-TEI et d’outils d’interrogation des textes balisés plus conviviaux. Elles ont donné lieu à publication dans un n° spécial de LINX 2007. - Organisation d’une journée d’études à Paris 10, le 10 juin 2006 : « Corpus et genres : apport des analyses des grands corpus pour la caractérisation des genres scolaires » Laboratoire MoDyCo – Université Paris X, UMR 7114 équipe « Ecrit et écriture scolaire » et IUFM de Versailles ayant abouti à la publication d’Actes « Construire et exploiter des corpus de genres scolaires » (Boré dir.), Presses Universitaires de Namur, collection Diptyque n°10, juin 2007. 3. Thèses en cours (2)

1. S. Djaoud : L’orientalisme en sciences humaines - Etude de thématique. Direction F. Rastier.

2. R. Kyheng : L’interprétation en linguistique textuelle : des variations aux invariants des textes. Direction F. Rastier.

4. Thèses soutenues (3) et HDR (1)

1. Thomas Beauvisage : Sémantique des parcours des utilisateurs sur le Web. Directeur F. Rastier. 2004.

2. Sylvain Loiseau : Sémantique du discours philosophique chez Deleuze : du corpus aux normes. Directeur F. Rastier. 2006.

3. Nicole Marty : Pratiques d’écriture à l’école primaire : l’apport des nouvelles technologies. Directeur J. Anis. 2003.

HDR soutenue (22 mars 2007) Marie-Laure Elalouf 5. Production scientifique halshs-00162626, Boré C. (éd.), 2007, Construire et exploiter des corpus de genres scolaires,

Presses Universitaires de Namur. halshs-00163027, Boré C., 2007, L’écriture scolaire entre stéréotype et idiolecte, variété des

modes d’expression de la pensée/parole d’autrui dans les textes d’élèves, Pratiques, 135-136.

Page 108: Laboratoire Modèles, Dynamiques, Corpus

108

halshs-00163009, Boré C., 2007, Corpus et genre, affinités, difficulté, Le français aujourd’hui, 159.

halshs-00162637, Boré C., 2005, Rhétorique de l’aveu : atténuation, négation, ironie dans L’Age d’homme de Michel Leiris, Michel Leiris « Ethos et Pathos ». Questions de style, 2, Presses Universitaires de Caen, 45-58.

halshs-00126183, Boré C., Elalouf M.-L., Bertucci M.-M., Corblin C., Tisset C., 2005, Chapitre 2 "Les tâches d’écriture" Chapitre 3 "De l’analyse des écrits scolaires aux questions didactiques", M.-L. Elalouf (éd.), Ecrire entre 10 et 14 ans, un corpus, des analyses des repères pour la formation, CRDP Académie de Versailles, CDDP Essonne.

hal-00170617, Boré C., 2004, Les réécritures, Le Français aujourd’hui, 144, AFEF. halshs-00114540, Boré C., 2004, L’écriture scolaire : langue, norme, "style" : quelques

exemples dans le discours rapporté, Théories de l’écriture et pratiques scolaires. Linx, 51, 91-106.

halshs-00162625, Boré C., Anis J., 2004, Théories de l’écriture et pratiques scolaires, Linx. halshs-00156962, Boré C., Elalouf M.-L., 2004, Construction et exploitation de corpus

d’écrits scolaires, Revue française de linguistique appliquée, XXI-1, 53-70. hal-00173292, Bouquet S., 2008, Bakhtine avec Saussure , Champs, sphères et genres. Linx. hal-00173290, Bouquet S., 2004, Linguistique générale et linguistique des genres, Les genres de la parole, Langages, 153. halshs-00168715, Elalouf M.-L., 2004, L’acquisition du lexique à l’épreuve d’un grand

corpus d’élèves, Elisabeth Calaque & Jacques David (éds.), Didactique du lexique, De Boeck.

halshs-00168710, Elalouf M.-L., Boré C., 2007, Construction et exploitation de corpus d’écrits scolaires, Revue française de linguistique appliquée, XII, 1, 53-70.

halshs-00168712, Elalouf M.-L., 2007, Les interactions orales en classe, un rôle essentiel dans la configuration de genres scolaires, Catherine Boré (éd.), Construire et exploiter des corpus de genres scolaires, 10, 89-106.

halshs-00117033, Elalouf M.-L., 2006, Le rôle du contexte d’enseignement dans la construction de la fiction, Repères, 33, 81-104.

halshs-00117037, Elalouf M.-L., 2005, De la 6e à la 1e, comment mobilisent-ils leurs connaissances sur la langue dans des tâches d’explication ?, Pratiques, 125-6, 157-87.

hal-00173297, Malrieu D., Bouquet S., à paraître, Pour une linguistique néo-saussurienne des genres de la parole, Linx, Champs, sphères et genres.

halshs-00161681, Malrieu D., 2007, Contribution à une sémantique néo-saussurienne des genres de la parole (2) : analyse des valeurs d’indexicalité interlocutoire de on selon les genres textuels, Linx, 56, 1, 20-30.

halshs-00161678, Malrieu D., 2007, Linguistique de corpus et caractérisation des genres : un exemple d’analyse d’un conte didactique, C. Boré (éd.), Construire et exploiter des corpus de genres scolaires, 10-20.

halshs-00161671, Malrieu D., 2005, Quel balisage du roman contemporain?, Corpora et questionnements du littéraire. Linx, n° spécial, 141-158.

halshs-00103428, Malrieu D., 2005, Domaines, champs génériques, temps et personnes, Williams G. (éd.), La linguistique de corpus, Actes des deuxièmes journées de la linguistique du corpus, Presses Universitaires de Rennes.

halshs-00161658, Malrieu D., 2004, Linguistique de corpus, genres textuels, temps et personnes, Langages, 153, 73-85.

Page 109: Laboratoire Modèles, Dynamiques, Corpus

109

hal-00171570, Rastier F., 2007, Conditions d’une linguistique des normes, Siouffi G., Steuckart A. (éds.), Les linguistes et la norme - Aspects normatifs du discours linguistique, Lang, 3-20.

hal-00171569, Rastier F., 2006, Traduction et genèse du sens, Marianne Lederer (éd.), Le sens en traduction, Minard, 37-49.

hal-00171568, Rastier F., 2006, La structure en question, Janus. Hommage à Elli Fischer-Joergensen, VI, 93-103.

hal-00171567, Rastier F., 2006, Formes sémantiques et textualité, Langages, 163, 99-114. hal-00171566, Rastier F., 2006, Saussure au futur. - Ecrits retrouvés et nouvelles réceptions -

Introduction à une relecture de Saussure, La Linguistique, 12, 3-18 hal-00171551, Rastier F., 2005, Pour une sémantique des textes théoriques, Revue de

Sémantique et de Pragmatique, 17, 151-180. hal-00171532, Rastier F., 2005, Enjeux épistémologiques de la linguistique de corpus,

Williams G. (éd.), La linguistique de corpus, Actes des deuxièmes journées de la linguistique du corpus, Presses Universitaires de Rennes, 31-46.

hal-00171550, Rastier F., 2005, Les mots sans les choses ? Questions sur la référence, Murguiá A. (éd.), Sens et référence, Tübingen, Narr, 55-104.

1.2.3.3. Corpus oraux et écrits 1. Membres de l’opération Membres rattachés à titre principal au laboratoire (7) Jean-Luc Minel (responsable) Javier Couto Michel de Fornel Denise Malrieu Atanas Tchobanov Richard Walter Stéphanie Weiser (aussi doctorante) Doctorants (2 dont 1 en cotutelle) Aiala Rosa Stéphanie Weiser (aussi ITA en CDD) Jeune chercheur associé (1) Florence Amardeilh Collaborations extérieures (2) Michel Jacobson (LACITO, CNRS) Olivier Baude (CORAL, Orléans) 2. Problématique Cette opération réunit deux projets lourds sur corpus et un atelier de formation auquel ont participé une dizaine de membres du laboratoire. Elle a développé une réflexion technique d’interopérabilité des corpus en vue d’augmenter leur étendue, en particulier pour les corpus oraux. La finalité de ces travaux vise

Page 110: Laboratoire Modèles, Dynamiques, Corpus

110

l’homogénéisation des normes et des formats afin de permettre une modélisation détaillée de corpus oraux, utile à la communauté scientifique. L’exploitation des corpus utilisés dans la composante est fortement dépendante des hypothèses de travail et de la finalité de la recherche. Aussi la dimension épistémologique a-t-elle été particulièrement développée. Elle s’est faite sous la forme d’ ateliers de réflexion et de formation. Elle a permis d’aborder les problèmes soulevés par : a) les traitements quantitatifs sur la structure d’un corpus et de chacun des textes qui le composent; b) les traitements quantitatifs sur les objets linguistiques2 et sur les relations qu’entretiennent entre eux ces objets de différentes granularité (par exemple les relations syntaxiques ou rhétoriques, etc.). L’étude des propriétés morpho-syntaxiques des séquences textuelles implique l’exploitation quantitative des fichiers étiquetés. Il faut pour cela définir à l’intérieur de schéma XML des variables nouvelles (dont certaines font appel à des listes de lexèmes prédéfinies) qui correspondent à des calculs que nous pensons d’intérêt général. c) les propriétés topologiques de la forme textuelle : il faut pouvoir travailler aussi bien sur le contenu des balises, que sur les balises elles-mêmes et leurs propriétés topologiques (distances, densité, enchaînements). d) les traitements de fouille qui nécessitent la navigation dans le corpus 3 actions structurent cette opération : 1) Interopérabilité des corpus oraux 2) Variling : Traitement des variations linguistiques dans les corpus 3) Atelier d’exploitation de corpus 2.a. Actions 1) Interopérabilité des corpus oraux Le projet « Interopérabilité des corpus sonores : le cas des corpus en français » a été réalisé par le laboratoires MoDyCo suite à une subvention de la Délégation générale à la Langue Française et aux Langues de France (Ministères de la culture). Le projet a consisté à établir un dialogue et à prévoir des modalités d’échanges ou de transferts d’expériences entre les différentes initiatives (laboratoires de recherche, bibliothèques, éditeurs privés, etc.) qui numérisent et diffusent des corpus sonores. Il est en effet important de pouvoir établir des analyses comparatives entre ces différents corpus sonores, tant du point de vue du contenu que des techniques et méthodologies mises en œuvres. Pour favoriser l’interopérabilité des corpus et des outils développés séparément, et d’intégrer les recherches en ce domaine dans le cadre d’une politique conjointe de normes et de formats, nous voulons proposer un modèle d’interopérabilité pour l’exploitation, la conservation et la diffusion de corpus sonores, en nous basant sur les travaux du Guide des bonnes pratiques « Corpus oraux » (http://www.culture.gouv.fr/culture/ dglf/corpus_oraux.htm). Pour réaliser cet objectif, nous avons organisé et nous maintenons un espace d’échanges et de confrontations des corpus constitués. Sur cet espace, est venue une communauté de spécialistes, venant d’horizons divers mais tous confrontés aux problématiques techniques d’interopérabilité des corpus. Nous avons fait cette animation en partenariat avec l’initiative 2 On entend par objet linguistique toute unité linguistique (morphème, léxème, proposition, phrase, cadre de discours, etc,) qui est l’objet de la recherche.

Page 111: Laboratoire Modèles, Dynamiques, Corpus

111

Cat-Cod, espace de discussion pour les recommandations de catalogage et de codage des corps oraux. Pour les applications, nous avons travaillé sur trois corpus qui en sont à des états de réalisation différents : Archivages (Lacito, Villejuif) ; PFC (Nanterre-Oslo-Toulouse) ; ESLO (Corral, Orléans). Ce projet a impliqué les responsables techniques de chaque corpus et a permis de déterminer les points de convergences puis de mettre en place un programme d’échanges de techniques et de formats, pour permettre à la communauté scientifique de travailler sur des corpus étendus. Les résultats de ces différents travaux sont disponibles à travers comptes-rendus, rapports et communications scientifiques, sur un site collaboratif et évolutif, à destination des spécialistes. Pour prolonger cette réflexion et permettre la création non d’un corpus omnibus mais d’un modèle détaillé de corpus oral, pour valoriser et mettre en commun les différentes compétences en traitement de corpus oraux, un groupe de travail s’est constitué : le GRICO, Groupe de réflexions sur l’interopérabilité des corpus oraux (R. Walter, A. Tchobanov, MoDyCo ; M. Jacobson, Lacito ; O. Baude, Coral). Ses objectifs concerneront le codage et l’archivage des corpus sonores, particulièrement l’interopérabilité entre ces corpus :

• échanger des informations, des méthodes et des outils ; • établir un inventaire de l’existant et des projets en cours ; • produire les spécifications d’un modèle de corpus oral de référence, en se basant sur les

normes internationales d’encodage et d’archivage ; • comparer ce modèle avec le « Guide des bonnes pratiques pour la constitution,

l’exploitation, la diffusion et la conservation des corpus oraux » (édité par l’observatoire des pratiques linguistiques de la DGLFLF, Ministère de la culture) ;

• réaliser un corpus test selon le modèle défini. En effet, différentes structures numérisent et diffusent des corpus sonores, il devient important d’établir un dialogue et de prévoir des modalités d’échanges ou de transferts d’expériences entre ces différentes initiatives. L’utilisateur pourra ainsi travailler sur des corpus étendus et avoir à sa disposition des traitements diachroniques et synchroniques. L’interopérabilité permet d’établir une convergence de techniques et de formats : le traitement spécifique de chaque corpus en sera ainsi amélioré. Par exemple, pour un corpus en phonologie, il faudrait instaurer un protocole permettant l’ajout d’informations phonologiques de transcription tout en préservant les codages existants. De ce fait, il faut établir des analyses comparatives entre ces différents corpus sonores, tant du point de vue du contenu que des techniques et méthodologies mises en œuvres. Il s’agit notamment de normaliser des formats permettant la conservation et l’exploitation des données dans un souci d’interopérabilité. Nous pensons en particulier à l’utilisation du langage XML dans le traitement de corpus sonores. Il est devenu capital d’établir les points de convergences puis de mettre en place un programme d’échanges de techniques et de formats, pour permettre à la communauté scientifique en linguistique de travailler sur des corpus étendus. 2) Variling : traitement des variations linguistiques dans les corpus A partir de l’automne 2006, a démarré le projet Variling - Traitement des variations linguistiques dans les corpus soutenu dans le cadre de l’appel ANR Corpus et outils de la Recherche en Sciences Humaines et Sociales. L’objectif du projet vise à une restitution, dans

Page 112: Laboratoire Modèles, Dynamiques, Corpus

112

des formats informatiques, de données langagières non stabilisées et à l’élaboration de protocoles d’exploitation. La participation de MoDyCo à travers l’implication de Richard Walter est d’assurer la coordination du travail informatique des 4 équipes participantes aux projets (Orléans, Tours, Villejuif et Nanterre/Paris) ; chacune ayant un service informatique ou des informaticiens. Lors de la première année du projet, il a en particulier la responsabilité, en coopération avec le LACITO (CNRS) et le Laboratoire d’Informatique de Tours, du traitement informatique des corpus du projet et de la réalisation d’une l’infrastructure pour :

• La gestion de corpus électronique ; • Le système de médiation et édition électronique ; • L’interopérabilité des corpus mis en œuvre.

Ce travail de coordination et de mutualisation doit permettre de garantir l’interopérabilité des corpus, de développer des outils partagés et d’intégrer les recherches dans le cadre d’une politique conjointe de normes et de formats. 3) Atelier d’exploitation de corpus Cette opération de formation visait à proposer à l’ensemble des membres du laboratoire (chercheurs, enseignant-chercheurs, doctorants) un atelier axé sur l’exploitation des corpus qui associe une formation technique avec une réflexion méthodologique. Cette formation a été accompagnée de la mise en place au laboratoire d’outils d’aide à l’exploitation de corpus. Pour la description de ces différents outils, on se reportera à la section 1.5. « Le travail des ingénieurs, techniciens et administratifs ». Deux types de travaux ont été réalisés : - Développement d’une méthodologie d’analyse des interactions élèves-enseignants On a abordé la spécificité des textes d’interactions orales qui nécessitent un balisage particulier en TEI, avant d’être soumis à un traitement automatique. La collaboration de membres du laboratoire travaillant sur les corpus scolaires (voir plus haut « Ecrit et écriture scolaire ») avec les ingénieurs de recherche de MoDyCo a permis une réflexion méthodologique sur les unités pouvant être traitées une fois le balisage réalisé. Des décomptes manuels ont ensuite été effectués pour sélectionner les requêtes les plus pertinentes au regard de la problématique de recherche : la contribution des interactions orales à la construction de genres scolaires, en relation avec les productions écrites. - Par ailleurs, une assistance à certains doctorants pour la constitution de leurs corpus numérisés normalisés a été fournie. 2.b. Groupe de travail - Séminaire interne (7 réunions en 2005 et 2006) - Atelier de corpus oraux et écrits 2.c. Journées d’études Le groupe a organisé deux journées d’études : - Vers un modèle de corpus oral diffusable en ligne, et donc interopérable (20 janvier 2005, Nanterre), - Quelles convergences entre corpus oraux et corpus écrits pour un modèle de corpus oral interopérable (10 février 2005, École normale supérieure, Lettres et Sciences humaines, Lyon)

Page 113: Laboratoire Modèles, Dynamiques, Corpus

113

2.d. Contrats - Convention d’échange scientifique avec le laboratoire Lacito (CNRS) - Subvention de la Délégation générale à la Langue Française et aux Langues de France (ministère de la Culture) : 15 000 � - Trois contrats ANR :

• Le projet CONIQUE financé par l’ANR (2005- 2008) et piloté par Brigitte Grau associe le LIMSI (UPR 3251), le CEA et le MoDyCo (responsable Jean-Luc Minel).

• Le projet EIFFEL financé par l’ANR-RNTL associe les sociétés Antidot, Mondeca et les laboratoires de recherche de l’INRIA Rocquencourt, du LIRMM (UMR 5506) et le MoDyCo (responsable Jean-Luc Minel).

• Le projet TRAMEDWEB, financé par l’ANR (projet blanc 2006-2009) et piloté par Jean Davallon, associe les Equipes Culture et Communication de l’Université Avignon (EA 5131), le GRIPIC de l’Université Paris-Sorbonne (EA 1498) et le laboratoire MoDyCo (responsable Jean-Luc Minel).

3. Thèses en cours (2 dont 1 en cotutelle)

1. Stéphanie Weiser. CDD ANR, Repérage d’information spatio-temporelles dans des sites Web. Directeur J.-L. Minel.

2. Aiala Rosa : Identification automatique des marques d’opinion dans les textes. Directeur J.-L. Minel, cotutelle avec Dina Wonsever (Instituto Nacional de Computacion (Uruguay).

4. Thèses soutenues (3)

1. Javier Couto : Conception d’une plate-forme de Navigation textuelle. Université Paris-Sorbonne, 2006. Directeur J.-L. Minel.

2. Nikolai Goergiev : Méthodologie et outils associés pour l’extraction de données dans des pages Web. Directeurs J.-L. Minel et J.-M. Labat (Université Paris 5), 2006. Bourse CIFRE avec la société NetRatings.

3. Florence Amardeilh : Web Sémantique et Informatique Linguistique : propositions méthodologiques et réalisation d’une plate-forme logicielle. Directeurs J.-L. et P. Laublet (Université Paris 4), 2007. Bourse CIFRE avec la société Mondeca.

5. Production scientifique halshs-00096816, Battistelli D., Minel J.-L., 2006, Les systèmes de résumé automatique :

comment assurer une continuité référentielle dans la lecture des textes, Compréhension des langues et interaction, Lavoisier, 299-336.

halshs-00132034, Battistelli D., Minel J.L., R. Schwer S., 2006, Quelques exemples d’utilisation des S_langages pour le traitement de la temporalité en linguistique, Rémi Lehn, Mounira Harzallah, Nathalie Aussenac-Gilles, Jean Charlet (éds.), SDC Semaine de la Connaissance, 5.

halshs-00161906, Battistelli D., Minel J.-L., R. Schwer S., 2006, Représentation des expressions calendaires dans les textes : vers une application à la lecture assistée de biographies, Traitement Automatique des Langues, 47, 3, 1-26.

Page 114: Laboratoire Modèles, Dynamiques, Corpus

114

halshs-00158849, Couto J., Minel J.-L., 2007, Navigation textuelle : représentation des textes et des connaissances, Traitement automatique des langues, 47, 1.

halshs-00158910, Couto J., Minel J.-L., 2007, NaviTexte, a Text Navigation Tool, 10th Congress of Italian Association for Artificial Intelligence [www.springer.com]

halshs-00155087, Couto J., Minel J.-L., Lundquist L., 2007, La Navegación Textual en el contexto del aprendizaje de lenguas, InfoSur, 1, 27-38.

halshs-00161905, Couto J., Minel J.-L., 2006, Navigation textuelle : représentation des textes et des connaissances, Traitement Automatique des Langues, 47, 2, 1-24.

halshs-00080993, Couto J., Minel J.-L., 2006, SEXTANT, un langage de modélisation des connaissances pour la navigation textuelle, Schedae ISDD, 19, 1, 105-116.

halshs-00098024, Couto J., Lundquist L., Minel J.-L., 2005, Naviguer dans les textes pour apprendre, TALN 2005, 421-426.

halshs-00082852, Garron I., Minel J.-L., Souchier E., 2005, Citer, indexer ou cartographier ? De la circulation et de la lecture des textes relatifs à une ouvre littéraire sur Internet, Indice, Index, Indexation, Indice, Index, Indexation, 163-174.

halshs-00097849, Lundquist L., Minel J.-L., Couto J., 2006, NaviLire, Teaching French by Navigating in Texts, Information Processing and Management of Uncertainty in Knowledge-based Systems, 1093-1099.

halshs-00159874, Minel J.-L., 2007,Calendar Expressions Ordering in text Corpora, Battistelli D., Schwer S. (éds.), NLDB’07, Poster Session’s proceedings, 12th International Conference on Applications of Natural Language to Information Systems, 3-4.

hal-00022146, Minel J.-L., 2005, Evaluation des systèmes de résumé automatique, L’Evaluation des Systèmes de traitement de l’information, Lavoisier, 171-184.

hal-00022145, Minel J.-L., Desclés J.-P., 2005, Interpréter par exploration contextuelle, Interpréter en Contexte, Hermès.

hal-00022144, Minel J.-L., 2005, Réflexions autour de l’identification, la modélisation et la visualisation de certaines organisations textuelles, L’unité texte, Perspectives, 231-250.

halshs-00166837, Patrin-Leclère V., Berthelot-Guiet K., Jeanne-Perrier V., Jeanneret Y., Minel J.-L., 2007, Ecrire le journal radiophonique : l’actualité naturalisée, Tardy C., Jeanneret Y. (éds.), L’écriture des médias informatisés - Espaces de pratiques, Hermès – Lavoisier.

halshs-00166839, Souchier E., Bonnaccorsi J., Garron I., Labelle S., Minel J.-L., 2007, Réécritures appareillées : appropriations de l’oeuvre de Raymond Queneau sur Internet, Tardy C., Jeanneret Y. (éds.), L’écriture des médias informatisés - Espaces de pratiques, Hermès – Lavoisier.

Page 115: Laboratoire Modèles, Dynamiques, Corpus

115

1.3. UTILISATION DES CREDITS - PERIODE 2004-2007 1.3.1. BUDGET DE L’UNITE : SOUTIEN DE BASE, SUBVENTIONS EXCEPTIONNELLES ET RESSOURCES PROPRES Le tableau ci-dessous présente les données financières relatives à la période 2004-2007. Remarques - La période 2004-2005 ne prend pas en compte le budget alloué au LEAPLE (ex UMR 8606 avant 2006). Son intégration à MoDyCo est devenue officielle au 1er janvier 2006. - Pour 2007, la période prise en considération va de janvier à juillet. - Le montant des ressources propres prend en compte à la fois les montants versés de l’année et les éventuels reports des années précédentes. - Des montants indiqués pour les universités Paris 10 et Paris 5 ont été déduits les frais de gestion pris par l’université.

Dans le bilan financier, tous les montants ont été calculés TTC.

Année Dotation de base (TTC) Subventions exceptionnelles

(TTC)

Ressources propres (TTC)

Total (TTC)

CNRS Univ. Paris 10 Univ. Paris 5

2004 38 272 16 850 7 654 103 752 166 528

2005 38 272 24 225 100 657 163 154

2006 72 238 24 225 19 550 5 980 363 502 485 495

2007 71 042 24 225 19 550 24 091 423 927 562 835

Evolution du budget 1) L’augmentation de la dotation de base Paris 10 en 2005 (24 225 contre 16 850 en 2004) correspond à un réajustement effectué par rapport au précédent contrat quadriennal. 2) Les subventions exceptionnelles de 2007 comprennent les aides allouées :

a) par la DR5 : vacations de secrétariat ; b) par l’université Paris 10 et le CNRS : aide au déménagement des chercheurs situés sur le site de Villejuif et aménagement des nouveaux locaux.

3) L’augmentation de la dotation de base entre 2005 et 2006 correspond à l’intégration des chercheurs et enseignants-chercheurs du LEAPLE. Dans les faits, la dotation rapportée à l’ensemble des personnels n’a pas été modifiée. 4) Dans le même temps, c’est la part des ressources propres qui a connu une augmentation importante entre 2005 et 2006-2007. 1.3.2. LES RESSOURCES PROPRES Le graphique ci-dessous illustre ce que nous venons de mentionner, soit la forte proportion du montant des ressources propres comparativement à celui de la dotation de base.

Page 116: Laboratoire Modèles, Dynamiques, Corpus

116

��������������� ��������������������������

�������

�������

�������

�������

�������

�������

���� ���� ���� ���

���

�����

��� �������� ����

� ���� ���������

La part de la dotation de base représentait respectivement en 2004 et 2005 35 % et 38 % du budget. En 2006 et 2007, elle ne représente que respectivement 24 % et 21 % du budget. Le montant des ressources propres a été multiplié par un peu plus de 4 entre 2004 et 2007. Si la part des ressources propres a toujours été importante (65 % du budget en 2004), elle représente, en 2007, 79 % de notre budget. Cela s’explique essentiellement par l’obtention de projets financés par l’ANR. Nous indiquons ci-dessous la liste des principaux contrats et subventions effectifs dans les années 2005-2007. Ne sont indiqués que les contrats et subventions dont le montant est supérieur à 3 000 euros. Ne sont pas indiqués les laboratoires pilotes ou partenaires. Ils sont classés par date de signature.

Nom du resp.

scientifique

Prénom du resp. scientif.

Titre du contrat Financeur Date de

signature du contrat

Montant TTC

Durée en

mois

LAKS Bernard Traitement de la variation phonologique en français dans la communication orale (VARCOM)

PI - CNRS 01/10/2004 4 500 24

LEEMAN Danielle Colloque Prépositions

Univ. Paris 10 01/03/2005 10 840 12

NOYAU Colette ACI Lexique verbal Univ. Toulouse 2

01/04/2005 6 200 24

DELAVEAU Annie Grande Grammaire

Institut de Linguistique Française

12/04/2005 12 000 24

KAHANE Sylvain LexSynt Institut de Linguistique Française

12/04/2005 10 000 36

Page 117: Laboratoire Modèles, Dynamiques, Corpus

117

LAKS Bernard Corpus oraux et interopérabilité

DGLFLF 13/10/2005 15 000 24

BAKER Michael Information Society Technologies - LEAD Technology-enhance Learning and Problem-solving Discussions : networked learning Environments in the Classroom

Communauté européenne

01/12/2005 170 532 36

LAKS Bernard PFC Cor ANR Blanc 01/12/2005 60 055 36

MINEL Jean Luc Conique ANR Blanc 01/12/2005 93 330 36

MINEL Jean Luc Eiffel ANR-RNTL 01/12/2005 122 410 36

VENEZIANO Edy Effets langagiers Fondation de France

01/01/2006 13 000 36

LEEMAN Danielle Locutions prépositionnelles et locutions prépositives du français

Institut de Linguistique Française

09/02/2006 5 000 12

LE CUNFF Catherine Interactions dans le groupe et apprentissages scolaires

Univ. Paris10 23/03/2006 5 000 24

LEEMAN Danielle La préposition comme valeur

Univ. Paris 10 23/03/2006 10 400 12

LACHERET Anne Prosodie IUF 16/10/2006 15 245 12

LAKS Bernard Colloque intern. en hommage à Pierre Encrevé "Faire Signe"

DGLFLF 26/10/2006 10 000 12

LAKS Bernard GALILEE PAI Egide 27/10/2006 3 510 12

MINEL Jean Luc Tramedweb ANR Blanc 06/11/2006 30 160 36

PARISSE Christophe Polycat ANR Blanc 06/11/2006 36 824 36

ROSENTHAL Victor PerSemSoc ANR Blanc 06/11/2006 34 634 36

VENEZIANO Edy Emergram ANR Blanc 06/11/2006 118 656 48

de FORNEL Michel Variling ANR ENS-SHS 22/01/2007 30 000 36

LEEMAN Danielle Expressions figées, traduction, interculturel

Univ. Paris 10 01/03/2007 8 000 12

LE PESANT Denis PHC Star Egide 28/03/2007 15 000 24

Total 840 296

Page 118: Laboratoire Modèles, Dynamiques, Corpus

118

1.3.3. LE FONCTIONNEMENT DU LABORATOIRE SUR LE PLAN BUDGETAIRE Le budget du laboratoire sur la part de la dotation de base est réparti en 4 postes budgétaires. Selon les postes, la décision de dépense relève de la direction ou du conseil de laboratoire. Nous avons en effet adopté depuis 4 ans le principe de la non-autonomie budgétaire des équipes : le nombre inégal de personnes associé à chaque équipe rendait l’attribution a priori difficile ; le laboratoire est géré par une assistante-gestionnaire uniquement depuis le 1/01/2006. Le tableau ci-dessous présente les différents postes budgétaires, à qui incombe la décision de dépenses et le pourcentage alloué par postes (qui est voté en conseil de laboratoire en début d’année civile). Le pourcentage n’a pas varié depuis 3 ans.

Poste Décision de dépense Pourcentage de la dotation de base

Moyens communs Direction 30

Recherche scientifique personnes Direction et conseil de laboratoire

si le montant demandé est élevé

55

Recherche scientifique projets Conseil de laboratoire 8

Etudiants et jeunes chercheurs associés

Direction 7

Le conseil de laboratoire est informé à chaque tenue de l’état des dépenses par poste. 1.3.4. LES DEPENSES Pour 2004-2007, pour la dotation de base et les subventions exceptionnelles, le montant des dépenses réparties entre Fonctionnement, Equipement et Vacations est présenté dans le tableau ci-dessous :

Année Fonctionnement Equipement Vacations Total

2004 40 805 7 533 14 439 62 776

2005 47 498 12 499 1 875 61 872

2006 82 956 39 038 0 121 993

Jusqu’en juillet 2007 * 45 993 49 201 11 766 106 959 * Les dépenses jusqu’en juillet 2007 représentent 77 % de la dotation de base et des subventions exceptionnelles.

Page 119: Laboratoire Modèles, Dynamiques, Corpus

119

��������������������

������

������

������

������

�������

�������

�������

���� ���� ���� �������������������

���

�����

������ ��

������ ���

! ���� ��� ���

Commentaires 1) Vacations Les dépenses de vacations sont généralement faibles. En 2004, elles correspondent essentiellement à un contrat assuré par Atanas Tchobanov, avant sa prise de fonction au 1er décembre, sur la base d’une subvention exceptionnelle que nous avions reçue. En 2007, les dépenses de vacations ont augmenté. Tous les crédits alloués en personnels (de notre dotation de base ou par la délégation DR5) ont été utilisés à l’emploi de vacataires pour seconder la gestion et le secrétariat. Il faut en effet rappeler les éléments suivants : au 1/01/2006, lors de l’intégration du LEAPLE, l’équipe est demeurée dans les locaux qu’elle occupait sur le site de Villejuif. Elle a été temporairement gérée par l’UPS 2259. Ce n’est plus le cas depuis le 1/01/2007. De plus, depuis juillet 2007, ces chercheurs ont intégré les nouveaux locaux mis à notre disposition par l’Université Paris 10. Toujours depuis le début de l’année 2007, la mise en place des nouveaux logiciels de gestion par le CNRS a été chaotique. Le laboratoire ne dispose que d’une seule secrétaire-gestionnaire, nommée au 1/01/2006, soit dans un contexte antérieur à l’intégration du LEAPLE. La charge de travail pour le secrétariat et la gestion s’est donc considérablement accrue. 2) Equipement Les dépenses d’équipement sont variables selon les années. La priorité des dépenses est donnée au financement des missions et des actions du laboratoire. Elles sont beaucoup plus élevées ces deux dernières années : - en 2006, nous avons rénové une partie de notre parc informatique et nous avons acheté deux imprimantes en prévision de l’aménagement des nouveaux locaux mis à disposition par l’Université en 2007 ; - en 2007, ces dépenses correspondent essentiellement au financement de l’aménagement de nos nouveaux locaux (achats de mobilier, poursuite de l’achat de matériels informatiques pour le fonctionnement collectif). A ce titre, nous avons bénéficié : * d’une subvention exceptionnelle de 11 960 euros TTC, de la part du CNRS, devant couvrir les frais d’emménagement des chercheurs de Villejuif * d’une subvention exceptionnelle de 7 000 euros TTC, de la part de l’université Paris 10.

Page 120: Laboratoire Modèles, Dynamiques, Corpus

120

En juillet 2007, les dépenses liées à l’aménagement des nouveaux locaux s’élèvent à 35 500 euros TTC, soit une dépense nette pour le laboratoire, à partir de la dotation de base, de 16 540 euros. Toutes les dépenses nécessaires n’ont pas encore été engagées. On peut regretter à ce propos que la contractualisation d’une UMR sur 4 ans et l’obligation de fonctionner avec des budgets aux dépenses annualisées, sans possibilité de reports (depuis 3 ans à l’université, depuis le début 2007 au CNRS), empêche toute gestion prévisionnelle. La situation du laboratoire en 2007 est donc devenue extrêmement difficile. C’est le poste fonctionnement qui de facto s’est trouvé amputé d’une partie de ses moyens. 3) Fonctionnement Nous indiquons ci-dessous la répartition des dépenses de fonctionnement.

����������������������������������� �������

�"

��"

��"

��"

��"

���"

���� ���� ���� ������������������

���

�� �������

#�����

��� $���%��

& �� ������������

'���� ��

La répartition des dépenses reste relativement stable chaque année. Trois remarques toutefois : - on notera la baisse de nos frais de reprographie depuis que l’Université Paris 10 a passé un nouveau marché public (comparaison 2004 et les autres années 2007) ; - dans le poste « Autres », nous avons comptabilisé les frais d’infrastructure, transférés à l’UPS 2259, qui assurait la gestion des chercheurs localisés à Villejuif jusqu’en juillet 2007. Cela explique l’augmentation de ce poste pour les années 2006 et 2007 ; - depuis 2004, les dépenses pour les missions sont en proportion toujours les plus importantes. Cela correspond à une priorité du laboratoire. En 2007, et pour la première fois depuis 2004, les dépenses engagées pour les missions ont été limitées à un montant plancher par personne, aussi bien pour les membres permanents que pour les docteurs et les jeunes chercheurs associés. Pour que la part des missions financées reste le poste le plus important (67 % du fonctionnement depuis début 2007), c’est au détriment d’autres dépenses (documentation, consommables de bureau essentiellement). Le soutien financier des doctorants et des jeunes chercheurs associés Depuis 2004, la direction du laboratoire et le conseil a voté l’existence d’un poste budgétaire spécifique concernant les doctorants et les jeunes chercheurs associés. Il est doté à hauteur de

Page 121: Laboratoire Modèles, Dynamiques, Corpus

121

7 % du soutien de base, excepté pour l’année 2007, où il a été calculé sur un soutien de base diminué des différentes provisions que nous avons dû faire en vue de l’aménagement de nouveaux locaux (cf. ci-dessus dépenses d’équipement s’élevant à plus de 16 000 euros, financés par la soutien de base). Depuis 2005, il est alimenté par les subventions obtenues auprès de l’Ecole doctorale « Connaissance, Langage, Modélisation » (mais aussi par la Mairie de Nanterre pour le colloque jeunes chercheurs). Jusqu’à la fin 2006, il était aussi largement alimenté par les reports que nous avions d’une année sur l’autre. Ce n’est plus le cas en 2007. Aussi en 2007, le financement des étudiants est beaucoup plus difficile. Pour la première fois depuis 2004, nous avons décidé en début d’année de fixer une somme maximale à laquelle les doctorants et jeunes chercheurs associés pouvaient prétendre. Nous indiquons dans le tableau ci-dessous le montant des dépenses pour les doctorants et jeunes chercheurs associés.

���������������

�� �������������������� ��������� ����������

�����

�����

�����

�����

������

������

������

���� ���� ���� �������������������

���

�����

Nous indiquons dans le tableau ci-dessous la répartition des dépenses en fonction des types de soutien : soutien de base et soutiens extérieurs.

Page 122: Laboratoire Modèles, Dynamiques, Corpus

122

���������������������

�� ����������� �����������������

�"��"��"��"��"��"��"�"��"(�"���"

���� ���� ���� �������������������

���

�� ������

) ��������*�+������

� ���� ���������

Comme nous l’indiquions plus haut, depuis 2005, la part des soutiens extérieurs et notamment de l’Ecole doctorale « Connaissance, Langage, Modélisation » est très importante (toujours plus de 30 % des montants). Depuis 2007, pour les raisons énoncées ci-dessus, la répartition s’est inversée : 60 % des dépenses ont été jusqu’à maintenant financées par des soutiens extérieurs. 1.4. LA POLITIQUE DE FORMATION VIS-A-VIS DES DOCTORANTS MoDyCo est un laboratoire fortement lié avec la formation et l’enseignement. En effet, la plupart des enseignants-chercheurs de l’université Paris 10 sont rattachés à MoDyCo. Ces dernières années, l’un des responsables du Département Sciences de Langage était aussi membre de MoDyCo. En outre, l’Ecole Doctorale « Connaissance, langage, modélisation », dont relève MoDyCo, est dirigée par D. Leeman, qui est aussi membre du laboratoire. Ces liens ont permis une excellente mise en place du LMD. C’est ainsi que la plupart des étudiants en Sciences du langage sont inscrits au laboratoire. MoDyCo a ainsi développé depuis quelques années une politique de soutien très active envers les doctorants : - le laboratoire soutient financièrement les doctorants et les jeunes chercheurs associés pour ce qui concerne le financement des missions (cf. poste budgétaire spécifique et bilan financier) ; - ils bénéficient du soutien des ITA dans leur travail de recherche ; - ils sont invités à communiquer le résultat de leurs recherches dans le cadre du séminaire du laboratoire ; - ils participent et/ou co-organisent les groupes de travail liés aux différentes opérations du laboratoire ; - deux étudiants ou jeunes chercheurs associés sont membres pleins du conseil de laboratoire, ils ont un mandat d’au maximum deux ans ; - depuis 2005, les représentants étudiants au conseil de laboratoire organisent une journée d’accueil des doctorants, qui a lieu à l’automne (présentation et programme sur le site : http://www.modyco.fr/?events:reunionsinstitutionnelles)

Page 123: Laboratoire Modèles, Dynamiques, Corpus

123

- depuis 2004, le laboratoire soutient l’initiative des doctorants et des jeunes chercheurs dans l’organisation d’un colloque jeunes chercheurs. Le colloque a eu lieu tous les ans depuis 2004 (présentation et programme sur le site : http://www.modyco.fr/?events:colloques) ; - depuis 2007, les docteurs et jeunes chercheurs associés ont organisé deux journées d’études (1 journée et une demi-journée), intitulées « Etat des recherches des doctorants » (ERD), au cours desquelles les doctorants présentent l’état d’avancement de leur travaux. La demande des doctorants a été particulièrement forte. Aussi la formule sera reconduite dans les années qui viennent (présentation et programme sur le site : http://www.modyco.fr/?events:workshops). Les éléments négatifs portent sur leurs conditions de travail, tout au moins pour la période allant jusqu’à juillet 2007. Le laboratoire ne pouvait mettre à leur disposition qu’un bureau comportant 4 postes de travail. Au vu du nombre de doctorants inscrits (119), la situation était déplorable. La mise à disposition de nouveaux locaux pour le laboratoire a été l’occasion de revoir ce point noir. Ils disposent désormais d’une salle de cours, permettant à une vingtaine d’entre eux de travailler dans des conditions correctes. Cette salle est par ailleurs située à l’étage au-dessus des bureaux occupés par les Ecoles doctorales. Ce nouvel aménagement n’est certes pas une panacée, mais il améliore grandement la situation antérieure. 1.4.1. BILAN DOCTORANTS 1.4.1.1. La durée de la thèse : décisions de l’Ecole doctorale « Connaissance, langage, modélisation » L’Ecole doctorale « Connaissance, langage, modélisation » ayant pris les décisions suivantes : - les thèses ont une durée de 3 ans ; - une quatrième année peut être accordée sur demande du directeur de thèse ; - une cinquième année ne peut être accordée qu’à titre dérogatoire ; le laboratoire s’est inscrit dans cette nouvelle politique. Il a fait un effort particulier pour responsabiliser les directeurs et encourager les soutenances. Depuis 2007, les étudiants inscrits en thèse depuis plus de 5 ans ne sont plus soutenus par le laboratoire. Ils demeurent cependant inscrits sur le site du laboratoire, qui est le lieu de gestion de nos listes de diffusion, afin de bénéficier des annonces concernant la vie scientifique du laboratoire. Par ailleurs, suite au précédent rapport de la section 34 (rapport à mi-parcours), le laboratoire s’est engagé dans une politique plus volontariste pour identifier et soutenir les étudiants réellement impliqués dans leur travail de thèse (cf. aussi infra). Le nouveau site a constitué un instrument efficace pour mieux répertorier les étudiants, mais aussi pour mieux les impliquer dans la vie du laboratoire (fiche perso, annonce de soutenance, annonce d’événement, liste de diffusion, etc.). Cela a conduit nécessairement à certains réaménagements du point de vue des effectifs. Le graphique ci-dessous récapitule le nombre d’étudiants inscrits par année d’inscription. Les trois étudiants inscrits depuis plus de 5 ans (années 1999 à 2001) ont connu d’importantes difficultés tout au long de leur thèse. Ils se sont engagés à soutenir à l’automne 2007. Cet engagement est aussi celui de la majorité des étudiants inscrits en 2002.

Page 124: Laboratoire Modèles, Dynamiques, Corpus

124

��������������������

������������������

� � �

��

��

��

��

��

��

��

��

��

��

�((( ���� ���� ���� ���� ���� ���� ���� ���

1.4.1.2. Le financement des doctorants Seuls 17 % des étudiants inscrits en thèse ont une bourse, comme le montre le graphique ci-dessous.

��������������������

�" ��"

��"

�"

��"

��"

��"

��"

��"

��"

�"

, ���� )�����+ #����

La situation n’est donc pas très satisfaisante. Même si l’on sait que c’est souvent le cas en SHS, il n’en reste pas moins que l’incidence sur la fin de la thèse est importante (cf. financement des docteurs (voir infra), où la part des docteurs financés par des bourses s’élève à 25 %).

Page 125: Laboratoire Modèles, Dynamiques, Corpus

125

1.4.1.3. Les thèses en cotutelle Les thèses en cotutelle sont au nombre de 21 ; elles représentent 18 % des thèses inscrites dans le laboratoire et associent 8 pays différents :

������������������ ���������� �

��������(

#��� �$��

����$��

-�.��

/�����

0 �1.$�

2�3�4,��

�����

5��$��3

�� �

����������������������

Les universités impliquées sont les suivantes :

Université Nombre d’étudiants en cotutelle

Université Nombre d’étudiants en cotutelle

Instituto Nacional de Computacion (Uruguay)

1 Université de Potsdam (Allemagne)

4

Université autonome de Barcelone (Espagne)

1 Université de Salerne (Italie)

1

Université d’Athènes (Grèce)

1 Université d’Oslo (Norvège)

1

Université de Brescia (Italie)

1 Université pédagogique d’Orenbourg (Russie)

1

Université de Fribourg-en-Brisgau (Allemagne)

1 Université Radboud de Nimègue (Pays-Bas)

1

Université de Milan (Italie)

1 Université Roma 3 (Italie) 2

Université de Moscou (Russie)

1 Université Tcheliabinsk (Russie)

1

Université de Munich (Allemagne)

3

Nombre d’étudiants : 21

Le laboratoire via les politiques développées par l’université et notamment par l’Ecole doctorale « Connaissance, langage, modélisation », a vivement encouragé les étudiants à effectuer leur thèse en cotutelle. La possibilité d’obtenir un diplôme et le titre de docteur dans

Page 126: Laboratoire Modèles, Dynamiques, Corpus

126

deux pays, la rencontre d’autres chercheurs et la confrontation des systèmes d’enseignement et d’encadrement, de même que et celle des méthodes de travail, la possibilité enfin d’obtenir des aides financières sont des avantages reconnus par tous, qui l’emportent sur les difficultés (système de notation, calendrier, organisation de la soutenance). 1.4.1.4. La direction de thèse En 2007, 25 directeurs sur les 38 HDR du laboratoire encadrent des doctorants (soit 66 %). Répartition chercheurs / enseignants-chercheurs Parmi ces 25 directeurs, on compte seulement 3 CNRS. La situation est donc déséquilibrée, comme dans beaucoup de laboratoires. Mais on peut aussi la relier à la récente intégration du LEAPLE, qui rassemblait plus de chercheurs HDR que MoDyCo. Ces chercheurs sont désormais associés de manière privilégiée à l’université Paris 10 plutôt qu’à l’université Paris 5. Et il faudra donc un peu de temps pour corriger cette situation. Nombre de thèses encadrées par personne Si chaque directeur encadre en moyenne 5 thèses, l’analyse de la répartition par personne montre une situation qui n’est pas optimale. Les données sont indiquées dans le tableau ci-dessous :

Nombre de directeurs de thèses encadrant

4 1 thèse

3 2 thèses

5 3 thèses

2 4 thèses

4 5 thèses

2 6 thèses

1 7 thèses

1 8 thèses

1 11 thèses

1 12 thèses

1 16 thèses

Le déséquilibre est important : 3 personnes encadrent plus de 10 thèses ; le maximum de thèses encadrées par une même personne étant de 16. Avec la mise en place de l’Equipe de formation doctorale, nous entendons, dans les années qui viennent, corriger cette répartition (cf. infra). Comme point positif, on notera que les enseignants-chercheurs HDR, récemment nommés au département de Sciences du langage, pratiquement dès le début de leur engagement, se sont engagés dans la direction de thèses.

Page 127: Laboratoire Modèles, Dynamiques, Corpus

127

1.4.2. BILAN DOCTEURS 1.4.2.1. La durée moyenne des thèses et leur financement 78 % des thèses soutenues entre octobre 2003 et juillet 2007 ont été réalisées en 5 ans ou moins (46 % en 3 ou 4 ans).

! �������������� �� ��

��"

��"��"

��"

�"

�"

��"

��"

��"

��"

��"

��"

����� ����� ����� 6������

En ce qui concerne le financement des thèses soutenues, comme nous le soulignions précédemment, 25 % des docteurs ont bénéficié d’une bourse. Il n’en reste pas moins que 75 % docteurs n’ont eu aucun financement ou ont eu un travail salarié. Les données sont présentées dans le graphique ci-dessous :

������������������������� �� ��

��" ��"

��"

�"

��"

��"

��"

��"

��"

��"

, ���� )�����+ #����

1.4.2.2. Le nombre de soutenances par année Nous présentons dans le graphique ci-dessous le nombre de soutenances par année.

Page 128: Laboratoire Modèles, Dynamiques, Corpus

128

���������� ������������

����

��������������

����7 �� ���4�+�� ���8

���� ���� ���� 9������������������

���

��������

�� ������

On note des différences importantes selon les années : - Pour 2003, nous avons fait état des soutenances qui ne figuraient pas dans le précédent rapport quadriennal. - Pour 2007, la première période de l’année n’est pas celle au cours de laquelle les étudiants soutiennent le plus. Un nombre important de soutenances est annoncé pour la fin de l’année (tous les étudiants inscrits en thèse depuis plus de 5 ans, la plupart des étudiants inscrits en 2002 et quelques autres). Le nombre de soutenances en 2007 devrait dépasser le nombre de soutenances des années 2005 ou 2006. - L’augmentation nette en 2005 et 2006 par rapport à 2004 s’explique par les deux intégrations que le laboratoire a réalisées. 1.4.2.3. Le devenir des docteurs Si nous avons noté ça et là différents points que nous avons à améliorer, l’examen de la situation professionnelle des docteurs souligne la qualité de la formation dispensée : près de 80 % ont un emploi ; 36 % ont trouvé un emploi dans le supérieur en France ou bien à l’étranger.

!�"����������� ��

��"

��"

��"

�"�"

��"��"

��"��"

��"��"

��"��"

��"

� �� ������������+�����

#������ �� � � �� ����+�����

Page 129: Laboratoire Modèles, Dynamiques, Corpus

129

1.4.3. LIENS AVEC L’ECOLE DOCTORALE 139 ET L’EQUIPE DE FORMATION DOCTORALE Le laboratoire MoDyCo entretient des liens très étroits avec l’Ecole doctorale 139 « Connaissance, langages et modélisation » de Paris 10 : http://www.u-paris10.fr/90169240/0/fiche_7C__pagelibre/ Il a été partie prenante de sa fondation et est encore aujourd’hui représenté à son conseil scientifique. L’équipe de formation doctorale 86 des 119 thèses encadrées par le laboratoire sont inscrites dans cette école doctorale en 2006-2007. 35 des 44 thèses soutenues entre fin 2003 et juillet 2007 relèvent de cette ED. En tant que le laboratoire constitue l’une des équipes d’encadrement doctoral de l’ED 139, celle-ci, chaque année, a accordé une allocation de recherche pour thèse à un doctorant de MoDyCo. Dans le cadre de la politique de l’ED 139, et en application de la réforme LMD, a été mis en place au sein du laboratoire MoDyCo, une équipe de formation doctorale (qui regroupe tous les enseignants et chercheurs participant à cet encadrement). Cette équipe a en particulier pour tâches : - d’assurer la visibilité nationale et internationale des thèses préparées à MoDyCo, - de fournir aux doctorants un complément de formation technologique (informatiques, statistiques, web etc.) et linguistiques (cours de langues, formation à la communication scientifique en anglais etc.) - de les aider dans leur parcours de professionnalisation ; - de les aider dans la recherche de financements pour leurs recherches ; - d’assurer un encadrement scientifique et pédagogique spécifique afin de garantir la qualité internationale des recherches. Direction L’équipe de formation doctorale de MoDyCo est dotée d’une direction composée pour chaque niveau de responsabilité d’un binôme chercheur CNRS/enseignant chercheur (excepté pour les relations internationales) : - Directeur scientifique : Bernard Laks (Directeur de MoDyCo) - Directeurs pédagogiques : Sarah Leroy (CNRS) et Anne Lacheret (Professeur) - Directeur pour les relations internationales : François Muller (Professeur) et Denis Le Pesant (Professeur) - Directeurs pour le soutien financier : Christian Hudelot (CNRS) et Marcel Cori (Professeur) - Directeurs pour la professionnalisation : Christophe Parisse (INSERM) et Jean-Luc Minel (CNRS). Rôle L’équipe de formation doctorale prend en charge l’encadrement de chaque thésard. Elle assure la sélection des candidatures à l’inscription en thèse. Conformément à la politique de l’ED 139, elle veille à ce que les directeurs de thèses et les doctorants se conforment à la Charte des Thèses mise en place. Avec le Conseil Scientifique de l’ED, l’équipe de formation doctorale est garante de l’équité, de la transparence et de la cohérence des critères d’évaluation des thèses, au moment de leur inscription, dans le déroulement des recherches, avant et lors de la soutenance et lors des interclassements pour allocations de recherches, contrats post doctoraux ou bourses de recherches diverses.

Page 130: Laboratoire Modèles, Dynamiques, Corpus

130

Formation doctorale internationale Le laboratoire MoDyCo participe activement à la mise en place d’une politique internationale de l’ED 139. Celle-ci a notamment pris la forme de la création d’une Ecole Doctorale Internationale dont MoDyCo est membre. Cette école regroupe les universités de Postdam, Roma 3, Madrid 3, Lisbonne et plus récemment Uppsala. Les activités de l’EDI, outre les échanges de doctorants, sont notamment marqués par un colloque annuel (Florence 2005, Rome, 2006, Lisbonne 2007). Les chercheurs de MoDyCo ont participé à chacun de ces colloques et un effort particulier a été fait pour la participation des thésards ou jeunes docteurs. Dans le cadre de cette EDI, se sont également mis en place des collèges doctoraux bi-nationaux particulièrement utiles pour permettre aux jeunes doctorants d’acquérir une expérience internationale et éventuellement de s’intégrer à des projets de recherche bilatéraux. Via l’ED 139, le laboratoire est ainsi partie prenante du collège doctoral franco-allemand (plus particulièrement centré sur la syntaxe et les modèles), du collège doctoral franco-suédois (plus particulièrement centré sur la linguistique textuelle) et du collège franco-bavarois (plus particulièrement centré sur la sociolinguistique et la dynamique des usages). D’autres collèges doctoraux binationaux sont en cours de constitution. Séminaires doctoraux Outre le séminaire interne du laboratoire et le colloque des jeunes chercheurs de MoDyCo, les doctorants du laboratoire participent également aux séminaires de l’ED et aux formations transversales mises en place à leur intention. Le laboratoire participe activement à l’encadrement de ces activités. Le séminaire de l’ED a pris au cours des 3 dernières années un caractère international. Regroupant des doctorants de Postdam, de Rome et de Paris 10 en sciences du langage et en sciences de l’éducation, il s’est tenu en 2006 à Veroli (Rome). Le laboratoire a soutenu financièrement cette opération et participé à son animation scientifique. Le séminaire transversal de l’ED a également mobilisé le laboratoire, qui a assuré chaque année l’encadrement d’un module. Le programme scientifique de 2008-2010 est consacré aux darwinisme et le laboratoire y prendra à nouveau toute sa place. Chacun des séminaires, nationaux ou internationaux de l’ED donne lieu à la publication d’un livret d’actes aux Presses Universitaires de Paris 10. Université européenne d’été En 2006 puis en 2007, l’ED 139 a mis en place une Université Européenne d’Eté à l’aide de financements européens et du ministère français de la recherche. Chaque année, le laboratoire MoDyCo a pris en charge l’organisation de l’une de ces journées : en 2006 sur le thème de la syllabe ; en 2007 sur celui de la modélisation. Associant à parité jeunes doctorants et chercheurs seniors, ces journées ont accueilli des linguistes issus d’une dizaine de pays européens avec lesquels MoDyCo est en relation de travail (cotutelles de thèse, projets bilatéraux européens, programmes des universités bi-nationales). Chacune de ces journées à fait l’objet de la publication d’un volume d’Actes, édité par un jeune chercheur, aux Presses Universitaires de Paris 10.

Page 131: Laboratoire Modèles, Dynamiques, Corpus

131

1.4.4. LES CNRS ET L’ENSEIGNEMENT Le laboratoire MoDyCo entretient des relations très étroites avec l’Ecole doctorale 139 « Connaissance, Langage, Modélisation » dirigée par Danielle Leeman, par ailleurs membre du laboratoire et de son Conseil. Dans ce cadre, les collègues habilités de MoDyCo participent à l’encadrement doctoral mis en place (cf. § 1.4.3.). Par ailleurs, le laboratoire est fortement lié au département de sciences du langage de Paris 10, où des collègues CNRS participent aux enseignements dispensés :

• Jean-Luc Minel outre les cours de TAL et d’ingénierie des langues qu’il dispense participe au groupe de travail chargé de définir la maquette des enseignements dans ces disciplines ;

• Atanas Tchobanov donne un enseignement en information et communication. Le laboratoire est aussi lié, depuis l’intégration du LEAPLE, à Paris 5 et à son Ecole doctorale :

• Jean-Pierre Jaffré intervient dans le cursus dirigé par L. Danon-Boileau à Paris 5 ; • Christian Hudelot enseigne régulièrement en psycholinguistique à Paris 5 et a donné

des cours à Poitiers ; Enfin les chercheurs CNRS dispensent des enseignements à l’extérieur de Paris 5 ou Paris 10 :

• Michael Baker donne un enseignement de psycholinguistique à Lyon 2, Clermont 2, à Paris 5, Paris 6, Stockholm et Neuchâtel ;

• Sarah Leroy a donné plusieurs cours en linguistique française et en méthodologie de la recherche, à Paris 7 et en Algérie (Ecole Doctorale Algéro-Française) ;

• Victor Rosenthal assure des cours à l’EHESS, Linguistique et psychologie culturelle. • Jean-Marie Vidal a assuré régulièrement des cours à Brest, Caen et Rennes.

1.5. LE TRAVAIL DES INGENIEURS, TECHNICIENS ET ADMINISTRATIFS En septembre 2007, le laboratoire MoDyCo compte 8 ingénieurs et techniciens (2 IR, 3 IE, 2 AI, 1 T) titulaires (CNRS et INSERM), ce qui, rapporté au nombre de chercheurs (14) CNRS et INSERM et d’enseignants-chercheurs (53) place le laboratoire dans les unités faiblement dotées. Cette sous-dotation, associée à une conception du travail d’ingénierie, a amené la direction du laboratoire, en accord avec le conseil de laboratoire et les personnels concernés, à impliquer les ITA dans les projets de recherche plutôt que de mettre en place des services communs, à l’exception de deux ITA qui sont impliqués dans la gestion opérationnelle du laboratoire :

• Mme Danielle Joseph (AI) est affectée au secrétariat et à la gestion administrative du laboratoire. Elle a en charge la gestion administrative, financière du laboratoire et la gestion des personnels. En 2007, le laboratoire a engagé deux vacataires en CDD (équivalent 6 mois et demi) pour aider D. Joseph dans sa tâche (une partie a été financée par la DR5, une autre sur notre dotation de base).

• M. Xavier Monnin (T) administre le parc informatique (deux serveurs sur lesquels sont implantés le système d’information et les données de gestion et une cinquantaine de postes individuels).

Les autres ingénieurs sont impliqués dans les projets de recherche (dont huit projets ANR et quatre projets internationaux) et participent activement au suivi et/ou au pilotage de ceux-ci.

Page 132: Laboratoire Modèles, Dynamiques, Corpus

132

Les résultats obtenus sous la forme de publications, de diffusion de logiciels et de valorisations des travaux (sites internet) témoignent du bien-fondé de cette politique. Par ailleurs, en 2007, un atelier de formation à l’exploitation des corpus écrits ou oraux a été mis en place par trois ITA (Denise Malrieu, Jean-Luc Minel, Atanas Tchobanov). Cet atelier ouvert à tous les membres du laboratoire, y compris les doctorants et les jeunes chercheurs associés, a associé une formation technique (XML et logiciels de traitements) avec une réflexion méthodologique. Deux axes de travail ont été privilégiés : un axe sur la sémantique du balisage et un axe sur la navigation textuelle. Une des retombées de cet atelier est la mise en place d’une plate-forme technique qui donne accès à différents logiciels de traitement de corpus :

• Unitex (http://www-igm.univ-mlv.fr/~unitex/) Ce logiciel (développé à l’Institut Gaspard Monge) permet de spécifier des grammaires locales, par l’intermédiaire d’une interface graphique. Unitex dispose de dictionnaires (plus d’une dizaine de langues) ce qui permet d’effectuer des traitements morphologiques et morpho-syntaxiques et d’annoter le texte.

• LinguaStream (http://www.linguastream.org/whitepaper.html) LinguaStream (développée au Greyc) est une plate-forme de traitement linguistique qui intègre un étiqueteur morpho-syntaxique (Tree Tagger) et un générateur de règles d’annotations (fondé sur les grammaires DCG).

• Corpus Reader (http://panini.u-paris10.fr/~sloiseau/CR/) CorpusReader (développé à MoDyCo par Sylvain Loiseau) est un programme qui vise à faciliter la manipulation et l’interrogation de corpus conformes aux recommandations TEI en exploitant la richesse du format XML. Il est particulièrement adapté aux corpus volumineux et aux corpus dont l’annotation est complexe et enchevêtrée.

• Syntex (www.univ-tlse2.fr/erss/) Syntex (développé à l’ERSS) est un analyseur syntaxique robuste. Il prend en entrée un fichier texte et fournit en sortie plusieurs fichiers au format XML qui décrivent des informations de type morpho-syntaxique et syntaxique (analyse en dépendance).

• NaviTexte (http://panini.u-paris10.fr/jlm/?Start:projets:NaviTexte) NaviTexte (développé à MoDyCo) est un logiciel de visualisation et de navigation textuelle qui permet de programmer, sous la forme d’opérations de navigation, des parcours dans des textes. Les opérations de navigation exploitent les annotations (morphologiques, morpho-syntaxiques, discursives).

1.6. LA POLITIQUE DE DIFFUSION ET DE VALORISATION DES CONNAISSANCES 1.6.1. LES SITES 1) Le portail MoDyCo (www.modyco.fr) Afin d’améliorer la gestion du laboratoire et de répondre aux besoins engendrés par la croissance du laboratoire, la direction du laboratoire a décidé en juin 2006 de mettre en place un système d’information qui intègre l’ensemble des données, administratives, financières et scientifiques de MoDyCo. Le nouveau site est opérationnel depuis mars 2007. Ce système d’information offre les fonctionnalités suivantes :

Page 133: Laboratoire Modèles, Dynamiques, Corpus

133

• Il offre aux membres du laboratoire la possibilité de suivre l’activité scientifique des équipes (journées d’études, groupes de travail, soutenance de thèses, etc.) et de participer aux différents groupes de travail qui sont mis en place (Figure 1). Il sert aussi d’instrument pour l’animation du séminaire : préparation des séances, calendrier, diffusion des textes, etc.

• Il constitue aussi un référentiel qui permet aux membres du laboratoire, qui ne sont pas présents sur le site de Nanterre, d’être informés des activités du laboratoire. Cette fonctionnalité est aussi ouverte à toutes les personnes extérieures au laboratoire.

Figure 1 : Le portail MoDyCo

• Il valorise la production scientifique du laboratoire en donnant accès, via une interface

intégrée au serveur HAL-SHS, à l’ensemble des publications des membres du laboratoire. Pour ce faire, tous les membres du laboratoire alimentent la collection MoDyCo créée sur serveur HAL-SHS3. En juillet 2007, la communauté scientifique a ainsi accès aux 136 articles et aux 954 notices bibliographiques de la collection MoDyCo (Figure 2). Par ailleurs, un fil RSS affiche sur le portail les dernières publications des membres du laboratoire (Figure 1).

3 Afin d’assister les membres du laboratoire dans cette activité de saisie, la direction et le conseil de laboratoire ont mis en place, au départ et pour une période limitée, un soutien assuré par une jeune chercheur du laboratoire (Houda Ounis) pour une période limitée.

Page 134: Laboratoire Modèles, Dynamiques, Corpus

134

Figure 2 : Accès à la collection MoDyCo

• Il constitue pour la direction un outil de gestion du laboratoire en donnant accès à l’ensemble des informations administratives.

• Un Intranet (Figure 3) fournit aux membres du laboratoire l’accès à des ressources scientifiques et à des informations spécifiques (règlement intérieur, comptes-rendus de réunions, demandes d’ordre de mission, formulaires administratifs, gestion des congés, etc.). Un dispositif de vote électronique (conseil de laboratoire, élection des représentants étudiants) a été aussi mis en place.

Figure 3 : Accès à l’Intranet

Figure 4 : Intranet Membres

Page 135: Laboratoire Modèles, Dynamiques, Corpus

135

Le comité éditorial Le système d’information est placé sous la responsabilité d’un comité éditorial constitué de sept membres du laboratoire, qui se réunit régulièrement pour définir la politique éditoriale, proposer de nouvelles fonctionnalités éditoriales et valider les choix techniques. Il a piloté l’important transfert de données des données de l’ancien site vers le nouveau site. Les réunions du comité éditorial sont annoncées sur le site (Rubrique « Réunions institutionnelles »). Il se réunit tous les trois mois pour faire un point complet sur le site. Mais afin d’être le plus réactif possible, il se réunit dès qu’une demande particulière est formulée par l’un des membres. Politique éditoriale En 2007, le comité éditorial a considéré les points suivants comme prioritaires : - du point de vue des utilisateurs externes et des membres de MoDyCo, le développement des différents menus et rubriques ; de même la visibilité des manifestations scientifiques organisées par le laboratoire (séminaires, journées d’études) et la visibilité de la production scientifique de ses membres ; - du point de vue des membres de MoDyCo, les différentes rubriques de l’intranet : diffusion d’informations scientifiques et institutionnelles, listes de diffusion des membres du laboratoire, comptes-rendus, règlement intérieur, rapports institutionnels, annuaire des membres, formulaires ; des outils d’aide ont été aussi mis en ligne (aide à la planification de rendez-vous, système de partage de fichiers) - du point de vue de la direction, les différentes bases de données alimentant le site (base des personnels, questions financières) ; les outils de gestion du site. Le comité éditorial a aussi organisé deux jours de formation pour les membres du laboratoire, afin qu’ils se familiarisent avec le maniement des « fiches perso » et l’inscription des événements dans le calendrier. Des fichiers d’aide ont été créés. Afin d’évaluer la pertinence de ses choix, le comité s’appuie entre autre sur un outil d’audit qui lui permet de suivre en temps réel l’activité du site. Ce suivi indique que la fréquentation du site est importante : du 1er avril au 3 juillet, plus de 8 900 visites (plus de 29 300 pages ont été visitées) ; en moyenne les visiteurs consultent un peu plus de 3 pages (alors que toutes les rubriques ne sont pas finalisées) ; en moyenne 64 % de nouveaux visiteurs (le ratio nouveaux visiteurs / anciens visiteurs ne chute pas). Le spectre géographique, national et international, est extrêmement varié (plus d’une trentaine de pays). Gestion technique Le système d’information a été réalisé en s’appuyant sur le logiciel UNAK qui est un CMS développé par Atanas Tchobanov, ingénieur de recherche à MoDyCo. Ce logiciel est par ailleurs distribué et diffusé en « Open Source » ce qui en garantit la pérennité. Depuis janvier 2007, le site est administré par Xavier Monnin, en collaboration avec Atanas Tchobanov.

Page 136: Laboratoire Modèles, Dynamiques, Corpus

136

2) Les sites spécifiques Parallèlement à la mise en place du portail MoDyCo, le laboratoire développe une politique diffusion des connaissances via des sites spécifiques à des projets propres ou menés en collaboration avec des équipes internationales : a) Le site du projet Phonologie du français contemporain (http://www.projet-pfc.net/) Le projet PFC est devenu en quelques années la référence pour les ressources phonologiques françaises en ligne. Il est en première place dans les moteurs de recherche internet avec les mots clés phonologie + français et sa popularité est croissante, avec plus de 12 000 visites annuelles en provenance de 130 pays. Avec un accès en ligne à 24 points d’enquêtes, 259 locuteurs et plus de 100 heures d’enregistrements transcrits et codés, le site destiné aux initialement aux chercheurs a évolué pour offrir une interface aux spécialistes de l’enseignement du français et, plus généralement, proposer une vitrine du français oral dans le monde. b) Le site de l’European Corpus Phonology Group (CorPho) (http://www.corpho.eu/) Le groupe européen de phonologie de corpus (European Corpus Phonology Group) a pour objectif l’établissement de standards pour les métadonnées des corpus phonologiques et la publication d’un ouvrage de référence sur la phonologie de corpus. Le site offre une plateforme de discussion et de diffusion des ressources du groupe Corpho. c) Le site du projet LexSynt (http://lexsynt.inria.fr/index.php) Le projet LexSynt (Lexiques syntaxiques et interface lexique-grammaire, http ://lexsynt.inria.fr), coordonné par Sylvain Kahane, est un projet coopératif, soutenu par l’ILF, dont l’objectif est de mettre à disposition des lexiques du français qui puissent être utilisés comme composante lexicale d’un modèle syntaxique à large couverture. La première manifestation du projet LexSynt a été une journée Atala organisée par S. Kahane en 2005 (Interface lexique-grammaire et lexiques syntaxiques et sémantiques ; http://www.atala.org/article.php3?id_article=240, 13 communications, 70 participants). Le projet rassemble aujourd’hui une trentaine de participants de 12 équipes : 6 équipes rattachés à l’ILF (MoDyCo, Atilf, ERSS, IGM, Lattice, LPL), 4 équipes INRIA (Atoll, Calligramme, Langue et Dialogue, Signes), 2 équipes étrangères (AKV à KULeuven, OLST à U. de Montréal). Le projet a favorisé le développement et la mise en ligne de 3 ressources : le Dicovalence (bach.arts.kuleuven.be/dicovalence), le Lefff (www.lefff.net) et les tables du lexique-grammaire, dont l’intégralité devrait bientôt être disponible. Un projet, GrammoFun, avec S. Kahane comme coordinateur, a été soumis en 2006 à l’ANR Blanc. Une refonte du projet, intitulée LOF et portée cette fois-ci par Laurence Danlos, a été soumise en 2007 à l’ANR Corpus. d) Le site du projet Microbio (http://www.microbioamsud.net/) Ce projet, qui réunit les laboratoires de 4 pays d’Amérique du Sud, l’INRIA Nancy et le laboratoire MoDyCo, est financé par Stic-Amsud. Les principaux objectifs visent aux développements et à l’intégration de diverses méthodes et technologies d’analyse et de fouille de textes en vue d’extraire automatiquement des informations qui permettront de construire, d’enrichir, de fusionner et de peupler des ontologies. Une première application est dédiée au domaine de la bioinformatique tout en sachant que le projet vise à développer des méthodes indépendantes, autant que faire se peut, du domaine.

Page 137: Laboratoire Modèles, Dynamiques, Corpus

137

e) Le site du projet LEAD (http://www.lead2learning.org/) Le projet LEAD vise l’élaboration d’outils informatiques et pédagogiques qui favorisent le travail de groupe à l’école, dans des situations où les élèves en co-présence collaborent à la fois grâce à l’interaction parlée et à l’interaction médiatisée par ordinateur (réseau Intranet). Dans ce cadre, le laboratoire MoDyCo est responsable pour la mise au point des méthodes d’analyse qualitative des interactions communicatives. Les partenaires du projet sont des laboratoires de sciences du langage (MoDyCo), de psychologie (University of Nottingham, University of Salerno, University of Utrecht) et d’informatique (École des Mines de Saint- Étienne, University of Salerno). 1.6.2. LE SEMINAIRE Le séminaire du laboratoire pour les années 2003-2004 s’est tenu à raison d’une fois par 6 semaines en moyenne, sur une demi-journée. Intervenaient systématiquement au moins un doctorant ou un jeune chercheur associé et un membre permanent (resp. S. David). Depuis 2005, il est co-organisé avec l’Ecole doctorale « Connaissance, Langage, Modélisation » de l’Université Paris 10. - En 2005-2006, il a pris la forme d’un séminaire thématique, à raison de 5 séances par année sur une journée (resp. D. Leeman). - En 2006-2007, le séminaire a eu lieu une dizaine de fois dans l’année, le mercredi après-midi. Il accueille 2 à 4 conférenciers à chaque séance (des doctorants et jeunes chercheurs associés, des membres permanents et des membres invités). Il est ouvert à l’ensemble de la communauté scientifique et couvre toutes les problématiques étudiées au laboratoire MoDyCo Les responsables du séminaire ont été Ch .Hudelot et S. Kahane. Ils ont été reconduits dans cette fonction par le conseil de laboratoire pour l’année 2007-2008. Comme nous l’avons dit précédemment, le site sert d’un instrument d’animation pour le séminaire : affichage dans le calendrier, sur la page d’accueil, dans le menu spécifique consacré au séminaire de MoDyCo. Les archives du séminaire sont disponibles sur le site à l’adresse suivante : http://www.modyco.fr/?events:s%C3%A9minaire 1.6.3. LA REVUE CALAP Les CALaP, créés par l’ex UMR 8606. Ils publient des travaux originaux dans le domaine de l’acquisition et de la pathologie du langage, en donnant toute leur place à de larges extraits de corpus ou d’autres données tant quantitatives que qualitatives. Les recherches sur l’acquisition et la pathologie du langage ne pouvant être menées dans l’isolement des disciplines, la revue sollicite et accueille les contributions de collaborateurs venus d’horizons différents : linguistes, psycholinguistes, sociologues, psychologues, praticiens orthophonistes, logopèdes ou enseignants. Le sommaire des différents numéros publiés est disponible désormais sur le site de MoDyCo. Les responsables en sont Ch. Hudelot et M. Kugler-Lambert.

Page 138: Laboratoire Modèles, Dynamiques, Corpus

138

Le prochain numéro des CALaP est le 25. Il paraîtra sous la direction de Christiane Préneron et a pour titre « Approches interactives de l’autonomisation langagière du jeune enfant en milieu familial ». 1.6.4. LES JOURNEES D’ETUDES ET LES COLLOQUES Le laboratoire soutient fortement l’organisation de journées d’études et de colloques, notamment via le poste budgétaire « Recherche scientifique projets ». Pour les années 2006 et 2007, à partir des informations répertoriées sur le site, nous pouvons faire état de l’organisation ou de la co-organisation d’une dizaine de 10 colloques et d’une vingtaine de journées d’études. Le laboratoire soutient l’organisation d’un colloque Jeunes chercheurs tous les ans depuis 2004 (voir section suivante). 1.6.5. LE COLLOQUE JEUNES CHERCHEURS COLDOC Depuis 2004, le laboratoire soutient l’initiative des doctorants et des jeunes chercheurs dans l’organisation d’un colloque jeunes chercheurs. L’équipe constituant le comité d’organisation change à chaque édition (mais un membre de l’équipe de l’année précédente intervient en début d’année pour aider le nouveau comité d’organisation). Le comité d’organisation rédige l’appel à communication, rassemble le comité scientifique, établit un budget, trouve des soutiens financiers et pilote l’organisation scientifique et matérielle du colloque. Il rend compte périodiquement de ses activités à deux membres du conseil de laboratoire (depuis 2004, il s’agit de Sophie David et Sarah Leroy). Il édite, s’il le souhaite et si les communications sont de bonne qualité, les actes du colloque. Outre les exposés oraux, le comité met en place une session poster (dans le thème du colloque ou hors thème) et planifie deux conférences invitées. Financièrement le colloque fonctionne avec le soutien du laboratoire, de l’Ecole doctorale « Connaissance, langage, modélisation », de l’UFR « Littérature, Langue, Philosophie » (Université Paris 10) et de la mairie de Nanterre. Les actes de l’édition 2005 sont finalisés. Ceux de l’édition 2006 sont en cours de finalisation. Il s’agit d’une publication électronique, disponible sur le site à l’adresse suivante : http://www.modyco.fr/?u_s=8&u_a=28& Les programmes des différentes éditions sont disponibles sur le site à l’adresse suivante : http://www.modyco.fr/?events:colloques. 1.6.6. LA POLITIQUE DE RESSOURCES Le laboratoire MoDyCo a mis en place une politique des ressources, qui vise à rendre celles-ci accessibles par la communauté et pérennes dans le temps. Les formats utilisés sont donc, tant que faire se peut, en accord avec les standards internationaux lorsque ceux-ci ont été publiés. Deux types de ressources sont actuellement proposées à la communauté scientifique : des corpus et des outils de traitement. Par ailleurs, le laboratoire est partenaire du CNTRL (http://www.cnrtl.fr/) et du CRDO (http://crdo.risc.cnrs.fr/exist/crdo/).

Page 139: Laboratoire Modèles, Dynamiques, Corpus

139

1) Les corpus 1a) Projet PFC En collaboration avec l’ERSS et l’Université d’Oslo, le laboratoire MoDyCo développe un vaste corpus du français parlé à travers le monde. Les caractéristiques essentielles de ce projet sont de proposer un protocole d’enquête uniforme, des méthodes d’analyse et des outils de traitement commun. Ce projet fournit ainsi à la communauté une description de la prononciation du français dans sa diversité géographique, sociale et stylistique et une vision globale de la phonologie du français. Le tableau ci-dessous quantifie les principales caractéristiques de PFC :

Enquêtes en ligne 24

Locuteurs en ligne 259 (sur 356 référencés)

Femmes 137, soit 52,.89%

Hommes 122, soit 47,10%

Sites liaisons codés 33 168

Sites schwa codés 126 982

Volumétrie 60 giga 90 heures de son

700 000 mots transcrits

Fréquentation 12 000 visiteurs uniques par an

1b) Projet LVF et LEF La ressource LVF se fonde sur les travaux de Jean Dubois et Françoise Dubois-Charlier (1997) : Les Verbes Français (1997) qui est la version textuelle d’une base de données lexicales. Selon la volonté des auteurs, Les Verbes Français, sous ces deux formes-là, est désormais mis à la disposition de la communauté scientifique par le truchement du site du laboratoire MoDyCo (CNRS & Université Paris 10). C’est un thésaurus de classes syntactico-sémantiques, c’est-à-dire de classes sémantiques définies par la syntaxe. 25 610 entrées verbales sont classifiées de la sorte. La ressource LEF Locutions en français, de Jean Dubois & Françoise Dubois-Charlier (2004), est une classification syntaxique comptant plus de 7 500 entrées. L’intention de l’ouvrage est moins de faire un recensement exhaustif des locutions que d’en proposer une typologie illustrée de nombreux exemples. Selon la volonté des auteurs, Locutions en français est désormais mis à la disposition de la communauté scientifique par le truchement du site du laboratoire MoDyCo (CNRS & Université Paris 10). 1c) Le corpus Duras Un corpus numérisé des œuvres écrites de M. Duras en format Word est en cours de constitution (resp. D. Malrieu). Le passage du format Word issu de la numérisation au texte Word normalisé suppose un travail assez important de corrections qui pourraient être partiellement automatisées, et il est loin d’être achevé. Le corpus de textes normalisés en format Word non balisé comporte environ 40 œuvres. Le corpus XMLisé avec balises conformes à la TEI, mais enrichissant cette dernière sur les dimensions genre textuel, discours rapportés, type de narrateur, comporte à ce jour 8 romans, une nouvelle, 6 récits autobiographiques, 4 recueils d’entretiens, 3 recueils d’articles de presse, soit 22 ouvrages.

Page 140: Laboratoire Modèles, Dynamiques, Corpus

140

Ce corpus étant composé de textes sous droits ne peut être mis à disposition sur le site et ne peut être que l’objet d’échanges ponctuels et personnels. 2) Les outils de traitement Dans le cadre de l’atelier d’exploitation de corpus, le laboratoire a mis en place une plate-forme d’outils de traitement qui sont accessibles aux chercheurs, dont deux, Corpus Reader et NaviTexte, ont été développés dans le laboratoire. Pour la description de ces outils, on se reportera à la section 1.5. ou bien sur le site du laboratoire : http://www.modyco.fr/?u_s=15&u_a=541&. 1.6.7. MORDYCUS Depuis le printemps 2007, le comité éditorial via un de ses membres (Philippe Gréa) a mis en place MorDyCus une lettre d’information électronique bimensuelle à destination des membres du laboratoire. Elle diffuse une sélection d’informations parmi les annonces scientifiques (appels à communications, colloques, parutions, etc.) et des annonces concernant la vie du laboratoire. Elle est stockée sur le site du laboratoire dans sa partie Intranet. 1.7. LES RESPONSABILITES EDITORIALES ET ASSOCIATIVES DES MEMBRES DU LABORATOIRE Différents membres du laboratoire ont des responsabilités importantes sur le plan éditorial ou dans le réseau associatif. Elles sont indiquées dans le tableau ci-dessous.

Nom Responsabilités - revues / associations

Michael Baker - Membre de l’Editorial Board de la collection : « Computer-Supported Collaborative Learning », Dordrecht, Boston, Londres, Kluwer Academic Publishers - Membre de l’Editorial Board de la revue « International Journal of Computer-Supported Collaborative Learning », Berlin, Springer Verlag

Simon Bouquet - Président de l’Institut Ferdinand de Saussure (Suisse)

Annie Delaveau - Présidente de l’AFLA jusqu’en 2006

Marianne Desmets - Co-direction de LINX4

Danièle Flament - Membre depuis 2002 du comité de rédaction la Revue française de Linguistique appliquée, éditions De Werelt, Amsterdam (http://www.rfla-org.journal) - Membre depuis 2006 du comité de rédaction de ITL International Journal of Applied Linguistics, éditions Peeters, Leuven.

4 Contrairement à ce qui est indiqué sur le site de l’université Paris 10, la revue LINX n’est pas une revue soutenue par MoDyCo.

Page 141: Laboratoire Modèles, Dynamiques, Corpus

141

Françoise Gadet - Membre de comité de lecture, notamment :

* Langage et Société, LINX, Glottopol, ROFCA * Journal of French Language Studies (Grande-Bretagne), Sociolinguistica (Allemagne), Revue Canadienne de linguistique appliquée (Canada), Journal of Language Contact (Etats-Unis), Sociolinguistic Studies (Espagne) - Membre de comités de rédaction * LIDIL (Grenoble) * Etudes sociolinguistiques (Belgique) - Présidente de la 10ème section de du XVII Congrès International de Linguistique et Philologie Romane

Philippe Gréa - Membre du comite de rédaction de la revue Cognitextes

Christian Hudelot - Membre du comité éditorial de la Collection Sciences du Langage de CNRS-EDITIONS - Responsable éditorial des Cahiers d’Acquisition et de Pathologie du Langage (CALaP) - Président de l’Association des Sciences du Langage (ASL) - Vice-président de l’Association Française de Psycholinguistique(AFPL) - Trésorier du Groupe International de Recherche PERGAME et vice-président de l’Association Française de Psycholinguistique

Sylvain Kahane - Corédacteur en chef de la revue TAL

Françoise Kerleroux - Membre du bureau du GDR de Morphologie (CNRS 2220)

Anne Lacheret - Membre de l’Institut universitaire de France - Membre de la Société de Linguistique de Paris - Membre du comité scientifique de la revue de Syntaxe et Sémantique de l’université de Caen - Membre du comité de lecture de la revue CORELA (Cognition, Représentation, Langage) - Membre de l’ISCA (International Speech Communication Association)

Bernard Laks - Membre de l’Advisory Board du Journal of Italian Linguistics - Vice-président de l’Association, Française de Linguistique Cognitive - Membre du comité de rédaction de Cognition (Maroc) - Membre de l’Editorial Board de Journal of French Language Studies (Cambridge UP) jusqu’en 2004 (2 mandats de 4 ans) - Membre de l’Editorial Board de la collection : « Studies in language variation » publiée par John Benjamins (Amsterdam, Londres)

Danielle Leeman - Directeur de Langages depuis 1973 - Directeur de Langue française depuis 1990 - Membre de comités scientifiques : * Modèles Linguistiques depuis 1999 * Linguisticae Investigationes depuis 2000

Jean-Luc Minel - Membre du comité de rédaction de la revue TAL

Colette Noyau - Membre des comités scientifiques : * Revue internationale de langue française Acquisition/Interaction en Langue Etrangère’ (AILE) * Revue Française de Linguistique Appliquée - Membre du comité de rédaction de LINX

Page 142: Laboratoire Modèles, Dynamiques, Corpus

142

Sylvie Plane - Co-directeur de collections :

* Codirection de la collection « Didactique et Formation » chez De Boeck (Belgique ) * Codirection de la collection « Recherches en didactique du français » aux Presses Universitaires de l’université Laval (Québec) - Membre de comités de rédaction : * Revue Repères (Institut National de Recherche Pédagogique) * Série« Français » pour la collection Doubles pages (CRDP du Limousin) - Membre du Conseil scientifique et pédagogique de l’IUFM d’Orléans-Tours - Présidente de la section française et vice-présidente internationale de l’Association Internationale pour la recherche en Didactique du Français

Victor Rosenthal - Rédacteur en chef d’Intellectica, revue de l’Association pour la Recherche Cognitive

Anna Sörès - Membre du comité de rédaction de LINX

1.8. LES RESPONSABILITES EN MATIERE D’ADMINISTRATION DE LA RECHERCHE Nous récapitulons ci-dessous les responsabilités des membres du laboratoire en matière d’administration et d’administration de la recherche. Nom Responsabilité

Christian Hudelot membre élu du comité national, section 45

Sarah Leroy membre élu du comité national, section 34 et 41

Jean-Luc Minel membre élu du comité national, section 34

Richard Walter membre élu du comité national, section 34 membre de la commission nationale de la formation permanente du CNRS

1.8. LES COLLABORATIONS NATIONALES ET INTERNATIONALES Depuis sa création, le laboratoire MoDyCo a privilégié la mise en place de collaborations nationales et internationales en vue de constituer un réseau qui permette d’atteindre une taille critique dans les thématiques du laboratoire. Les tableaux ci dessous présentent l’ensemble des collaborations qu’entretient le laboratoire en septembre 2007, sur le plan national et sur le plan international. Elles sont classées par ordre alphabétique d’institution. Ces informations sont aussi disponibles sur le site du laboratoire : http://www.modyco.fr/?u_s=9&u_a=29& 1) Les collaborations nationales Les collaborations nationales qu’entretient le laboratoire s’élève à plus de 50 ; plus de 15 font l’objet d’un financement ou d’une forme de contractualisation.

Institution / Entreprise Thèmes Financement / Contractualisation

Bibliothèque publique d’information TAL

Page 143: Laboratoire Modèles, Dynamiques, Corpus

143

CEA, Commissariat à l’Energie Atomique TAL ANR

Centre de Recherche en Langue et Littérature Italiennes et de l’Italie Economique, Université de Paris 10

Textes

Centre de recherches hispano-américaines GRECUN, Université Paris 10

Textes

Centre Hospitalier G. Régnier, Rennes Pathologie du langage

Centre Hospitalier Laborit, Poitiers Pathologie du langage

Centre Hospitalier Universitaire, Brest Pathologie du langage

Centre Médico Psychologique pour Enfant & Adolescents, Lannion Pathologie du langage

Cognition et Développement, Institut de Psychologie, Université de Paris 5

Acquisition Fondation de France

Département d’Art du Spectacle, Université de Paris 10 Textes

DIDREM (recherche en didactique des mathématiques), Université Paris 7

Acquisition

EHESS TAL

ENS-Lyon Pathologie du langage

ENST, Ecole Nationale Supérieure des Télécommunications TAL

Entreprise Antidot TAL ANR-RNTL

Entreprise Mondeca TAL ANR-RNTL

Equipe Syled, Université Paris 3 Lexique

INRIA TAL / Modèles formels

Action de Recherche Coopérative Mosaïque, « Modèles syntaxiques de haut niveau » / ANR-RNTL

Institut Médico-Psychologique, Saint-Brieuc Pathologie du langage

ITEM, Université Paris 3 Litéracie

IUFM Grenoble Litéracie

IUFM Nord, Université de Lille 2 Acquisition

IUFM Orléans-Tours Textes

Laboratoire Culture et Communication, Université d’Avignon TAL ANR

Laboratoire d’Informatique de Paris Nord TAL

Laboratoire de Linguistique Formelle, Université Paris 7 Morphologie CNRS

Page 144: Laboratoire Modèles, Dynamiques, Corpus

144

Laboratoire de Psychologie, Université Nancy 2 Acquisition

Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur

TAL ANR

Laboratoire d’Informatique, de Robotique et de Microélectronique, Université Montpellier 2

TAL ANR-RNTL

Laboratoire ERSS, Université Toulouse 2 Phonologie ANR

Laboratoire ICAR, ENS-LSH, Université de Lyon 2 Acquisition / Textes

ANR Emergram

Laboratoire Lacito, Université Paris 3 et Paris Sorbonne TAL Corpus Convention CNRS

Laboratoire Langage, Mémoire et Développement Cognitif, Université de Poitiers

Acquisition / Litéracie

Laboratoire LAPSCO, Université de Clermont-Ferrand Litéracie

Laboratoire Lattice, Université Paris 7 Modèles formels

Laboratoire Lisyc –EA 3883, Université de Brest Litéracie

Laboratoire LORIA TAL ANR

Laboratoire Neuropsychologie Clinique de l’Enfant, Hôpital Robert Debré

Pathologie du langage

Laboratoire Parole et Langage, Université d’Aix-en-Provence Phonologie PICS et ANR

LILA, Université Paris 7 Phonologie

Recherche sur le Français contemporain EA 1483, Université Paris 3 Acquisition

UFR Lettres, arts, cinéma, Université Paris 7 Pathologie du langage

UFR Psychologie, Université Toulouse 2 Litéracie

Université d’Aix Acquisition

Université d’Angers Interactions

Université de Besançon Textes

Université de Bordeaux 3 Modèles formels

Université de Caen Syntaxe / Lexique

Université de Lille 3 Acquisition ANR Emergram

Université d’Orléans Phonologie ANR

Université du Maine Interactions

Université Paris Sorbonne TAL ANR

Page 145: Laboratoire Modèles, Dynamiques, Corpus

145

2) Les collaborations internationales Les collaborations internationales qu’entretient le laboratoire s’élève à plus de 60 ; plus de 30 font l’objet d’un financement ou d’une forme de contractualisation.

Institution Pays Thème Financement / Contractualisation

Carnegie Mellon University, Pittsburg Etats-Unis Pathologie du langage

Copenhaguen Business School Danemark TAL Ambassade de France

Department of Italian Studies Bristol University Grande-Bretagne Textes

Department of Italian Studies, University of California

Etats-Unis Textes

Facultad de Matemática, Universidad Nacional de Córdoba

Argentine TAL STIC-Amsud, CNRS

Faculté de l’Education à Oslo Norvège Acquisition

Faculté de Psychologie et des Sciences de l’Éducation, Université de Genève

Suisse Acquisition

INCO, Instituto de Computación Uruguay TAL ECOS-Sud / cotutelle

Institut des Langues Romanes, Université de Lund

Suède Acquisition

Institut Pasteur de Montevideo Uruguay TAL STIC-Amsud, CNRS

Katholieke Universiteit Leuven Belgique Modèles formels

Max-Planck Institut für Psycholinguistik, Nimègue

Pays-Bas Acquisition

Memorial University of Newfoundland, St John’s

Canada Pathologie du langage

Ministères de l’Education du Bénin et Niger Bénin et Niger Acquisition

Pontificia Universidade Católica do Rio Grande do Sul, Faculdade de Informatica

Brésil TAL STIC-Amsud, CNRS

Rutgers University Etats-Unis Acquisition ANR Emergram

SNS Pise Italie Phonologie Contrat UFI

Standford University Etats-Unis Acquisition ANR Emergram

Universidad de Concepción Chili TAL STIC-Amsud, CNRS

Université autonome de Barcelone Espagne Textes Cotutelle

Université d’Athènes Grèce Acquisition Cotutelle

Université de Bergame Italie Acquisition

Université de Brême Allemagne Acquisition

Université de Brescia Italie Sociolinguistique Cotutelle

Page 146: Laboratoire Modèles, Dynamiques, Corpus

146

Université de Chicago Etats-Unis Phonologie CNRS

Université de Fribourg Suisse Prosodie

Université de Fribourg-en-Brisgau Allemagne Sociolinguistique Cotutelle

Université de Gand Belgique Lexique

Université de Genève Suisse Prosodie / Lexique

Université de Kristiansand Norvège Acquisition

Université de Lancaster Grande-Bretagne TAL

Université de Liège Belgique Pathologie du langage

Université de Lisbonne Portugal Phonologie

Université de Louvain-la-Neuve Belgique Prosodie ANR

Université de Madrid Espagne Acquisition ANR Emergram

Université de Mexico Mexique Acquisition ANR Emergram

Université de Milan Italie Sociolinguistique Cotutelle

Université de Montréal Canada Modèles formels

Université de Moscou Russie Phonologie Cotutelle

Université de Neuchâtel Suisse Prosodie

Université de Potsdam Allemagne Textes / Syntaxe Cotutelle

Université de Rome 3 Italie Syntaxe Cotutelle

Université de Salerne Italie Textes Cotutelle

Université de Sao Paolo Brésil Acquisition / Interactions

Université de Séoul Corée du Sud Syntaxe Egide

Université de Tel-Aviv Israël Prosodie

Université d’Odense Danemark Phonologie

Université d’Oslo Norvège Phonologie ANR / cotutelle

Université du Québec à Montréal Canada Pathologie du langage

Université du Québec en Outaouais Canada Acquisition

Université d’Utrecht Pays-Bas Interactions Projet européen

Université libre de Bruxelles Belgique Lexique

Université Ludwig Maximilians - Munich Allemagne Sociolinguistique / Acquisition

Cotutelle

Université pédagogique d’Orenburg Russie Textes Cotutelle

Université Pompeu Fabra Espagne Modèles formels

Université Radboud de Nimègue Pays-Bas Phonologie Cotutelle

Université Tcheliabinsk Russie Sociolinguistique Cotutelle

Page 147: Laboratoire Modèles, Dynamiques, Corpus

147

Université York, Toronto Canada Acquisition

University Hawai’i Etats-Unis Acquisition ANR Emergram

University of Texas Etats-Unis Acquisition ANR Emergram

Vrije Universiteit Brussel Belgique Lexique

Récapitulatif quantitatif Les deux graphiques ci-dessous récapitulent les données précédentes sur le plan quantitatif.

������������������������������������������

�������������

#�������� �

/�������� ��

:�*����

:��+�����

' �.����; � ����<��3���*�

' ��% � $��

2��% � $���������$�$�

2% � � $��

) �� ���$�������� =#

:

=�*���

����������������������������������������������

�����������������

& �������

#�������� �

/�������� ��

:�*����

' �.����; � ���

<��3���*�

2��% � $�����

���$�$�

2% � � $��

2� � ���

) �� ���$��������

=#:

=�*���

Par ailleurs, le laboratoire a accueilli plusieurs chercheurs invités. On notera : - Basilio Calderone (SNS Pise, chercheur invité ; contrat université franco-italienne, 2007) - Ernesto d’Andrade de l’Université de Lisbonne - John Goldsmith de Chicago University - Géraldine Legendre de John Hopkins University - Lita Lundquist, Professeur à CBS (Danemark), 1 semaine, 2007 - Alain Polguère a été professeur invité à l’Université Paris 10 en janvier-février 2005 - Dina Wonsever, Professeur à l’INCO (Uruguay), 3 semaines, 2007.

Page 148: Laboratoire Modèles, Dynamiques, Corpus

148

1.9. LES EFFECTIFS DU LABORATOIRE 1.9.1. PERIODE 2004-2007 Comme nous l’avons indiqué à plusieurs reprises, les effectifs du laboratoire ont augmenté tout d’abord au 01/01/2005 avec l’intégration du Celith de l’EHESS et au 01/01/2006 avec l’intégration du LEAPLE. Dans le même temps, différents enseignants-chercheurs ont demandé leur rattachement à titre principal. Précisons qu’une procédure de rattachement à titre principal a été mise en place : le dossier du candidat est instruit par un rapporteur, membre du laboratoire, et soumis au vote du conseil de laboratoire. Régulièrement le conseil de laboratoire se prononce sur le rattachement à titre secondaire de personnes ayant déjà un rattachement principal ou qui n’ont pas un statut leur permettant d’être rattaché à titre principal (professeur des écoles, professionnels en orthophonie, etc.). Nous faisons ci-dessous le point sur les départs et les arrivées depuis le 01/01/2004.

Départs Nombre

Personnels permanents

Retraite 3

Changement de laboratoire 4

Décès 1

Personnels temporaires

Fin de délégation CNRS 2

Fin de contrat POST-DOC 1

Autres fins de contrat (ITA, chercheur invité, etc.) 4

Total 15

Parmi les personnels permanents, le changement de laboratoire apparaît comme la première cause de départ (mais pratiquement identique au nombre de départ à la retraite, encore faible (3)) ; elle est largement liée à la pression des départements et des équipes universitaires pour rassembler leurs effectifs.

Page 149: Laboratoire Modèles, Dynamiques, Corpus

149

Arrivées Nombre

Personnels permanents

Membres du Celith 4

Membres du LEAPLE 28

Autres permanents 16

Personnels temporaires

Délégation CNRS 3

ITA CDD - vacataires 10

Autres temporaires 1

Total 62

On notera que la laboratoire, de 2004 à 2005, a largement attiré de nouveaux membres : la différence entre les départs et les arrivées pour les personnels permanents ou les personnes temporaires est dans les deux cas à l’avantage des arrivées. Pour les personnels temporaires, on notera l’importance des ITA en CDD, dont la plupart sont engagés sur des contrats ANR. Pour les personnels permanents, qui représentent la grande majorité, outre les arrivées des membres du Celith et du LEAPLE, on remarquera le nombre important des autres permanents (16) : tous les enseignants-chercheurs recrutés à Paris 10 ont été intégrés dans le laboratoire ; plusieurs ITA CNRS nous ont rejoints (2 recrutements par NOEMI en administration et informatique ; 1 recrutement d’un IR, 1 changement d’affectation pour un IR). Les autres personnels permanents sont constitués par des enseignants-chercheurs d’autres universités et d’un CR. 1.9.1. PERIODE 2007-2009 ET PROCHAIN QUADRIENNAL Nous indiquons tout d’abord la répartition des chercheurs, enseignants-chercheurs et ITA par année de naissance. Cette répartition a été établie sur la base des effectifs du laboratoire au 1/09/07.

Page 150: Laboratoire Modèles, Dynamiques, Corpus

150

��������������� ��#����������$������� ��#��%&����������������

(

�(��

�(��

�(��

�(��

�(��

�(��

�(��

�(��

�(��

�(��

�(��

�(��

�(��

�(��

�(�

�(�

�(�

�(�

�(�

�(��

������������

������

Cette répartition montre la zone de fragilité du laboratoire : dans les années qui viennent, beaucoup de ses personnels vont partir en retraite. C’est ce qu’on examine plus précisément ci-dessous. Projection des départs en retraite L’âge de référence pris en compte est 65 ans. Ne sont pas comptabilisés les membres émérites ou honoraires et les membres ne participant pas au projet 2009-2012. A l’heure

actuelle Départs

à la retraite avant 2009

Effectif en 2009

Effectif projeté

en 2012 compte non tenu des renouvellements

Différence nette 2009-2012

Pourcentage de la baisse des effectifs

par rapport à 2009

Enseignants-chercheurs 45 2 43 35 8 19%

Chercheurs 13 3 10 9 1 16%

ITA 8 2 6 4 2 33%

Total effectif 66 7 59 48 11 16%

Le graphique suivant reprend les données du tableau ci-dessus compte non tenu des renouvellements :

Page 151: Laboratoire Modèles, Dynamiques, Corpus

151

'�����������������

��

��

�� (

� ���������������������

������( 2� ����� �����

���

(�������

�����$�����4�%���%����

&%���%����

/=#

Etant donné les départs à la retraite projetés, pour mener à bien notre projet scientifique (cf. partie Projet), il importe que le laboratoire soit soutenu sur le plan des recrutements, notamment du côté des ITA.

Page 152: Laboratoire Modèles, Dynamiques, Corpus

152

2. PRODUCTION SCIENTIFIQUE - PERIODE 2004-2007 (effectuée dans le cadre de l’unité) 2.1. PRODUCTION SCIENTIFIQUE DES MEMBRES DU LABORATOIRE : HAL-SHS - PERIODE 2004-2007 La bibliographie des membres du laboratoire est répertoriée dans HAL-SHS. Le choix de ce support numérique a été motivé par les raisons suivantes : 1. Nous nous sommes inscrits dans les choix du CNRS concernant le développement des archives ouvertes. 2. HAL-SHS s’est ainsi imposé comme format pour la base bibliographique de référence au sein du laboratoire, chaque membre en assurant la mise à jour en y entrant régulièrement sa production scientifique. Afin d’aider les membres du laboratoire dans l’entrée de leurs références, la direction et le conseil de laboratoire ont mis en place au départ un soutien assuré par un jeune docteur du laboratoire. 3. Sur le site de MoDyCo, via une interface intégrée au serveur HAL-SHS, la communauté a accès à l’ensemble de la production du laboratoire. De plus, via un fil RSS, les dernières publications des membres du laboratoire sont mises de l’avant dès la page d’accueil du site. 4. Les données résultant de l’extraction sont normées selon des critères choisis par le CNRS. Les rapporteurs disposent dès lors de documents offrant des possibilités de recherches fines et d’analyses quantitatives rapides. Extraction de HAL-SHS - La période de référence commence en 2004. - Peu de références « à paraître » ont été répertoriées, le système HAL-SHS offrant difficilement la possibilité d’indiquer ces références. - La production inscrite sur le CD-ROM est constituée de celle des membres rattachés à titre principal (chercheurs, enseignants-chercheurs, ingénieurs) pour la période 2004-2007 ou pour des périodes inférieures selon les dates d’arrivée ou de sortie des membres. - La catégorie « vulgarisation » n’existant pas dans HAL-SHS, nous avons traité ces références comme des « autres publications ». - Les rapports de recherche n’ont pas été entrés ou se trouvent dans la catégorie « autres publications ». - Quand plusieurs membres du laboratoire sont co-auteurs d’un même ouvrage, la référence est indiquée une seule fois. Le compte a donc été effectué à partir du nombre de références (et non à partir du ou des noms, contrairement à ce que nous avions fait dans le rapport à mi-parcours de 2005). Documents établis pour le rapport Deux types de format sont proposés aux rapporteurs : 1) Un format imprimé classique établi à partir d’une exportation des données de HAL-SHS. Ce format imprimé ne rassemble que la production des docteurs ayant soutenu entre 2003 et 2007. 2) Un format numérique (joint au rapport sur un CD-ROM) au format XML proposé par HAL-SHS. Afin de rendre la consultation de ces documents numériques plus conviviale, un

Page 153: Laboratoire Modèles, Dynamiques, Corpus

153

éditeur (XML-Notepad) est aussi enregistré sur le CD. On trouvera ci-après un exemple de copie d’écran des fonctionnalités de ce logiciel. Enfin, les données sont présentées dans différents fichiers :

• Le fichier ACL contient les publications dans les revues avec comités de lecture. • Le fichier COM contient les publications/communications dans les colloques avec/sans

actes. • Le fichier OUV contient les publications des ouvrages, chapitres d’ouvrage et direction

d’ouvrages. • Le fichier CONF contient les publications des conférences invitées. A ce propos, il

convient de noter que sont intégrées dans cette catégorie des interventions dans des séminaires extérieurs au laboratoire.

Capture d’écran de l’éditeur XML-Notepad (la commande « Expand All » ouvre tous les dossiers en marge qui contiennent les balises,

et développe les notices)

Page 154: Laboratoire Modèles, Dynamiques, Corpus

154

2.3. PRODUCTION SCIENTIFIQUE : BILAN QUANTITATIF - RECAPITULATIF

Type Enseignants-chercheurs, chercheurs, ingénieurs

Articles dans des revues avec comité de lecture (ACL) 197

Articles dans des revues sans comité de lecture (SLC) 21

Articles dans des actes de colloque (ACT) 140

Communications en colloque sans actes (COM) 96

Ouvrages ou chapitres d’ouvrage (O) 141

Directions d’ouvrage (DO) 34

Rapports de recherche (RAP) 0

Vulgarisation (VUL) 0

Autres publications/productions (AP) 30

Total de la production du laboratoire 659

Soit sous forme graphique :

)������ ��#��������$������� ��#%&�

���� ������������* �

��

���

���

���

���

#&: ):& #&= &>' > �> #2 �5: #2

& ����� ���������

������

Page 155: Laboratoire Modèles, Dynamiques, Corpus

155

2.3. PRODUCTION SCIENTIFIQUE DES DOCTEURS AYANT SOUTENU LEUR THESE DANS LE LABORATOIRE - PERIODE 2003-2007 La production des docteurs ayant soutenu leur thèse entre 2003 et 2005 est précédée de sa référence HAL ou HALSHS. Elle est répertoriée ci-dessous et n’est pas inscrite sur le CD-ROM. Articles dans des revues avec comité de lecture ACL_hal-00170664, Delumeau F., à paraître, Découpage syllabique automatique du créole

guadeloupéen, Espace créole, 12. ACL_hal-00170655, Facq-Mellet C., 2005, Le dire-vrai dans le discours politique : l’exemple

des questions au Gouvernement, Revue des sciences humaines, Numéro spécial, 73-84. ACL_hal-00124859, Hamma B., 2006, Etat des lieux sur l'identité sémantique de la

préposition "par", Modèles linguistiques, 54. ACL_hal-00124862, Hamma B., 2006, L'expression de la cause à travers le prisme de la

préposition "par", Modèles linguistiques, 53. ACL_hal-00124864, Hamma B., 2006, Vers une redéfinition des définitions

lexicographiques. Remarques sur les signifiés de beau et de dent », Revue de Lexicologie. ACL_halshs-00124197, Hamma B., 2004, "Par exemple": l'expression de l'altérité dans l'acte

d'exemplification, Revue de Sémantique et Pragmatique, 15-16, 155-181. ACL_halshs-00124210, Hamma B., 2005, Jouer avec les constructions verbales. La

polysémie en question, Diptyque, 133-146. ACL_halshs-00124218, Hamma B., 2004, "Commencer par" et "finir par", des semi-

auxiliaires non élus à l'unanimité. "Débuter, terminer" et "couronner" + par, des candidats malheureux à l'“ auxiliarité ”, Diptyque, 95-115.

ACL_hal-00170880, Hamon S., 2005, Vaguer C., Leeman D., Les nouvelles syntaxes sont-elles utiles à la grammaire ?, Le Verbe dans tous ses états (2) : de la phrase au texte, Presses Universitaires de Namur.

ACL_halshs-00147551, Hamon S., Leeman D., 2007, Les verbes de cause à partir de l'exemple de "causer", Langue Française, 153, 74-91.

ACL_halshs-00129231, Khammari I., 2004, En combiné avec les noms de lieu : préposition et préfixe, Revue de Sémantique et Pragmatique, 15/16, 101-119.

ACL_halshs-00129234, Khammari I., 2004, Construction être en V-n, Diptyque, 2, 135-48. ACL_halshs-00129235, Khammari I., 2004, En préfixe et en préposition : une seule forme, un

seul sens ?, Linx, 50, 169-178. ACL_halshs-00129240, Khammari I., 2006, De l'identité de la préposition en, Modèles

linguistiques, II, 54, 115-135. ACL_hal-00170643, Lavie R.-J., 2004, A mixed treatment of categoricity and regularity :

Solutions that don’t do justice to a well-exposed complexity. Commentary to Ray Jackendoff’s Foundations for Language, Behavioral and Brain Sciences, 26.

ACL_hal-00170662, Muni Toke V., 2004, Traduire l’inconscient dans la langue : signifiant et intentionnalité. L’exemple de l’unheimlich freudien, Marges Linguistiques, 8, 54-63.

ACL_halshs-00112612, Muni Toke V., 2006, La notion d'inconscient dans la réflexion linguistique de Jacques Damourette et Edouard Pichon. L'exemple de la sysémie homophonique, Langage et inconscient, 2, 112-132.

Page 156: Laboratoire Modèles, Dynamiques, Corpus

156

ACL_hal-00170646, Ono A., 2004, Deux théories de l’énonciation autour de la "subjectivité dans le langage", Résonances, 2, 294-101.

ACL_halshs-00113094, Ounis H., 2004, Le nom "amour" : grammaticalisation et métaphore, Revue de sémantique et pragmatique, 15-16, 211-219.

ACL_halshs-00088773, Vaguer C., 2004, Constitution d'une base de données : les emplois de 'dans' marquant la “coïncidence", Revue française de linguistique appliquée, IX-1, 183-197.

ACL_halshs-00088777, Vaguer C., Choi S.-U., Jeong M.-H., 2005, L'approximation : un outil pour mettre en évidence des divergences dans l'emploi de la préposition 'dans' en français et en coréen, BULAG, 30, 165-183.

ACL_halshs-00088779, Vaguer C., 2005, Pourquoi ne peut on pas *sombrer dans le bonheur ? Etude de constructions verbales "V 'dans' Némotion", LIDIL, 32, 83-102.

ACL_halshs-00088781, Vaguer C., 2005, 'Dans les + numéral' : un déterminant de quantification faible ?, Travaux de Linguistique, 50, 113-129.

ACL_halshs-00106402, Vaguer C., 2006, L'identité de la préposition 'dans' : de l'intériorité à la coïncidence, Modèles linguistiques, 53, 111-130.

ACL_halshs-00121313, Vaguer C., 2005, 'Pédaler dans la semoule'. Approches des constructions verbales figées de structure 'V dans GN', Linx, 53, 231-245.

ACL_halshs-00139532, Vaguer C., 2006, Approche du sens des prépositions : le cas de 'vers', Modèles linguistiques, 237-250.

ACL_halshs-00139533, Vaguer C., 2006, Bibliographie générale : recueils et articles consacrés aux prépositions du français, Modèles linguistiques, 54, 171-203.

ACL_halshs-00139535, Vaguer C., 2006, Étude de GP en 'dans', à sens causal, Linx, 54, 91-102.

Communications dans des colloques sans actes COM_hal-00170906, Anane C., Les connecteurs comme marque de cohérence narrative dans

des récits oraux de jeunes élèves tunisiens en français et en arabe tunisien, Cohérence et Discours, 2005-02-17, Tunis, Tunisie.

COM_hal-00169194, Guerin E., Propositions pour une didactique de la grammaire qui rendrait compte de la nécessaire variabilité de la langue, Propositions pour une didactique de la grammaire qui rendrait compte de la nécessaire variabilité de la langue, 2007-06, France.

COM_hal-00169196, Guerin E., Bellonie J.-D., Langue scolaire et réalité linguistique des élèves : le cas des écoliers martiniquais, Langue scolaire et réalité linguistique des élèves : le cas des écoliers martiniquais, 2007-06, France.

COM_hal-00169197, Guerin E., Sohbani B., Autour du film L’esquive, d’A. Kechiche, mise en lumière d’une forme d’argot contemporain, 2006-11, France.

COM_hal-00169198, Guerin E., Essai de caractérisation du sens de on, Journées franco-suédoises de linguistique, 2005-06, France.

COM_hal-00169199, Guerin E., Le français à l’école : une variété figée inadaptée, Journées Linguistiques 2005, Institut de philologie romane, Munich, 2005-04, France. COM_hal-00124836, Hamma B., Étude translinguistique de quelques prépositions

'dynamiques' : "à travers" et ses équivalents en arabe et en anglais, Grammaires et lexiques comparés, 2004-11-11, Deauville, France.

Page 157: Laboratoire Modèles, Dynamiques, Corpus

157

COM_hal-00124838, Hamma B., Travail de corpus et modélisation des données : le cas des constructions 'distributives' en "par", Recueil des données en Sciences du langage et constitution de corpus, 2005-06-17, Nanterre, France.

COM_hal-00124840, Hamma B., Sur quelques emplois du verbe 'terminatif' «finir»: entre semi-auxiliaireet verbe libre, Sur la route du verbe, 2004-09-30, Nancy, France.

COM_hal-00124851, Hamma B., Les grammaires cognitives : visées théoriques et limites empiriques, Séminaire du laboratoire Lexique & Grammaire, 2005-05-07, Marne-la-Vallée, France.

COM_hal-00170900, Hamon S., Parce que face aux différentes valeurs causales de la phrase complexe, De la langue au discours : l’un et le multiple dans les outils grammaticaux, 2005-05-26, Montpellier, France.

COM_hal-00170901, Hamon S., L’énoncé causal : que fait le connecteur ?, Journées d’étude franco-suédoises de linguistique, 2005-06-24, Paris, France.

COM_halshs-00169079, Khammari I., Les verbes supports construits avec en, Journée d'étude "Le verbe dans tous ses états : propriétés linguistiques et transpositions didactiques", 2004-01-29, Nanterre, France.

COM_halshs-00169086, Khammari I., Fonctionnement de la préposition en, La préposition comme valeur, 2006-04-07, Florence, Italie.

COM_hal-00170902, Lavie R.-J., Postuler l’exemplarisme pour expliquer la productivité explique aussi que les sujets aient des productions quasi-normées, Journées d’étude du Réseau Ile-de-France des Sciences Cognitives, 2004-02-06, Paris, France.

COM_hal-00170903, Lavie R.-J., Théorie des exemplaires en linguistique et perspective pour le sujet cognitif, Colloque international Alternatives en sciences cognitives, 2004-12-08, Compiègne, France.

COM_hal-00170904, Lavie R.-J., Interspeaker variation and learnability in an exemplar-based productive model, Colloque international Grammaire et Cognition. Du fait grammatical au fait cognitif, 2005-05-19, Bordeaux, France.

COM_hal-00170910, Lavieu B., "Léa lave son linge à la main" ou comment "à la main" ne désigne pas la partie du corps, Journée d’étude Le Semi-figement, 2005-03-25, Nanterre, France.

COM_hal-00170911, Loiseau S., L’éthos du philosophe chez Deleuze, Journée d’étude Analyses sémantiques de corpus philosophiques numérisés, 2004-03-08, Paris, France.

COM_hal-00170912, Loiseau S., Réactionnaire et fasciste : entre discours politique et discours philosophique, Journée d’étude Emprunts et gloses politiques, 2005-10-22, Université de Provence, France.

COM_hal-00170913, Loiseau S., XML comme format cumulatif : décrire la solidarité de différents niveaux d’annotation, Journée d’étude Atala Articuler les traitements sur corpus, 2005-02-12, Paris, France

COM_hal-00170914, Loiseau S., Comment décrire les concepts philosophiques ? Analyse sémantique sur corpus, Journée d’étude Corpus de sciences sociales, 2005-06-08, Paris, France.

COM_hal-00170915, Loiseau S., Thématique et impression référentielle dans le discours philosophique. Description sur corpus, Journée d’étude Conscila Sémantique des textes théoriques, 2005-12-02, Paris, France.

COM_hal-00171140, Muni Toke V., Le locuteur de Damourette et Pichon : du locuteur national au locuteur natif, Locuteur quasi-natif ou apprenant très avancé : regards croisés de sociolinguistique et d'acquisition, 2007-09-20, Nanterre,France.

Page 158: Laboratoire Modèles, Dynamiques, Corpus

158

COM_hal-00171151, Muni Toke V., Le locuteur : de Damourette et Pichon aux théories de l’énonciation, Neuvième Atelier des Doctorants en Linguistique, 2005-10-17, Paris, France.

COM_halshs-00088801, Vaguer C., 'Dans' : l'expression de la coïncidence spatio-temporelle, Colloque International "On the expression of Time and Space", 2004-09-23, Anvers, Belgique.

COM_halshs-00088802, Vaguer C., Constituer un observable pour l'étude des constructions verbales “V + dans SN”, Colloque Jeunes Chercheurs (Col'Doc.04) : "La Construction des observables en sciences du langage", 2004-04-29, Nanterre, France.

COM_halshs-00088803, Vaguer C., Zephir-V2 : une base de données linguistique pour l'étude des constructions verbales, 74ème Congrès de l'ACFAS, "Le savoir : trame de la modernité", 2005-05-15, Université McGill, Montréal, Canada.

COM_halshs-00088804, Vaguer C., La préposition 'vers', Quatrième rencontre internationale de Sémantique et Pragmatique (RSP4) : "La place du sens en linguistique", 2006-06-13, Université d'Orléans, France.

COM_halshs-00121316, Vaguer C., Etude de constructions verbales figées, Journée d'études "Le semi-figement", 2005-03-25, Nanterre, France.

Directions d’ouvrages DO_halshs-00088783, Vaguer C., Lavieu B., 2004, Le verbe dans tous ses états : Grammaire,

sémantique, didactique.Actes de la journée d'étude "Didactique de la syntaxe", 29 janvier 2004, Université Paris X-Nanterre (France), Presses Universitaires de Namur / CE.

DO_halshs-00117329, Vaguer C., Leeman D., 2006, Des savoirs savants aux savoirs enseignés, Presses Universitaires de Namur & CE.

Chapitres d’ouvrages scientifiques OS_hal-00170529, Champion F., Porquier R., Petit G., 2004, Beacco J. C., Bouquet S.,

Porquier R. (éd.), Notions générales (ch. 4). Notions spécifiques (ch. 8). Répertoires lexicaux notionnels, Niveau B2 pour le Français - Un référentiel, Didier, Paris.

OS_halshs-00124941, Ounis H., 2007, "Coup de foudre": étude linguistique d'une métaphore, Lambert-Lucas.

OS_hal-00170917, Poudat C., Loiseau S., 2005, Tognini Bonelli E. (éd.), Authorial presence in academic genres, Strategies in Academic Discourse, Benjamins, 51-68.

OS_hal-00170918, Vera De Tamagnini N., 2004, Bazzano B. (éd.), Discours scientifique ou de spécialité. La relation concept/ terme dans le domaine de la linguistique, Formas y funciones de los discursos literario y audiovisual contemporáneos, Publicaciones de la Facultad de Filosofía y Letras, 9-31.

Communications dans des colloques avec actes ACT_halshs-00097820, Amardeilh F., Laublet P., Minel J.-L., 2005, Annotation

documentaire et peuplement d'ontologie à partir d'extractions linguistiques, IC'2005, 100-112.

ACT_halshs-00102591, Amardeilh F., Laublet P., Minel J.-L., 2005, Document annotation and ontology population from linguistic extractions, Proceedings of the 3rd international conference on Knowledge capture, ACM Press, 161-168.

Page 159: Laboratoire Modèles, Dynamiques, Corpus

159

ACT_halshs-00115243, Amardeilh F., Carloni O., Noël L., 2006, PressIndex: a Semantic Web Press Clipping Application, Semantic Web Challenge 2006.

ACT_halshs-00115255, Amardeilh F., 2006, -06-12OntoPop or how to annotate documents and populate ontologies from texts, ESWC 2006, Workshop on Mastering the Gap: From Information Extraction to Semantic Representation, 187, CEUR Workshop Proceedings.

ACT_hal-00170890, Arroyo González E.Interaction, reformulations et “ scories ” en tant que traces de la construction des rôles dans un entretien radiophonique, Le Français parlé des médias.

ACT_hal-00170526, Champion F., 2005, Théorie de l'indication et didactique du Fle en milieu professionnel, Actes du Colloque international de didactique cognitive DIDCOG 2005, 57-64 (http://w3.univ-tlse2.fr/lordat/didcog/didcog2005/actes/assets/Actes-complet.pdf).

ACT_hal-00170528, Champion F., 2005, F. Lexique et théorie de l'indication, Grossmann, M.A. Panneau et G. Petit (éds.), Didactique du lexique : langue, cognition, discours. Colloque sur l'enseignement du lexique, , Ellug, 133-146.

ACT_halshs-00080993, Couto J., Minel J.-L., 2006, SEXTANT, un langage de modélisation des connaissances pour la navigation textuelle, Schedae, ISDD, 191, Presses Universitaire de Caen, 105-116.

ACT_halshs-00097818, Couto J., Minel J.-L., 2004, Interfaces dynamiques de fouilles textuelles : vers une plate-forme de navigation textuelle, Semaine du Document Numérique, Recherche d'Informations dans les Documents par l'exploitation de Processus Perceptifs et Cognitifs, 448-456.

ACT_halshs-00098024, Couto J., Lundquist L., Minel J.-L., 2005, Naviguer dans les textes pour apprendre, TALN 2005, 421-426.

ACT_halshs-00169448, Delumeau F., 2004, Quelle forme graphique pour lésan trankil ?, Colette Feuillard, (éd.), Actes du XXVIème colloque international de linguistique fonctionnelle, Peter Lang, 79-82.

ACT_halshs-00169449, Delumeau F., 2005, Variation et diglossie en contexte guadeloupéen : quelques éléments de réflexion, Multilinguisme, multiculturalisme et milieu urbain, 41-61.

ACT_halshs-00170482, Delumeau F., à paraître, Quelle méthodologie de construction des observables dans l'optique de la génération automatique d'énoncés en créole guadeloupéen ?, Actes du colloque RFS 2005. Variations en diachronie et en synchronie.

ACT_halshs-00170483, Delumeau F., à paraître, Problèmes de traduction automatique en contexte diglossique : cas de la correspondance entre subordonnées françaises et créoles, Actes du colloque SCL 2006 Caribbean Language Studies and Educational Development.

ACT_halshs-00121758, Georgiev N., Labat J.M., Minel J.L., Nicolas L., 2005, Supervised Data Extraction, International Conference WWW/Internet, 100-115.

ACT_hal-00169191, Guerin E., 2005, Entre oral et écrit, quel modèle pour l'enseignement ? Actes du séminaire thématique en sciences du langage consacré aux problématiques de l’oral, Publication électronique de l’Ecole Doctorale, Connaissances, Langage, Modélisation, Université Paris X, Nanterre, 2005-06-03, France.

ACT_hal-00169192, Guerin E., 2007, Echec de la communication : une mauvaise appréhension de l’hétérogénéité linguistique, Actes de la journée d’étude sur les pratiques langagière des jeunes locuteurs en milieu urbain, Publication électronique, Nanterre, France.

ACT_hal-00170876, Guézennec N., 2005, Van den Avenne C., “ Je suppose que vous parlez tous breton ”. Mobilité et alternances codiques dans le conte en Basse-Bretagne, 3° colloque du RFS2003, L'Harmattan, Paris, 163-179.

Page 160: Laboratoire Modèles, Dynamiques, Corpus

160

ACT_hal-00170878, Hamon S., 2005, Propriétés syntaxiques et valeurs argumentatives des conjonctions parce que et puisque, Prépositions et conjonctions de subordination, Colloque franco-roumain de linguistique, Editura Excelsior Art, 145-159.

ACT_halshs-00144513, Lavie R.-J., 2004, Systemic productivity must complement structural productivity, Soares da Silva, A., Torres, A. & Gonçalves, M. (éds.), Linguagem, Cultura e Cognição: Estudos de Linguística Cognitiva 210th Congress of Cognitive Linguistics, Editions Almedina, 280-290.

ACT_hal-00170888, Lavieu B., 2004, Recherches linguistiques et didactique de la grammaire, Vargas C. (éd.), Langue et étude de la langue. Approches linguistiques et didactiques, Publications de l’Université de Provence, 69-80.

ACT_hal-00170892, Loiseau S., 2005, Thématique et sémantique contextuelle d’un concept philosophique, Williams G. (éd.), La Linguistique de corpus. Deuxièmes journées de la linguistique de corpus, Presses Universitaires de Rennes, 129-140.

ACT_hal-00171138, Muni Toke V., à paraître, Transparence et opacité du métalangage de l'Essai de grammaire de la langue française : Interprétation des termes construits et multiplicité des niveaux d'analyse, Actes de ColDoc 07. Le vocabulaire scientifique et technique en Sciences du Langage.

ACT_hal-00171148, Muni Toke V., à paraître, Constitution d’un champ disciplinaire. Etude du chapitre liminaire de l’Essai de grammaire de la langue française de Damourette et Pichon, Actes de ColDoc06. Intra-disciplinarité et extra-disciplinarité en sciences du langage.

ACT_hal-00171149, Muni Toke V., à paraître, Pour faire la grammaire française que nous concevons, il fallait être Français. La grammaire nationale de Damourette et Pichon, Actes du colloque (Mé)faits de langue et identité.

ACT_halshs-00117463, Ounis H., 2004, "Coup de foudre": métaphore ou signifié dans la langue ?, Actes des VIème Rencontres Jeunes Chercheurs de l'Ecole Doctorale 268 "Langage et langues", 393-96.

ACT_halshs-00088790, Vaguer C., 2004, 'Ella est plongée dans sa lecture' : 'lecture', complément ou prédicat ?, Actes des VIèmes Rencontres Jeunes Chercheurs de l'ED 268, Paris III-ILPGA , 470-74.

ACT_halshs-00088792, Vaguer C., 2005, Une base de données comme moyen de communication scientifique ?, Actas I, IXème Simposio International de comunicación social, 134-138.

ACT_halshs-00088796, Vaguer C., 2005, De l'utilité d'un corpus en syntaxe, mais quel corpus ?, P. Vergely (éd.), Rôle et place des Corpus en Linguistique, Actes du Colloque JETOU'2005, Université de Toulouse-Le Mirail, 101-114.

ACT_halshs-00139536, Vaguer C., 2006, Nouvelles technologies et apprentissage de la lecture, C. Vaguer & D. Leeman (dir.), Des savoirs savants aux savoirs enseignés. Didactique du français, Presses Universitaires de Namur & CE.