Etude de la variation interdiscursive des titres de section
description
Transcript of Etude de la variation interdiscursive des titres de section
2 et 3 juin 2004 Journées d’étude de l’opération « sémantique et corpus »La place des méthodes quantitatives dans le travail du linguiste
1
Etude de la variation interdiscursive des titres de section
• Cadre général– Etude du rôle de l’unité titre dans la structuration du discours
– Hypothèse issue des travaux de Biber (1988) : l’emploi de toute forme syntaxique varie en fonction du genre de texte où elle apparaît
• Quels observables ?– Annotation manuelle
– Structure syntaxique des titres
• Un corpus diversifiéNbre de mots Nbre de textes Nbre de titres
Textes professionnels (Gestion des déplacements)
57 000 10 345
Articles scientifiques (Géopolitique)
267 000 31 348
Articles scientifiques (Ingénierie de la connaissance)
123 000 18 345
Total 457 000 59 1041
2 et 3 juin 2004 Journées d’étude de l’opération « sémantique et corpus »La place des méthodes quantitatives dans le travail du linguiste
2
Description de la forme des titres de section dans le corpus (1)
• Un ensemble de formes diversifiées
• Exemples
Nbre d’occ %
SN 946 91%
SV 29 3%
SP 24 2%
Phrase 42 4%Total 1041 100%
SN La géographie stratégique de l’ère nucléaire
SV Penser la guerre totale
SP Pour une "mondialisation durable"
Phrase La place du pétrole dans le bilan énergétique est stable
2 et 3 juin 2004 Journées d’étude de l’opération « sémantique et corpus »La place des méthodes quantitatives dans le travail du linguiste
3
Description de la forme des titres de section dans le corpus (2)
• Ponctuation / coordination
• Exemples
Nbre d’occ %
Coordination 96 9%
Ponctuation 94 9%
Aucune 851 82%
Total 1041 100%
Coordination Les médias et les ONG
Recul de la pauvreté et inégalité internationale
Ponctuation Décolonisation : une déconstruction politique et militaire
Le cycle de Doha : état des lieux
2 et 3 juin 2004 Journées d’étude de l’opération « sémantique et corpus »La place des méthodes quantitatives dans le travail du linguiste
4
Description de la forme des titres de section dans le corpus (2)
• Comment ces formes se répartissent-elles dans les textes ?
SNOcc %
SVOcc %
SPOcc %
PhraseOcc %
Coord.Occ %
Ponct.Occ %
Gestion des déplacements
343 36% __ 2 8% __ 26 27% 5 5%
Géopolitique 299 32% 6 21% 14 58% 29 69% 41 43% 65 69%
Ingénierie de la connaissance
304 32% 23 79% 8 34% 13 31% 29 30% 24 26%
Total 946 100% 29 100% 24 100% 42 100% 96 100% 94 100%
2 et 3 juin 2004 Journées d’étude de l’opération « sémantique et corpus »La place des méthodes quantitatives dans le travail du linguiste
5
Quels sont les liens entre la forme des titres et le type de texte ?
Articles scientifiques (Ingénierie des connaissances)
Articles scientifiques (géopolitique)
Textes professionnels (Gestion des déplacements)
SNSV SP
Bipartite
Phrastique
Coord
Ponct
Phrase
Bloc uniqueBloc unique