2010 09 06_construire-edition-electronqiue-vol-2-bouvard-et-pecuchet-colloque-mauriac-exeter
-
Upload
emmanuelle-morlock -
Category
Education
-
view
48 -
download
0
Transcript of 2010 09 06_construire-edition-electronqiue-vol-2-bouvard-et-pecuchet-colloque-mauriac-exeter
COMME UN KALÉIDOSCOPE…
Construire l’édition électronique du second volume de Bouvard et Pécuchet de Flaubert
L’édition critique, de l’imprimé au numérique : François Mauriac et les autres…
24e colloque international François Mauriac - Université d’Exeter, Grande-Bretagne, 2-4 septembre 2010
Emmanuelle Morlock-Gerstenkorn (CNRS – Service d’ingénierie documentaire de l’ISH – UMS 1798)
Stéphanie Dord-Crouslé (CNRS – Laboratoire LIRE – UMR 5611)
Le projet Bouvard
C’est un projet de recherche porté par Stéphanie Dord-Crouslé, chercheur au LIRE (UMR 5611).
Lancé en juin 2005, le projet a obtenu un financement de l’ANR (2008-2001) au titre de l'appel à projets « Corpus » 2007. La participation du service d’ingénierie documentaire de l’ISH au projet s’inscrit dans ce cadre :• Accompagnement à la gestion de projet
• Veille technologique et expertise TEI
• Coordination technique (Raphaël Tournoy)
Plan
1. Une édition nécessairement électronique
2. Contraintes et apports de l’encodage
3. L’enjeu interface
Un véritable « chantier documentaire »…Le manuscrit conservé à la bibliothèque municipale de Rouen :• 8 gros recueils de documents divers
• 2 recueils pour le Dictionnaire des idées reçues)
Caractéristiques :• taille imposante (2300 feuillets)
• hétérogénéité matérielle et typologique
• classement patrimonial sujet à caution
…pour lequel le support électronique est seul adapté• Navigation multicritères dans les 10 volumes : • patrimoniale (volume, dossier, cote)
• par type
• par date
• par scripteur
• Accès direct à toutes les pages
• Mise en regard du fac-simile image et de la transcription
• Moteur de recherche
• Liens directs vers les ouvrages cités disponibles en ligne
• Etc.
Le site de travailhttp://dossiers-flaubert.ish-lyon.cnrs.fr/
Un second volume au périmètre et à l’organisation flousUn « texte » composé de fragments –citations et extraits d’œuvres - dont les unités sont le plus souvent impossibles à identifier et à classer avec certitude…
« Ces notes, dans son projet, devaient être reliées, soudées ensemble, par des morceaux de récit qui remettaient en scène les deux commis, et par des morceaux de dialogues, formant les commentaires de leurs lectures et de leurs copies. Ces parties, je ne puis me permettre de les faire, et, sans elles, le livre est illisible : il ne forme plus qu'une agglomération, qu'un amas de citations sans ordre, dont le sens même échappera très souvent au lecteur. »
Maupassant - lettre du 30 juillet 1881 à la nièce de Flaubert
roc oc o
Sty le médica l
da nge rs du c hoc o la t .
http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_7_f_014__r____http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_3_f_128__r____
Un processus de composition complexe
A partir de l’analyse matérielle et typologique du corpus, un classement se dessine :
Notes de lecture (NL) Notes de lectures annotées de marques de
sélection (NLM) Listes récapitulatives de recopiages ou
« todo lists » (PR) Les pages préparées par Laporte (PP1)
pour le 2nd volume Les montages de morceaux de PP1 réalisés
par Flaubert et annotés de marques de sélection (PP2)
Les pages de la main de Flaubert préparées pour le 2nd volume, pendant la
collaboration et après la brouille (PP3)
Mais ce n’est pas une chronologie ni un processus complet : les PP n’ont pas vocation à passer par ces 3 stades ! 2nd volume achevé = PP1+ PP2 + PP3
http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_7_f_012__r____http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_6_f_192__r____http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_3_f_134__r____
Structuration du corpus et numérisation du texte : choix de la TEILa Text Encoding Initiative est un consortium international d’universitaires qui développe un standard d’encodage depuis le début des années 90 :
les « Guidelines »
= cadre de description très générique pour l’encodage structuré de textes de natures variées, en vue de leur échange et de leur exploitation.
Le format TEI est choisi pour le projet Bouvard suite à une « étude de faisabilité », menée dans le cadre du stage de fin d’étude d’un master 2 professionnel.
Des contraintes fortes
Un balisage descriptif privilégiant la « logique » textuelle (sur sa présentation matérielle)
Une structure arborescente hiérarchique unique (interdiction des chevauchements de balises en XML)
L’encodage manuel est une tâche longue (donc coûteuse), pour lequel il faut être (bien) formé…
Transcription diplomatiqu
e traditionnell
e
Pré-balisage
EncodageContrôle et enrichissem
ent
Supervision scientifique
Macro-Structuratio
n en <teiCorpus>
Indexation sémantique
Intégration dans
l'interface d'édition
Le « workflow » TEI du projet
1
2
3
4
5
Mais une solution au problème de l’extraction des fragments textuelsComment gérer la saisie de toutes les relations possibles entre un fragment et ses classements :
• prévus• probables• potentiels• abandonnés• etc.
sur plus de 3500 pages ?Fragmen
t 1
Littérature de
Jocrisses
vérités
jocrisses
imbécilles
Fragment 2
Littérature de
Jocrisses
Fragment 3
Littérature de
Jocrisses
jocrisse
Fragment 4
Littérature de
Jocrisses
Fragment 5
Littérature de
Jocrisses
Littérature de
jocrisses
Véritésjocrisses
imbécilles
Fragment 1
Fragment2 Jocrisses
Fragment 3
Fragment 4
Fragment 5
Exemple de hiérarchie logique d’une page
http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_1_f_082__r____
« Littérature de Jocrisses »
en <head> (titre de liste)
= s’applique à tous les items
de la liste (fragments)
« jocrisse »placé dans le <label>
(étiquette d’item) est redoublé pour le troisième <item>
(fragment) et uniquement lui
Littérature de jocrisses<head>
Véritésjocrisses
imbécilles<label>
Fragment 1<item>
Fragment2<item>
Jocrisses<label>
Fragment 3<item>
Fragment 4<item>
Fragment 5<item>
Le même exemple avec les balises TEI choisies
http://dossiers-flaubert.ish-lyon.cnrs.fr/cote-g226_1_f_082__r____
Un cahier des charges ambitieux
Reconstitutions conjecturales :•Parcours figés •Mode simple• Mode expert
Représentation des fragments et des catégories de classement• Degré de certitude par rapport au 2nd volume• Orientation dans l’éventail des mobilités possibles
Édition de la transcription textuelle• Exploiter les possibilités du support électronique• Respect si possible des conventions traditionnelles d’édition critique
• Ergonomie de la présentation de l’appareil critique• Lisibilité et utilisabilité
Deux interfaces clés
1. La « matrice »
Une représentation visuelle simplifiée permettant d’éditer facilement une première base de travail à partir :
• des grandes sections thématiques
• de la typologie des fragments
2. L’interface de lecture et de reclassement
Suggérer des reclassements en exploitant les métadonnées enregistrées dans la base de données….
1. La « matrice »
« J’édite mon Second volume de Bouvard et Pécuchet »…
Typologie des fragments
Catégories de classement PR NL avec marque(s) de sélectionNL sans marque
de sélection Doc préparat Doc provis.
croix
catégorie croix et catégorie
soulignement ou trait vertical
Annonces, réclames, circulaires
Nomenclatures et bizarreries
Spécimens de style
Scientifiques
Ecclésiastiques
Grands Écrivains
Romantiques
Dramatiques
Révolutionnaires
Réaliste, populaire, cavalier, des propriétaires
Officiels, Souverains
Nomenclatures et bizarreries
Spécimens de style
Esthétique et Critique
Haine des romans
Classiques corrigés
Histoire et Idées scientifiques
Contradictions de la science
Philosophie
Religion. Mysticisme. Prophéties
Grands Hommes
Exaltation du Bas
Beautés
Injures. Sottises. Lâchetés. Amour. Palinodies
0% 20% 40% 60% 80%100%
Page préparéePage récapitulativeNote de lecture avec marques de sélectionNote de lecture sans marqueDossier de Jules DuplanDocumentation provi-sionnelle brute
Ajuster le curseurPar exemple + ou – de notes
de lectures avec marques
Sections thématique
s
Types génétiqu
es
2. L’interface de lecture et de reclassement des fragments
Spécimens de style
• Style scientifique• Style agricole
• Arbres enfants• Valets de comédie• Gamins • Vertueux• Belle pensée
• Les jésuites ont rendu des services éminents à la littérature et à l’instruction publique. (…)
• Grande pensée• Style rococo• (…)
La lecture de la reconstitution s’effectue en dépliant ou repliant les catégories…
Section thématique Fragment
Catégorie
Plusieurs modes de lecture combinés…
• Style agricole • Après Canova*• Belle pensée
3-135-f5
• ce qui couronne la gloire des jésuites
•
C3-136-f2
Spécimens de style
• Style scientifique• Style agricole
• Arbres enfants• Valets de comédie• Gamins • Vertueux• Belle pensée
• Les jésuites ont rendu des services éminents à la littérature et à l’instruction publique. (…)
• Grande pensée• Style rococo• (…)
Transcriptions Diplomatique Semi-
diplomatique Normalisée
Référence bibliographiqueImage de la page complèteSéquenceDossierEtc.
Le guidage des reclassements éventuels
Catégories proches
• spécimens de style
• périphrases• ethnographique
Catégories plus lointaine s (vedettes
associées à toutes les autres
citations du même auteur
• idées scientifiques•sciences d'avant le déluge
•sciences de l’Egypte•Moïse infaillible•astronomie•exaltation du Bas• la philosophie de notre siècle
•philosophies du 18e siècle
•tous coquins•Locke•Grands hommes •Voltaire
Catégories très éloignées
• Gallilée• Locke• etc.
Reclasser ?
Catégories extraites de la base
de données
Histoire et idées
scientifiques
•(…)•Histoire• Idées scientifiques• linguistique•Si on avait un dictionnaire des langues sauvages on y trouverait des restes évidents d’une langue antérieure parlée par un peuple éclairé, et quand même nous ne les trouverions pas, il en résulterait seulement que la dégradation est arrivée au point d’effacer ces derniers restes.
•4-48-f-•(…)
De Maistre, Les Soirées de Saint-Pétersbourg, 2e entretien
Comparer visuellement les reconstitutions ?Si créer une reconstitution, c’est « remplir le tableau », il est facile d’en proposer une représentation visuelle et graphique et de comparer ainsi plusieurs reconstitutions entre elles…La métaphore du
kaléidoscope :« Cette image permet (…) d'illustrer un propos soutenant que ce ne sont pas les éléments qui font le tout, mais la forme que prend leur combinaison : le tout n'est pas réductible à la somme de ses parties. »
Wikipédia, consulté le 31 août 2010
Nomenclatures et bizarreries
Spécimens de style
Esthétique et Critique
Haine des romans
Classiques corrigés
Histoire et Idées scientifiquesContradictions de la
science
Philosophie
Religion. Mysticisme. Prophéties
Grands Hommes
Exaltation du Bas
Beautés
Injures. Sottises. Lâchetés. Amour. Palinodies
Reconstitution de Léa Caminiti
Nomenclatures et bizarreries
Spécimens de style
Esthétique et Critique
Haine des romans
Classiques corrigés
Histoire et Idées scientifiques
Contradictions de la sciencePhilosophie
Religion. Mysticisme. Prophéties
Grands Hommes
Exaltation du Bas
Beautés
Injures. Sottises. Lâchetés. Amour. Palinodies
0
100
200
PPPRNLMNLDUPBRUT
Merci pour votre attention !
http://dossiers-flaubert.ish-lyon.cnrs.fr/
stephanie.dordcrousle
@ens-lyon.fr
Des questions ?