Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF,...

31
1 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD Synthèse du sondage sur les éditeurs XML TEI/EAD Introduction ..................................................................................................................... 3 Méthodologie ...................................................................................................................................................................... 3 Résultats d’ensemble ........................................................................................................ 5 Répartition des langues ...................................................................................................................................................... 5 Diplôme le plus élevé des répondants au sondage ................................................................................................. 5 Professions des répondants ............................................................................................................................................... 6 Fonction des répondants au sein de leur institution ............................................................................................. 6 Domaines de recherche des participants au sondage ........................................................................................... 6 Périodes historiques des corpus ...................................................................................................................................... 7 Langues des corpus ............................................................................................................................................................... 8 Des supports de texte variés.............................................................................................................................................. 8 Temps de travail sur l’éditeur .......................................................................................................................................... 9 Depuis combien de temps connaissez-vous la TEI / l’EAD ? .............................................................................. 9 Depuis combien de temps utilisez-vous la TEI / l’EAD ? ....................................................................................10 Comment avez-vous appris la TEI / l’EAD ? ............................................................................................................10 Niveau de maîtrise des technologies de l’information des répondants ......................................................11 Systèmes d’exploitation utilisés .....................................................................................................................................11 La TEI, format le plus utilisé par les répondants à ce sondage ......................................................................11 Niveau de maîtrise des technologies de l’information des répondants en fonction des formats les plus utilisés..............................................................................................................................................................................12 Usage les plus fréquents de l’éditeur XML (encodage et/ou transformation).........................................12 Recommandations concernant les méthodes de travail suivies par les participants au sondage et connaissance de la TEI / de l’EAD que cela implique..........................................................................................12 Satisfaction globale des répondants concernant la solution qu’ils utilisent actuellement ...............13 Préférence marquée pour un éditeur open source ...............................................................................................14 Prix de l’éditeur.....................................................................................................................................................................14 Résultats détaillés........................................................................................................... 16 Éditeurs utilisés ............................................................................................................................................................... 16 Éditeurs utilisés professionnellement.........................................................................................................................16 Usage personnel de l’éditeur...........................................................................................................................................17 Précisions sur la satisfaction ...................................................................................................................................... 17 Satisfaction en fonction de la profession ..................................................................................................................17 Satisfaction en fonction du format le plus souvent utilisé ................................................................................17 Satisfaction en fonction du temps passé à travailler sur l’éditeur................................................................18 Éditeur XML et workflow............................................................................................................................................. 19 Usage les plus fréquents de l’éditeur XML (encodage et/ou transformation).........................................19 Outils propres à l’usage des répondants développés en complément des fonctionnalités de l’éditeur ....................................................................................................................................................................................20 Les formats..............................................................................................................................................................................20 Support de texte et formats utilisés.............................................................................................................................22 Fonctionnalités les plus utiles ........................................................................................................................................23 Fonctionnalités manquantes ..........................................................................................................................................24 Innovations proposées par les participants au sondage ...................................................................................25 Besoin d’un outil collaboratif .........................................................................................................................................26 Outil idéal ................................................................................................................................................................................26 Perception de la TEI/ de l’EAD ......................................................................................................................................27 Autres commentaires des participants au sondage .............................................................................................28 Conclusion ...................................................................................................................... 29

Transcript of Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF,...

Page 1: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

1 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Synthèse du sondage sur les éditeurs XML TEI/EAD

Introduction ..................................................................................................................... 3 Méthodologie ...................................................................................................................................................................... 3

Résultats d’ensemble ........................................................................................................ 5 Répartition des langues ...................................................................................................................................................... 5 Diplôme le plus élevé des répondants au sondage ................................................................................................. 5 Professions des répondants ............................................................................................................................................... 6 Fonction des répondants au sein de leur institution ............................................................................................. 6 Domaines de recherche des participants au sondage ........................................................................................... 6 Périodes historiques des corpus ...................................................................................................................................... 7 Langues des corpus ............................................................................................................................................................... 8 Des supports de texte variés.............................................................................................................................................. 8 Temps de travail sur l’éditeur .......................................................................................................................................... 9 Depuis combien de temps connaissez-vous la TEI / l’EAD ? .............................................................................. 9 Depuis combien de temps utilisez-vous la TEI / l’EAD ? ....................................................................................10 Comment avez-vous appris la TEI / l’EAD ? ............................................................................................................10 Niveau de maîtrise des technologies de l’information des répondants ......................................................11 Systèmes d’exploitation utilisés .....................................................................................................................................11 La TEI, format le plus utilisé par les répondants à ce sondage ......................................................................11 Niveau de maîtrise des technologies de l’information des répondants en fonction des formats les plus utilisés..............................................................................................................................................................................12 Usage les plus fréquents de l’éditeur XML (encodage et/ou transformation).........................................12 Recommandations concernant les méthodes de travail suivies par les participants au sondage et connaissance de la TEI / de l’EAD que cela implique ..........................................................................................12 Satisfaction globale des répondants concernant la solution qu’ils utilisent actuellement ...............13 Préférence marquée pour un éditeur open source ...............................................................................................14 Prix de l’éditeur .....................................................................................................................................................................14

Résultats détaillés ........................................................................................................... 16 Éditeurs utilisés ............................................................................................................................................................... 16

Éditeurs utilisés professionnellement .........................................................................................................................16 Usage personnel de l’éditeur ...........................................................................................................................................17

Précisions sur la satisfaction ...................................................................................................................................... 17 Satisfaction en fonction de la profession ..................................................................................................................17 Satisfaction en fonction du format le plus souvent utilisé ................................................................................17 Satisfaction en fonction du temps passé à travailler sur l’éditeur ................................................................18

Éditeur XML et workflow ............................................................................................................................................. 19 Usage les plus fréquents de l’éditeur XML (encodage et/ou transformation).........................................19 Outils propres à l’usage des répondants développés en complément des fonctionnalités de l’éditeur ....................................................................................................................................................................................20 Les formats..............................................................................................................................................................................20 Support de texte et formats utilisés .............................................................................................................................22 Fonctionnalités les plus utiles ........................................................................................................................................23 Fonctionnalités manquantes ..........................................................................................................................................24 Innovations proposées par les participants au sondage ...................................................................................25 Besoin d’un outil collaboratif .........................................................................................................................................26 Outil idéal ................................................................................................................................................................................26 Perception de la TEI/ de l’EAD ......................................................................................................................................27 Autres commentaires des participants au sondage .............................................................................................28

Conclusion ...................................................................................................................... 29

Page 2: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

2 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Annexe : Cas d’utilisation ................................................................................................ 30 Conservateur de bibliothèque municipale ........................................................................................................... 30 Doctorant réalisant des éditions électroniques en TEI ................................................................................... 30 Chercheur ........................................................................................................................................................................... 30 Responsable de bibliothèque numérique, spécialiste de métadonnées ................................................... 30 Ingénieur d’études .......................................................................................................................................................... 31

Page 3: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

3 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Introduction

L’Équipex Biblissima a pour objectif de créer un observatoire du patrimoine écrit du Moyen

Âge et de la Renaissance. Il donnera à terme un accès commun à plusieurs entrepôts d’images numériques, à de nombreuses bases de données, à des éditions électroniques, ainsi qu’à une boîte à outils. Les institutions partenaires du projet réalisent de nombreux travaux utilisant l’EAD (catalogue BnF Archives et Manuscrits par exemple), ou la TEI pour des éditions électroniques (inventaires de la bibliothèque du Mont Saint-Michel à la MRSH de Caen, projet Sermones au CIHAM, reliures.data.bnf à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques virtuelles humanistes au CESR de Tours, etc.)

Des partenaires de Biblissima créent actuellement des développements autour d’outils pour l’encodage normalisé et la publication de documents en EAD et en TEI (notamment des inventaires de bibliothèques anciennes). Le pôle document numérique de la MRSH de Caen a ainsi développé un environnement de travail open source autour du logiciel XMLMind, un développement qu’il est envisagé de poursuivre dans le cadre de Biblissima. L’enquête1 avait donc pour objectif de mieux connaître les pratiques et les besoins des utilisateurs d'éditeurs XML réalisant des encodages en TEI et/ou en EAD, afin de développer des outils correspondant au mieux à leurs besoins.

D’autres études ont déjà été menées sur les utilisateurs de la TEI, par exemple le sondage de Marjorie Burghart et Malte Rehbein sur les pratiques des membres du SIG Manuscripts du TEI Consortium2, sur lesquelles nous nous sommes appuyés. Nous suivrons également de près les développements du projet DiXiT, Digital Scholarly Editions Initial Training Network (http://dixit.uni-koeln.de/).

Méthodologie

Ce sondage en ligne a été créé avec le logiciel libre LimeSurvey3. Le questionnaire contenait 45 questions, dont 16 obligatoires. Le questionnaire, précédé d’une page d’accueil, était composé de 3 pages de questions en trois groupes (trois pages web) :

« Votre environnement d'édition », pour connaître la pratique actuelle des répondants

« Vos attentes », groupe de questions se concentrant sur leurs besoins

« Pour mieux vous connaître », afin d'avoir des informations plus précises sur les répondants et leur travail.

Les deux premiers groupes concentraient les questions centrales du sondage. Le dernier groupe de questions ne contenait aucune question obligatoire.

Le sondage a été traduit en trois langues : français, anglais, allemand. Afin de diffuser les invitations au sondage, nous avons ciblé à la fois des personnes-ressources contactées individuellement par e-mail (103 personnes) et des listes de diffusion, au niveau national et international.

Les listes de diffusion retenues étaient : TEI-List (1046 abonnés), DH list (590 abonnés), bibliopat (1364 abonnés). Le sondage a également fait l'objet d'une brève d'actualité sur le site de Biblissima, qui venait d'être lancé.

1 Le sondage est toujours disponible à cette adresse :

http://www.biblissima-condorcet.fr/limesurvey/index.php/229321/lang-fr 2 Marjorie Burghart, Malter Rehbein, The present and future of the TEI community of Manuscript Encoding (2012), Journal of the Text Encoding Initiative. 3 https://www.limesurvey.org

Page 4: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

4 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Les réponses ont été collectées anonymement via un sondage en ligne entre le 14 mai et le 14 juin 2013. Concernant le nombre de réponses au questionnaire, le logiciel LimeSurvey fait la distinction entre les réponses complètes (les réponses des personnes qui ont répondu aux questions obligatoires, soit 16 questions sur les 45 questions proposées ou plus) et les réponses incomplètes (nombre de personnes qui ont ouvert le sondage mais n’ont pas répondu à toutes les questions obligatoires) : Réponses complètes : 102 Réponses incomplètes : 249 Nombre total de réponses : 351 La fonctionnalité d’enregistrement de la dernière page indique qu’en fait la plupart des répondants (219) se sont arrêtés à l’ouverture du sondage (page d’accueil). 29 ont ouvert la première page. Trois répondants se sont arrêtés à la page 2 et ont exprimé leurs attentes sur les fonctionnalités, sans pour autant répondre à l’ensemble des questions obligatoires.

Il faut retenir que le questionnaire a recueilli 102 réponses complètes4. Parmi les 102 répondants, 55, soit plus de la moitié, ont renseigné leur e-mail à la dernière question du sondage et peuvent donc être considérés comme véritablement intéressés par les développements à venir. Ce questionnaire s'adressait à des personnes utilisant déjà des éditeurs pour l’encodage en TEI ou en EAD. Il permet donc de mieux connaître les avantages, les inconvénients, les insuffisances des outils existants, et les desiderata d'un public déjà convaincu. Cette première étape, en particulier la description de la communauté cible, de ses besoins, des fonctionnalités souhaitées, permet une première définition de l'outil qui conviendrait à un autre public cible : celui des utilisateurs potentiels, n'ayant jamais pratiqué le balisage XML. Le cahier des charges de l'outil sera donc affiné par une enquête qualitative auprès de ce second cercle d'utilisateurs, sociologiquement et professionnellement identique au premier.

4 Les résultats présentés ci-dessous sont basés sur les réponses complètes (102), sauf quand précisé autrement.

Page 5: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

5 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Résultats d’ensemble

Répartition des langues

Figure 1 Langue des réponses complètes

Diplôme le plus élevé des répondants au sondage

Figure 2 Diplôme le plus élevé des répondants

100 participants ont répondu à cette question. Les détenteurs de master et de doctorat représentent la grande majorité des participants à ce sondage. D’autres diplômes que ceux proposés ont été mentionnés, comme archiviste-paléographe ou conservateur des bibliothèques.

18%

29%

53%

Langues des réponses complètes

de

en

fr

0

5

10

15

20

25

30

35

40

45

50

Master Doctorat Autre Licence Baccalauréat

Eff

ect

if

Diplômes des répondants

Page 6: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

6 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Professions des répondants5

Figure 3 Professions des répondants

Fonction des répondants au sein de leur institution6

Les fonctions les plus représentées sont : maître de conférence (8 répondants), chercheur (6), bibliothécaire responsable des services numériques (5), chef de projet (5), collaborateur au sein d’un projet (5), ingénieur d’études (5), responsable de fonds anciens (5), conservateur (3), directeur d’études (3), doctorant (3), professeur (3), coordinateur de projet (2), enseignant-chercheur (2). Ont également été mentionnées une trentaine de fonctions distinctes (assistant archiviste, chargé de ressources numériques, directeur de publication, e-archiviste, responsable de la numérisation, etc.).

Domaines de recherche des participants au sondage

Avec 146 domaines de recherche indiqués pour 102 réponses complètes, on s’aperçoit que les répondants sont parfois pluridisciplinaires, comme il l’a aussi été mentionné dans le champ « autre ».

5 Les 87 réponses textuelles à cette question ont été rassemblées sous les catégories de professions suivantes. 6 Cette question a fait l’objet de 88 réponses.

0

5

10

15

20

25

30

35

40

Eff

ect

ifs

Catégories de profession

Professions

Page 7: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

7 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Figure 4 Disciplines des répondants

Les autres disciplines mentionnées sont les digital humanities (5 fois), la philosophie, l’histoire du livre, l’archivistique, le latin, l’informatique, l’ethnologie, l’information et la documentation, la médecine, l’archéologie, etc.

Périodes historiques des corpus

Les répondants travaillent souvent sur plusieurs périodes historiques (167 périodes historiques indiquées pour 102 réponses complètes), un répondant a même indiqué travailler sur « toutes les périodes ».

Figure 5 Périodes historiques sur lesquelles travaillent les répondants

Les périodes historiques concernées en premier lieu par Biblissima (Moyen Âge et Renaissance) sont logiquement bien représentées parmi les répondants.

Page 8: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

8 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Langues des corpus

Les corpus comprennent très souvent plusieurs langues (359 langues indiquées pour 102 réponses complètes). La langue dominante est le latin (présent dans 66% des corpus des répondants), suivi par le français (62%), l’anglais (52%), l’allemand (41%), soit les trois langues du questionnaire. Les autres langues se répartissent ainsi : Réponse Décompte Pourcentage

Grec ancien 34 33,33%

Espagnol 25 24,51%

Autre 25 24,51%

Italien 23 22,55%

Arabe 14 13,73%

Hébreu 13 12,75%

D’autres langues ont également été mentionnées en commentaire : chinois, japonais, langues amérindiennes, irlandais, russe, syriaque, copte, turc, néerlandais, araméen, arménien, égyptien, etc.

Des supports de texte variés

Les répondants travaillent très fréquemment sur plusieurs supports de texte (300 supports de textes pour 102 réponses). Les manuscrits (68% des répondants) dominent largement, suivis par les imprimés anciens (38%), les livres modernes (37% des répondants), les lettres (32% des répondants), les actes (23% des répondants), les incunables (23%). Ces données correspondent au public cible de Biblissima. D’autres supports de textes ont également été mentionnés : la reliure, les dessins/schémas, les fonds d’archives, ainsi que « tous » les supports de textes proposés7. L’éditeur doit donc être souple concernant les formats utilisés. Il est important d’organiser une structure claire et simple d’utilisation pour des besoins variés.

7 Outre ceux précédemment cités, étaient proposés comme support de texte : carte géographique, fragment, inscription épigraphique, périodique, rouleau.

Page 9: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

9 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Temps de travail sur l’éditeur

Figure 6 Temps de travail hebdomadaire et proportionnel au temps de travail passé sur ce type d'outil

Les deux graphiques ci-dessus représentent le nombre d’heures passé à travailler avec les éditeurs par semaine, et le pourcentage du temps de travail que cela représente.

La moitié des répondants utilise l’éditeur moins de 25% de son temps de travail, et un tiers l’utilise entre 25 et 50% de son temps de travail.

Depuis combien de temps connaissez-vous la TEI / l’EAD ?8

Figure 7 Nombre d'années de connaissance de la TEI / de l'EAD

8 100 réponses à cette question

24%

31% 14%

31%

Nombre d'heures passé sur l'éditeur par semaine

< 5h

5-10h

10-15h

> 15h

50%

33%

12%

5%

Pourcentage du temps de travail que cela représente

< 25%

25-50%

50-75%

> 75%

0

5

10

15

20

25

30

35

3-5 ans > 10 ans 5-10 ans 1-2 ans < 1 an

Eff

ect

if

Nombre d'années de connaissance de la TEI / de l'EAD

Page 10: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

10 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Depuis combien de temps utilisez-vous la TEI / l’EAD ?9

Figure 8 Nombre d'années d'utilisation de la TEI / de l'EAD

Les plus grands groupes de participants au sondage connaissent et utilisent la TEI et /ou l’EAD depuis 3-5 ans et depuis plus de 10 ans. On observe aussi un décalage dans le temps, normal, entre la prise de connaissance et l’utilisation de la TEI et/ou de l’EAD.

Comment avez-vous appris la TEI / l’EAD ?

Il faut noter que sur les 100 participants ayant répondu à cette question, près de la moitié sont autodidactes, ce qui renforce le besoin d’outil convivial et collaboratif. 28% ont reçu une formation professionnelle, et 26% une formation universitaire. Les répondants ont parfois mentionné les formations auxquelles ils ont participé : l’Oxford summer school, les stages de la BnF, le master de l’École des Chartes, l’Enssib, Médiadix, le MUTEC, etc.

Figure 9 Modes d'apprentissage de la TEI / de l'EAD

9 94 réponses à cette question

0

5

10

15

20

25

30

35

3-5 ans > 10 ans 5-10 ans 1-2 ans < 1 an

Eff

ect

if

Nombre d'années d'utilisation de la TEI / de l'EAD

46%

28%

26%

Modes d'apprentissage de la TEI / de l'EAD

En autodidacte

Formationprofessionnelle

Formation universitaire

Page 11: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

11 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Niveau de maîtrise des technologies de l’information des répondants

64% des répondants au sondage se définissent comme des utilisateurs confirmés des technologies de l’information et 21% comme utilisateurs débutants. Cette répartition nous semble logique en raison de la diffusion du questionnaire : les listes de diffusion comme la TEI-list étant suivies par des personnes plus spécialisées. Plus de 15 % des répondants n’ont pas donné leur opinion. 44 participants ont commenté cette question, principalement pour préciser depuis combien de temps ils travaillent avec la TEI ou l’EAD. Sans surprise, les participants s’estimant utilisateurs confirmés des technologies de l’information passent plus de temps à travailler avec un éditeur que les répondants s’estimant utilisateurs débutants (51 % des « utilisateurs confirmés » travaillent plus de 10h par semaine avec ces outils). Néanmoins, nous avons relevé que près de 25% des « utilisateurs débutants » travaillent plus de 15h par semaine avec ces outils.

Systèmes d’exploitation utilisés

Figure 10 Systèmes d'exploitation

60 répondants utilisent deux systèmes d’exploitation différents et 13 utilisent les trois systèmes. Un autre système d’exploitation a été mentionné : Android. L’éditeur doit donc être compatible avec plusieurs systèmes d’exploitation.

La TEI, format le plus utilisé par les répondants à ce sondage

Le format utilisé le plus souvent par les répondants au sondage est la TEI (69,61%). Quant à l’EAD, c’est le format le plus souvent utilisé par 20,59% des répondants au sondage. (Les proportions auraient sans doute été très différentes si le questionnaire avait été diffusé auprès de mailing-lists davantage suivies par des archivistes.) Enfin, 9,80% des répondants indiquent utiliser plus souvent d’autres formats que la TEI ou l’EAD. En croisant les réponses concernant le format le plus souvent utilisé avec les professions des répondants, on s’aperçoit que l’EAD est essentiellement utilisé par les bibliothécaires/conservateurs (78% des répondants utilisant le plus souvent l’EAD). Les autres professions utilisent le plus souvent la TEI comme format d’encodage.

26%

22%

52%

Systèmes d'exploitation utilisés

Mac

Linux

Windows

Page 12: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

12 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Niveau de maîtrise des technologies de l’information des répondants en

fonction des formats les plus utilisés

- 52% des répondants qui font surtout de l’EAD estiment être des utilisateurs confirmés des technologies de l’information - 19% des répondants qui font surtout de l’EAD estiment être des utilisateurs débutants des technologies de l’information - 66% des répondants qui font surtout de la TEI estiment être des utilisateurs confirmés des technologies de l’information - 21% des répondants qui font surtout de la TEI estiment être des utilisateurs débutants des technologies de l’information.

Usage les plus fréquents de l’éditeur XML (encodage et/ou transformation)

La quasi-totalité des répondants au sondage réalise des encodages (97%), mais une part non négligeable effectue aussi la transformation des fichiers XML (64%). Les autres usages de l’éditeur mentionnés (19 réponses) sont majoritairement le contrôle / la correction des encodages, mais aussi la programmation, les requêtes XQuery, le traitement de texte.

Recommandations concernant les méthodes de travail suivies par les

participants au sondage et connaissance de la TEI / de l’EAD que cela

implique

Les répondants10 recommandent leur méthode de travail essentiellement à des personnes avec des connaissances de base en TEI (18 répondants), « à des débutants » (15), à des personnes avec des connaissances avancées en TEI (15). Concernant l’EAD, les recommandations sont adressées soit à des personnes avec des connaissances de base (4), soit à des personnes avec des connaissances avancées de la DTD (6). Cela indique que si certaines méthodes sont faciles à aborder, d’autres nécessitent des connaissances plus poussées (personnes pratiquant la XSLT, spécialistes des technologies de l’information, etc.) Par ailleurs, des réponses (6) mentionnent la nécessité d’une formation spécifique à l’outil d’encodage puis d’un encadrement (par exemple «Bien adaptée à l'édition de sources ; nécessité d'une formation initiale et d'un encadrement très suivi »). À noter également que certaines personnes (6) ne recommandent pas leur méthode de travail.

10 67 réponses à cette question (réponse textuelle libre)

Page 13: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

13 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Satisfaction globale des répondants concernant la solution qu’ils utilisent

actuellement

Figure 11 Satisfaction globale des participants concernant la solution qu’ils utilisent actuellement.

77% des participants à ce sondage indiquent qu’ils sont satisfaits ou très satisfaits de la solution qu’ils utilisent actuellement. La question sur la satisfaction concernant la solution utilisée actuellement par les répondants a fait l’objet de 60 commentaires ; les répondants y ont justifié leur degré de satisfaction. Les points positifs mis en avant soulignent en particulier la richesse des fonctionnalités d’oXygen (18 commentaires), ou de l’environnement XXE développé à Caen autour de XMLMind (« L'outil est facile à utiliser grâce à des interfaces de travail ergonomiques. ») Les raisons données à l’insatisfaction sont la prise en main complexe des outils, à cause notamment des interfaces trop chargées des éditeurs (oXygen, XMetal). Les commentaires négatifs soulèvent aussi le besoin d’interfaces plus ergonomiques et personnalisables (masque de saisie), d’un éditeur non propriétaire, mais également la gestion des fichiers lourds et des écritures de droite à gauche, et le manque de tutoriels.

1%

22%

60%

17%

Satisfaction globale des participants

Pas satisfait

Peu satisfait

Satisfait

Très satisfait

Page 14: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

14 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Préférence marquée pour un éditeur open source

Figure 12 Préférence pour un éditeur open source

La question « Avez-vous une préférence pour un éditeur propriétaire ou pour un éditeur open source ? » a donné matière à de nombreux commentaires justifiant la réponse (philosophie open source, coûts, etc.) Un éditeur open source est clairement plébiscité, mais un tiers tout de même des répondants n’a pas de préférence sur le sujet.

Prix de l’éditeur

Figure 13 Combien seriez-vous prêt à payer pour un éditeur commercial, professionnellement ?

2%

68%

30%

Préférence pour un éditeur open source

Préférence pour unéditeur propriétaire

Préférence pour unéditeur open source

Pas de préférence

11%

15%

27% 19%

18%

10%

Prix que les participants sont prêts à payer professionnellement pour un éditeur commercial

0 €

< 30€

30-50€

50-75€

75-100€

> 150€

Page 15: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

15 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Figure 14 Combien seriez-vous prêt à payer pour un éditeur commercial, personnellement ?

Les répondants sont donc moins enclins à payer personnellement pour un éditeur commercial que professionnellement.

37%

30%

17%

9%

7%

0%

Prix que les participants sont prêts à payer personnellement pour un éditeur commercial

0 €

< 30€

30-50€

50-75€

75-100€

> 150€

Page 16: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

16 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Résultats détaillés

Éditeurs utilisés

Éditeurs utilisés professionnellement

Professionnellement, 49% des répondants utilisent un éditeur XML, 10% des répondants utilisent un éditeur général (éditeur de texte) et 41% utilisent les deux types d’éditeurs. Concernant les questions sur les éditeurs, il était possible d’indiquer l’utilisation de plusieurs éditeurs dans les réponses. Au total, 144 éditeurs11 ont été signalés comme utilisés professionnellement par les 102 participants, ce qui signifie qu’une part importante d’entre eux utilise plusieurs éditeurs. Oxygen est de loin l’éditeur XML le plus utilisé par les répondants, 77 des participants l’utilisent. XMLMind/XXE et XMetal/XMAX sont chacun utilisés par 11 participants. Les réponses proposées comportaient aussi Altova XML Spy ; deux répondants seulement l’utilisent. Notepad ++ est l’éditeur de texte le plus utilisé par les répondants qui n’utilisent qu’un éditeur de texte. L’utilisation des autres éditeurs de texte proposés dans les choix de réponse est très faible. Concernant les répondants qui utilisent à la fois un éditeur XML et un éditeur de texte, Oxygen et Notepad ++ sont également les éditeurs les plus utilisés (voir ci-dessous).

Figure 15 Editeurs utilisés par les répondants qui utilisent deux types d’éditeurs (éditeur XML et éditeur de

texte).

Au total, 27 éditeurs ont été mentionnés dans les champs « Autre » des six questions sur les éditeurs utilisés (le nombre de mentions est indiqué entre parenthèses): Emacs (13), BBEdit (8), Microsoft Word (6), Gedit (6), TextMate (4), Eclipse (4), Vim (4), XML Copy Editor (3), TUSTEP (2), Geany (2), Bluefish (2), Xmplify (2), Classical Text Editor (2), Text Grid XML-Editor (2), Open Office (2), JAXE (1), WordPerfect 8 (1), UltraXML (1), Kate (1), Scrivener (1), Komodo Edit (1), EmEditor (1), Editplus (1), NoteTab Pro (1), Sublime Text 2 (1), « Calames (ABES) » (1), et « jEdit + plugin XML » (1), ce qui indique une grande variété d’éditeurs utilisés.

11 auxquels il faut rajouter les éditeurs mentionnés dans la rubrique « autre »

Page 17: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

17 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Usage personnel de l’éditeur

66% des répondants utilisent aussi un éditeur personnellement. Concernant les types d’éditeurs utilisés personnellement, 24% des répondants au sondage utilisent un éditeur XML, 17% utilisent un éditeur général (éditeur de texte) et 25% utilisent les deux types d’éditeurs. L’utilisation d’oXygen est aussi dominante.

Précisions sur la satisfaction

En plus d’être l’éditeur le plus utilisé professionnellement par les participants au sondage, oXygen est également l’éditeur qui concentre la plus grande part d’utilisateurs satisfaits de la solution qu’ils utilisent. (Seulement 19% des participants qui utilisent oXygen professionnellement sont peu satisfaits, alors que cette proportion varie entre 36 et 50% pour les autres éditeurs XML.)

Satisfaction en fonction de la profession12

- Enseignants-chercheurs et bibliothécaires/conservateurs : 31% sont peu satisfaits, 58% sont satisfaits, 11% sont très satisfaits. - Ingénieurs d’études : 10% sont peu satisfaits, 80% sont satisfaits, 10% sont très satisfaits. Les ingénieurs d’études sont globalement plus satisfaits de la solution qu’ils utilisent que les autres groupes. Il faudra donc prêter une attention particulière aux situations des enseignants-chercheurs et des bibliothécaires-conservateurs dans le cadre du développement d’un outil d’édition en XML TEI et XML EAD.

Satisfaction en fonction du format le plus souvent utilisé

En effectuant des tris croisés sur les résultats, on s’aperçoit que les personnes utilisant surtout l’EAD sont globalement moins satisfaites (38% de peu satisfaits et seulement 10% de très satisfaits) que les personnes utilisant avant tout la TEI (un cinquième des répondants est très satisfait).

12 Nous avons détaillé ici les résultats pour les trois catégories de professions les plus représentées, les répondants des autres catégories de profession (étudiant, informaticien, archiviste, éditeur) sont majoritairement satisfaits ou très satisfaits.

Page 18: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

18 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Figure 16 Satisfaction des répondants utilisant surtout l'EAD

Figure 17 Satisfaction des participants utilisant surtout la TEI

L’outil développé devra donc prendre en considération les besoins spécifiques des utilisateurs de l’EAD.

Satisfaction en fonction du temps passé à travailler sur l’éditeur

Les répondants travaillant moins de 5h par semaine sur l’éditeur sont moins satisfaits par la solution qu’ils utilisent actuellement. Si 25% des personnes travaillant moins de 5h13 par semaine avec ces outils sont très satisfaites, en revanche, 33% de ce groupe s’estime « peu satisfait. Une explication à cette moindre satisfaction peut être la longue courbe d’apprentissage de ces outils. L’outil développé

13 Répartition des répondants : 24 travaillent avec un éditeur moins de 5h par semaine, 32 entre 5h et 10h, 14 entre 10h

et 15h, et 32 plus de 15h.

0%

38%

52%

10%

EAD

Pas satisfait

Peu satisfait

Satisfait

Très satisfait

1%

18%

61%

20%

TEI

Pas satisfait

Peu satisfait

Satisfait

Très satisfait

Page 19: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

19 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

devra donc être intuitif et facile à prendre en main pour les personnes qui n’ont que peu de temps à y consacrer.

Figure 18 Satisfaction des participants utilisant l'éditeur mois de 5h par semaine

Les autres groupes d’utilisateurs (travaillant entre 5 et 10h, entre 10 et 15h, ou plus de 15h) sont davantage satisfaits avec chaque fois près de 80% de répondants satisfaits ou très satisfaits et 20% de peu satisfaits.

Éditeur XML et workflow

Usage les plus fréquents de l’éditeur XML (encodage et/ou transformation)

65% des répondants qui font de l’encodage se définissent comme utilisateurs confirmés des technologies de l’information. 19% des répondants qui font de l’encodage se définissent comme utilisateurs débutants des technologies de l’information. 16% des répondants qui font de l’encodage n’ont pas donné leur opinion sur leur niveau de maîtrise des technologies de l’information. 72% des répondants qui font des transformations sont des « utilisateurs confirmés » des technologies de l’information. 8% des répondants qui font des transformations sont des « utilisateurs débutants » des technologies de l’information. 20% des répondants qui font des transformations n’ont pas donné leur opinion sur leur niveau de maîtrise des technologies de l’information. Ces chiffres étaient assez attendus, les « utilisateurs débutants » travaillent prioritairement à l’encodage de leur document de travail, et ce n’est que dans un second temps qu’ils s’attèlent à la transformation, nécessitant un savoir-faire supplémentaire. L’outil à développer devra donc être didactique concernant l’étape de la transformation afin de réduire l’écart entre les pratiques des utilisateurs débutants et confirmés des technologies de l’information. Les obstacles rencontrés lorsque les participants ont commencé à travailler avec ce type d’outil confortent cette analyse. En effet, la transformation XSL et l’apprentissage de la TEI sont les

0%

33%

42%

25%

Satisfaction des participants utilisant l'éditeur moins de 5h par semaine

Pas satisfait

Peu satisfait

Satisfait

Très satisfait

Page 20: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

20 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

obstacles le plus souvent mentionnés par les répondants (représentant chacun 15,5% des obstacles signalés). Viennent ensuite l’ergonomie de l’interface, qui a été un obstacle pour sept répondants, le manque de documentation (4 répondants) et le manque de support technique (4), la gestion des caractères non-latins (3). Ont également été signalés comme obstacles, le manque de connaissance de l’EAD, la longue courbe d’apprentissage des outils, l’exploitation de l’encodage, le manque d’outil collaboratif, le manque de communication, le manque de formation, l’absence de validation, l’absence d’auto-complétion des éléments, les choix d’encodage en TEI, la gestion des écritures de droite à gauche, la compréhension des textes bidirectionnels, l’apprentissage d’ODD, la compréhension de XML, la compréhension des erreurs de validation par rapport au schéma, l’accès difficile aux représentations numériques des manuscrits, les faibles performances de l’éditeur avec des fichiers volumineux, la gestion des traductions, l’apprentissage d’eXist, le manque d’intégration de l’EAD nativement dans XMLMind, le manque d’un bon éditeur, le manque de support institutionnel, l’utilisation du débogueur, la maîtrise de XPath et de XQuery.

Outils propres à l’usage des répondants développés en complément des

fonctionnalités de l’éditeur

31% des répondants14 ont indiqué avoir développé des outils propres à leur usage en complément des fonctionnalités de l’éditeur. La plupart des répondants ayant développé des outils personnalisés pour leur usage estiment être des utilisateurs confirmés des technologies de l’information (84%). Principalement, ce sont des XSLT qui sont ainsi développées (10 répondants). 6 autres répondants utilisent des langages de scripts (Perl, Shell, TUSTEP), deux utilisent des requêtes XQuery, enfin on utilise des expressions régulières propres à ses besoins. D’autres usages spécifiques ont également été signalés: deux répondants ont développé des environnements XXE (pour l’encodage des inventaires et pour l’édition critique) associés à des feuilles de style CSS et XSL, un répondant a développé une aide à la saisie personnalisée (exemples associés aux balises et attributs), la BnF a fait faire des développements supplémentaires sur XMAX pour développer une feuille de style de saisie. D’autres répondants ont développé des logiciels encore plus poussés. L’outil développé devra intégrer ce type de fonctionnalités et proposer des espaces de travail avec des modèles documentés.

Les formats

XML-TEI et HTML sont les formats les plus exploités par les répondants de notre sondage, que ce soit en format d’entrée ou en format de sortie. Le format d’entrée dominant est la TEI (68,63% des répondants), ce qui révèle une pratique de saisie directe en TEI dans l’éditeur. Le second format d’entrée le plus utilisé est HTML (42,16%), suivi de XSL (36,27%), doc (35,29%), et de l’EAD (30,39%). Les autres formats mentionnés sont Dublin Core, TXT, LaTeX, VITA, ALTO, EPIDOC, XML personnalisé, CEI, EAC, MODS, EPUB. Les formats de sortie dominants sont la TEI, format de sortie pour 62,75% des répondants et HTML, format de sortie pour 57,84% des répondants. L’EAD est un format de sortie pour 30,39% des répondants. XSL est un format de sortie pour 29,41%.

14 Soit 32 personnes.

Page 21: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

21 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

À noter que seulement 13% des répondants font des sorties en RDF. Ce qui explique le peu d’information des répondants sur leur workflow concernant le passage de la TEI et de l’EAD vers RDF (et inversement), qui intéresse pourtant le projet Biblissima au plus haut point. Enfin, trois participants ne connaissent pas les formats d’entrée, et deux les formats de sortie sur lesquels il travaille, ce qui dénote un public globalement averti.

Figure 19 Formats d'entrée

Figure 20 Formats de sortie

À la vue des graphiques, on s’aperçoit qu’il y a peu d’écart entre les formats utilisés en entrée et en sortie.

Page 22: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

22 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Support de texte et formats utilisés

Figure 21 Supports de texte et formats les plus utilisés

Le croisement des réponses concernant les supports de texte et les formats utilisés pour les baliser nous montre qu’un même type de support peut faire l’objet de plusieurs balisages. Il semble donc difficile de réaliser un espace de travail normalisé convenant à tous ces supports de texte.

0

10

20

30

40

50

60

Supports de texte et formats les plus utilisés

Autre format

EAD

TEI

Page 23: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

23 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Fonctionnalités les plus utiles

Une liste de fonctionnalités était proposée, et les participants au sondage étaient invités à les noter du moins important (1) au plus important (5).

Figure 22 Fonctionnalités jugées les plus utiles par les participants au sondage

Les fonctionnalités jugées très importantes (niveau 5) par le plus grand nombre de personnes sont les fonctionnalités basiques d’un éditeur XML, à savoir la validation, le contrôle en cours de saisie et les possibilités de recherche dans le document (recherche-remplace, expressions régulières, XPath, XQuery) et XSL pour la transformation des documents encodés (les participants sont aussi très demandeurs d’un aperçu de ces transformations). On s’aperçoit que la gestion des jeux de caractères est également importante pour un grand nombre des participants au sondage. Enfin, 19 participants soulignent l’importance de disposer d’un éditeur client léger et 18 celle d’une connexion à des applications Web, fonctionnalités qui ne sont pas intégrées à la plupart des éditeurs XML, comme le laissent transparaître les réponses sur les fonctionnalités manquantes (figure ci-dessous). La connexion à des applications Web devient pourtant incontournable pour travailler avec des fichiers en RDF.

0

10

20

30

40

50

60

70

80

90

Eff

ect

ifs

Page 24: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

24 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Fonctionnalités manquantes

Les mêmes fonctionnalités qu’à la question précédente étaient proposées et il était possible de cocher plusieurs réponses (à la différence de la question précédente, il n’y avait pas de niveau à indiquer). Un total de 191 fonctionnalités manquantes a été signalé.

Figure 23 Fonctionnalités manquantes aux participants

Parmi les fonctionnalités qui font le plus défaut aux participants au sondage, on trouve l’aperçu de la transformation (20 répondants) et la comparaison des fichiers (16), l’éditeur client léger (16) et la connexion à des applications Web (14). Les cinq fonctionnalités manquantes signalées dans « Autre » témoignent d’un besoin de formation et de tutoriel, de fonctionnalités pour l’édition SVG et de collaboration via un éditeur client léger. L’analyse des fonctionnalités manquantes signalées par les répondants en fonction de leur profession indique que les enseignants-chercheurs manquent de fonctionnalités concernant l’aperçu de la transformation (10 répondants), la gestion des écritures en caractères non-latins (9), la comparaison des fichiers (8), la connexion à des applications Web (8). Ils sollicitent également un éditeur client léger (8). Les fonctionnalités faisant le plus défaut aux bibliothécaires/conservateurs sont l’aperçu de la transformation (4), le contrôle en cours de saisie (4), une interface masquant le code source (4), et davantage de possibilités de recherche dans le document (4).15

15 Les fonctionnalités qui font défaut aux autres catégories de professions ne sont pas détaillées, le nombre de réponses à

cette question étant trop faible pour dégager des tendances signifiantes.

0

5

10

15

20

25

Eff

ect

if

Page 25: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

25 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

On s’aperçoit que les besoins sont relativement variés entre les différents groupes d’utilisateurs. L’outil développé devra être suffisamment souple pour répondre à ces divers besoins ou se concentrer sur les besoins d’un type d’utilisateur.

Innovations proposées par les participants au sondage

Les innovations les plus sollicitées sont des facilités pour la transformation et la publication des textes encodés, suivies de la validation, la gestion de la collaboration, le masque de saisie, et une interface client léger.

On peut dégager deux types de demandes concernant les transformations: - une transformation « clés en mains » : « une chaine éditoriale de la TEI vers le HTML », « XSLT pré-paramétrées pour sortie pdf, html, publication papier, visualiseur type Pléade... d'un clic des scénarios standards de transformation de la TEI de tout genre / type (transcriptions, textes critiques avec apparats, manuscrits, bibliographies, articles, etc) vers doc, odt, pdf, html » , « obtenir une sortie imprimable facilement pour les relectures », « avoir des boutons qui transforment directement votre document XML en un autre ». - une transformation assistée (amélioration de la prévisualisation) : « Un éditeur permettant de voir les différentes étapes de transformation, pour une XSLT avec plusieurs passages. Une interface de visualisation HTML/CSS plus dynamique (comme firebug par exemple) », « pouvoir modifier l’affichage (transformation) sans avoir de lignes de code trop complexe à entrer ». Sont également sollicités la validation (8 fois), la gestion de la collaboration (versionnage) (7 fois), l’intégration d’un masque de saisie (7), un éditeur client léger (6), une amélioration du workflow (5), l’auto-complétion des éléments (5), une interface utilisateur simple (5), des liaisons textes-images facilitées (5), la gestion de XPath (4), la gestion des fichiers lourds(4), une exploitation facilitée des encodages (3), la comparaison des fichiers (3), l’amélioration des fonctionnalités de recherche (expressions régulières) (3), la gestion des écritures de droite à gauche, de haut en bas et bidirectionnelles (3), etc. D’autres types d’innovations ont été proposés. La gestion de macro, la gestion de caractères spéciaux, la gestion des liens vers des fichiers d’autorité, la gestion du SVG, le souhait d’un éditeur open source, la personnalisation de l’interface, la visualisation de l’arborescence XML, la visualisation du code source ont été cités deux fois. D’autres innovations ont été mentionnées une seule fois : l’amélioration de la performance, la correction orthographique, une fonction de désindentation, un éditeur adapté au domaine d’expertise, la facilité d’accès, la génération automatique de schéma ODD, la gestion des annotations au niveau des lemmes, la gestion des caractères latins étendus, la gestion des entités nommées, la gestion des expressions régulières et des scripts, la gestion des fichiers lourds, la gestion des problèmes d’espaces, la gratuité de l’éditeur, l’intégration d’un dictionnaire de balises EAD, la liaison avec une base de données, une fonction plier/déplier le code, un plugin Roma, la gestion de la rétrocompatibilité, un éditeur stable, le support des raccourcis VIM. Au total, 121 innovations ont été proposées, ce qui est un résultat intéressant. Deux participants ont de nouveau indiqué être satisfaits des fonctionnalités d’oXygen. Parmi les innovations proposées, on retrouve beaucoup de fonctionnalités déjà présentées dans les questions sur les fonctionnalités importantes et manquantes. Des fonctionnalités existantes ont donc été présentées comme des innovations. Les répondants au sondage n’en ont donc certainement pas connaissance, ce qui peut révéler un manque d’explication dans les guides d’utilisation ou de convivialité dans les éditeurs.

Page 26: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

26 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Enfin, des propositions plus innovantes ont été énoncées, démontrant que des améliorations sont encore possibles (par exemple l’amélioration du workflow, l’amélioration de la performance des éditeurs, la gestion des fichiers lourds, et la liaison texte-image).

Besoin d’un outil collaboratif

Un outil collaboratif est fortement sollicité (par 85% des répondants au sondage), même si le versionnage n’était pas une des fonctionnalités les plus plébiscitées dans les questions spécifiques aux fonctionnalités (le terme de versionnage était peut-être trop technique).

Nombre de personnes travaillant sur le projet

Figure 24 Nombre de personnes travaillant sur le projet

La majorité des projets d’édition rassemblent des petites équipes (entre 2 et 5 personnes). De plus, on recense un plus grand nombre de projets rassemblant plus de 15 personnes que de projets légèrement plus petits (10-15 personnes). L’organisation actuelle des projets concernés par l’utilisation d’éditeurs XML pour le balisage en TEI ou EAD montre que des outils collaboratifs seraient une grande aide pour un workflow efficace et des résultats de qualité.

Outil idéal

La fonctionnalité qui est le plus souvent mentionnée pour décrire l’outil idéal est une transformation XSL assistée pour la publication des textes encodés (« I think it is not the editor that is a problem to work with the TEI, but the tools for transforming and publishing the encoded texts. »). Elle est sollicitée par huit répondants, et c’est une idée qu’on retrouve aussi dans les réponses concernant les innovations. Huit répondants indiquent qu’oXygen répond à la définition de l’outil idéal. Un autre répondant spécifie que l’outil idéal est « Un oXygen plus intuitif ». Les répondants ont cité d’autres outils qu’ils considèrent comme idéal : XXE développé à Caen (2 répondants), Textgrid, Millefeuille, Projet Qumran-Lexikon à Göttingen.

Page 27: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

27 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

L’outil idéal est un client Web (4 répondants) ; toutefois pour deux répondants, il est utilisable hors connexion. Il comporte un masque de saisie (4 répondants), voire est utilisable sans connaître la TEI (« Something that allows someone to do their work without knowing what TEI is.») Les autres fonctionnalités citées plusieurs fois pour l’outil idéal sont la validation par rapport au schéma (3), la collaboration (versionnage) (3), l’auto-complétion (2), une aide XPath (2), une aide pour les expressions régulières (2), la personnalisation de l’interface (3) (notamment en fonction du schéma). Un participant, un chercheur non spécialiste des technologies de l’information, a explicité sa méthode de travail et son besoin d’un éditeur associé à une base de données et un moteur de recherche : « Quelque chose entre oXygen et Classical Text Editor. L'idée d'une plateforme qui puisse fournir un éditeur en TEI, qui facilite l'exportation des textes édités dans une base dotée d'un moteur de recherche. […] Il serait utile de donner la possibilité d'annoter les textes édités, p. ex. bibliographie, notes explicatives etc. Un visualiseur comme http://v-machine.org/index.php aurait une vertu pédagogique et permettrait d'avoir une vue comparée des leçons d'un texte édité. En termes d'exportation, il serait bien d'avoir PDF et des feuilles de transformation qui préparent le texte pour une éventuelle édition papier. » Ont également été mentionnés pour l’outil idéal une « interface Web permettant de synchroniser l’image et la transcription », une interface ergonomique, un éditeur associé à une base de données, une aide aux choix d’encodage. Certains participants au sondage ont répondu différemment à cette question concernant la description de leur outil idéal : pour trois répondants, la convivialité de l’outil n’est pas un point critique, un répondant pense que l’outil idéal n’existe pas, et un autre que la formation est plus importante que l’éditeur utilisé. Enfin, quatre répondants trouvent la TEI conviviale.

Perception de la TEI/ de l’EAD

Enfin, nous avons demandé aux participants quelle était leur perception de la TEI et/ou de l’EAD. La TEI est perçue le plus souvent comme un schéma XML pour l’encodage des textes (4 répondants), un standard de facto pour l’encodage des textes (3) et des pratiques soutenues par une communauté pour l’encodage de documents (4). La TEI est présentée comme incontournable (2), utile (2), souple (3), un bon outil (2) ; elle possède un « grand potentiel » (3), mais elle est également « complexe » (3) et difficile à cause de la multiplicité des choix d’encodages possibles (3). Deux répondants soulignent le manque de formation ou « d’exemples d’applications claires ». Parmi les réponses les plus développées, des répondants perçoivent la TEI comme « un bon moyen d’éditer des sources de manière pérenne et interopérable », un « modèle de représentation de la richesse des sources primaires », permettant « la réflexion épistémologique sur nos pratiques de collation et de structuration des documents qu'elle induit», « une exploitation sémantique rigoureuse des documents encodés », elle est encore « essentielle pour des travaux analytiques ». Enfin, un répondant perçoit la TEI comme « une ontologie de textes de sciences humaines pas entièrement réfléchie jusqu'au bout (techniquement non formulée comme une ontologie et inconsistante en raison de son développement inductif) ». Concernant la perception de l’EAD, cinq répondants ont présenté l’EAD comme un standard pour l’encodage des instruments de recherche archivistique. Deux répondants ont indiqué attendre avec impatience la nouvelle version de l’EAD dont la publication est prévue pour 2014. L’EAD a aussi été présentée comme une « DTD souple encore trop peu connue dans les bibliothèques municipales », « un format tout à fait satisfaisant intellectuellement pour le traitement des archives » mais qu’il « reste à améliorer les outils, pour les institutions qui manquent de moyens, ou qui sont isolées et

Page 28: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

28 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

travaillent seules sur ce format». Un répondant a indiqué que l’EAD devrait être maintenue de façon plus ouverte, sur l’exemple de la TEI. Cinq répondants ont présenté des éléments de réponse communs à la TEI et l’EAD. Un des répondants insiste sur le fait qu’une formation soit nécessaire pour leur utilisation. Trois autres proposent des définitions générales de la TEI et l’EAD, comme des langages de balisage pour l’encodage des documents du patrimoine culturel, des « outils qui correspondent aux catégories scientifiques manipulées », ou encore « Ce sont avant tout des outils conceptuels et méthodologiques très génériques. Incontournables (normalisation) et vrai apport à la scientificité des projets (enjeu du "contrôle des interprétations") ».

Autres commentaires des participants au sondage

Les répondants ont donné des exemples de projets pertinents pour Biblissima comme Cendari, le projet Qumramlexikon à Göttingen, le projet Monasterium et son éditeur Web (Université de Cologne). Enfin, d’autres idées ont été exprimées. Un participant, réaliste, pense que « l'outil magique n'existe pas ». Un autre allant dans le même sens, précise que la connaissance de XML ne peut pas être remplacée par un outil user-friendly. Ont aussi été rappelés l’importance de la collaboration entre ingénieurs et chercheurs, et l’intérêt de mettre en place un suivi sur l'utilisation de l'outil au-delà des formations. Plus simplement un répondant, souhaite un « éditeur TEI décent ». Un autre répondant s'est de nouveau exprimé en faveur du développement d'un encodeur libre. Des participants se sont de nouveau exprimés sur les fonctionnalités qu’ils souhaitent présentes dans un éditeur : le besoin d'outils de publication Web type XTF (eXtensible Text Framework), l’importance de l’aide à l'utilisation de type masque de saisie, l’auto-complétion, l’aide aux choix d’encodage (essentiels pour les débutants), ainsi que l’exploitation de l’encodage. Aussi, un répondant souhaite pouvoir travailler avec un éditeur pour des « transcriptions topographiques » (liaison texte-image, transcription et localisation au niveau des mots ou des caractères). Enfin, un répondant a indiqué que son équipe était disponible pour être bêta testeurs d’un éventuel éditeur développé dans le cadre de Biblissima.

Page 29: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

29 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Conclusion Cette enquête nous a apporté des informations riches et précises sur les pratiques et les besoins des utilisateurs d’éditeurs XML pour l’encodage en TEI et EAD. S’il existe déjà des éditeurs répondant aux besoins des utilisateurs, des améliorations sont tout de même souhaitées par les participants à ce sondage. Cette enquête rend aussi compte de la variété des utilisateurs, qui ont une maîtrise plus ou moins importante des technologies de l’information, qui travaillent sur des supports différents, des formats différents, des workflows différents (quelques exemples de cas d’utilisation sont présentés en annexe). On s’aperçoit que les besoins sont assez divers entre les différents groupes d’utilisateurs. Dans le cadre de Biblissima, l’outil développé devra donc être suffisamment souple pour répondre à ces besoins variés (paléographie, lien texte-image, édition critique, palimpsestes, reliures, etc.) ou se concentrer sur les besoins d’un type d’utilisation particulier. Si l’enquête nous a indiqué que la majorité des participants utilise oXygen et en sont satisfaits dans l’ensemble, les participants ont néanmoins une forte préférence pour un éditeur XML open source. Ils ont aussi besoin de certaines fonctionnalités complémentaires et plus accessibles (plusieurs participants au sondage on en effet souligné la complexité des interfaces de certains éditeurs, notamment pour des débutants). Les fonctionnalités les plus sollicitées sont :

un module de transformation XSL assistée. En effet, la fonctionnalité qui est le plus souvent mentionnée pour décrire l’outil idéal est une transformation XSL assistée pour la publication des textes encodés (feuille de style XSL intégrées et facilement personnalisables, aperçu de la transformation, etc.) C’est une étape centrale dans l’édition électronique (textes, catalogues, notices, etc.) qui, du fait de la complexité de XSL, pose problème aux débutants. Cette fonctionnalité sera d’autant plus importante qu’on envisage de faciliter le workflow concernant le passage des encodages en TEI et EAD vers RDF.

une interface Web, directement accessible par le navigateur. Les participants au sondage ne semblent pas intéressés par un client lourd. L’éditeur client léger doit toutefois être utilisable hors connexion. Facilement personnalisable, il comporte idéalement un masque de saisie (pour permettre l’encodage sans avoir une connaissance trop pointue de XML, de la TEI et de l’EAD) et conserve la possibilité de voir le code source.

un outil collaboratif 85% des participants au sondage ont besoin d’un outil collaboratif qui gère le versionnage de façon efficiente.

Page 30: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

30 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

Annexe : Cas d’utilisation

Parmi les réponses des participants, certaines nous ont paru particulièrement intéressantes en raison de leurs pratiques et de leurs besoins spécifiques. Nous en faisons ici un résumé.

Conservateur de bibliothèque municipale Ce participant au sondage encode des fonds anciens en EAD et fait de la rétroconversion de catalogue en EAD (CGM). Cet utilisateur souligne le manque de formation (notamment à l’utilisation avancée de l’encodeur) et de support technique : il n’y a pas d’informaticien disponible pour ce type de travaux au sein de la bibliothèque. L’encodage est réalisé par une petite équipe qui a besoin d’un outil collaboratif. L’outil doit aussi être facile à prendre en main (interface user-friendly) pour une équipe « techniquement démunie ». Les utilisateurs font directement de la saisie en EAD dans l’encodeur, à partir d’inventaires sur Word ou Excel, les formats de sortie sont HTML, PDF, XSL et des formats d’export OAI-PMH. Les fonctionnalités qui lui font défaut sont :

- l’aperçu de la transformation - le choix entre plusieurs interfaces de travail - la comparaison des fichiers - un éditeur client léger - une interface masquant le code source

Il souhaite un outil donnant la possibilité d’inclure les thésaurus pour l’indexation ou des fonctionnalités pour la gestion des autorités.

Doctorant réalisant des éditions électroniques en TEI

Utilisateur avancé des nouvelles technologies, il réalise à la fois l’encodage et la transformation de son corpus grâce à oXygen qui répond à ses besoins. Travaillant seul, il n’a pas besoin d’un outil collaboratif. Les fonctionnalités importantes pour ce type d’utilisateur sont l’écriture en caractères latins étendus, et en caractères non-latins, les possibilités de recherche dans le document (expressions régulières, XPath, XQuery). Il souhaite seulement que l’outil gère mieux les fichiers lourds et que la transformation soit plus aisée et rapide afin de pouvoir visualiser immédiatement le résultat de l’édition.

Chercheur

Il maîtrise bien l’éditeur pour l’encodage mais ne maîtrise pas ce qui se passe après. Il trouve d’ailleurs frustrant de ne pas avoir la main sur la transformation des données, faute de connaissances en XSLT. L’innovation qu’il souhaite est une fonctionnalité permettant de modifier l’affichage de l’encodage sans avoir trop de code complexe (XSL) à réaliser. Comme le conservateur des bibliothèques ci-dessus, il a également besoin d’un outil collaboratif et du support technique d’un informaticien.

Responsable de bibliothèque numérique, spécialiste de métadonnées

Travaillant sur les catalogues, manuscrits et inventaires, il jongle avec de nombreux formats : CSV, doc, EAD, TEI, EXCEL, OAI-PMH, HTML, MarcXML, METS/MODS, RDF, XLS et PDF et réalise à la fois des encodages et leur transformation. Il utilise plusieurs éditeurs : TextMate, TextEdit et oXygen. Sa méthode de travail nécessite d’être complètement familier de XML, de la TEI, et de l’EAD, elle n’est pas à la portée des débutants. Apprendre à manier l’ensemble des fonctionnalités d’oXygen a été le principal obstacle qu’il a rencontré. Les fonctionnalités qu’il juge les plus importantes sont : l’aperçu

Page 31: Synthèse du sondage sur les éditeurs XML TEI/EAD › sites › doc.biblissima... · à la BnF, projet Sanderus à l’IRHT, Miroir des classiques au CJM-ENC, les Bibliothèques

31 Biblissima-Synthèse du sondage sur les éditeurs XML TEI/EAD

du document transformé, la connexion à des applications Web, la connexion à une base XML native, le contrôle en cours de saisie, les possibilités de recherche dans le document (expressions régulières, XPath, XQuery), la validation, le versionnage et XSLT. Il est satisfait des outils qu’il utilise et aucune fonctionnalité ne lui fait défaut. Il a besoin d’un outil collaboratif mais n’a pas de préférence particulière pour un éditeur open source.

Ingénieur d’études

Il utilise Oxygen et Emacs pour réaliser des encodages en TEI et leur transformation. Il est satisfait de la solution qu’il utilise actuellement même s’il indique que des améliorations pourraient être effectuées. Il aimerait par exemple une meilleure gestion des expressions régulières et des scripts (PERL 5 entre autres), une meilleure gestion des caractères spéciaux, notamment lors de la recherche dans le document, ainsi qu’une amélioration de l'utilisation de la mémoire vive pour les fichiers lourds et les transformations XSL. Pour lui, l’outil idéal serait « un outil configurable en fonction de n’importe quel schéma TEI spécifique à un projet et dont le paramétrage aurait été pensé pour faciliter ce point. » Comme 85% des répondants au sondage, il a besoin d’un outil collaboratif, il travaille en effet avec une petite équipe.