Formation EXMARaLDA · EXMARaLDA • Construction et analyse de corpus de langue parlée • Projet...

21
Formation EXMARaLDA Thomas Schmidt www.exmaralda.org

Transcript of Formation EXMARaLDA · EXMARaLDA • Construction et analyse de corpus de langue parlée • Projet...

  • Formation EXMARaLDA

    Thomas Schmidt

    www.exmaralda.org

    http://www.exmaralda.org/

  • Programme

    1.

    Introduction

    2.

    Exercice

    de transcription

    3.

    Edition, Recherche

    4.

    Assemblage

    fouille de corpus

  • EXMARaLDA

    Construction et analyse

    de corpus

    de langue parlée

    Projet

    du SFB ‚Multilingualisme‘

    2000‐2011

    Domaines

    d‘utilisation:–

    Conversation

    Analysis / Discourse

    Analysis

    Apprentissage

    des langues

    (L1 et L2)

    Dialectologie

    multimodalité, phonétique, sociologie, …

  • EXMARaLDA: Principes

    Flexibilité: différentes

    approches

    théoriques,  questions

    de recherche, systèmes

    de 

    transcription•

    Interopérabilité: échange

    avec

    Praat, ELAN 

    etc.•

    Indépendance

    de plateforme

    (Windows, 

    Macintosh, Linux)•

    Durabilité

    / Persistance: XML, Unicode, etc.

    Multimédia, Hypertexte, Automatisation

  • EXMARaLDA: Partitur‐Editor

  • EXMARaLDA: Corpus Manager

  • EXMARaLDA: EXAKT

  • Partition Musicale

  • Partition Musicale

    Trompette

    Viole

    Tuba

  • Partition Musicale

    Trompette

    Viole

    Tuba

    Temps

    simultanément

  • Partition linguistique

  • Relations structurelles1. Suite temporelle

    Partition linguistique

  • Data Model

    Relations structurelles1. Suite temporelle2. Simultanéité

  • Data Model

    Relations structurelles1. Suite temporelle2. Simultanéité3. Equivalence

  • Data Model

  • Data Model

  • Conventions

    de transcription

    – exemple: HIAT

  • Conventions

    de transcription

    – exemple: HIAT

  • Transcrire: Démarches

    préparatoires

    1.

    Edit

    > Preferences•

    Language: Français

    Media: DirectShow

    AutoSave

    2.

    Transcription > Méta‐information

    3.

    Transcription > Table des locuteurs

    4.

    Transcription > Recordings

    5.

    Couche

    > Ajouter

    couche

  • Transcrire

    1.

    Append

    interval…

    2.

    Ajustez

    la sélection•

    Play Selection

    3.

    Entrez

    la transcription

    4.

    Répétez…

  • Expressions régulières•

    tout–

    tout, surtout, toutefois, …

    \btout\b–

    tout

    \b[Tt]out\b–

    Tout, tout

    \bdé[a‐zéêè]+\b–

    débat, déstabiliser, etc.

    \b(est|êtes|sont|suis)\b–

    est,êtes, sont, suis, …

    Formation EXMARaLDAProgrammeEXMARaLDAEXMARaLDA: PrincipesEXMARaLDA: Partitur-EditorEXMARaLDA: Corpus ManagerEXMARaLDA: EXAKTPartition MusicalePartition MusicalePartition MusicaleFoliennummer 11Foliennummer 12Foliennummer 13Foliennummer 14Foliennummer 15Foliennummer 16Conventions de transcription – exemple: HIATConventions de transcription – exemple: HIATTranscrire: Démarches préparatoiresTranscrireExpressions régulières