Présentation 16h00 – 16h45 Programmeevent.ircam.ma/docs/ticam2011/programme.pdf ·...

2
Présentation Les ressources linguistiques interviennent, d’une façon croissante, au coeur même de la conception et du développement de différents produits informatiques, que ce soit en amont (utilisation de données linguistiques) ou en aval pour la production de nouvelles ressources et le développement de nouveaux outils. Par ailleurs, les langues naturelles peu informatisées souffrent en général d’un manque en termes de ressources, qui constituent un besoin crucial pour l’intégration de ces langues dans les nouvelles technologies d’information. Pour cette raison, une des préoccupations majeures du traitement automatique des langues (TAL) est la disposition de telles ressources. De nos jours, entamer un tel champ nécessite d’abord une préparation basique (codage de système graphique, claviers de saisie, etc.) de la langue en question avant de s’aligner sur les spécifications et normes internationales en la matière pour garantir un maximum de réutilisabilité des ressources et outils développés et d’interopérabilité avec les autres langues. En effet, dans le cas de la langue amazighe (berbère), le processus de standardisation et de généralisation de l'utilisation du caractère tifinaghe au niveau des technologies d'information, a préparé le terrain pour le développement des outils du TAL et pour la gestion des ressources linguistiques, aussi bien monolingues que multilingues. Il reste néanmoins d’autres efforts à consentir pour favoriser l'usage de l’amazighe et contribuer à sa promotion. Les axes d’intervention de cette édition inclnent : application des normes de représentation et de stockage des ressources (vocales et textuelles) annotées, standardisées et/ou partagées ; solutions de bases d’informatisation des ressources (codage, saisie, normalisation, etc.) ; systèmes de gestion des ressources langagières pour le TAL ; méthodologies techniques de la construction des corpus et autres ressources linguistiques (lexiques, grammaires, etc.) ; réflexion sur les besoins en ressources langagières pour les langues peu dotées ; applications en TAL exploitant les ressources langagières incluant : - outils d’annotation et d’analyse à différents niveaux (morphologique, syntaxique, sémantique, etc.), - Outils d’accès aux ressources langagières ; - Indexation et recherche de données textuelles ; - Extraction d’information ; - Alignement des corpus multilingues ;- Génération automatique de textes; - Localisation des logiciels. Programme Jeudi 24 février 2011 9h15 – 10h00 Accueil et inscription des participants 10h00 – 10h45 Séance d’ouverture 10h00 – 10h15 Allocution de Monsieur le Recteur de l’IRCAM 10h15 – 10h30 Mot du comité d’organisation 10h30 – 10h45 Pause café 10h45 – 12h00 Première Séance Informatisation des langues peu dotées Modérateur : Michael Zock 10h45 – 11h15 « Pour la création d’un Groupe TEI Berbère fédérant la mise en chantier d’un sous-ensemble de balises spécifiques assurant la qualité d’interopérabilité des ressources linguistiques amazighes » H. Hudrisier (MSH, France) 11h15 – 11h45 « The risk of cross-language plagiarism for less resourced languages such as Amazigh » P. Rosso (UPV, Espagne) 14h00 – 16h00 Deuxième Séance Construction et exploitation des ressources - 1 Modérateur : Meftaha Ameur 14h00 – 14h30 « Si tous les chemins mènent à Rome, ils ne se valent pas tous. Le problème d’accès lexical » M. Zock (CNRS, France), D. Schwab (LIG, Grenoble) 14h30 – 15h00 « Le projet DictAm : dictionnaire électronique des verbes Amazighe-Français » S. Moukrim (LLL, France) 15h00 – 15h30 « Projet de dictionnaire bilingue illustré (tamazighte-français) des locutions nominales fauniques et floriques » M. Chakiri (UPD- Sorbonne, France) 15h30 – 16h00 « Compiling of a Berber-French Dictionary (Figuig dialect) » M. Yeou (Univ. Chouaib Doukkali de Eljadida, Maroc) 16h00 – 16h45 Troisième Séance Session Poster et pause café Modérateur : Fakir Mohamed « Mise au point d’une base de données lexicale. Construction et application, cas : La langue amazighe » D. Nahali (Univ. de Béjaïa, Algérie) « Référentiel de la Terminologie Amazighe » N. EL Azrak et A. EL Hamdaoui (IRCAM, Maroc) « Fault detection system for Arabic language » R. Bouslimi, H. Amraoui ( FSJEG, Tunisie) « A universal Amazigh keyboard for Latin script and Tifinagh» P. Anderson (Royaume-Uni) « Exercises in Arabic Indexing: Finding Repetitions in the Quran » K. Honsali, M. Majid Himmi et E. Bouyakhf (LIMIARF-FSR, Maroc) « Analyseur Morphologique des Mots Arabes » S. EL Hassani, A. Hamdani et T. EL YAZIDI (IERA, Maroc) "tifawin a tamazivt" ﻧﺤﻮ ﺣﻮﺳﺒﺔ ﻣﺤﻼﺗﻴﺔ ﻟﻸﻓﻌﺎﻝ ﻓﻲ ﺍﻟﻜﺘﺎﺏ ﺍﳌﺪﺭﺳﻲ» K. Ouqua (IRCAM, Maroc « ﻭ ﺃﺑﻌﺎﺩﻫﺎ ﺍﻟﺘﻌﻠﻴﻤﻴﺔ« Les ressources langagières pour la recherche d’information textuelle : Cas de la langue amazighe » F. Ataa Alllah et S. Boulaknadel (IRCAM, Maroc) « La transcription phonétique de la langue amazighe : vers un système de la synthèse de la parole » H. Jaa (IRCAM, Maroc), B. Elgraini (EMI, Maroc) 16h45 – 18h15 Quatrième séance Reconnaissance optique de Tifinaghe Modérateur : Ali Rachidi 16h45 – 17h15 « Recognition of Tifinaghe Handwritten Charac- ters using Legendre Moments for feature extraction » M. Abaynarh (EMI, Maroc), H. El fadili (ENSAF, Maroc), L. Zenkouar (EMI, Maroc) 17h15 – 17h45 « Reconnaissance Automatique de l’Ecriture Amazighe a base de ligne de l’écriture » Y. Es saady (FS d’Agadir, Maroc), A. Rachidi (ENCG d’Agadir, Maroc), M. El Yassa (FS d’Agadir, Maroc), D. Mammass (FS d’Agadir, Maroc) 17h45 – 18h15 « Reconnaissance des Caractères Amazighs par les Modèles de Markov cachés » B. Bazdouz et M. Fakir (FST de Benimellal, Maroc)

Transcript of Présentation 16h00 – 16h45 Programmeevent.ircam.ma/docs/ticam2011/programme.pdf ·...

Page 1: Présentation 16h00 – 16h45 Programmeevent.ircam.ma/docs/ticam2011/programme.pdf · 2012-10-31 · Présentation Les ressources linguistiques interviennent, d’une façon croissante,

Présentation

Les ressources linguistiques interviennent, d’une façon croissante, au coeur même de la conception et du développement de différents produits informatiques, que ce soit en amont (utilisation de données linguistiques) ou en aval pour la production de nouvelles ressources et le développement de nouveaux outils.

Par ailleurs, les langues naturelles peu informatisées souffrent en général d’un manque en termes de ressources, qui constituent un besoin crucial pour l’intégration de ces langues dans les nouvelles technologies d’information. Pour cette raison, une des préoccupations majeures du traitement automatique des langues (TAL) est la disposition de telles ressources. De nos jours, entamer un tel champ nécessite d’abord une préparation basique (codage de système graphique, claviers de saisie, etc.) de la langue en question avant de s’aligner sur les spécifications et normes internationales en la matière pour garantir un maximum de réutilisabilité des ressources et outils développés et d’interopérabilité avec les autres langues.

En effet, dans le cas de la langue amazighe (berbère), le processus de standardisation et de généralisation de l'utilisation du caractère tifinaghe au niveau des technologies d'information, a préparé le terrain pour le développement des outils du TAL et pour la gestion des ressources linguistiques, aussi bien monolingues que multilingues. Il reste néanmoins d’autres efforts à consentir pour favoriser l'usage de l’amazighe et contribuer à sa promotion.

Les axes d’intervention de cette édition inclnent :• application des normes de représentation et de stockage des ressources (vocales et textuelles) annotées, standardisées et/ou partagées ;• solutions de bases d’informatisation des ressources (codage, saisie, normalisation, etc.) ;• systèmes de gestion des ressources langagières pour le TAL ;• méthodologies techniques de la construction des corpus et autres ressources linguistiques (lexiques, grammaires, etc.) ;• réflexion sur les besoins en ressources langagières pour les langues peu dotées ;• applications en TAL exploitant les ressources langagières incluant : - outils d’annotation et d’analyse à différents niveaux (morphologique, syntaxique, sémantique, etc.),- Outils d’accès aux ressources langagières ;- Indexation et recherche de données textuelles ;- Extraction d’information ;- Alignement des corpus multilingues ;- Génération automatique de textes; - Localisation des logiciels.

Programme

Jeudi 24 février 20119h15 – 10h00 Accueil et inscription des participants

10h00 – 10h45

Séance d’ouverture10h00 – 10h15 Allocution de Monsieur le Recteur de l’IRCAM10h15 – 10h30 Mot du comité d’organisation10h30 – 10h45 Pause café

10h45 – 12h00 Première Séance Informatisation des langues peu dotées

Modérateur : Michael Zock10h45 – 11h15 « Pour la création d’un Groupe TEI Berbère fédérant la mise en chantier d’un sous-ensemble de balises spécifiques assurant la qualité d’interopérabilité des ressources linguistiques amazighes » H. Hudrisier (MSH, France)11h15 – 11h45 « The risk of cross-language plagiarism for less resourced languages such as Amazigh » P. Rosso (UPV, Espagne)

14h00 – 16h00 Deuxième SéanceConstruction et exploitation des ressources - 1

Modérateur : Meftaha Ameur14h00 – 14h30 « Si tous les chemins mènent à Rome, ils ne se valent pas tous. Le problème d’accès lexical » M. Zock (CNRS, France), D. Schwab (LIG, Grenoble) 14h30 – 15h00 « Le projet DictAm : dictionnaire électronique des verbes Amazighe-Français » S. Moukrim (LLL, France)15h00 – 15h30 « Projet de dictionnaire bilingue illustré (tamazighte-français) des locutions nominales fauniques et floriques » M. Chakiri (UPD- Sorbonne, France)15h30 – 16h00 « Compiling of a Berber-French Dictionary (Figuig dialect) » M. Yeou (Univ. Chouaib Doukkali de Eljadida, Maroc)

16h00 – 16h45 Troisième SéanceSession Poster et pause caféModérateur : Fakir Mohamed

« Mise au point d’une base de données lexicale. Construction et application, cas : La langue amazighe » D. Nahali (Univ. de Béjaïa, Algérie)« Référentiel de la Terminologie Amazighe » N. EL Azrak et A. EL Hamdaoui (IRCAM, Maroc)« Fault detection system for Arabic language » R. Bouslimi, H. Amraoui ( FSJEG, Tunisie)« A universal Amazigh keyboard for Latin script and Tifinagh» P. Anderson (Royaume-Uni)« Exercises in Arabic Indexing: Finding Repetitions in the Quran » K. Honsali, M. Majid Himmi et E. Bouyakhf (LIMIARF-FSR, Maroc)« Analyseur Morphologique des Mots Arabes » S. EL Hassani, A. Hamdani et T. EL YAZIDI (IERA, Maroc)"tifawin a tamazivt" نحو حوسبة محالتية لألفعال في الكتاب املدرسي»

K. Ouqua (IRCAM, Maroc « و أبعادها التعليمية

« Les ressources langagières pour la recherche d’information textuelle : Cas de la langue amazighe » F. Ataa Alllah et S. Boulaknadel (IRCAM, Maroc)« La transcription phonétique de la langue amazighe : vers un système de la synthèse de la parole » H. Jaa (IRCAM, Maroc), B. Elgraini (EMI, Maroc)

16h45 – 18h15 Quatrième séanceReconnaissance optique de Tifinaghe

Modérateur : Ali Rachidi16h45 – 17h15 « Recognition of Tifinaghe Handwritten Charac-ters using Legendre Moments for feature extraction »M. Abaynarh (EMI, Maroc), H. El fadili (ENSAF, Maroc), L. Zenkouar (EMI, Maroc)17h15 – 17h45 « Reconnaissance Automatique de l’Ecriture Amazighe a base de ligne de l’écriture » Y. Es saady (FS d’Agadir, Maroc), A. Rachidi (ENCG d’Agadir, Maroc), M. El Yassa (FS d’Agadir, Maroc), D. Mammass (FS d’Agadir, Maroc)17h45 – 18h15 « Reconnaissance des Caractères Amazighs par les Modèles de Markov cachés » B. Bazdouz et M. Fakir (FST de Benimellal, Maroc)

Page 2: Présentation 16h00 – 16h45 Programmeevent.ircam.ma/docs/ticam2011/programme.pdf · 2012-10-31 · Présentation Les ressources linguistiques interviennent, d’une façon croissante,

Comité scientifique :Aboutajdine Driss (FSR, Rabat) Ameur Meftaha (IRCAM, Rabat)

Boulaknadel Siham (IRCAM, Rabat)Bouyakhf El Houssaine (FSR, Rabat)Cavalli-Sforza Violetta (AUI, Ifrane)

Francopoulo Gil (TAGMATICA, Paris)Hamdani Abdelfettah (IERA, Rabat)

El Moujahid El Houssain (IRCAM, Rabat)Yousfi Abdellah (FSJES, Rabat)

Haralambous Yannis (ENSTB, Bretagne/ France)Iazzi El Mehdi (FLSH, Agadir)Jean Thierry (OLPC, France)Mammas Driss (FS, Agadir)

Mouradi Abdelhak (ENSIAS, Rabat)Ouahmi Ould-Braham (MSH, Paris Nord)

Pognan Patrice ( INALCO, Paris)Rosso Paolo (UPV, Valence)Rachidi Ali (ENCG, Agadir)

Soudi Abdellah (ENIM, Rabat)Souifi Hamid (IRCAM, Rabat)Zenkouar Lahbib (EMI, Rabat)

Comité d’organisation :Ait Ouguengay Youssef

Ansar KhalidAtaa Allah FadouaBoulaknadel Siham

Outahajala MohamedSouifi Hamid

Assistance technique et administrative :El Marssi Karim

Boumediane MouniaOuzine Aïcha

El Houdaigui Mustapha

Vendredi 25 février 20119h00 – 10h30 Première Séance

Outils d’annotationModérateur : Hammou Fadili

9h00 – 9h30 « A Tool for Annotating Texts with Morphological and Syntactic Information » V. Cavalli-Sforza et H. Rehioui (Univ. Al Akhawayn, Maroc)9h30 – 10h00 « Building an annotated corpus for Amazighe » M. Outahajala (IRCAM, Maroc), L. Zenkouar (EMI, Maroc), P. Rosso (UPV, Espagne)10h00 – 10h30 « Etiquetage morphosyntaxique de l’amazighe » F. Ataa allah (IRCAM, Maroc)10h30 – 10h45 Pause café

10h45 – 12h15 Deuxième séanceMorphosyntaxe et sémantique

Modérateur : Ouahmi Ould braham10h45 – 11h15 « Un lexique morpho-syntaxique des verbes arabes » A. El Jihad, S. Elhassani et S. Rami (IERA, Maroc)11h15 – 11h45 « Contribution à l’élaboration d’un générateur d’états d’annexions » M. Mahrazi (Univ. de Béjaïa)11h45 – 12h15 « Un bouquet de domaines d’applications de PROSEM et gestion de la sémantique contextualisée » H. Fadili (CNAM, France)

15h00 – 16h30 Troisième SéanceConstruction et exploitation des ressources langagières – 2

Modérateur : Violetta Cavalli-Sforza15h00 – 15h30 « Corpus oraux : Essai de segmentation automatique » N. Tigziri (UMMTO, Algérie), R. Jolivet (Univ. de Lausanne, France), S. Chalah (UMMTO, Algérie), R. Boukherouf (UMMTO, Algérie), S. Merzouki (UMMTO, Algérie), S. Hassani (UMMTO, Algérie)15h30 – 16h00 « Vers une représentation normalisée de la banque de données de l’IERA » A. Hamdani et S. Elhassani (IERA, Maroc), 16h00 - 16h30 « Histoire d’une initiative récente : la Biblio-thèque numérique berbère » O. Ould braham (MSH, France)16h30 – 16h45 Pause café

Table ronde et ClôtureModérateur : Ait Ouguengay Youssef

16h45 – 17h45 « L’amazighe et les nouvelles technologies : Méthodologies de construction et outils d’exploitation »