Curriculum vitæ - textmining.biztextmining.biz/Staff/Roche/CV_MR/CV_MathieuRoche.pdf · Domaines...

16
Curriculum vitæ Mathieu Roche, Chercheur HDR Cirad TETIS, AgroParisTech, Cirad, Irstea LIRMM, UMR 5506, CNRS, Université Montpellier 2 Web : http://www.lirmm.fr/mroche/ Cursus Expérience Professionnelle À partir d’octobre 2013 : Chercheur HDR, Cirad (assimilé à Directeur de Recherche 1 ) Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad 2 ) Département Environnements et Sociétés UMR Territoires, Environnement, Télédetection et Information Spatiale (TETIS) Équipe Système d’Information Spatialisée : modélisation, extraction et diffusion des dOnnées et connais- sances (SISO) 2005-2013 : Maître de Conférences Université Montpellier 2, Faculté des Sciences UMR Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier (LIRMM) Équipe Exploration et exploitation de données textuelles (TEXTE) - En délégation CNRS au LIRMM – 2011-2012. - Titulaire de la PES (Prime d’Excellence Scientifique) – 2009-2013. 2004-2005 : Demi poste d’ATER (Attaché Temporaire de l’Enseignement et de la Recherche) Université Paris 11 (Orsay), Faculté des Sciences UMR Laboratoire de Recherche en Informatique (LRI) Équipe Inférence et Apprentissage (IA) 2001-2004 : Allocataire de recherche, Moniteur en informatique Université Paris 11 (Orsay), Faculté des Sciences UMR Laboratoire de Recherche en Informatique (LRI) Équipe Inférence et Apprentissage (IA) Formation Décembre 2011 : Habilitation à Diriger des Recherches (HDR) à l’Université Montpellier 2. Titre : "Fouille de Textes : de l’extraction des descripteurs linguistiques à leur induction". Jury : N. Aussenac-Gilles (Présidente), E. Gaussier (Rapporteur), G. Lapalme (Rapporteur), S. Matwin (Rapporteur), P. Gallinari, Y. Kodratoff, V. Prince, M. Teisseire. Décembre 2004 : Doctorat en Informatique à l’Université Paris XI, mention Très Honorable. Titre : "Intégration de la construction de la terminologie de domaines spécialisés dans un processus global de fouille de textes". Jury : C. Froidevaux (Présidente), C. Vrain (Rapportrice), A. Napoli (Rapporteur), Y. Toussaint (Rappor- teur avec A. Napoli), P. Sébillot (Examinatrice) et Y. Kodratoff (Directeur de thèse). 2001 : DEA 3 Information Interaction Intelligence à l’Université Paris 11 (Orsay), mention Bien. 1 Cadres scientifiques du Cirad classés en catégorie 8 et au-delà ou en catégorie 7 et titulaires d’une HDR (règle d’équivalence notamment utilisée dans les rapports d’évaluation AERES). 2 EPIC sous la tutelle du ministère de l’Enseignement supérieur et de la Recherche et du ministère des Affaires étrangères. 3 Diplôme d’Etudes Approfondies. 1

Transcript of Curriculum vitæ - textmining.biztextmining.biz/Staff/Roche/CV_MR/CV_MathieuRoche.pdf · Domaines...

Curriculum vitæ

Mathieu Roche, Chercheur HDRCirad

TETIS, AgroParisTech, Cirad, Irstea

LIRMM, UMR 5506, CNRS, Université Montpellier 2

Web : http://www.lirmm.fr/∼mroche/

Cursus• Expérience Professionnelle

– À partir d’octobre 2013 : Chercheur HDR, Cirad (assimilé à Directeur de Recherche1)• Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad2)Département Environnements et Sociétés• UMR Territoires, Environnement, Télédetection et Information Spatiale (TETIS)Équipe Système d’Information Spatialisée : modélisation, extraction et diffusion des dOnnées et connais-sances (SISO)

– 2005-2013 : Maître de Conférences• Université Montpellier 2, Faculté des Sciences• UMR Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier (LIRMM)Équipe Exploration et exploitation de données textuelles (TEXTE)

- En délégation CNRS au LIRMM – 2011-2012.- Titulaire de la PES (Prime d’Excellence Scientifique) – 2009-2013.

– 2004-2005 : Demi poste d’ATER (Attaché Temporaire de l’Enseignement et de la Recherche)• Université Paris 11 (Orsay), Faculté des Sciences• UMR Laboratoire de Recherche en Informatique (LRI)Équipe Inférence et Apprentissage (IA)

– 2001-2004 : Allocataire de recherche, Moniteur en informatique• Université Paris 11 (Orsay), Faculté des Sciences• UMR Laboratoire de Recherche en Informatique (LRI)Équipe Inférence et Apprentissage (IA)

• Formation

– Décembre 2011 : Habilitation à Diriger des Recherches (HDR) à l’Université Montpellier 2.Titre : "Fouille de Textes : de l’extraction des descripteurs linguistiques à leur induction".Jury : N. Aussenac-Gilles (Présidente), E. Gaussier (Rapporteur), G. Lapalme (Rapporteur), S. Matwin(Rapporteur), P. Gallinari, Y. Kodratoff, V. Prince, M. Teisseire.

– Décembre 2004 : Doctorat en Informatique à l’Université Paris XI, mention Très Honorable.Titre : "Intégration de la construction de la terminologie de domaines spécialisés dans un processus globalde fouille de textes".Jury : C. Froidevaux (Présidente), C. Vrain (Rapportrice), A. Napoli (Rapporteur), Y. Toussaint (Rappor-teur avec A. Napoli), P. Sébillot (Examinatrice) et Y. Kodratoff (Directeur de thèse).

– 2001 : DEA3 Information Interaction Intelligence à l’Université Paris 11 (Orsay), mention Bien.

1Cadres scientifiques du Cirad classés en catégorie 8 et au-delà ou en catégorie 7 et titulaires d’une HDR (règle d’équivalence notammentutilisée dans les rapports d’évaluation AERES).

2EPIC sous la tutelle du ministère de l’Enseignement supérieur et de la Recherche et du ministère des Affaires étrangères.3Diplôme d’Etudes Approfondies.

1

Activités de recherche (depuis 2005)

• Domaines de recherche : Fouille de Textes, Traitement Automatique du Langage Naturel, Recherched’Information.

• Thème principal : Extraction et exploitation des descripteurs linguistiques en fouille de textes.

Les méthodes de fouille de textes consistent à modéliser puis mettre en œuvre des méthodologies appliquées auxdonnées textuelles afin d’en déterminer le sens et/ou découvrir des connaissances nouvelles. Elles s’appuient sur des ap-proches linguistiques et/ou statistiques. Les processus de fouille de textes sont souvent composés d’une phase d’extractionde descripteurs linguistiques tels que les mots-clés les plus significatifs. Elle est suivie d’une phase d’exploitation de cesdescripteurs dans le cadre de tâches précises énumérées ci-dessous.

• Recherche d’Information

∗ Analyse de sentiments· Fouille de données d’opinion et classification (depuis 2007)avec P. Poncelet (LIRMM), M. Plantié (LGI2P-EMA), G. Dray (LGI2P-EMA), F. Trousset (LGI2P-EMA), B. Duthil (LGI2P-EMA)

· Analyse de sentiments et informations géospatiales (depuis 2012)avec M. Teisseire (TETIS), P. Poncelet (LIRMM), P. Maurel (TETIS), J.P. Tonneau (TETIS),E. Valette (TETIS), V. Prince (LIRMM)

∗ Entrepôts de données textuelles· Extraction et agrégation de descripteurs linguistiques pour les entrepôts de données textuelles(depuis 2009)avec P. Poncelet (LIRMM), M. Teisseire (TETIS), S. Bringay (LIRMM), F. Bouillot (stageCNAM), N. Béchet (post-doc)

∗ Classification de documents· Classification de données du Web Social (blogs, tweets) (depuis 2007)avec N. Verdier (société PaperBlog), I. Bayoudh (stage ingénieur), B. Rosoor (société Web Report),L. Sebag (société Web Report), S. Bringay (LIRMM)

· Classification d’offres d’emploi (2008-2010)avec R. Kessler (thèse LIA), J.M. Torres-Moreno (LIA), M. El-Bèze (LIA), N. Béchet (thèseLIRMM)

· Classification de données bruitées et hétérogènes (depuis 2007)avec V. Poulain d’Andecy (société ITESOFT), H. Hamza (société ITESOFT)

∗ Visualisation de documents· Visualisation de données textuelles biomédicales (2009-2011)avec S. Bringay (LIRMM), M. Teisseire (TETIS), A. Sallaberry (thèse LABRI & PIKKO)

• Extraction de la terminologie et désambiguisation

∗ Terminologie et titrage· Titrage automatique de documents (depuis 2008)avec C. Lopez (thèse LIRMM), V. Prince (LIRMM), M. Faure (société Open-S/EvalAccess)

∗ Entités Nommées· Désambiguisation des acronymes/expansions (depuis 2007)avec V. Prince (LIRMM), I. Mougenot (LIRMM)

· Identification d’Entités Nommées (depuis 2010)∗ Extraction de la terminologie

· Extraction de la terminologie dans un processus de fouille de textes (depuis 2005)avec Y. Kodratoff (LRI), T. Heitz (LRI, Univ. of Shefield, et société Ontotext)

· Extraction de la terminologie dans des textes en Ancien français (2006-2007)avec C. Serp (thèse Univ. Montpellier 3), E. Cazal (stage CNAM), M. Teisseire (TETIS), A.Laurent (LIRMM)

∗ Relations sémantiques entre termes· Enrichissement des classes sémantiques (2006-2009)avec N. Béchet (thèse LIRMM), J. Chauché (LIRMM)

2

· Extraction automatique de gloses (depuis 2006)avec A. Mela (Univ. Montpellier 3), A. Steuckardt (LPL, Univ. de Provence)

• Extraction d’information

∗ Extraction d’information dans les logs (depuis 2008) avec H. Saneifar (thèse LIRMM/Satin-Technologies),S. Bonniol (société Satin-Technologies), P. Poncelet (LIRMM)

• Traitement lexical

∗ Mise en correspondance de schémas (2005-2008)avec F. Duchateau (thèse LIRMM), Z. Bellahsene (LIRMM), F. Pinet (Cemagref)

∗ Détection de tendances (2007-2010)avec A. Laurent (LIRMM), B. Laurent (société Namae Concept), S. Jaillet (société CrysaLEAD)

Publications Scientifiques

→ DBLP Computer Science Bibliography (76 entrées4) :http://www.informatik.uni-trier.de/∼ley/db/indices/a-tree/r/Roche:Mathieu.html

→ Sélection de 6 publications récentes (liste complète de mes publications donnée en Annexe) :

• C. Lopez, V. Prince, M. Roche. How can catchy titles be generated without loss of informativeness?Expert Systems with Applications, Elsevier, 2013, to appear [IF : 1.85 en 2012]

• C. Lopez, V. Prince, M. Roche. NOMIT: Automatic Titling by Nominalizing. In Proceedings of NAACLHLT’12 (North American Chapter of the Association for Computational Linguistics – Human LanguageTechnologies), Full paper, 274-283, 2012 [Rang A]

• R. Kessler, N. Béchet, M. Roche, J.M. Torres-Moreno, M. El-Bèze. A Hybrid-based Approach to ManageJob Offers and Candidates. Information Processing & Management, Elsevier, Volume 48, Issue 6, 1124-1135, 2012 [Rang A, IF : 1.67 en 2011]

• A. Sallaberry, N. Pecheur, S. Bringay, M. Roche, M. Teisseire. Sequential patterns mining and gene se-quence visualization to discover novelty from microarray data. Journal of Biomedical Informatics, Elsevier,Vol. 44, Issue 5, 760-774, 2011 [IF : 1.72 en 2011]

• M. Roche, V. Prince. A Web-Mining Approach to Disambiguate Biomedical Acronym Expansions.Informatica, Vol 34, No 2, p243-253, 2010 [Taux de sélection ∼ 30%]

• M. Roche, Y. Kodratoff. Text and Web Mining Approaches in Order to Build Specialized Ontologies.Journal of Digital Information (JoDI), Vol 10, No 4, 2009 [Rang A en 2009]

→ Synthèse du nombre de publications :

Type de publications 2005 2006 2007 2008 2009 2010 2011 2012 2013 TOTALÉditions ouvrage int. 1 1Éditions revues nat. 1 1 1 3Ouvrage 1 1Chapitres de livre 1 1 2Revues int. 1 2 4 2 3 1 13Revues nat. 1 3 1 2 7Actes de conf. int. 1 3 9 6 8 5 7 4 43Actes de work. int. 1 3 1 2 4 1 12Actes de conf nat. 2 3 2 6 5 8 8 3 4 41TOTAL 3 4 11 20 15 24 16 18 12 123

4à la date du 10 août 2013.

3

→ Synthèse des conférences/revues des publications (depuis 2007) :

Type publications 2007 2008 2009 2010 2011 2012 2013Éditions ouvrage int. IGIÉditions revues nat. RNTI RNTI RNTIChapitres de livre TI CCISRevues int. IJSI JoDI IDA, Informatica JBI, IJCSI IPM ESWA

IJCISIM SIGMOD Record IJCISIM LIRevues nat. RNTI ISI, Corpus RNTI Corela

Documents Numériques EpistéméActes de conf. int. DEXA, DAWAK, IIP ISMIS, MIE SOCPAR, ISVC RANLP NAACL, EACL CICLING. ICDIM, CSTST ECIR, MAW IceTAL, MedInfo DEXA, LTC NLDB , DEXA, JADT NLDB, KDIR

JADT, CICLING KDIR, DEXA KEER, EKAW, ICCS WEBIST AGILE, PAIS WIMSActes de work. int. SMDB QSI Cogalex DMHM, GIRT ISIP

CIR, WAT PSD PLEADActes de conf nat. BDA INFORSID JFO, TOTH IC, TOTH INFORSID, EDA EGC EGC

CORIA LFA TALN CORIA, VSST TALN, TOTH SFC SAGEOEGC EGC EGC SFC, EGC INFORSID

Animation de la Recherche (depuis 2005)

• Responsable & membre de projets de Recherche

Projets académiques en cours :

– Porteur du projet Mastodons-CNRS ANIMITEX (2013-2014) – co-responsable scientifique avecM. Teisseire (TETIS, Irstea). Projet en collaboration avec les laboratoires LIRMM (Montpellier), TETIS(Montpellier), ICube (Strasbourg), GREYC (Caen), LIUPPA (Pau)Dans le cadre des Projets Grandes masses de données scientifiques – Mastodons mis en place par le CNRS,5 projets sur 20 ont été sélectionnés (25%) en 2013.

Analyse d’Images fondée sur des Informations Textuelles.

– Porteur du projet PEPS-CNRS ECOMESS (2013) – co-responsable scientifique avec R. Panckhurst(Praxiling, Université Montpellier 3).Dans le cadre des Projets Exploratoires PluridisciplinaireS (PEPS) mis en place par le CNRS et de l’appelHuMaIn : Humanités - Mathématiques - sciences de l’Information, 23 projets sur 113 ont été sélectionnés(20%).

Analyse contrastive des émotions contenues dans les messages courts.

– Porteur du projet Senterritoire (2012-2013)Projet pluridisciplinaire sélectionné (2012) et renouvelé (2013) par le Conseil Scientifique de la MSH-M.

Extraction des sentiments véhiculés dans les documents liés à l’aménagement du territoire.

– Membre de l’ANR Jeunes Chercheurs SIFR (2013-2017) portée par C. Jonquet (LIRMM).Indexation sémantique de ressources biomédicales francophones.

– Membre du projet Parlons de nous (2013-2014) porté par S. Bringay (LIRMM, Université Montpellier3) et F. Galtier (CHU Montpllier).Projet pluridisciplinaire sélectionné par le Conseil Scientifique de la MSH-M.

Mise en œuvre d’un système d’analyse semi-automatique des récits présents dans les fora de santé sur le Web.

Projets académiques finalisés :

– Porteur du projet PEPS-CNRS RESENS (2010) – co-responsable scientifique avec A. Mela (Univer-sité Montpellier 3).Dans le cadre des Projets Exploratoires PluridisciplinaireS (PEPS) mis en place par le CNRS, l’InstitutINS2I a sélectionné 10 projets sur 69 soumis (15%).

Recueil des descriptions spontanées pour accéder automatiquement au sens des mots.

– Membre du projet DGLFLF (2012-2013) porté par R. Panckhurst (Praxiling, Université Montpellier3).Projet pluridisciplinaire sélectionné par la Délégation Générale à la Langue Française et aux Langues deFrance.

Transcodage d’un corpus de SMS.

– Membre du projet sms4science (2011-2012) porté par R. Panckhurst (Praxiling, Université Montpellier3).Projet pluridisciplinaire sélectionné par le Conseil Scientifique de la MSH-M.

Acquisition et traitement d’un corpus conséquent de SMS.

4

– Porteur du projet ProSigles (2007-2008).Projet sélectionné par le Conseil Scientifique de l’Université Montpellier 2.

Extraction et gestion des sigles issus de textes plus ou moins spécialisés.

– Porteur du projet TSAL – Traitement Statistique et Algorithmique du Langage (2006).Projet "Pluridisciplinaires 2006" - Département STICS de l’Université Montpellier 2.

Extraction des connaissances à partir de corpus écrits en français médiéval.

– Membre de l’ANR Forum (2005-2008) portée par Z. Bellahsene (LIRMM).Extension des techniques d’intégration pour permettre le partage de données dans un environnement à grande

échelle.

• Responsable de projets de transfert de technologie (avec chercheurs du LIRMM)

– Responsable scientifique de Projets Industriels [part du LIRMM en K€] :

∗ Itesoft – 2011-2014 – co-resp. avec P. Poncelet∗ Succeed Together – 2011-2012 (resp. scientifique)∗ WebReport – 2010-2011 – co-resp. avec S. Bringay∗ Nevantropic – 2009/2010 – co-resp. avec P. Poncelet∗ Expernova – 2009/2011 – co-resp. avec P. Poncelet∗ Satin – 2008/2011 – co-resp. avec P. Poncelet et A. Laurent∗ Itesoft – 2008 (resp. scientifique)

– Responsable scientifique de Projets Incubés du Languedoc-Roussillon Incubation :

∗ Darryl (porteur P. Hoton) – incubation prévue en 2012 – co-resp. avec J.P. Prost∗ Open-S/EvalAccess (porteur M. Faure) – incubé en 2008 – co-resp. avec V. Prince∗ Namae Concept (porteur B. Laurent) – incubé en 2007 – co-resp. avec A. Laurent

• Responsable & Membre de Comités d’Organisation

– En projet : Organisation de la conférence NLDB 2014 (International Conference on Application of NaturalLanguage to Information Systems) à Montpellier

– Co-responsable avec M. Teisseire (TETIS) du workshop international GeoDoc’2012 dans lecadre de la conférence PAKDD’2012

Présentation de méthodes innovantes combinant informations géographiques et informations issues des donnéestextuelles

– Co-responsable avec F. Saïs (LRI – Orsay) et N. Béchet (LIRMM – Montpellier / INRIARocquencourt) des ateliers EvalECD’09, EvalECD’10, EvalECD’11 dans le cadre des conférencesEGC’09, EGC’10 et EGC’11

Confrontation des méthodes d’évaluation dans un processus d’Extraction de Connaissances à partir de Données(ECD)

– Membre du Comité d’Organisation de la conférence TALN’11Présentation des dernières avancées liées aux méthodes et applications du TALN.

– Membre du Comité d’Organisation des Journées JIGOT’10Présentation des méthodes d’extraction, de formalisation et d’utilisation de la connaissance dans le domaine

des géosciences.

– Membre du Comité d’Organisation de la conférence EDA’09Présentation de travaux de recherche innovants liés aux Entrepôts de Données.

– Co-responsable avec P. Poncelet (LGI2P – Nîmes) de l’atelier FODOP’08 (FOuille des Donnéesd’OPinions) dans le cadre de la conférence INFORSID’08

Développement d’une communauté pluridisciplinaire (fouille de données, aide à la décision, modélisation desconnaissances, TAL, linguistique, etc) qui s’intéresse au traitement des données d’opinion.

– Membre du Comité d’Organisation du challenge "Analyzing Web Traffic" dans le cadre desconférences ECML/PKDD’07

Classification du trafic HTTP afin de distinguer les différents types d’attaques et le trafic normal.

5

– Concepteur avec J. Azé (LRI - Orsay) du premier Défi Francophone de Fouille de Textes :DEFT’05. Responsable avec J. Azé du Comité d’Organisation de DEFT’05 et DEFT’06 (Co-présidentsdu Comité de Programme: Y. Kodratoff et V. Prince).

DEFT’05 (DÉfi Fouille de Textes) est le premier défi francophone du domaine. L’édition 2005 de DEFTconsistait à déterminer les phrases issues d’un corpus d’allocutions de F. Mitterrand présentes dans un corpus dediscours de J. Chirac. Onze équipes représentant neuf laboratoires ont participé. La campagne DEFT’06 organiséedans le cadre de la Semaine du Document Numérique à Fribourg en Suisse avait pour but de déterminer les segmentsthématiques à partir de trois corpus de domaines différents (politique, juridique, scientifique). Depuis sa création,le défi DEFT est organisé annuellement (participation en tant que membre du CP)

• Encadrement de thèses et stages

– Thèses de Doctorat

Thèses en cours :∗ Thèse INRA-Labex Numev de Soumia Lilia Berrahou – depuis novembre 2012 [co-encadrée avec P.

Buche (INRA) et J. Dibie Barthelemy (AgroParisTech)]Encadrement : 30%Titre : Extraction de relation n-aires dans les textes

∗ Thèse UM2 de Juan Lossio – depuis octobre 2012 [co-encadrée avec C. Jonquet (LIRMM-Smile) et M.Teisseire (TETIS)]Encadrement : 20%Titre : Enrichissement d’ontologie biomédicale en français

∗ Thèse Industrielle (avec la société Itesoft) de Flavien Bouillot – depuis avril 2012 [co-encadrée avecP. Poncelet (LIRMM)]Encadrement : 50%Titre : Classification de données bruitées et hétérogènes.

∗ Thèse MESR de Guillaume Tisserand – depuis octobre 2011 [co-encadrée avec V. Prince (LIRMM-Texte)]Encadrement : 70%Titre : Extraction de relations sémantiques dans les textes.Thèses soutenues :

∗ Thèse UM2-Région de Cédric Lopez – 2009-2012 [co-encadrée avec V. Prince (LIRMM-Texte)]Encadrement : 70%Titre : Titrage automatique de documents textuels.

∗ Thèse CIFRE (avec la société Satin Technologies) de Hassan Saneifar – 2008-2011 [co-encadrée avecP. Poncelet (LIRMM-Tatoo)] - Thèse soutenue le 02 décembre 2011Encadrement : 70%Titre : Extraction d’information à partir de Logs.

∗ Thèse BDI CNRS-Région de Nicolas Béchet – 2006-2009 [co-encadrée avec J. Chauché (LIRMM-Texte)]- Thèse soutenue le 08 décembre 2009Encadrement : 90%Titre : Extraction et regroupement de descripteurs morpho-syntaxiques pour des processus de Fouillede Textes.

– Stages Recherche (Master 2) :

∗ Ludovic Lebras – 2011-2012 [co-encadré avec P. Buche (INRA), J. Dibie-Barthélemy (AgroParisTech)]Thème : Extraction d’informations dans les articles scientifiques

∗ Sabiha Tahrat – 2011-2012 [co-encadré avec M. Teisseire (TETIS)]Thème : Extraction d’informations géospatiales dans les textes

∗ Stage de Jérôme Dorado – 2010-2011 [co-encadré avec S. Bringay (LIRMM)]Thème : Étude lexicale, syntaxique et graphique des tweets

∗ Stage de Walid Belhaoues – 2008-2009 [co-encadré avec V. Prince (LIRMM), S. Léon (LIRMM), M. Faure(Open-S/EvalAccess)]Thème : Titrage automatique de pages Web

∗ Stage de Miguel Macias – 2007-2008 [co-encadré avec V. Prince (LIRMM), A. Labadié (LIRMM)]Thème : Titrage automatique de pages Web

∗ Stage de Ali Harb – 2007-2008 [co-encadré avec P. Poncelet (LGI2P) , M. Plantié (LGI2P)]Thème : Fouille de données d’opinion

6

∗ Stage de Sami Laroum – 2007-2008 [co-encadré avec N. Béchet (LIRMM)]Thème : Classification de données bruitées issues d’OCR

∗ Stage de Nicolas Boffo – 2007-2008 [co-encadré avec A. Laurent (LIRMM), J. Bres (PRAXILING)]Thème : Extraction de descripteurs linguistiques temporels

∗ Stage de Larbi Mesbahi – 2005-2006 [co-encadré avec M. Teisseire (LIRMM), J. Chauché (LIRMM)]Thème : Utilisation d’informations syntaxiques associées à LSA

∗ Stage de Tang Yi Fei – 2005-2006 [co-encadré avec Z. Bellahsene (LIRMM)]Thème : Mise en correspondance de schémas

– Stages de fin d’étude d’Ingénieur :

∗ Stage d’ingénieur CNAM de Flavien Bouillot – 2010-2011 [co-encadré avec P. Poncelet (LIRMM)]Thème : Cubes de tweets

∗ Stage d’ingénieur CNAM de Pierre Nghiem – 2009-2010 [co-encadré avec P. Poncelet (LIRMM)]Thème : Entrepôts de données textuelles

∗ Stage de fin d’étude d’ingénieur d’Ines Bayoudh – INSAT Tunisie / Société Paperblog - 2007-2008[co-encadré avec N. Béchet (LIRMM)]Thème : Classification de blogs

∗ Stage d’ingénieur CNAM d’Emmanuel Cazal – 2006-2007 [co-encadré avec A. Laurent (LIRMM), M.Teisseire (LIRMM)]Thème : Extraction de la terminologie

– Stage Post Doctoral :

∗ Stage de Eric Kergosien (Pau – France) - 2012-2013 (14 mois) [co-encadré avec M. Teisseire (TETIS), S.Bringay (LIRMM)]Thème : Identification de sentiments liés aux territoires (projet Senterritoire)

∗ Stage de Corrado Loglisci (Italie) - 2012 (3 mois) [co-encadré avec M. Teisseire (TETIS), D. Ienco (TETIS)]Thème : Extraction de relations geospatiales dans les documents

∗ Stage de Feirouz Chakkoura (Syrie) - 2008-2009 (3 mois) [co-encadré avec S. Bringay (LIRMM), M. Teisseire(LIRMM)]Thème : Prise en compte de connaissances sémantiques pour la Recherche d’Information en biomédecine

– TER stages et projets tutorés (Master 1 et 2) :

∗ Stages de un à quatre étudiants en Master 2 Informatique – 2007-2013[co-encadrés avec A. Laurent (LIRMM), B. Laurent (Namae Concept), S. Jaillet (CrysaLEAD)]

∗ Projets tutorés et stages d’analyse en Master 1 Informatique (Intégration de Compétences) – 2006-2013[co-encadrés avec S. Kaci (LIRMM), C. Lopez (Viseo), A. Laurent (LIRMM), B. Laurent (Namae Concept), I.Mougenot (LIRMM), S. Bringay (LIRMM)]

∗ Stages de quatre étudiants en Master 1 Informatique – 2005-2013[co-encadrés avec E. Kergosien (LIRMM-TETIS), A. Mela (Univ. Montpellier 3), A. Laurent (LIRMM), B.Laurent (Namae Concept), S. Jaillet (CrysaLEAD), M. Hascoët (LIRMM), V. Prince (LIRMM), M. Faure(Open-S/EvalAccess)]

∗ Stages Polytech – 2005-2009[co-encadrés avec M. Teisseire (LIRMM), A. Laurent (LIRMM), B. Laurent (Namae Concept)]

• Jury de Doctorat, Master, CST (Comité de Suivis des Thèses)

– Jury de Doctorat (hors doctorants co-encadrés) :

∗ Francisco López-Orozco (Univ. de Grenoble) – juillet 2013 (rapporteur)∗ Wei Wang (Univ. Paris 11) – avril 2013 (examinateur)∗ Nicolas Beauger-Kuchmann (Ecole Centrale Paris) – février 2013 (rapporteur)∗ Benjamin Duthil (Ecole des Mines) – décembre 2012 (examinateur)∗ Van Tien Nguyen, (Univ. Pau) – novembre 2012 (examinateur)∗ Rémi Lavalley (Univ. Avignon) – juillet 2012 (examinateur)∗ Yassine Mrabet (Univ. Paris 11) – juillet 2012 (rapporteur)∗ Cécile Low Kam (Univ. Montpellier 2) – décembre 2010 (invité)∗ Dong (Haoyuan) Li (Univ. Montpellier 2) – septembre 2009 (examinateur)

7

∗ Rémy Kessler (Univ. Avignon) – juillet 2009 (examinateur)

– Rapporteur de stages de M2 Informatique (hors LIRMM/Univ. Montpellier 2) :

∗ Master Recherche (Univ. Rennes) – 2009∗ Master ECD (Univ. Lyon 2) – depuis 2007 (en moyenne un rapport par an)

– Membre de CST (Ecole Doctorale I2S – Montpellier) :

∗ Léa Guizol – Directeurs de thèse : M. Croitoru, M. Leclere∗ Pattataporn Warintarawej – Directeurs de thèse : A. Laurent, P. Pompidor∗ Aymen Troudi – Directeurs de thèse : A.-D. Seriai, M. Huchard∗ Dong (Haoyuan) Li – Directeurs de thèse : P. Poncelet, A. Laurent∗ Cécile Low Kam – Directeurs de thèse : A. Mas, M. Teisseire∗ Hai Phan – Directeurs de thèse : M. Teisseire, P. Poncelet

• Évaluation de dossiers (projets, équipes et recrutements)

– Evaluations :

∗ depuis 2011 : Évaluation de demandes de crédit d’impôt recherche (CIR) issues de sociétés∗ 2013 : Evaluation de projets ANR et Idex - Sorbonne / Paris Centre∗ 2009 : Évaluation d’équipe associée INRIA

– Comités de sélection/spécialistes :

∗ 2012 : Membre du Comité de Sélection du poste MC 2524 de l’Université Paris 6∗ 2007-2008 : Membre de la Commission de Spécialistes de l’Université d’Avignon (CSE 7, 27, 61)

• Autres responsabilités administratives/scientifiques

– Responsabilités dans des organismes régionaux :

∗ Depuis 2012 : Membre du Conseil Scientifique (COSTI) de Transferts LR

– Responsabilités au LIRMM :

∗ 2010-2013 : Co-responsable de l’équipe-projet TEXTE (2010-2012) puis responsable (2012-2013)

∗ 2010-2012 : Membre élu du Conseil Scientifique∗ 2011-2012 : Représentant du Conseil Scientifique à la Commission Valorisation∗ 2007-2013 : Correspondant de l’association SPECIF (Société des Personnels Enseignants et

Chercheurs en Informatique de France)∗ 2006-2013 : Membre de la Commission bibliothèque – Exposé invité dans le cadre de la conférenceFREDOC’08 rassemblant les documentalistes du CNRS.

• Relectures d’articles

– Revues internationales

∗ Membre de Comité Editorial : Linguisticae Investigationes (special issue "SMS Communication: ALinguistic Approach")

∗ Membre de Comités de Lecture : IEEE Intelligent Systems, International Journal of Human-Computer Studies, International Journal of Software and Informatics, Journal of Digital Information,International Journal of Web Applications, Data & Knowledge Engineering, Information Sciences,Computational Intelligence, International Journal of Hybrid Intelligence, Natural Language Engineer-ing, International Journal of Collaborative Intelligence

– Revues nationales

∗ Membre de Comité Editorial : TAL (numéro spécial "Opinions, sentiments et jugements d’évaluation")∗ Membre de Comités de Lecture : TSI, ISI, TAL, RNTI (numéro spécial Fouille de données complexes :

complexité liée aux données multiples), I3 (numéro spécial "Information Mining and Retrieval on the Web"

8

– Conférences et Workshops internationaux

∗ Membre de Comités de Programmes : NLDB’13, DBKDA’14/13/12/11/10/09, LASM’13(NAACL workshop), Hybrid’12 (EACLWorkshop), FDO’12Workshop, WIMS’11Workshop, CIRSE’10/09Workshop, SOCPAR’10 (membre du CP de la session "Efficient Management of Masses of Data")

∗ Membre de Comités de Lecture : CIKM’11, CSNT’11, FQAS’11, AKDM’11, ICDM’10/09,ECML/PKDD’10/04/03/02, KDIR’10, DEXA’09, ICADIWT’09, APWeb-WAIM’09, SAC’08, MMD’08,CAISE’07, ISWC’06, LREC’06, ISWC’06

– Conférences et Ateliers nationaux :

∗ Membre de Comités de Programmes : EGC’14/13/12/11, CORIA’14/13/12/07, RECITAL’13/09/08,TALN’11, INFORSID’11/06 (membre adj. du CP en 2006, membre du CP de la session ISIE en 2011), WebSocial’11/10, ECS’11, ExCoCo’11, SIDE’10/09/08, RJCRI’09 (Vice-Prés. du CP), DEFT’11/10/09/08/07,SOS’13, IN-OVIVE’13

∗ Membre de Comités de Lecture : EGC’10/09/08/07/05/03, TALN’13/12/10/09/08, INFOR-SID’12/10/07, JFO’09, BDA’11/10/09, RFIA’08, LFO’07, EDA’07, MAJECSTIC’07/06/05/04

Enseignement (depuis 2005)

• Responsabilités Administratives d’Enseignement :

– 2008-2011 : Responsable de la Spécialité "Intégration de Compétences" (IC) – Master Informa-tique

La mention Informatique de l’Université Montpellier 2 comporte deux spécialités (habilitation LMD2). Unedes spécialités, Intégration de Compétences, a pour but d’apporter, au cours d’un cursus de deux ans, lesconnaissances en informatique essentielles pour acquérir une double compétence. Cette spécialité comporte troisparcours : "Compétences Complémentaires en Informatique", "Bioinformatique", "Système d’Information Géo-graphique" et mutualise des modules avec le parcours "Physique-Informatique" de la mention Physique. Elle com-porte environ 70 étudiants en M1 et 50 étudiants en M2.Site web du Master IC : www.lirmm.fr/IC

– 2006-2011 : Responsable du Parcours Compétences Complémentaires en Informatique (CCI)– Master Informatique Spécialité IC

– 2006-2011 : Responsable des stages de la Spécialité IC – Master Informatique

– 2008-2009 : Responsable du Certificat Professionnel CP09 : "Webmestre : Conception de SitesAdministration et Serveurs Web" – CNAM Languedoc Roussillon

• Responsabilités Pédagogiques d’Enseignement (Université Montpellier 2) :

– 2007-2013 : Co-resp. (avec T. Libourel) UE "Systèmes d’Information et Bases de Données –niveau 2"Licence Informatique L3

– 2007-2013 : Co-resp. (avec A. Laurent) UE "Extraction de Connaissances dans les Données"Master Informatique IFPRU

– 2007-2013 : Co-resp. (avec M. Teisseire) UE "Fouille de Données Avancée"Master Informatique IFPRU

– 2007-2013 : Resp. UE "Fouille de Données"Master Informatique IC

– 2007-2013 : Co-resp. (avec I. Mougenot et T. Libourel) avec M. Teisseire UE "Administration des Basesde Données"Master Informatique IC

9

– 2006-2013 : Co-resp. (avec I. Mougenot) UE "Systèmes d’Information et Bases de Données"Master Informatique IC

– 2008-2011 : Co-resp. (avec T. Libourel) UE "Stages d’analyse ou Projets Tutorés"Master Informatique IC

– 2006-2007 : Co-resp. (avec T. Libourel) UE "Systèmes d’Information et Bases de Données –niveau 1"Licence Informatique L2

– 2005-2007 : Resp. UE "Fouille de Données"Master Professionnel Informatique

• Autres enseignements :

– UE "Algorithmique - programmation - internet" – CNAM (niveau L1)

– UE "Technologies du Web (XML)" – Master Informatique IC - M1

– UE "Programmation Applicative (Scheme)" – Licence Informatique - L2

10

Annexe : liste complète des publications (depuis 2005)

• Éditions de revues et d’ouvrages

[1] J. Azé, N. Béchet, L. Berti-Equille, S. Guillaume, M. Roche, F. Saïs. Mesurer et évaluer la qualité des données et desconnaissances. Numéro spécial de la revue RNTI (Revue des Nouvelles Technologies de l’Information), volume E-22, 2012

[2] V. Prince, M. Roche. Information Retrieval in Biomedicine: Natural Language Processing for Knowledge Integration. IGIPublishing, Medical Information Science Reference, 460 pages, 2009

[3] M. Roche, P. Poncelet. Fouille de Données d’Opinions. Numéro spécial de la revue RNTI (Revue des Nouvelles Technologiesde l’Information), volume E-17, 202 pages, 2009

[4] V. Prince, Y. Kodratoff, J. Azé, M. Roche. Défi Fouille de Textes : reconnaissance automatique des auteurs de discours- Campagne DEFT’05 (TALN’05). Numéro spécial de la revue RNTI (Revue des Nouvelles Technologies de l’Information),volume E-10, 148 pages, 2007

• Livre

[5] M. Roche. Terminologie et Fouille de Textes (publication de la thèse), Éditions universitaires européennes, ISBN : 978-613-1-50420-4, 2010

• Chapitres de livre

[6] H. Saneifar, S. Bonniol, A. Laurent, P. Poncelet, M. Roche. How to Rank Terminology Extracted by Exterlog. In Chapterin Knowledge Discovery, Knowlege Engineering and Knowledge Management, Series: Communications in Computer andInformation Science (CCIS), Springer-Verlag, revised selected paper of KDIR’09, p121-132, 2011

[7] M. Roche. Utilisation des ressources du Web pour la classification conceptuelle. Dans les Techniques de l’Ingénieur (T.I.).H 7 420, 2007

• Revues internationales avec comité de lecture

[8] C. Lopez, V. Prince, M. Roche. How can catchy titles be generated without loss of informativeness? Expert Systems withApplications, Elsevier, 2013, to appear [IF : 1.85 en 2012]

[9] R. Kessler , N. Béchet , M. Roche, J.-M. Torres-Moreno , M. El-Bèze. A hybrid approach to managing job offers andcandidates. Information Processing & Management, Volume 48, Issue 6, 1124-1135, 2012 [Rang A, IF : 1.67 en 2011]

[10] P. Accorsi, N. Patel, C. Lopez, R. Panckhurst, M. Roche. Seek&Hide: Anonymising a French SMS corpus using natural lan-guage processing techniques. Linguistic æInvestigationes (special issue "SMS Communication: A Linguistic Approach"),John Benjamins, Vol. 35, Issue 2, 163-180, 2012

[11] C. Lopez, V. Prince, M. Roche. How to Title Electronic Documents Using Text Mining Techniques. International Journalof Computer Information Systems and Industrial Management Applications, revised selected paper of SOCPAR’10, Vol. 4,p.562-569, 2012

[12] A. Sallaberry, N. Pecheur, S. Bringay, M. Roche, M. Teisseire. Sequential patterns mining and gene sequence visualizationto discover novelty from microarray data. Journal of Biomedical Informatics, Elsevier, Vol. 44, Issue 5, 760-774, 2011 [IF :1.72 en 2011]

[13] S. Laroum, N. Béchet, H. Hamza, M. Roche. Hybred: An OCR Document Representation for Classification Tasks.International Journal of Computer Science Issues, Vol. 8, Issue 3, No 2, 2011 [IF : 0.24 en 2011]

[14] H. Li, A. Laurent, P. Poncelet, M. Roche. Extraction of Unexpected Sentences: A sentiment Classification AssessedApproach. Intelligent Data Analysis Journal (IDA), Vol 14, No 1, p31-46, 2010 [IF : 0.40 en 2010]

[15] Z. Bellahsene, S. Benbernou, H. Jaudoin, F. Pinet, O. Pivert, F. Toumani, S. Bernard, P. Colomb, R. Coletta, E. Coquery,F. de Marchi, F. Duchateau, M.-S. Hacid, A. Hadjali, M. Roche. FORUM: a Flexible Data Integration System. SIGMODRecord, Vol 39, No2, p11-18, 2010 [IF : 0.85 en 2010]

[16] M. Roche, V. Prince. A Web-Mining Approach to Disambiguate Biomedical Acronym Expansions. Informatica, Vol 34,No2, p243-253, 2010 [taux d’acceptation ∼ 30%]

[17] N. Béchet, J. Chauché, V. Prince, M. Roche, M. Roche. Corpus and Web: Two Allies in Building and AutomaticallyExpanding Conceptual Classes. Informatica, Special Issue on Semantic Informational Technologies, Vol 34, No3, p279-286,2010

[18] M. Roche, Y. Kodratoff. Text and Web Mining Approaches in Order to Build Specialized Ontologies. Journal of DigitalInformation (JoDI), Vol 10, No 4, 2009 [Rang A en 2009]

[19] G. Dray, M. Plantié, A. Harb, P. Poncelet, M. Roche, F. Trousset. Opinion Mining from Blogs. International Journal ofComputer Information Systems and Industrial Management Applications, Vol 1, p205-213, 2009

[20] M. Roche, V. Prince. Managing the Acronym/Expansion Identification Process for Text-Mining Applications. InternationalJournal of Software and Informatics, Special issue on Data Mining, Vol 2, No 2, p163-179, 2008 [taux d’acceptation : 28%]

11

• Revues nationales avec comité de lecture

[21] C. Lopez, V. Prince, M. Roche. Le résumé et le titrage automatique partagent-ils les mêmes objectifs ? Corela, Vol 11,No1, 2013

[22] R. Panckhurst, C. Détrie, C. Lopez, C. Moïse, M. Roche, B. Verine. Sud4science, de l’acquisition d’un grand corpus deSMS en français à l’analyse de l’écriture SMS. Revue Epistémé, Liénard (éd.), "Communication électronique et écrituresnumériques", Vol 9, 2013

[23] S. Laroum, N. Béchet, H. Hamza, M. Roche. Classification automatique de documents bruités à faible contenu textuel.Numéro spécial de la revue RNTI, Fouille de Données Complexes, Vol E-18, 2010

[24] A. Harb, M. Plantié, M. Roche, G. Dray, F. Trousset, P. Poncelet. Détection d’opinion. Comment déterminer les adjectifsd’opinion d’un domaine donné. Revue du Documents Numériques, Vol 11, No 1-2, p37-61, 2008

[25] F. Duchateau, Z. Bellahsene, M. Roche. Improving Quality and Performance of Schema Matching in Large Scale. RevueISI (Ingénierie des Systèmes d’Information), Vol 13, No 5, p59-82, 2008

[26] C. Serp, A. Laurent, M. Roche, M. Teisseire. La quête du Graal et la réalité numérique. Revue Corpus, Vol 7, p173-189,2008

[27] J. Azé, M. Roche, E. Alphonse, A. Amrani, T. Heitz, A.-D. Mezaour. Bilan du premier défi francophone de Fouille deTextes. Numéro spécial de la revue RNTI, Défi Fouille de Textes : reconnaissance automatique des auteurs de discours -Campagne DEFT’05 (TALN’05), Vol E-10, p15-38, 2007

• Actes de Conférences internationales avec comité de lecture

2013

[28] S. L. Berrahou, P. Buche, J. Dibie-Barthelemy, M. Roche. How to extract unit of measure in scientific documents? InProceedings of KDIR’13 (International Conference on Knowledge Discovery and Information Retrieval), Session Text Mining,Vilamoura, Portugal, 2013

[29] G. Tisserant, V. Prince, M. Roche. GenDesc: Partial generalisation of linguistic features. In Proceedings of NLDB13(International conference on Applications of Natural Language Processing), Short paper, Springer-Verlag, LNCS, p.343-348,University of Salford, UK, 2013

[30] S. Tahrat, E. Kergosien, S. Bringay, M. Roche, M. Teisseire. Text2Geo: from textual data to geospatial information. InProceedings of WIMS’13 (International Conference on Web Intelligence, Mining and Semantics), Madrid, Spain, 2013

[31] N. Patel, P. Accorsi, D. Inkpen, C. Lopez, M. Roche. Approaches of anonymisation of an SMS corpus. In Proceedingsof CICLING’13 (Conference on Intelligent Text Processing and Computational Linguistics), Springer-Verlag, LNCS, Vol 1,p.77-88, Samos, Greece, 2013

2012

[32] C. Lopez, V. Prince, M. Roche. NOMIT: Automatic Titling by Nominalizing. In Proceedings of NAACL HLT’12 (NorthAmerican Chapter of the Association for Computational Linguistics – Human Language Technologies), p.274-283, Montréal,Canada, 2012

[33] M. Roche, O.M. Garbasevschi WeMiT: Web-Mining for Translation. In Proceedings of PAIS/ECAI’12 (Conference onPrestigious Applications of Intelligent Systems), Poster, Sort Paper, Montpellier, p993-994, p993-994weFrance, 2012

[34] A. Mela, M. Roche, A. Bekhtaoui. Lexical knowledge acquistion using spontaneous descriptions in texts In Proceedings ofNLDB’12 (International conference on Applications of Natural Language Processing), Short paper, Springer-Verlag, LNCS,p.366-371, Groningen, The Netherlands, 2012

[35] C. Loglisci, D. Ienco, M. Roche, M. Teisseire, D. Malerba. An Unsupervised Framework for Topological Relations Extractionfrom Geographic Documents. In Proceedings of DEXA’12 (International Conference on Database and Expert SystemsApplications), Springer-Verlag, LNCS, Vol 2, p.48-55, Vienna, Austria, 2012

[36] M. Roche. Fonctions de Rang et Fouille du Web pour l’identification et la catégorisation d’Entités Nommées. In Proceedingsof JADT’12 (Journées internationales d’Analyse statistique des Données Textuelles), p.859-870, Liège, Belgique, 2012

[37] F. Bouillot, P. Poncelet, M. Roche. How and why exploit tweet’s location information? In Proceedings of AGILE’12(International Conference on Geographic Information Science), Short paper, Avignon, France, 2012

[38] C. Lopez, V. Prince, M. Roche. Just Title It! (by an Online Application) In Proceedings of EACL’12 (InternationalConference on Geographic Information Science), Demonstration, p.31-34, Avignon, France, 2012

2011

[39] C. Lopez, V. Prince, M. Roche. Automatic titling of Articles Using Position and Statistical Information. In Proceedings ofRANLP’11 (Recent Advances in Natural Language Processing), Poster, p727-732, Hissar, Bulgaria, 2011

[40] C. Lopez, V. Prince, M. Roche. Automatic Generation Approach of Short Titles. In Proceedings of LTC’11 (Language andTechnology Conference), Poznan, Poland, 2011

[41] B. Duthil , F. Trousset, M. Roche, G. Dray, M. Plantié, J. Montmain, P. Poncelet. Towards an Automatic Characterizationof Criteria. In Proceedings of DEXA’11 (International Conference on Database and Expert Systems Applications), Vol 1,Springer-Verlag, LNCS, p457-465, Toulouse, France, 2011

[42] S. Bringay, N. Béchet, F. Bouillot, P. Poncelet, M. Roche, M. Teisseire. Towards an On-Line Analysis of Tweets Processing.In Proceedings of DEXA’11 (International Conference on Database and Expert Systems Applications), Vol 2, Springer-Verlag,LNCS, p154-161, Toulouse, France, 2011

12

[43] M. Roche. How Statistical Information from the Web can Help Identify Named Entities. In Proceedings of WEBIST’11(International Conference on Web Information Systems), Session Web and Text Mining, p685-689, Noordwijkerhout, Nether-lands, 2011

2010

[44] H. Saneifar, S. Bonniol, A. Laurent, P. Poncelet, M. Roche. Passage Retrieval in Log Files: An Approach Based on QueryEnrichment. In Proceedings of IceTAL’10 (International Conference on Natural Language Processing), Springer-Verlag,LNCS, p357-368, Reykjavik, Iceland, 2010

[45] A. Sallaberry, N. Pecheur, S. Bringay, M. Roche, M. Teisseire. Discovering Novelty in Gene Data: From Sequential Patternsto Visualization. In Proceedings of the 6th International Symposium on Visual Computing, Poster, Springer-Verlag, LNCS,p534-543, Las Vegas, NV, USA, 2010

[46] C. Lopez, V. Prince, M. Roche. Automatic Titling of Electronic Documents by Noun Phrase Extraction. In Proceedings ofIEEE SOCPAR’10 (Soft Computing and Pattern Recognition), Paris, France, 2010

[47] C. Lopez, V. Prince, M. Roche. Text titling application. In Demonstration proceedings of EKAW’10 (Knowledge Engineeringand Knowledge Management by the Masses), Lisbonne, Portugal, 2010

[48] S. Bringay, M. Roche, M. Teisseire, P. Poncelet, R. Abdel Rassoul, J.M. Verdier, G. Devau. Sequential Patterns: applicationto micro-arrays data analysis for Alzheimer disease. In Proceedings of MedInfo’10 (International Congress on MedicalInformatics), Cape Town, South Africa, 2010

[49] A. Sallaberry, N. Pecheur, S. Bringay, M. Roche, M. Teisseire. SequenceViewer: visualization of genes sequences. InProceedings of MedInfo’10 (International Congress on Medical Informatics), Demonstration (long abstract), Cape Town,South Africa, 2010

[50] M. Roche. FIN3E Approach: Identification of Named Entities from Extracted Terms. In Proceedings of ICCS’10 (Interna-tional Conference on Cognitive Science), Poster (long abstract), p.356-358, Beijing, China, 2010

[51] A. Laurent, B. Laurent, D. Brouillet, S. Martin, M. Roche. Embedding Emotions within Automatically Generated BrandNames. In Proceedings of KEER’10 (International Conference on Kansei Engineering and Emotion Research), Paris, 2010

2009

[52] R. Kessler, N. Béchet, J.M. Torres-Moreno, M. Roche, M. El-Bèze. Job Offer Management: How Improve the Ranking ofCandidates. In Proceedings of ISMIS’09 (International Symposium on Methodologies for Intelligent Systems), Springer-Verlag,LNCS, p431-441, Prague, Czech Republic, 2009

[53] H. Saneifar, S. Bonniol, A. Laurent, P. Poncelet, M. Roche. Mining for Relevant Terms from Log Files. In Proceedingsof KDIR’09 (International Conference on Knowledge Discovery and Information Retrieval), p77-84, Funchal - Madeira,Portugal, 2009

[54] H. Saneifar, S. Bonniol, A. Laurent, P. Poncelet, M. Roche. Terminology Extraction from Log Files. In Proceedings ofDEXA’09 (International Conference on Database and Expert Systems Applications), Springer-Verlag, LNCS, p769-776, Linz,Austria, 2009

[55] N. Béchet, M. Roche, J. Chauché. A Hybrid Approach to Validate Induced Syntactic Relations. In Proceedings of IEEEMAW’09 (International Symposium on Mining and Web), p727-732, Bradford, United Kingdom, 2009

[56] N. Béchet, M. Roche, J. Chauché. Towards the Selection of Induced Syntactic Relations. In Proceedings of ECIR’09(European Conference on Information Retrieval), Springer-Verlag, LNCS, Poster (Short paper), p786-790, Toulouse, France,2009

[57] P. Salle, S. Bringay, M. Teisseire, F. Chakkoura, M. Roche, G. Devauc, C. Lautier, J.M. Verdier. GeneMining: Identification,Visualization and Interpretation of Brain Ageing Signatures. In Proceedings of Medical Informatics Europe (MIE), p767-771,Sarajevo, Bosnia and Herzegovina, 2009

2008

[58] N. Béchet, M. Roche, J. Chauché. How the ExpLSA approach impacts the document classification tasks. In Proceedingsof IEEE ICDIM’08 (International Conference on Digital Information Management), p241-246, University of East London,London, United Kingdom, 2008

[59] A. Harb, M. Plantié, G. Dray, M. Roche, F. Trousset, P. Poncelet. Web opinion mining: How to extract opinions fromblogs? In Proceedings of IEEE/ACM CSTST’08 (International Conference on Soft Computing as Transdisciplinary Scienceand Technology), p211-217, Cergy, France, 2008

[60] I. Bayoudh, N. Béchet, M. Roche. Blog classification: Adding Linguistic Knowledge to Improve the K-NN Algorithm.In Proceedings of IIP’08 (International Conference on Intelligent Information Processing), Springer IFIP, p68-77, Beijing,China, 2008

[61] M. Plantié, M. Roche, G. Dray, P. Poncelet. Is a Voting Approach Accurate for Opinion Mining? In Proceedings of DaWaK08 (International Conference on Datawarehousing and Knwoledge Discovery), Springer-Verlag, LNCS, p413-422, Turin, Italy,2008

[62] H. Li, A. Laurent, M. Roche, P. Poncelet. Extraction of Opposite Sentiments in Classified Free Format Text Reviews. InProceedings of DEXA 08 (International Conference on Database and Expert Systems Applications), Springer-Verlag, LNCS,p710-717, Turin, Italy, 2008

[63] N. Béchet, M. Roche, J. Chauché. ExpLSA: An Approach Based on Syntactic Knowledge in Order to Improve LSA for aConceptual Classification Task. In Proceedings of RCS volume - CICLing’08, Poster, p213-224, University of Haifa, Israel,2008

13

[64] N. Béchet, M. Roche, J. Chauché. ExpLSA et classification de textes. In Proceedings of JADT’08 (Journées internationalesd’Analyse statistique des Données Textuelles), Vol 1, p167-177, Lyon, France, 2008

[65] C. Serp, E. Cazal, A. Laurent, M. Roche. Tervotiq : un système de vote pour l’extraction de la terminologie d’un corpusen français médiéval. In Proceedings of JADT’08 (Journées internationales d’Analyse statistique des Données Textuelles),Vol 2, p1069-1080, Lyon, France, 2008

[66] M. Roche, V. Prince. Évaluation et détermination de la pertinence pour des syntagmes candidats à la collocation. InProceedings of JADT’08 (Journées internationales d’Analyse statistique des Données Textuelles), Poster, Vol 2, p1009-1020,Lyon, France, 2008

2007

[67] M. Roche, V. Prince. AcroDef: A Quality Measure for Discriminating Expansions of Ambiguous Acronyms. In Proceedingsof CONTEXT’07, Springer-Verlag, LNCS, Poster, p411-424, Roskilde University, Denmark, 2007

[68] F. Duchateau, Z. Bellahsene, M. Roche. A Context-based Measure for Discovering Approximate Semantic Matching betweenSchema. In Proceedings of Research Challenges in Information Science (RCIS) - IEEE, p9-20, Ouarzazate, Maroc, 2007

[69] W. Guedria, Z. Bellahsene, M. Roche. A Flexible Approach Based on the user Preferences for Schema Matching. InProceedings of Research Challenges in Information Science (RCIS) - IEEE, p21-26, Ouarzazate, Maroc, 2007

2005

[70] J. Azé, M. Roche, Y. Kodratoff, M. Sebag. Preference Learning in Terminology Extraction: A ROC-based approach. InProceedings of ASMDA’05 (Applied Stochastic Models and Data Analysis), p209-219, Brest, France, 2005

• Actes de Workshops internationaux avec comité de lecture

[71] How to Extract Relevant Knowledge from Tweets? F. Bouillot, P.N. Hai, N. Béchet, S. Bringay, D. Ienco, S. Matwin, P.Poncelet, M. Roche, M. Teisseire. In Proceedings of "Information Search, Integration and Personalization" Workshop,Revised version in Communications in Computer and Information Science, Volume 146, pp 111-120, 2013

[72] C. Loglisci, D. Ienco, M. Roche, M. Teisseire, D. Malerba. Toward Geographic Information Harvesting: Extraction of SpatialRelational Facts from Web Documents. In Proceedings of SSTDM Workshop (Spatial and Spatio-Temporal Data Mining),ICDM Workshop, p.789-796, Brussels, Belgium, 2012

[73] D. Breton, S. Bringay, F. Marques, P. Poncelet, M. Roche. Mining Web Data for Epidemiological Surveillance. In Proceedingsof DMHM Workshop (Data Mining for Healthcare Management Workshop), PAKKD Workshop, Revised Selected Papers,LNCS, Springer Verlag, p.11-21, Kuala Lumpur, Malaisia, 2012

[74] F. Bouillot, P. Poncelet, M. Roche, D. Ienco, E. Bigdeli, S. Matwin. French Presidential Elections: What are the Most Effi-cient Measures for Tweets? In Proceedings of PLEAD Workshop (Politics, Elections and Data Workshop), CIKM Workshop,ACM, p.23-30, Maui, USA, 2012

[75] S. Tahrat S., M. Roche, M. Teisseire. Extraction of Geospatial Information from Documents. In Proceedings of GeographicInformation Retrieval Tutorial - Panel discussion. AGILE Worskshop, 2012

[76] C. Lopez, V. Prince, M. Roche. Managing Personal Information by Automatic Titling of E-mails. In Proceedings of PSD(Workshop of Personal Semantic Data) - EKAW’10, Lisonne, Portugal, 2010

[77] N. Béchet, M. Roche. How to Expand Dictionaries with Web-Mining Techniques. In Proceedings of Cogalex (CognitiveAspects of the Lexicon) - COLING’10, Beijing, China, 2010

[78] R. Kessler, N. Béchet, M. Roche, M. El-Bèze, J.M. Torres-Moreno. E-Gen: automatic profiling system for ranking candidatesanswers in Human Resources. In Proceedings of QSI workshop (Quantitative Semantic methods for the Internet) - OTM’08,Springer-Verlag, LNCS, p625-634, Monterrey, Mexico, 2008

[79] C. Raissi, J. Brissaud, G. Dray, P. Poncelet, M. Roche, M. Teisseire M. Web Analyzing Traffic Challenge: Description andResults. In Proceedings of ECML/PKDD’2007 Discovery Challenge, p47-52, Poland, 2007

[80] N. Béchet, M. Roche, J. Chauché. Improving LSA by expanding the contexts. In Proceedings of Context-Based InformationRetrieval (CIR) workshop - CONTEXT’07, Poster (Short paper), p105-108, Roskilde University, Denmark, 2007

[81] F. Duchateau, Z. Bellahsene, M. Roantree, M. Roche. An Indexing Structure for Automatic Schema Matching. In Proceedingsof the International Workshop on Self-Managing Database Systems (SMDB) - ICDE’07, p485-491, Istanbul, Turkey, 2007

[82] M. Roche, Y. Kodratoff. Pruning Terminology Extracted from a Specialized Corpus for CV Ontology Acquisition. InProceedings of onToContent’06 workshop (Ontology content and evaluation in Enterprise) - OTM’06, Springer Verlag, LNCS,p1107-1116, Montpellier, France, 2006

• Actes de Conférences nationales avec comité de lecture

2013

[83] E. Kergosien, P. Maurel, M. Roche, M. Teisseire. OPITER : Fouille de données d?opinion pour les territoires In Actes dela conférence SAGEO’13 (Spatial Analysis and GEOmatics), Brest, 2013

[84] F. Bouillot, O. Gout, P. Magnier, C. Pénin, P. Poncelet, M. Roche. Vers un outil de cartographie : qui est l’expert ? InActes de la conférence EGC’13 (Extraction et Gestion des Connaissances), Démonstration (Résumé étendu), Toulouse, 2013

[85] L. Lebras, P. Buche, J. Dibie-Barthélemy, M. Roche. Enrichissement d’une RTO par l’ajout de termes spécialisés. In Actesde la conférence EGC’13 (Extraction et Gestion des Connaissances), Poster (Résumé étendu), Toulouse, 2013

14

[86] S. Tahrat, E. Kergosien, S. Bringay, M. Roche, M. Teisseire. Text2Geo : des données textuelles aux informations géospatiales.In Actes de la conférence EGC’13 (Extraction et Gestion des Connaissances), p.407-412, Article court, Toulouse, 2013

2012

[87] M. Dieye, M.R. Doulache, M. Floussi, J. Chabalier, I. Mougenot, M. Roche. Construction d’un dictionnaire multilingue debiodiversité à partir de dires d’experts. In Actes de la conférence INFORSID’12, Article court, Montpellier, 2012

[88] H. Saneifar, S. Bonniol, P. Poncelet, M. Roche. Segmentations des fichiers logs. In Actes de la conférence EGC’12(Extraction et Gestion des Connaissances), p.381-386, Article court, Bordeaux, 2012

[89] G. Tisserant, V. Prince, M. Roche. Détection de relations sémantiques à partir de texte. In Actes de la conférence SFC’12(Rencontres de la Société Francophone de Classification), Marseille, 2012

2011

[90] S. Léon, M. Roche. Une étude comparative diachronique du féminisme. In Actes de la conférence Toth’11 (Terminologie &Ontologie : Théories et Applications), 2011 [version étendue : Rapport de Recherche du LIRMM RR-13010, 2013]

[91] H. Saneifar, S. Bonniol, P. Poncelet, M. Roche. Identification des divisions logiques de fichiers logs. In Actes deSFC’11(Rencontres de la Société Francophone de Classification), Orléans, 2011

[92] S. Bringay, N. Béchet, F. Bouillot, P. Poncelet, M. Roche, M. Teisseire. Analyse de gazouillis en ligne. In Actes de EDA’11(Journées francophone sur les Entrepôts de Données et l’Analyse), p87-102, Clermont-Ferrand, 2011

[93] C. Lopez, M. Roche. Approche de construction automatique de titres courts par des méthodes de Fouille du Web. In Actesde TALN’11 (Traitement Automatique des Langues Naturelles), p39-50, Montpellier, 2011

[94] C. Lopez, V. Prince, M. Roche. Recherche documentaire par titrage automatique. In Actes d’INFORSID’11, Lille, 2011

[95] A. Mela, M. Roche, M.A. Bekhtaoui. Mixer les moyens pour extraire les gloses. In Actes de la conférence EGC’11 (Extractionet Gestion des Connaissances), p95-106, Brest, 2011

[96] B. Duthil, F. Trousset, M. Roche, M. Plantié, G. Dray, J. Montmain. Une nouvelle approche pour l’extraction non superviséede critères. In Actes de la conférence EGC’11 (Extraction et Gestion des Connaissances), Poster (Résumé étendu), p325-326,Brest, 2011

[97] B. Rosoor, L. Sebag, S. Bringay, M. Roche A la recherche des tweets porteurs d’informations journalistiques. In Actes de laconférence EGC’11 (Extraction et la Gestion des Connaissances), Démonstration (Résumé étendu), p283-286, Brest, 2011

2010

[98] M. Roche. Filtrage des Entités Nommées par des méthodes de Fouille de Textes. In Actes de la conférence Toth’10(Terminologie & Ontologie : Théories et Applications), Annecy, 2010

[99] B. Rosoor, L. Sebag, S. Bringay, P. Poncelet, M. Roche Quand un tweet détecte une catastrophe naturelle... In Actes de laconférence VSST’10 (Veille Stratégique Scientifique et Technologique), Toulouse, 2010

[100] C. Lopez, V. Prince, M. Roche. Titrage automatique de documents électroniques par extraction de syntagmes nominaux.In Actes des Journées francophones d’Ingénierie des Connaissances, p 17-28, Nîmes, 2010

[101] D. Breton, M. Roche, P. Poncelet, F. Marques. Cartographie de dépêches pour analyser le développement d’épidémies. InActes des Journées francophones d’Ingénierie des Connaissances, Poster (Article court), p229-234, Nîmes, 2010

[102] D. Breton, M. Roche, P. Poncelet, F. Marques. Analyse de dépêches pour l’épidémiologie. In Actes des Journées francophonesd’Ingénierie des Connaissances, Démonstration (Résumé étendu), p271-273, Nîmes, 2010

[103] H. Saneifar, S. Bonniol, A. Laurent, P. Poncelet, M. Roche. Recherche de passages pertinents dans les fichiers logs parenrichissement de requêtes. In Actes de la conférence francophone en Recherche d’Information et Applications (CORIA),p239-254, Sousse, Tunisie, 2010

[104] S. Bringay, A. Laurent, P. Poncelet, M. Roche, M. Teisseire. Bien cube, les données textuelles peuvent s’agréger ! In RevueRNTI (Revue des Nouvelles Technologies de l’Information), numéro spécial EGC’2010, p585-596, Hammamet, Tunisie, 2010Article nominé parmi les 8 meilleurs articles applicatifs d’EGC’10.

[105] A. Sallaberry, N. Pecheur, S. Bringay, M. Roche, M. Teisseire. SequencesViewer : Visualisation de séquences ordonnées degènes ou comment rendre accessible des motifs séquentiels trop nombreux ? In Revue RNTI (Revue des Nouvelles Technologiesde l’Information), numéro spécial EGC’2010, Article court, p387-392, Hammamet, Tunisie, 2010

2009

[106] H. Saneifar, S. Bonniol, A. Laurent, P. Poncelet, M. Roche. Processus d’extraction et de validation de la terminologie issuede logs. In Actes des Journées Francophones sur les Ontologies (JFO’2009), Poitiers, 2009

[107] N. Béchet, M. Roche, J. Chauché. Corpus et Web : deux alliés pour la construction de l’enrichissement automatique declasses conceptuelles. In Actes de la conférence Toth’09 (Terminologie & Ontologie : Théories et Applications), Annecy, 2009

[108] R. Kessler, N. Béchet, J.M. Torres-Moreno, M. Roche, M. El-Bèze. Profilage de candidatures assisté par Relevance Feedback.In Actes de la conférence TALN’09, Poster, Senlis, 2009

[109] N. Béchet, M. Roche, J. Chauché. Comment valider automatiquement des relations syntaxiques induites. In Revue RNTI(Revue des Nouvelles Technologies de l’Information), numéro spécial EGC’2009, p169-180, Strasbourg, 2009Article nominé parmi les 9 meilleurs articles académiques d’EGC’09

15

[110] O. Djanga, H. Hamzioui, M. Hatchi, I. Mougenot, M. Roche. Regroupement des Définitions de Sigles Biomédicaux.In Revue RNTI (Revue des Nouvelles Technologies de l’Information), numéro spécial EGC’2009, Démonstration (Résuméétendu), p487, Strasbourg, 2009

2008

[111] M. Roche, V. Prince. Processus global d’acquisition et de gestion des sigles. In Actes de la conférence INFORSID’08,Fontainebleau, 2008

[112] H. Li, A. Laurent, M. Roche, P. Poncelet. Recherche de sentiments opposés par une approche floue à partir de textes libres.In Actes de la conférence LFA’08 (Logique Floue et ses Applications), Lens, 2008

[113] N. Béchet, M. Roche, J. Chauché. ExpLSA : utilisation d’informations syntaxico-sémantiques associées à LSA pour améliorerles méthodes de classification conceptuelle. In Revue RNTI (Revue des Nouvelles Technologies de l’Information), numérospécial EGC’2008, p589-600, Sophia-Antipolis, 2008

[114] M. Plantié, M. Roche, G. Dray. Un système de vote pour la classification de textes d’opinion. In Revue RNTI (Revue desNouvelles Technologies de l’Information), numéro spécial EGC’2008, Article court, p583-588, Sophia-Antipolis, 2008

[115] V. Matviico, N. Muret, M. Roche. Processus d’acquisition d’un dictionnaire de sigles et de leurs définitions à partir d’uncorpus. In Revue RNTI (Revue des Nouvelles Technologies de l’Information), numéro spécial EGC’2008, Démonstration(Résumé étendu), p231-232, Sophia-Antipolis, 2008

[116] J. Rabatel, Y. Lin, Y. Pitarch, H. Saneif, C. Serp, M. Roche, A. Laurent. Visualisation des motifs séquentiels extraits àpartir d’un corpus en Ancien Français. In Revue RNTI (Revue des Nouvelles Technologies de l’Information), numéro spécialEGC’2008, Démonstration (Résumé étendu), p237-238, Sophia-Antipolis, France, 2008

2007

[117] F. Duchateau, Z. Bellahsène, M. Roche. BMatch: a Semantically Context-based Tool Enhanced by an Indexing Structureto Accelerate Schema Matching. In Actes des Journées Bases de Données Avancées (BDA), Marseille, 2007

[118] M. Roche, V. Prince. DefAcro : mesure de qualité pour le choix de la définition des acronymes ambigus. In Actes de laquatrième conférence francophone en Recherche d’Information et Applications (CORIA), p255-270, Saint-Etienne, 2007

2006

[119] A. Mela, M. Roche. Des gloses de mot aux types de textes : un bilan différencié. In Actes du colloque "Corpus en Lettreset Sciences sociales : des documents numériques à l’interprétation", Texto! [en ligne] Vol XI, n°2, 2006.

[120] M. Roche, Y. Kodratoff. Choix du taux d’élagage pour l’extraction de la terminologie. Une approche fondée sur les courbesROC. Revue RNTI (Revue des Nouvelles Technologies de l’Information) numéro spécial conférence EGC’06, p205-216, Lille,2006

[121] M. Roche. Acquisition de la terminologie et définition des tâches à effectuer, deux principes indissociables. Dans Actes desJournées de Rochebrune (Rencontres interdisciplinaires sur les systèmes complexes naturels et artificiels), p151-161, Megève,2006

2005

[122] A. Amrani, M. Roche, Y. Kodratoff, O. Matte-Tailliez. Inductive Improvement of Part-of-Speech Tagging and its Effecton a Terminology of Molecular Biology. In Proceedings of the 18th Conference of the Canadian Society for ComputationalStudies of Intelligence, AI 2005, Springer-Verlag, LNCS, p366-376, Victoria, British-Columbia, Canada, 2005

[123] T. Heitz, M. Roche, Y. Kodratoff. Extraction de termes centrée autour de l’expert. Revue RNTI (Revue des NouvellesTechnologies de l’Information) numéro spécial conférence EGC’05, Démonstration (Article court), p685-690, Paris, 2005

16