Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le...

34
Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitement de caractères par analogie ENSSAT - IRISA Lannion David Guennec IUT de Lannion 16 juin 2009 David Guennec Soutenance de stage

Transcript of Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le...

Page 1: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Soutenance de stageTraitement de caractères par analogie

ENSSAT - IRISA Lannion

David Guennec

IUT de Lannion

16 juin 2009

David Guennec Soutenance de stage

Page 2: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

1 Introduction

2 Présentation de l’école

3 Le projet

4 La réalisation

5 Conclusion

David Guennec Soutenance de stage

Page 3: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Introduction au sujetRaisons de mon choix

1 IntroductionIntroduction au sujetRaisons de mon choix

2 Présentation de l’école

3 Le projet

4 La réalisation

5 Conclusion

David Guennec Soutenance de stage

Page 4: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Introduction au sujetRaisons de mon choix

Introduction

Cette présentation résume le travail que j’ai réalisé sur l’analogie aucours de mon stage de fin d’études de DUT informatique au sein del’équipe Cordial, dans les locaux de l’ENSSAT.Notre présentation suivra le plan du rapport :

Présentation de l’écoleLe projetLa réalisation

David Guennec Soutenance de stage

Page 5: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Introduction au sujetRaisons de mon choix

Introduction

Motivations pour le stageIntérêt pour le sujet traitéDécouverte de l’environnement de la rechercheIntérêt porté à l’ENSSATIntérêt pour les outils utilisés lors du développement

David Guennec Soutenance de stage

Page 6: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Vue d’ensembleSituation géographiqueHiérarchie

1 Introduction

2 Présentation de l’écoleVue d’ensembleSituation géographiqueHiérarchie

3 Le projet

4 La réalisation

5 Conclusion

David Guennec Soutenance de stage

Page 7: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Vue d’ensembleSituation géographiqueHiérarchie

L’ENSSAT

L’ENSSAT, École Nationale Supérieure des Sciences Appliquées etde Technologie, a été créée en 1986 à l’initiative de la ville deLannion. Les objectifs étaient notamment de :

Former des ingénieurs compétents dans les domaines d’activitédes industries locales.Procurer une possibilité de poursuites d’études aux diplômésde DUT (notamment ceux de l’IUT de Lannion).

David Guennec Soutenance de stage

Page 8: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Vue d’ensembleSituation géographiqueHiérarchie

En quelques chiffresL’ENSSAT représente :

4 filières (LSI, EII, Optronique, Ingénieur en apprentissage)5 laboratoires de recherche (Cordial, Pilgrim, CAIRN,FOTON-ENSSAT, TSI2M)116 personnels au total dont 36 enseignants-chercheursPlus de 1500 diplômés depuis sa création en 1986

David Guennec Soutenance de stage

Page 9: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Vue d’ensembleSituation géographiqueHiérarchie

La situation géographique de l’ENSSAT engendre différentsavantages et inconvénients :

AvantagesProximité du littoral et nombreuses possibilités d’activitésculturelles et sportivesNombreuses voies d’accès rapides à la ville

Inconvénients

Éloignement des grandes citésLannion → méconnaissance de la ville

David Guennec Soutenance de stage

Page 10: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Vue d’ensembleSituation géographiqueHiérarchie

Situation de l’ENSSAT en Bretagne

David Guennec Soutenance de stage

Page 11: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Vue d’ensembleSituation géographiqueHiérarchie

Organigramme de l’ENSSAT

David Guennec Soutenance de stage

Page 12: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Contexte du stageLa proportion analogiqueLes outils utilisésLes objectifsBases de donnéesDéroulement du stageRapport de temps

1 Introduction

2 Présentation de l’école

3 Le projetContexte du stageLa proportion analogiqueLes outils utilisésLes objectifsBases de donnéesDéroulement du stageRapport de temps

4 La réalisation

5 Conclusion

David Guennec Soutenance de stage

Page 13: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Contexte du stageLa proportion analogiqueLes outils utilisésLes objectifsBases de donnéesDéroulement du stageRapport de temps

Il est important de préciser tout d’abord que le stage s’esteffectué dans un cadre de recherche.Le projet a été effectué dans le cadre de l’équipe Cordial, dontles recherches portent sur le dialogue oral homme-machine.⇒ Ces recherches ont fait appel à la notion de proportion

analogique, sur laquelle a porté notre stage.

David Guennec Soutenance de stage

Page 14: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Contexte du stageLa proportion analogiqueLes outils utilisésLes objectifsBases de donnéesDéroulement du stageRapport de temps

DéfinitionOn a quatre objets A, B, C et D appartenant au même univers. Unerelation de proportion analogique est une relation du type :

A : B :: C : D ⇐⇒ "A est à B ce que C est à D"

Cela signifie que la relation qui existe entre un objet A et un objetB est du même type que celle entre l’objet C et l’objet D.

David Guennec Soutenance de stage

Page 15: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Contexte du stageLa proportion analogiqueLes outils utilisésLes objectifsBases de donnéesDéroulement du stageRapport de temps

Lorsqu’une relation est en proportion analogique additive, elle doitformer un parallélogramme, comme sur cet exemple :

Fig.: Analogie additive entre quatre objets

La relation qui va de A vers B est définie par un vecteur et larelation qui va de C vers D est définie par ce même vecteur

David Guennec Soutenance de stage

Page 16: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Contexte du stageLa proportion analogiqueLes outils utilisésLes objectifsBases de donnéesDéroulement du stageRapport de temps

Dissemblance analogiqueMais que se passe t’il lorsque la relation n’est pas tout à fait enanalogie ?

David Guennec Soutenance de stage

Page 17: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Contexte du stageLa proportion analogiqueLes outils utilisésLes objectifsBases de donnéesDéroulement du stageRapport de temps

Les outils utilisésAfin de mener à bien le stage, nous avons été amené à utiliser lesoutils suivants :

Weka pour la visualisation des donnéesEclipse pour le développement en JAVAeUML (plugin pour Eclipse) pour la conception desprogrammesTEXnicCenter et LATEX pour le rapport de stage et laprésentation

David Guennec Soutenance de stage

Page 18: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Contexte du stageLa proportion analogiqueLes outils utilisésLes objectifsBases de donnéesDéroulement du stageRapport de temps

Les objectifsLe but du stage a été de tester les propriétés de l’analogie surune base de données concrètes.Il a donc fallu développer des applications permettant dechercher les relations en analogie dans la base, d’évaluer leurnombre, leurs caractéristiques, les meilleures relations, etc.

David Guennec Soutenance de stage

Page 19: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Contexte du stageLa proportion analogiqueLes outils utilisésLes objectifsBases de donnéesDéroulement du stageRapport de temps

Programmes conçusPour cela, différents programmes ont été implémentés :

David Guennec Soutenance de stage

Page 20: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Contexte du stageLa proportion analogiqueLes outils utilisésLes objectifsBases de donnéesDéroulement du stageRapport de temps

Bases de donnéesAu cours du stage, deux bases de données, contenues dans desfichiers de texte, ont été utilisées :

La base initiale, contenant les données de caractèresmanuscrits écrits par différents scripteursUne deuxième base, contenant les données de voyellesprononcées par différents locuteurs

David Guennec Soutenance de stage

Page 21: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Contexte du stageLa proportion analogiqueLes outils utilisésLes objectifsBases de donnéesDéroulement du stageRapport de temps

Différentes phases du stagePour réaliser l’objectif du stage, il a fallu accomplir plusieurs tâchesdifférentes :

Étude de l’analogieExtraction de données dans les bases (fichiers de données)Étude de l’analogie sur les centres de gravité de distributionsgaussiennesÉtude de l’analogie sur les matrices de covariance dedistributions gaussiennes.

David Guennec Soutenance de stage

Page 22: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Contexte du stageLa proportion analogiqueLes outils utilisésLes objectifsBases de donnéesDéroulement du stageRapport de temps

Le projet s’est donc divisé en plusieurs tâches, présentées sur lediagramme de GANTT suivant, telles qu’elles ont été réalisées :

David Guennec Soutenance de stage

Page 23: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

PréliminairesVisualisation des donnéesTravail sur la dissemblance analogiqueTravail sur les matrices de covariance

1 Introduction

2 Présentation de l’école

3 Le projet

4 La réalisationPréliminairesVisualisation des donnéesTravail sur la dissemblance analogiqueTravail sur les matrices de covariance

5 Conclusion

David Guennec Soutenance de stage

Page 24: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

PréliminairesVisualisation des donnéesTravail sur la dissemblance analogiqueTravail sur les matrices de covariance

Les premières tâches ont été :

1 d’étudier les concepts de l’analogie que nous avons été amenéà utiliser

2 d’extraire les données qui nous intéressent dans la base dedonnées fournie initialement (lettres manuscrites).

Celles-ci ont été réalisées simultanément durant les trois premièressemaines du stage.

⇒ Nous avons alors pu visualiser les données de la basesous Weka.

David Guennec Soutenance de stage

Page 25: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

PréliminairesVisualisation des donnéesTravail sur la dissemblance analogiqueTravail sur les matrices de covariance

Visualisation des données

Fig.: Visualisation de quatre classes de la base de données. Chaque classeest définie par un scripteur et une lettre.

David Guennec Soutenance de stage

Page 26: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

PréliminairesVisualisation des donnéesTravail sur la dissemblance analogiqueTravail sur les matrices de covariance

Inconvénients de la baseDans un premier temps, nous avons cherché à réduire le nombretrop conséquent d’attributs de la base de données. Ceci n’acependant pas pu être réalisé, nous avons donc décidé derechercher une autre base de données.

Deuxième base de donnéesNous avons alors reproduit les mêmes opérations sur la deuxièmebase de données. Les résultats furent alors meilleurs.

David Guennec Soutenance de stage

Page 27: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

PréliminairesVisualisation des donnéesTravail sur la dissemblance analogiqueTravail sur les matrices de covariance

Visualisation des données

Fig.: Visualisation des données de quatre classes de la deuxième base dedonnées. Chaque classe est cette fois définie par un locuteur et unevoyelle.

David Guennec Soutenance de stage

Page 28: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

PréliminairesVisualisation des donnéesTravail sur la dissemblance analogiqueTravail sur les matrices de covariance

Calcul de la dissemblanceIl a ensuite fallu procéder au calcul de la dissemblance sur toutes lesrelations de la base. Cette dissemblance a été calculée sur lescentres de gravité de chaque classe.

Résultats décevants → sur la base de voyelles, les relations quisemblaient en analogie ne sont, au mieux, que de 67 %.

Cependant, certaines excellentes relations parmi celles quisemblaient le plus en analogie selon le programme que nous avonsimplémenté ont été trouvées.

David Guennec Soutenance de stage

Page 29: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

PréliminairesVisualisation des donnéesTravail sur la dissemblance analogiqueTravail sur les matrices de covariance

Travail sur les matrices de covarianceAprès avoir calculé les matrices de covariance de chaque classe,nous avons testé le concept de proportion analogique sur celles-ci.

Ceci fait appel à des notions d’algèbre linéaire présentées dans lerapport. Voici cependant, à titre d’exemple, le détail du calcul desmatrices de covariance de chaque classe, avec mi le nombre depoints de la classe :

µ̂i =1mi

mi∑j=1

xj

Q̂i =1mi

mi∑j=1

(xj − µ̂i )(xj − µ̂i )T

David Guennec Soutenance de stage

Page 30: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

PréliminairesVisualisation des donnéesTravail sur la dissemblance analogiqueTravail sur les matrices de covariance

0.44 −0.06 0.01 −0.04 −0.04 0.03 0.03 −0.13 −0.05 0.08

0.06 −0.18 −0.02 0.01 −0.02 0.02 0 −0.03 −0.09 −0.02

−0.01 −0.02 −0.24 0.02 −0.02 0.03 0.07 −0.03 −0.02 0.04

−0.04 −0.01 −0.02 0.14 0.02 −0.04 0.03 −0.02 0 −0.01

−0.04 0.02 0.02 0.02 0.13 −0.05 0.01 0.02 0.07 0.04

0.02 −0.02 −0.02 −0.03 −0.03 0.07 0.02 −0.01 0 −0.01

−0.03 0 0.06 −0.02 −0.01 −0.02 −0.14 0.01 0.01 −0.03

−0.09 0.02 0.03 −0.02 0.01 −0.01 −0.01 0.1 0.05 0.02

−0.03 0.06 0.01 0 0.04 0 −0.01 0.04 0.23 0.06

−0.05 −0.01 0.03 0 −0.02 0.01 −0.02 −0.01 −0.06 −0.14

David Guennec Soutenance de stage

Page 31: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

PréliminairesVisualisation des donnéesTravail sur la dissemblance analogiqueTravail sur les matrices de covariance

0.44 −0.06 0 0 0 0 0 −0.13 −0.05 0.08

0 −0.18 0 0 0 0 0 0 −0.09 0

0 0 −0.24 0 0 0 0.07 0 0 0

0 0 0 0.14 0 0 0 0 0 0

0 0 0 0 0.13 −0.05 0 0 0.07 0

0 0 0 0 0 0.07 0 0 0 0

0 0 0.06 0 0 0 −0.14 0 0 0

−0.09 0 0 0 0 0 0 0.1 0.05 0

0 0.06 0 0 0 0 0 0 0.23 0.06

−0.05 0 0 0 0 0 0 0 −0.06 −0.14

David Guennec Soutenance de stage

Page 32: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

PréliminairesVisualisation des donnéesTravail sur la dissemblance analogiqueTravail sur les matrices de covariance

Travail sur les matrices de covarianceAprès avoir calculé les matrices de covariance de chaque classe,nous avons testé le concept de proportion analogique sur celles-ci.

Résultats → nombreux problèmesNous en avons donc conclu que le concept de proportion analogiquene fonctionnait pas bien avec la base de données.

David Guennec Soutenance de stage

Page 33: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

1 Introduction

2 Présentation de l’école

3 Le projet

4 La réalisation

5 Conclusion

David Guennec Soutenance de stage

Page 34: Soutenance de stage - perso.univ-rennes1.fr€¦ · Introduction Présentation de l’école Le projet La réalisation Conclusion Soutenance de stage Traitementdecaractèresparanalogie

IntroductionPrésentation de l’école

Le projetLa réalisation

Conclusion

Conclusion

Les objectifs du stage ont été atteintsD’excellentes relations ont pu être visualiséesLes programmes conçus ont tous été testés sont parfaitementfonctionnels, et ont permis d’atteindre les objectifs du stageBon aperçu de l’environnement de la rechercheBeaucoup de connaissances gagnées/approfondiesExcellente mise à l’épreuve des acquis à l’IUT

Echec relatif des tentatives de mise en évidence de l’analogiesur les bases de données

David Guennec Soutenance de stage