Download - F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 1: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Modeles bayesiens pour l’apprentissage non supervise

Francois Caron

INRIA Bordeaux Sud OuestEquipe CQFD

Jeudi 23 octobre 2008

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 1 / 39

Page 2: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Sommaire

1 Introduction

2 Modeles bayesiens non parametriques

3 Algorithme MCMC

4 Classification non supervisee dynamique

5 Conclusion

Page 3: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Sommaire

1 Introduction

3 Algorithme MCMC

5 Conclusion

Page 4: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Apprentissage non supervise

Ensemble de donnees z1, z2, . . . , zn

Estimer un parametre inconnu ! a partir des donnees

Reduction de dimension, classification . . .

Objectif : prediction, interpretabilite, compression. . .

Approche bayesienne

! A priori sur le parametre inconnu !! Distribution a posteriori de ! conditionnellement aux donnees

Page 5: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Approche bayesienne

Page 6: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Approche bayesienne

Page 7: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Approche bayesienne

Page 8: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Approche bayesienne

Page 9: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Approche bayesienne

! A priori sur le parametre inconnu !

! Distribution a posteriori de ! conditionnellement aux donnees

Page 10: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Approche bayesienne

Page 11: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification non supervisee

Classer ces donnees en groupes partageant des caracteristiquessimilaires

Estimer le centroıd de chaque groupe

Page 12: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 13: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 14: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Pour chaque donnee k, k = 1, . . . , n, estimer la variable de classeck = j , j = 1, 2 . . .

Estimer le centroıd Uj , j = 1, 2, . . . de chaque groupe

Page 15: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Exemple : Classification de potentiels d’actionLewicki,Network : Comput. Neural Syst., 1998

Brefs potentiels d’action enregistres par une micro-electrode

Objectif : classer les signaux afin d’attribuer chaque potentiel a unneurone particulier

Nombre de neurones inconnu, bruit de fond

Page 16: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 17: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 18: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Exemple : Classification de sequences d’expression de genesMedvedovic and Sivaganesan, Bioinformatics, 2002.

Puces a ADN : donnees d’expression de gene pour plusieurs genes etplusieurs conditions experimentales

Classification de genes avec des sequences d’expression similaires

Page 19: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Exemple : Classification de sequences d’expression de genesMedvedovic and Sivaganesan, Bioinformatics, 2002.

Puces a ADN : donnees d’expression de gene pour plusieurs genes etplusieurs conditions experimentales

Classification de genes avec des sequences d’expression similaires

Page 20: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Nombre de partitions pour n donnees : nombre de Bell

Nombre de donnees 2 5 10 100 200Nombre de Bell 2 52 115975 4.7! 10115 6! 10275

Nombre de donnees important : mise a l’echelle

Bruit de fond

Dimension des donnees

Autres parametres/hyperparametres inconnus

Nombre de groupes inconnu

Page 21: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithmes de clusteringJohnson, 1967. MacQueen, 1967.

Clustering hierarchique

K-means

Clustering base sur un modele

! Approche bayesienne (empirique)! Parametrique/non parametrique

Page 22: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

K-means

Page 23: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

K-means

Page 24: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

K-means

Page 25: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

K-means

Page 26: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

K-means

Page 27: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

K-means

Page 28: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

K-means

Page 29: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

K-means

Page 30: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

K-means

Page 31: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

K-means

Page 32: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

K-means

Page 33: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Reformuler comme un probleme d’estimation densite

Donnees z1, . . . , zn i.i.d. selon une distribution inconnue F

Exemple : Melange de distributions gaussiennes

F =K!

j=1

"jN (·|µj ,!j)

ou"

j "j = 1

Page 34: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification basee sur un modeleDempster et al., 1977

F est suppose etre un melange de distributions F ="K

j=1 "j f (·|Uj)

U1, . . . ,UK sont les centroıds des clusters

"1, . . . ,"K sont les tailles relatives des clusters ("K

j=1 "j = 1) de tellefacon que Pr(ck = j) = "j

f (·) est la forme parametrique d’un cluster (e.g. gaussienne demoyenne et matrice de covariance inconnues)

Objectif : Estimer ! = {U1:K , "1:K} etant donne z1:n

Approche bayesienne empirique : maximiserp(z1:n|!) =

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Algorithme Expectation-Maximization

Page 35: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

j=1 "j f (·|Uj)

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Page 36: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

j=1 "j f (·|Uj)

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Page 37: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

j=1 "j f (·|Uj)

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Page 38: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

j=1 "j f (·|Uj)

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Page 39: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

j=1 "j f (·|Uj)

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Page 40: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

j=1 "j f (·|Uj)

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Page 41: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Sommaire

1 Introduction

3 Algorithme MCMC

5 Conclusion

Page 42: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Cadre Bayesien

Parametre ! et observations z

Distribution a priori p(!) et vraisemblance p(z |!)Distribution a posteriori obtenue par le theoreme de Bayes

p(!|z) =p(!)p(z |!)

p(z)

Page 43: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Markov Chain Monte Carlo

En general impossible de determiner analytiquement p(!|z)

! Dimension importante! Pas de forme parametrique simple (e.g. gaussienne...)

Developpement des methodes de Monte Carlo

Comment obtenir des echantillons !(1),!(2), . . . , !(N)

approximativement distribues selon p(!|z) ?

! = {!1, . . . , !p}

Echantillonneur de Gibbs

Pour i = 1, . . . ,N,

Pour k = 1, . . . , p, echantillonner !(i)k selon

p(!k |!(i)1 , . . . , !(i)

k!1, !(i!1)k+1 , . . . , !(i!1)

p , z)

Page 44: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Estimation de densite bayesienne (parametrique)

Donnees z1, . . . , zn i.i.d. selon une distribution inconnue F

F est un melange de distributions F ="K

j=1 "j f (·|Uj)

Cadre bayesien complet : distributions a priori sur les poids et lescentroıds

"1:K " D(#

K, . . . ,

#

K)

Uj " G0 pour j = 1, . . . ,K

Page 45: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Estimation de densite bayesienne (parametrique)

Modele hierarchique

"1:K " D(#

K, . . . ,

#

K)

Uj " G0 pour j = 1, . . . ,K

Pour k = 1, . . . , n

ck " "1:K

zk |ck ,U1:K " f (·|Uck )

Objectif : Estimer p("1:K ,U1:K , c1:n|z1:n)

Page 46: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Modele hierarchique non parametriqueProcessus de Dirichlet a melange

Limite du modele parametrique quand K #$Modele bayesien hierarchique

"1:K " D(#

K, . . . ,

#

K)

Uj " G0 pour j = 1, . . . ,K

Pour k = 1, . . . , n

ck " "1:K

zk |ck ,U1:K " f (·|Uck )

F prend la forme d’un melange infini (denombrable)F =

""j=1 "j f (·|Uj)

Page 47: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Modele hierarchique non parametriqueProcessus de Dirichlet a melange

Distribution a deux parametres sur F

# > 0 regle la taille relative des clusters :

! Si ## 0, un cluster de taille % 1! Si ##$, infinite de clusters de poids similaires

G0 est la distribution a priori sur les centroıds des clusters

Non parametrique : Le nombre d’inconnues (clusters) augmente avecles donnees

Page 48: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Simulations

Page 49: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Simulations

Page 50: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Simulations

Page 51: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Sommaire

1 Introduction

3 Algorithme MCMC

5 Conclusion

Page 52: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Processus du restaurant chinois

Poids "1:", centroıds des clusters U1:", variables d’allocation c1:n

Integration analytique selon les parametres (de dimension infinie)"1:" et calculer Pr(ck |c1:k!1)

processus du restaurant chinois

Page 53: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 54: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 55: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 56: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Une donnee k est associee

! a un cluster existant avec une probabilite proportionnelle au nombre dedonnees associees a ce cluster

! a un nouveau cluster avec une probabilite proportionnelle a #

E"et de clustering

Page 57: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Sous certaines conditions, on peut egalement integrer selon les Uj

Objectif : Obtenir des echantillons c(1)1:n , c(2)

1:n , . . . , c(N)1:n

approximativement distribues selon Pr(c1:n|z1:n)

Echantillonneur de Gibbs pour la classification non supervisee

Pour i = 1, . . . ,N,

Pour k = 1, . . . , n, echantillonner c(i)k selon

Pr(ck |c(i)1 , . . . , c(i)

k!1, c(i!1)k+1 , . . . , c(i!1)

n , z1:n)

Page 58: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 59: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 60: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 61: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 62: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 63: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Methodes bayesiennes non parametriques pour laclassification non superviseeResume

Base sur un modele : la forme parametrique d’un cluster doit etredefinie (e.g. gaussienne, etc.)

Approche bayesienne

! Distribution a priori sur la taille relative des clusters (#)! Distribution a priori sur les centroıds des clusters (G0)

Nombre de clusters inconnu et estime a partir des donnees

Algorithmes de simulation e#caces

Bruit de fond/autres parametres inconnus peuvent etre pris en compte

Page 64: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Sommaire

1 Introduction

3 Algorithme MCMC

5 Conclusion

Page 65: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification non supervisee dynamique

Clustering statique : hypothese d’echangeabilite des donneesz1, . . . , zn

Si les donnees sont obtenues sequentiellement, cette hypothese peutetre trop forte

Nombre de clusters, les centroıds/tailles des clusters peuvent evolueren fonction du temps

Page 66: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Clustering dynamique

Ensemble de donnees zk,n k = 1, . . . , n, t = 1, . . . ,T

Page 67: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Clustering dynamique

Ensemble de donnees zk,n k = 1, . . . , n, t = 1, . . . ,T

Page 68: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Exemple : Classification de pics neuronauxBar-Hillel et al., J. of Neuroscience Methods, 2006

Brefs potentiels d’action enregistres par une micro-electrodeObjectif : classer les signaux afin d’attribuer chaque potentiel a unneurone particulierDerive de l’electrode, evolution des formes des pics et du bruit defond...

Page 69: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Exemple : Classification de pics neuronauxBar-Hillel et al., J. of Neuroscience Methods, 2006

Brefs potentiels d’action enregistres par une micro-electrodeObjectif : classer les signaux afin d’attribuer chaque potentiel a unneurone particulierDerive de l’electrode, evolution des formes des pics et du bruit defond...

Page 70: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Processus du restaurant chinois dynamique

Page 71: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 72: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 73: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 74: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 75: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 76: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithme

On peut dans certains cas integrer egalement les centroıds des clusters

Echantillons pour approcher Pr(c1:n,1:T |z1:n,1:T )

Algorithmes de Monte Carlo e#caces hors et en ligne

Page 77: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Simulation

Donnees simulees avec bruit de fond

Page 78: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Maladie de la fievre aphteuse

Page 79: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Maladie de la fievre aphteuse

Page 80: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Sommaire

1 Introduction

3 Algorithme MCMC

5 Conclusion

Page 81: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

ConclusionMethodes bayesiennes non parametriques : Processus de Dirichlet

Base sur un modele : forme parametrique d’un cluster

Bayesien : distribution a priori sur les centroıds/taille des clusters

Non parametrique : Nombre de clusters est directement estime apartir des donnees

Algorithmes de Monte Carlo e#caces pour estimer ces modeles

Versions statiques/dynamiques

Page 82: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 83: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 84: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 85: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Page 86: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Bibliographie

F. Caron, M. Davy, A. DoucetGeneralized Polya Urn for time-varying Dirichlet Process MixturesInternational Conference on Uncertainty in Artificial Intelligence, 2007.

A.P. Dempster, N.M. Laird and D.B. RubinMaximum Likelihood from Incomplete Data via the EM algorithmJournal of the Royal Statistical Society, 1977.

T. FergusonA Bayesian analysis of some nonparametric problems,The annals of statistics, vol. 1, pp. 209-230, 1973.

R.M. NealMarkov chain sampling methods for Dirichlet process mixture models,Journal of Computational and Graphical Statistics, 9 :249-265, 2000

C. Robert et G. CasellaMonte Carlo statistical Methods,Springer-Verlag, 1999.

Page 87: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

The end

Merci pour votre attention