mes_slides_chap_2

40
PROBLEMATIQUE DE L’IDENTIFICATION BACTERIENNE Cours d’aide à la décision médicale Année 2010-2011 WILFART SEBASTIEN MASTER 2 INFO

Transcript of mes_slides_chap_2

Page 1: mes_slides_chap_2

PROBLEMATIQUE DE

L’IDENTIFICATION BACTERIENNE

Cours d’aide à la décision médicale

Année 2010-2011

WILFART SEBASTIEN

MASTER 2 INFO

Page 2: mes_slides_chap_2

Introduction – Les entérobactéries (1)

Famille de bactéries pathogènes ou non

ayant des caractéristiques biochimiques

communes et dont l’habitat est le tube

digestif de l’homme ou celui des animaux.

Escherichia coli Salmonella

Page 3: mes_slides_chap_2

Introduction – Les entérobactéries (1)

Escherichia

Shigella

Serrata

Enterobacter

Citrobacter

Salmonella

KlebsiellaProteus

Providencia

Yersinia

Morganella

Page 4: mes_slides_chap_2

Introduction – Les entérobactéries (2)

L’identification des bactéries est réalisée à

l’aide de micro-tests biochimiques prêts à

l’emploi.

Page 5: mes_slides_chap_2
Page 6: mes_slides_chap_2

+ - + - + - + - - + - + + + + + + + + +

Page 7: mes_slides_chap_2

+ - + - + - + - - + - + + + + + + + + +

Page 8: mes_slides_chap_2

+ - + - + - + - - + - + + + + + + + + +

5 2 1 5 7 6 3

Page 9: mes_slides_chap_2

Méthode probabiliste - Introduction

Page 10: mes_slides_chap_2

Introduction – Les entérobactéries (3)

PROCESSUS D’IDENTIFICATION

Organisme

inconnu u

Kits de microtubes

Informations de classification

Modèle

d’identification

Proposition

d’identification

Fiabilité de la

proposition

Tests additionnelsFormulation de

l’identification

OUI NON

Page 11: mes_slides_chap_2

Introduction – Les entérobactéries (4)

MODELE D’IDENTIFICATION

Afin de choisir parmi plusieurs bactéries celle(s) qui

ressemble(nt) le plus à un germe inconnu prélevé

sur un individu présumé malade, on peut avoir

recours:

• à la méthode dichotomique

arbres de décision

• à la méthode probabiliste

approche bayésienne +

maximum de vraisemblance

Page 12: mes_slides_chap_2

Méthode des arbres de décision (1)

Méthode reposant sur la construction d’un

arbre binaire tel que:

- chaque sommet représente un test

biochimique à résultat binaire

- chaque feuille représente une bactérie

potentielle (ou un groupe de bactéries)

Page 13: mes_slides_chap_2

Méthode des arbres de décision (2)

HY-ENTEROTEST

Page 14: mes_slides_chap_2

Méthode des arbres de décision (3)

HY-ENTEROTEST

Page 15: mes_slides_chap_2

Méthode des arbres de décision (4)

HY-ENTEROTEST

5%

17%

11%

1%

Page 16: mes_slides_chap_2

Méthode probabiliste - Introduction

Méthode basée sur l’utilisation d’une matrice

donnant pour chaque bactérie identifiable,

sa probabilité de réaction positive à chaque

test.

Page 17: mes_slides_chap_2

Méthode probabiliste - Introduction

Page 18: mes_slides_chap_2

Méthode probabiliste – Introduction (1)

Soient:

• u le germe inconnu à identifier

• n tests biochimiques t1, t2, ... , tn

T = t1, t2, ..., tn

• m espèces identifiables b1, b2, ... , bm

B = b1, b2, ... , bm

R(u) = ensemble des résultats des tests de T

réalisés sur le germe inconnu u

Page 19: mes_slides_chap_2

Méthode probabiliste – Introduction (2)

P(biR(u)) = probabilité a posteriori de bi

P(bi) = probabilité a priori de bi

P(R(u)bi) = probabilité qu’une souche de la bactérie

bi B donne l’ensemble des résultats R(u) obtenus

pour le germe u

Page 20: mes_slides_chap_2

Méthode probabiliste – Théorème de Bayes

P(biR(u)) = probabilité a posteriori de bi

P(bi) = probabilité a priori de bi

P(R(u)bi) = probabilité qu’une souche de la bactérie

bi B donne l’ensemble des résultats R(u) obtenus

pour le germe u

Par le théorème de Bayes:

m

k

kk

iii

buRPbP

buRPbPuRbP

1

)|)(().(

)|)(().())(|(

Page 21: mes_slides_chap_2

Règle de décision de Bayes:

Méthode probabiliste - Théorème de Bayes

))(|(max))(|( 1

* uRbPuRbP imi

Page 22: mes_slides_chap_2

Règle de décision de Bayes:

Qui est équivalente à:

Méthode probabiliste - Règle de Bayes

))(|(max))(|( 1

* uRbPuRbP imi

)}|)(().({max))(|( 1

*

iimi buRPbPuRbP

Page 23: mes_slides_chap_2

Méthode probabiliste – Règle de Bayes

)}|)(().({max))(|( 1

*

iimi buRPbPuRbP

Page 24: mes_slides_chap_2

Méthode probabiliste – Règle de Bayes

Les probabilités a priori P(bi) ne pouvant

être connues avec exactitude, elles sont

supposées constantes.

)}|)(().({max))(|( 1

*

iimi buRPbPuRbP

Page 25: mes_slides_chap_2

Méthode probabiliste – Règle de Bayes

Les probabilités a priori P(bi) ne pouvant

être connues avec exactitude, elles sont

supposées constantes.

Comment calculer les P(R(u)|bi)?

)}|)(().({max))(|( 1

*

iimi buRPbPuRbP

Page 26: mes_slides_chap_2

Méthode probabiliste – Règle de Bayes

Les probabilités a priori P(bi) ne pouvant

être connues avec exactitude, elles sont

supposées constantes.

Comment calculer les P(R(u)|bi)?

Méthode du maximum de vraisemblance

)}|)(().({max))(|( 1

*

iimi buRPbPuRbP

Page 27: mes_slides_chap_2

Méthode probabiliste – MLE

L(R(u)bi) = vraisemblance de l’hypothèse

« le germe inconnu u est la bactérie bi B »

par rapport aux résultats R(u)

L(R(u)bi) ≈ P(R(u)bi)

Page 28: mes_slides_chap_2

Méthode probabiliste – MLE

Soit: Ni souches bien identifiées de la bactérie bi

Nik souches positives au test tk T

La vraisemblance d’une réaction positive au

test tk, pour une souche de l’espèce bi :

1)(0

iN

ikN

ib

kX

Page 29: mes_slides_chap_2

Méthode probabiliste – MLE

Soit: R(bi) = r1, r2, ... , rn

La vraisemblance des résultats R(bi), pour une

souche de l’espèce bi

kk r

iki

r

kii bXbXbbRL 1

Page 30: mes_slides_chap_2

Méthode probabiliste – MLE

Soit un germe inconnu u.

On pose:

Dès lors:

,ive pour u est positk

quand ri

bk

Xi

buk

Y ,

,ive pour u est négatquand rb kikX

ibu

kY 1,

m

k

iki buYbuRL1

),()|)((

Page 31: mes_slides_chap_2

Principe du maximum de vraisemblance

Choisir b* comme la (les) bactéries(s)

représentative(s) du germe u telle(s) que:

Méthode probabiliste – MLE

)}|)(({max)|)(( 1

*

imi buRLbuRL

Page 32: mes_slides_chap_2

Méthode probabiliste – Exemple

EXEMPLE- T = {Mobilité, H2S, Indole, Urée, ONPG, Gaz}

- B = {Prot. vulgaris, Prot. mirabilis, Edwardsiella, Salmonella}

- un germe inconnu u de profil R(u)

- R(u) = mobilité (+), H2S (+), Indole (+), Urée (+), ONPG (–), Gaz (+)}

Xk(bi) Mobilité H2S Indole Urée ONPG Gaz

P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86

P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93

Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99

Samonella 0.95 0.86 0.03 0.00 0.02 0.92

Page 33: mes_slides_chap_2

L(R(u) P. vulgaris) = 0.95 x 0.83 x 0.89 x 0.99 x (1.00 – 0) x 0.86 = 0.597

L(R(u) P. mirabilis) = 0.96 x 0.83 x 0.02 x 0.99 x (1.00 – 0) x 0.93 = 0.015

L(R(u) Edwardsiella) = 0.98 x 0.94 x 1.00 x 0 x (1.00 – 0) x 0.99 = 0

L(R(u) Salmonella) = 0.95 x 0.86 x 0.03 x 0 x (1 – 0.98) x 0.92 = 0

Méthode probabiliste – Exemple

Xk(bi) Mobilité H2S Indole Urée ONPG Gaz

P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86

P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93

Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99

Samonella 0.95 0.86 0.03 0.00 0.02 0.92

Page 34: mes_slides_chap_2

L(R(u) P. vulgaris) = 0.95 x 0.83 x 0.89 x 0.99 x (1.00 – 0) x 0.86 = 0.597

L(R(u) P. mirabilis) = 0.96 x 0.83 x 0.02 x 0.99 x (1.00 – 0) x 0.93 = 0.015

L(R(u) Edwardsiella) = 0.98 x 0.94 x 1.00 x 0 x (1.00 – 0) x 0.99 = 0

L(R(u) Salmonella) = 0.95 x 0.86 x 0.03 x 0 x (1 – 0.98) x 0.92 = 0

Méthode probabiliste – Exemple

Xk(bi) Mobilité H2S Indole Urée ONPG Gaz

P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86

P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93

Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99

Samonella 0.95 0.86 0.03 0.00 0.02 0.92

Page 35: mes_slides_chap_2

Normalisation des vraisemblances

Choisir b* comme la (les) bactéries(s)

représentative(s) du germe u telle(s) que:

Méthode probabiliste – Normalisation et seuil

m

k

k

ii

buRL

buRLuRbL

1

)|)((

)|)(())(|(

**

1

* ))(|())}(|({max))(|( suRbLetuRbLuRbL imi

Page 36: mes_slides_chap_2

Méthode probabiliste – Exemple 1

EXEMPLE 1- T = {Mobilité, H2S, Indole, Urée, ONPG, Gaz}

- B = {Prot. vulgaris, Prot. mirabilis, Edwardsiella, Salmonella}

- un germe inconnu u de profil R(u)

- R(u) = {mobilité (+), H2S (+), Indole (+), Urée (+), ONPG (–), Gaz (+)}

Xk(bi) Mobilité H2S Indole Urée ONPG Gaz

P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86

P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93

Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99

Samonella 0.95 0.86 0.03 0.00 0.02 0.92

Page 37: mes_slides_chap_2

EXEMPLE 1

L(R(u) P. vulgaris) = 0.597

L(R(u) P. mirabilis) = 0.015

L(R(u) Edwardsielle) = 0

L(R(u) Salmonella) = 0

__________

TOTAL 0,612

L(P. vulgaris|R(u)) = 0.597 / 0,612 = 0,975

L(P. mirabilis|R(u)) = 0.015 / 0,612 = 0,025

L(Edwardsielle|R(u)) = 0 / 0,612 = 0

L(Salmonella|R(u)) = 0 / 0,612 = 0

__________

TOTAL 1

Méthode probabiliste – Exemple 1

Page 38: mes_slides_chap_2

EXEMPLE 1

L(R(u) P. vulgaris) = 0.597

L(R(u) P. mirabilis) = 0.015

L(R(u) Edwardsielle) = 0

L(R(u) Salmonella) = 0

__________

TOTAL 0,612

L(P. vulgaris|R(u)) = 0.597 / 0,612 = 0,975

L(P. mirabilis|R(u)) = 0.015 / 0,612 = 0,025

L(Edwardsielle|R(u)) = 0 / 0,612 = 0

L(Salmonella|R(u)) = 0 / 0,612 = 0

__________

TOTAL 1

Méthode probabiliste – Exemple 1

Page 39: mes_slides_chap_2

Méthode probabiliste – Exemple 2

EXEMPLE 2- T = {Mobilité, H2S, Indole, Urée, ONPG, Gaz}

- B = {Prot. vulgaris, Prot. mirabilis, Edwardsiella, Salmonella}

- un germe inconnu u de profil R(u)

- R(u) = {mobilité (+), H2S (+), Indole (-), Urée (+), ONPG (–), Gaz (+)}

Xk(bi) Mobilité H2S Indole Urée ONPG Gaz

P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86

P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93

Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99

Samonella 0.95 0.86 0.03 0.00 0.02 0.92

Page 40: mes_slides_chap_2

EXEMPLE 2

L(R(u) P. vulgaris) = 0.074

L(R(u) P. mirabilis) = 0.719

L(R(u) Edwardsielle) = 0

L(R(u) Salmonella) = 0

__________

TOTAL 0,793

L(P. vulgaris|R(u)) = 0.074 / 0,793 = 0,093

L(P. mirabilis|R(u)) = 0.719 / 0,793 = 0,907

L(Edwardsielle|R(u)) = 0 / 0,793 = 0

L(Salmonella|R(u)) = 0 / 0,793 = 0

__________

TOTAL 1

Méthode probabiliste – Exemple 2