Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F....

23
Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina et A. Paris Laboratoire des xénobiotiques (Toulouse) UMR INRA/ENVT Equipe : Physiologie, Métabolisme et Signatures biologiques

Transcript of Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F....

Page 1: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

Fouille de données en appui des analyses métabonomiques

Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina et A. Paris

Laboratoire des xénobiotiques (Toulouse) UMR INRA/ENVTEquipe : Physiologie, Métabolisme et Signatures biologiques

Page 2: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

Objectif

• Identifier les réponses du métabolisme à une perturbation

• Exemples d’applications :– OGM– Cancer du colon– Toxicité– Dopage

Page 3: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

8 7 6 5 4 3 2 1 ppm

hippurate

urée

eau

TMSP

allantoïne

lactate

2-oxoglutarate

citrate

succinate

créatinine

Variable detection&

Quantification

Biochemical analysis

Variable filrtation

AFD&

Classification

StatisticalChemiometrical

Bioinformatical analysis

Specific biological condition(e.g. external stress)

Experimentationdefinition

Identification and interpretation of

bio-markers

Structural andBiological analysis

LD1 (63.4%)

LD

2 (

15

.6%

)

-6 -4 -2 0 2 4 6

-4-2

02

4

AFD sur 30 variables

BN1

BN2

BT

SN1

SN2

ST

Ra

ts s

an

s T

em

oin

s P

om

me

de

te

rreserie 11

serie 12serie 21serie 22

p (D2 Mahalanobis=0)

BT

BN1 <10-4

BN2 0.0034

p (D2 Mahalanobis=0)

ST

SN1 0.0431

SN2 0.0002

BF15

Safrane

hippurate/tryptophanevalinelactatelysinecétoglutarate/succinateglucoseTMAO/phénylalanine

1

2

3

4

5

Page 4: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

8 7 6 5 4 3 2 1 ppm

Variable detection&

Quantification

Biochemical analysis

Variable filrtation

AFD&

Classification

StatisticalChemiometrical

Bioinformatical analysis

Specific biological condition(e.g. external stress)

Experimentationdefinition

Identification and interpretation of

bio-markers

Structural andBiological analysis

LD1 (63.4%)

LD

2 (

15

.6%

)

-6 -4 -2 0 2 4 6

-4-2

02

4

AFD sur 30 variables

BN1

BN2

BT

SN1

SN2

ST

Ra

ts s

an

s T

em

oin

s P

om

me

de

te

rreserie 11

serie 12serie 21serie 22

p (D2 Mahalanobis=0)

BT

BN1 <10-4

BN2 0.0034

p (D2 Mahalanobis=0)

ST

SN1 0.0431

SN2 0.0002

BF15

Safrane

hippurate/tryptophanevalinelactatelysinecétoglutarate/succinateglucoseTMAO/phénylalanine

1

2

3

4

5

Page 5: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

8 7 6 5 4 3 2 1 ppm

Variable detection&

Quantification

Biochemical analysis

Variable filtration

AFD&

Classification

StatisticalChemiometrical

Bioinformatical analysis

Specific biological condition(e.g. external stress)

Experimentationdefinition

Identification and interpretation of

bio-markers

Structural andBiological analysis

LD1 (63.4%)

LD

2 (

15

.6%

)

-6 -4 -2 0 2 4 6

-4-2

02

4

AFD sur 30 variables

BN1

BN2

BT

SN1

SN2

ST

Ra

ts s

an

s T

em

oin

s P

om

me

de

te

rreserie 11

serie 12serie 21serie 22

p (D2 Mahalanobis=0)

BT

BN1 <10-4

BN2 0.0034

p (D2 Mahalanobis=0)

ST

SN1 0.0431

SN2 0.0002

BF15

Safrane

hippurate/tryptophanevalinelactatelysinecétoglutarate/succinateglucoseTMAO/phénylalanine

1

2

3

4

5

Page 6: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

Hamster.plasma.01 LOG 2 individus supprimés

variable Splus

deplt chimiq

composé Can1 rang Can2 rang Can3 rang Can4 rang

V768     0,75 5 -0,11 20 0,63 9 -0,02 25

V800     -0,14 21 0,68 2 -0,23 19 0,47 7

V688     -0,81 2 0,18 18 0,46 15 0,29 10

V627     -0,72 6 -0,23 15 -0,60 11 0,24 12

V562     -0,81 1 0,51 7 -0,02 25 -0,05 23

V812     0,39 18 0,32 12 0,11 23 0,86 1

V717     0,58 12 0,22 16 -0,67 7 -0,14 18

V469     0,31 19 0,09 21 0,46 14 0,78 2

V804     -0,04 25 0,74 1 0,19 22 0,56 5

V225     -0,61 10 0,56 5 -0,09 24 0,56 4

V782     0,71 7 -0,05 23 0,70 6 0,02 24

V611     -0,10 23 -0,53 6 0,56 12 0,63 3

V507     -0,42 17 0,33 11 -0,80 2 -0,12 19

V630     -0,13 22 -0,02 25 -0,88 1 0,40 9

Page 7: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

Chimie analytique

• Pour les variables significatives, identifier les molécules : – par analyse de la

bibliographies

– par analyse des spectres

C4H7OBr

Page 8: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

8 7 6 5 4 3 2 1 ppm

Variable detection&

Quantification

Biochemical analysis

Variable filtration

AFD&

Classification

StatisticalChemiometrical

Bioinformatical analysis

Specific biological condition(e.g. external stress)

Experimentationdefinition

Identification and interpretation of

bio-markers

Structural andBiological analysis

LD1 (63.4%)

LD

2 (

15

.6%

)

-6 -4 -2 0 2 4 6

-4-2

02

4

AFD sur 30 variables

BN1

BN2

BT

SN1

SN2

ST

Ra

ts s

an

s T

em

oin

s P

om

me

de

te

rreserie 11

serie 12serie 21serie 22

p (D2 Mahalanobis=0)

BT

BN1 <10-4

BN2 0.0034

p (D2 Mahalanobis=0)

ST

SN1 0.0431

SN2 0.0002

BF15

Safrane

hippurate/tryptophanevalinelactatelysinecétoglutarate/succinateglucoseTMAO/phénylalanine

1

2

3

4

5

Page 9: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

Analyse biologique

Page 10: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

Merci de votre attention

Page 11: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

Analyse statistique

• Par ACP les individus particuliers sont sélectionnés et supprimés– Les axes de l’ACP sont des combinaisons linéaires des

variables dont l’objectif est de maximiser la variance entre les individus

• Par AFD on plonge les individus dans le plan – Les axes factoriels de l’AFD sont des combinaisons

linéaires des variables visant à maximiser la variance entre les groupes d’individus (resp. en minimisant la variance à intra-groupes)

Page 12: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

Résultats pour l’urine

Page 13: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

ACP

-60 -40 -20 0 20

-40

-20

02

04

0

Axe 1

Axe

2

L11

L12

L13

L14

L15

L16

L17

L18

L21

L22

L23

L24

L25

L26

L27

L29

L31

L32

L33

L34

L36L39

L41L42

L43

L44

L45

L46

L48

L49

L51

L52

L53

L54

L55

L56

L57

L58L61

L62

L63

L64

L65

L67

L68

L6inconnu1L6inconnu2

hamster.urine.01

(44%)

(18%

)

ACP

4 individus particuliers sont repérés

Page 14: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06(43%)

(18%

)

-40 -20 0 20 40

-40

-20

02

04

0

Axe 1

Axe

2

L11

L12

L13

L14

L16

L18 L21

L22

L23

L24

L26

L27

L29

L31

L32

L33

L34

L36

L39

L41

L42

L43

L44L45

L46

L48

L49

L51

L52

L53

L54

L55

L56

L57

L58

L61

L62

L63

L65

L67

L68

L6inconnu1

L6inconnu2

hamster.urine.01ACP

(4 individus particuliers supprimés)

L1

L3

L4L2

L5

L6

Page 15: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

AFD

LD1 (60.9%)

LD

2 (

17

.7%

)

-20 -10 0 10 20

-10

-50

51

01

52

0AFD sur 22 variables

ha

mst

er.

uri

ne

.01

LO

G

L1L2L3L4L5L6

L1

L2

L3

L4

L5

L6

L1 camembert lait cruL2 camembert huile végétaleL3 camembert fraction trioléineL4 camembert lait standard

L5matière grasse extraite de camembert lait standard

L6 témoins

Page 16: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

AFD

LD3 (10.4%)

LD

4 (

7%

)

-15 -10 -5 0 5 10

-10

-50

5AFD sur 22 variables

ha

mst

er.

uri

ne

.01

LO

G

L1L2L3L4L5L6

L1 L2

L3

L4

L5

L6

L1 camembert lait cruL2 camembert huile végétaleL3 camembert fraction trioléineL4 camembert lait standard

L5matière grasse extraite de camembert lait standard

L6 témoins

Page 17: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

Résultats pour le plasma

Page 18: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06-40 -20 0 20 40 60

-40

-20

02

04

0

Axe 1

Axe

2

L11plasma

L12plasma

L13plasma

L14plasma

L15plasma

L16plasma

L17plasma

L18plasmaL19plasma

L21plasmaL22plasma

L23plasma

L24plasma

L25plasma

L26plasma

L27plasma

L28plasma

L29plasma

L31plasma

L32plasma

L33plasmaL34plasma

L35plasma

L36plasma

L37plasma

L38plasma

L39plasma

L41plasma

L42plasmaL43plasma

L44plasma

L45plasma

L46plasma

L47plasmaL48plasma

L49plasma

L51plasma

L52plasma

L53plasma

L54plasma

L55plasmaL56plasma

L57plasma

L58plasma

L59plasma

L61plasma

L62plasma

L63plasma

L64plasma

L65plasma

L66plasma

L67plasma

L68plasma

L69plasma

hamster.plasma.01

ACP

Page 19: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

ACP

-40 -20 0 20 40 60

-40

-20

02

04

0

Axe 1

Axe

2

L11plasma

L12plasma

L13plasma

L14plasma

L15plasma

L16plasma

L17plasma

L18plasma

L19plasma

L21plasmaL22plasma

L23plasma

L25plasma

L26plasma

L27plasma

L28plasma

L29plasma

L31plasma

L32plasma

L33plasmaL34plasma

L35plasma

L36plasma

L37plasma

L38plasma

L39plasma

L41plasma

L42plasmaL43plasma

L44plasma

L45plasma

L46plasma

L47plasmaL48plasma

L49plasma

L51plasma

L52plasma

L53plasma

L54plasma

L55plasmaL56plasma

L57plasma

L58plasma

L59plasma

L61plasma

L62plasma

L63plasma

L64plasma

L65plasma

L66plasma

L67plasma

L68plasma

hamster.plasma.01 moins 2 individus

ACP

(2 individus particuliers supprimés)

Page 20: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

• Procédure de sélection d’un ensemble restreint de variables :– ANOVA : variable significatives– Pas à pas : éliminer les redondances dans cet

ensemble de variables

Page 21: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

AFD

LD1 (46.9%)

LD

2 (

17

.1%

)

-5 0 5 10

-6-4

-20

24

68

AFD sur 25 variables

ha

mst

er.

pla

sma

.01

LO

G

L1L2L3L4L5L6

L1

L2

L3

L4

L5

L6

L1 camembert lait cruL2 camembert huile végétaleL3 camembert fraction trioléineL4 camembert lait standard

L5matière grasse extraite de camembert lait standard

L6 témoins

Page 22: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

AFD

LD3 (14.3%)

LD

4 (

13

%)

-5 0 5 10

-4-2

02

46

AFD sur 25 variables

ha

mst

er.

pla

sma

.01

LO

G

L1L2L3L4L5L6L1

L2

L3

L4

L5

L6

L1 camembert lait cruL2 camembert huile végétaleL3 camembert fraction trioléineL4 camembert lait standard

L5matière grasse extraite de camembert lait standard

L6 témoins

Page 23: Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina.

Fabien Jourdan, FDC06

Hamster.plasma.01 LOG 2 individus supprimés

variable Splus

deplt chimiq

composé Can1 rang Can2 rang Can3 rang Can4 rang

V768     0,75 5 -0,11 20 0,63 9 -0,02 25

V800     -0,14 21 0,68 2 -0,23 19 0,47 7

V688     -0,81 2 0,18 18 0,46 15 0,29 10

V627     -0,72 6 -0,23 15 -0,60 11 0,24 12

V562     -0,81 1 0,51 7 -0,02 25 -0,05 23

V812     0,39 18 0,32 12 0,11 23 0,86 1

V717     0,58 12 0,22 16 -0,67 7 -0,14 18

V469     0,31 19 0,09 21 0,46 14 0,78 2

V804     -0,04 25 0,74 1 0,19 22 0,56 5

V225     -0,61 10 0,56 5 -0,09 24 0,56 4

V782     0,71 7 -0,05 23 0,70 6 0,02 24

V611     -0,10 23 -0,53 6 0,56 12 0,63 3

V507     -0,42 17 0,33 11 -0,80 2 -0,12 19

V630     -0,13 22 -0,02 25 -0,88 1 0,40 9