Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F....
-
Upload
stephanie-bellet -
Category
Documents
-
view
106 -
download
0
Transcript of Fabien Jourdan, FDC06 Fouille de données en appui des analyses métabonomiques Fabien Jourdan, F....
Fabien Jourdan, FDC06
Fouille de données en appui des analyses métabonomiques
Fabien Jourdan, F. Vinson, C. Canlet, N. Priymenko, G. Gottardi, J. Molina et A. Paris
Laboratoire des xénobiotiques (Toulouse) UMR INRA/ENVTEquipe : Physiologie, Métabolisme et Signatures biologiques
Fabien Jourdan, FDC06
Objectif
• Identifier les réponses du métabolisme à une perturbation
• Exemples d’applications :– OGM– Cancer du colon– Toxicité– Dopage
Fabien Jourdan, FDC06
8 7 6 5 4 3 2 1 ppm
hippurate
urée
eau
TMSP
allantoïne
lactate
2-oxoglutarate
citrate
succinate
créatinine
Variable detection&
Quantification
Biochemical analysis
Variable filrtation
AFD&
Classification
StatisticalChemiometrical
Bioinformatical analysis
Specific biological condition(e.g. external stress)
Experimentationdefinition
Identification and interpretation of
bio-markers
Structural andBiological analysis
LD1 (63.4%)
LD
2 (
15
.6%
)
-6 -4 -2 0 2 4 6
-4-2
02
4
AFD sur 30 variables
BN1
BN2
BT
SN1
SN2
ST
Ra
ts s
an
s T
em
oin
s P
om
me
de
te
rreserie 11
serie 12serie 21serie 22
p (D2 Mahalanobis=0)
BT
BN1 <10-4
BN2 0.0034
p (D2 Mahalanobis=0)
ST
SN1 0.0431
SN2 0.0002
BF15
Safrane
hippurate/tryptophanevalinelactatelysinecétoglutarate/succinateglucoseTMAO/phénylalanine
1
2
3
4
5
Fabien Jourdan, FDC06
8 7 6 5 4 3 2 1 ppm
Variable detection&
Quantification
Biochemical analysis
Variable filrtation
AFD&
Classification
StatisticalChemiometrical
Bioinformatical analysis
Specific biological condition(e.g. external stress)
Experimentationdefinition
Identification and interpretation of
bio-markers
Structural andBiological analysis
LD1 (63.4%)
LD
2 (
15
.6%
)
-6 -4 -2 0 2 4 6
-4-2
02
4
AFD sur 30 variables
BN1
BN2
BT
SN1
SN2
ST
Ra
ts s
an
s T
em
oin
s P
om
me
de
te
rreserie 11
serie 12serie 21serie 22
p (D2 Mahalanobis=0)
BT
BN1 <10-4
BN2 0.0034
p (D2 Mahalanobis=0)
ST
SN1 0.0431
SN2 0.0002
BF15
Safrane
hippurate/tryptophanevalinelactatelysinecétoglutarate/succinateglucoseTMAO/phénylalanine
1
2
3
4
5
Fabien Jourdan, FDC06
8 7 6 5 4 3 2 1 ppm
Variable detection&
Quantification
Biochemical analysis
Variable filtration
AFD&
Classification
StatisticalChemiometrical
Bioinformatical analysis
Specific biological condition(e.g. external stress)
Experimentationdefinition
Identification and interpretation of
bio-markers
Structural andBiological analysis
LD1 (63.4%)
LD
2 (
15
.6%
)
-6 -4 -2 0 2 4 6
-4-2
02
4
AFD sur 30 variables
BN1
BN2
BT
SN1
SN2
ST
Ra
ts s
an
s T
em
oin
s P
om
me
de
te
rreserie 11
serie 12serie 21serie 22
p (D2 Mahalanobis=0)
BT
BN1 <10-4
BN2 0.0034
p (D2 Mahalanobis=0)
ST
SN1 0.0431
SN2 0.0002
BF15
Safrane
hippurate/tryptophanevalinelactatelysinecétoglutarate/succinateglucoseTMAO/phénylalanine
1
2
3
4
5
Fabien Jourdan, FDC06
Hamster.plasma.01 LOG 2 individus supprimés
variable Splus
deplt chimiq
composé Can1 rang Can2 rang Can3 rang Can4 rang
V768 0,75 5 -0,11 20 0,63 9 -0,02 25
V800 -0,14 21 0,68 2 -0,23 19 0,47 7
V688 -0,81 2 0,18 18 0,46 15 0,29 10
V627 -0,72 6 -0,23 15 -0,60 11 0,24 12
V562 -0,81 1 0,51 7 -0,02 25 -0,05 23
V812 0,39 18 0,32 12 0,11 23 0,86 1
V717 0,58 12 0,22 16 -0,67 7 -0,14 18
V469 0,31 19 0,09 21 0,46 14 0,78 2
V804 -0,04 25 0,74 1 0,19 22 0,56 5
V225 -0,61 10 0,56 5 -0,09 24 0,56 4
V782 0,71 7 -0,05 23 0,70 6 0,02 24
V611 -0,10 23 -0,53 6 0,56 12 0,63 3
V507 -0,42 17 0,33 11 -0,80 2 -0,12 19
V630 -0,13 22 -0,02 25 -0,88 1 0,40 9
Fabien Jourdan, FDC06
Chimie analytique
• Pour les variables significatives, identifier les molécules : – par analyse de la
bibliographies
– par analyse des spectres
C4H7OBr
Fabien Jourdan, FDC06
8 7 6 5 4 3 2 1 ppm
Variable detection&
Quantification
Biochemical analysis
Variable filtration
AFD&
Classification
StatisticalChemiometrical
Bioinformatical analysis
Specific biological condition(e.g. external stress)
Experimentationdefinition
Identification and interpretation of
bio-markers
Structural andBiological analysis
LD1 (63.4%)
LD
2 (
15
.6%
)
-6 -4 -2 0 2 4 6
-4-2
02
4
AFD sur 30 variables
BN1
BN2
BT
SN1
SN2
ST
Ra
ts s
an
s T
em
oin
s P
om
me
de
te
rreserie 11
serie 12serie 21serie 22
p (D2 Mahalanobis=0)
BT
BN1 <10-4
BN2 0.0034
p (D2 Mahalanobis=0)
ST
SN1 0.0431
SN2 0.0002
BF15
Safrane
hippurate/tryptophanevalinelactatelysinecétoglutarate/succinateglucoseTMAO/phénylalanine
1
2
3
4
5
Fabien Jourdan, FDC06
Analyse biologique
Fabien Jourdan, FDC06
Merci de votre attention
Fabien Jourdan, FDC06
Analyse statistique
• Par ACP les individus particuliers sont sélectionnés et supprimés– Les axes de l’ACP sont des combinaisons linéaires des
variables dont l’objectif est de maximiser la variance entre les individus
• Par AFD on plonge les individus dans le plan – Les axes factoriels de l’AFD sont des combinaisons
linéaires des variables visant à maximiser la variance entre les groupes d’individus (resp. en minimisant la variance à intra-groupes)
Fabien Jourdan, FDC06
Résultats pour l’urine
Fabien Jourdan, FDC06
ACP
-60 -40 -20 0 20
-40
-20
02
04
0
Axe 1
Axe
2
L11
L12
L13
L14
L15
L16
L17
L18
L21
L22
L23
L24
L25
L26
L27
L29
L31
L32
L33
L34
L36L39
L41L42
L43
L44
L45
L46
L48
L49
L51
L52
L53
L54
L55
L56
L57
L58L61
L62
L63
L64
L65
L67
L68
L6inconnu1L6inconnu2
hamster.urine.01
(44%)
(18%
)
ACP
4 individus particuliers sont repérés
Fabien Jourdan, FDC06(43%)
(18%
)
-40 -20 0 20 40
-40
-20
02
04
0
Axe 1
Axe
2
L11
L12
L13
L14
L16
L18 L21
L22
L23
L24
L26
L27
L29
L31
L32
L33
L34
L36
L39
L41
L42
L43
L44L45
L46
L48
L49
L51
L52
L53
L54
L55
L56
L57
L58
L61
L62
L63
L65
L67
L68
L6inconnu1
L6inconnu2
hamster.urine.01ACP
(4 individus particuliers supprimés)
L1
L3
L4L2
L5
L6
Fabien Jourdan, FDC06
AFD
LD1 (60.9%)
LD
2 (
17
.7%
)
-20 -10 0 10 20
-10
-50
51
01
52
0AFD sur 22 variables
ha
mst
er.
uri
ne
.01
LO
G
L1L2L3L4L5L6
L1
L2
L3
L4
L5
L6
L1 camembert lait cruL2 camembert huile végétaleL3 camembert fraction trioléineL4 camembert lait standard
L5matière grasse extraite de camembert lait standard
L6 témoins
Fabien Jourdan, FDC06
AFD
LD3 (10.4%)
LD
4 (
7%
)
-15 -10 -5 0 5 10
-10
-50
5AFD sur 22 variables
ha
mst
er.
uri
ne
.01
LO
G
L1L2L3L4L5L6
L1 L2
L3
L4
L5
L6
L1 camembert lait cruL2 camembert huile végétaleL3 camembert fraction trioléineL4 camembert lait standard
L5matière grasse extraite de camembert lait standard
L6 témoins
Fabien Jourdan, FDC06
Résultats pour le plasma
Fabien Jourdan, FDC06-40 -20 0 20 40 60
-40
-20
02
04
0
Axe 1
Axe
2
L11plasma
L12plasma
L13plasma
L14plasma
L15plasma
L16plasma
L17plasma
L18plasmaL19plasma
L21plasmaL22plasma
L23plasma
L24plasma
L25plasma
L26plasma
L27plasma
L28plasma
L29plasma
L31plasma
L32plasma
L33plasmaL34plasma
L35plasma
L36plasma
L37plasma
L38plasma
L39plasma
L41plasma
L42plasmaL43plasma
L44plasma
L45plasma
L46plasma
L47plasmaL48plasma
L49plasma
L51plasma
L52plasma
L53plasma
L54plasma
L55plasmaL56plasma
L57plasma
L58plasma
L59plasma
L61plasma
L62plasma
L63plasma
L64plasma
L65plasma
L66plasma
L67plasma
L68plasma
L69plasma
hamster.plasma.01
ACP
Fabien Jourdan, FDC06
ACP
-40 -20 0 20 40 60
-40
-20
02
04
0
Axe 1
Axe
2
L11plasma
L12plasma
L13plasma
L14plasma
L15plasma
L16plasma
L17plasma
L18plasma
L19plasma
L21plasmaL22plasma
L23plasma
L25plasma
L26plasma
L27plasma
L28plasma
L29plasma
L31plasma
L32plasma
L33plasmaL34plasma
L35plasma
L36plasma
L37plasma
L38plasma
L39plasma
L41plasma
L42plasmaL43plasma
L44plasma
L45plasma
L46plasma
L47plasmaL48plasma
L49plasma
L51plasma
L52plasma
L53plasma
L54plasma
L55plasmaL56plasma
L57plasma
L58plasma
L59plasma
L61plasma
L62plasma
L63plasma
L64plasma
L65plasma
L66plasma
L67plasma
L68plasma
hamster.plasma.01 moins 2 individus
ACP
(2 individus particuliers supprimés)
Fabien Jourdan, FDC06
• Procédure de sélection d’un ensemble restreint de variables :– ANOVA : variable significatives– Pas à pas : éliminer les redondances dans cet
ensemble de variables
Fabien Jourdan, FDC06
AFD
LD1 (46.9%)
LD
2 (
17
.1%
)
-5 0 5 10
-6-4
-20
24
68
AFD sur 25 variables
ha
mst
er.
pla
sma
.01
LO
G
L1L2L3L4L5L6
L1
L2
L3
L4
L5
L6
L1 camembert lait cruL2 camembert huile végétaleL3 camembert fraction trioléineL4 camembert lait standard
L5matière grasse extraite de camembert lait standard
L6 témoins
Fabien Jourdan, FDC06
AFD
LD3 (14.3%)
LD
4 (
13
%)
-5 0 5 10
-4-2
02
46
AFD sur 25 variables
ha
mst
er.
pla
sma
.01
LO
G
L1L2L3L4L5L6L1
L2
L3
L4
L5
L6
L1 camembert lait cruL2 camembert huile végétaleL3 camembert fraction trioléineL4 camembert lait standard
L5matière grasse extraite de camembert lait standard
L6 témoins
Fabien Jourdan, FDC06
Hamster.plasma.01 LOG 2 individus supprimés
variable Splus
deplt chimiq
composé Can1 rang Can2 rang Can3 rang Can4 rang
V768 0,75 5 -0,11 20 0,63 9 -0,02 25
V800 -0,14 21 0,68 2 -0,23 19 0,47 7
V688 -0,81 2 0,18 18 0,46 15 0,29 10
V627 -0,72 6 -0,23 15 -0,60 11 0,24 12
V562 -0,81 1 0,51 7 -0,02 25 -0,05 23
V812 0,39 18 0,32 12 0,11 23 0,86 1
V717 0,58 12 0,22 16 -0,67 7 -0,14 18
V469 0,31 19 0,09 21 0,46 14 0,78 2
V804 -0,04 25 0,74 1 0,19 22 0,56 5
V225 -0,61 10 0,56 5 -0,09 24 0,56 4
V782 0,71 7 -0,05 23 0,70 6 0,02 24
V611 -0,10 23 -0,53 6 0,56 12 0,63 3
V507 -0,42 17 0,33 11 -0,80 2 -0,12 19
V630 -0,13 22 -0,02 25 -0,88 1 0,40 9