Soutenance de stage - math.unice.frbinard/IMREDD.pdf · 10/10/2012 4 Etymologie ANGIO- : vaisseau...
Transcript of Soutenance de stage - math.unice.frbinard/IMREDD.pdf · 10/10/2012 4 Etymologie ANGIO- : vaisseau...
Présenté par:
Carole BINARD ([email protected])
Doctorante (1ère année) à l’Université Nice Sophia-Antipolis
(LJAD – équipe de probabilité et statistiques)
Journées de l’IMREDD 8-10 octobre 2012
Modélisation statistique de l’influence de protéines de signalisation sur
l’angiogénèse
SOM
MA
IRE
2 Journées de l’IMREDD 2012
10/10/2012
I. Cadre biologique 1. Définitions 2. Objectifs
II. Cadre mathématique 1. Théorie de sélection de variables pour l’identification
de cibles 2. Théorie de la sélection de partitions pour
l’estimation d’une fonction réelle
III. Travaux réalisés 1. Illustration de la sélection de partitions 2. Illustration de la sélection de variables
SOM
MA
IRE
10/10/2012 4
Etymologie
ANGIO- : vaisseau (grec) - GENESE : naissance, source, origine (grec) Définition
Création de nouveaux vaisseaux sanguins à partir de vaisseaux préexistants
CA
DR
E B
IOLO
GIQ
UE
1. L’angiogénèse 2. L’angiogénèse tumorale 3. Objectifs
Journées de l’IMREDD 2012
I.C
AD
RE
BIO
LOG
IQU
E
5
Tumeur cancéreuse
Appauvrissement du milieu
Appauvrissement du milieu
Milieu cellulaire Journées de l’IMREDD 2012
10/10/2012
Membrane basale Cellules endothéliales
CA
DR
E B
IOLO
GIQ
UE
1. L’angiogénèse 2. L’angiogénèse tumorale 3. Objectifs
I.C
AD
RE
BIO
LOG
IQU
E
6
Tumeur cancéreuse
Diffusion de facteurs de croissance
Appauvrissement du milieu
Appauvrissement du milieu
Activation de voies de
signalisation
Milieu cellulaire Journées de l’IMREDD 2012
10/10/2012
Membrane basale Cellules endothéliales
CA
DR
E B
IOLO
GIQ
UE
1. L’angiogénèse 2. L’angiogénèse tumorale 3. Objectifs
I.C
AD
RE
BIO
LOG
IQU
E
7
Tumeur cancéreuse
Appauvrissement du milieu
Appauvrissement du milieu
Activation de voies de
signalisation
Nouveaux vaisseaux
Nouveaux vaisseaux
Apports en nutriments et oxygène
Milieu cellulaire Journées de l’IMREDD 2012
10/10/2012
Membrane basale Cellules endothéliales
CA
DR
E B
IOLO
GIQ
UE
1. L’angiogénèse 2. L’angiogénèse tumorale 3. Objectifs
I.C
AD
RE
BIO
LOG
IQU
E
8 Journées de l’IMREDD 2012
10/10/2012
CA
DR
E B
IOLO
GIQ
UE
1. L’angiogénèse 2. L’angiogénèse tumorale 3. Objectifs
Inhiber les voies de signalisation
Biologiques Mathématiques
Sélectionner les variables pertinentes dans l’explication d’un
phénomène
Comprendre le lien entre phénomène
angiogénique et concentrations en
facteurs croissance
Estimer une fonction par une fonction
constante par morceaux
I.C
AD
RE
BIO
LOG
IQU
E
Sélection de variables
Sélection de partitions
CA
DR
E M
ATH
EMA
TIQ
UE
10 Journées de l’IMREDD 2012
10/10/2012
on observe le phénomène:
2~ ,Y N I 0n et inconnues
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
II.
CA
DR
E M
ATH
EMA
TIQ
UE
(1) ( )
1 ... p
pY X X ( )Y f C
Estimer les paramètres Estimer la fonction f
Estimer μ à partir des observations
Sélection de variables Sélection de partitions
12
1 variable réponse Y à n observations centrée N variables explicatives centrées à n observations chacune et les sont déterministes
Le bruit est gaussien
L’espérance de Y notée μ appartient à
σ connue
( )j
ix1 i n 1 j N
1 ~ (0,1)ii n N
(1) ( ): ,..., NV vect X X
10/10/2012
( )jX
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
1. Hypothèses générales 2. Remarque 3. Evaluer l’estimateur 4. Objectifs
CA
DR
E M
ATH
EMA
TIQ
UE
Journées de l’IMREDD 2012
II.
CA
DR
E M
ATH
EMA
TIQ
UE
13 Journées de l’IMREDD 2012
10/10/2012
(1) ( ),..., NVect X X ( )
1
Nj
j
j
X
Estimer μ = estimer les
Cadre linéaire gaussien
1ˆ ( ' ) 'X X X Y
( )
1
ˆ ˆˆN
j
j
j
X X
D’où
j
1. Hypothèses générales 2. Remarque 3. Evaluer l’estimateur 4. Objectifs
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
14 Journées de l’IMREDD 2012
10/10/2012
(1) ( ),..., NVect X X ( )
1
Nj
j
j
X
Estimer μ = estimer les
Cadre linéaire gaussien
1ˆ ( ' ) 'X X X Y
D’où
j
1ˆ ( ' ) 'X X X X Y
V (1) ( ): ,..., NV vect X X
1. Hypothèses générales 2. Remarque 3. Evaluer l’estimateur 4. Objectifs
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
15
2 2 2 dim( )ˆ
Vn n
VE E Y
n
Terme de variance
Journées de l’IMREDD 2012 10/10/2012
La qualité d’un estimateur se mesure par son erreur quadratique
moyenne:
ˆ ˆ²EQM Biais Var
ˆVY
1. Hypothèses générales 2. Remarque 3. Evaluer l’estimateur 4. Objectifs
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
16
Déterminer des sous-ensembles de l’ensemble
Identifier celui qui fournit les prévisions les plus fiables
(1) ( ),..., NX X
Journées de l’IMREDD 2012 10/10/2012
1. Hypothèses générales 2. Remarque 3. Evaluer l’estimateur 4. Objectifs
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
17 Journées de l’IMREDD 2012
10/10/2012
Sous-ensembles de
(1) ( ),..., NX X
Sous-espace vectoriel
m M
( ) ;mV vect X m
m M
ˆmm V Y
Sous-ensembles m de
1,..., N
dimm mD V
Collection M de sous-ensembles m
Collection S de sous-espaces mV
2
2 2m
N si N nD p
n si N n
1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
18
Meilleur modèle: m(s)
( )
2 22
diminf
m s m
m
V Vnm Mn
VE Y
n
Journées de l’IMREDD 2012 10/10/2012
2 22
dimm m
m
V Vn n
Vm M E Y
n
biais variance
1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle
Egalité Oracle
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
19 Journées de l’IMREDD 2012
10/10/2012
Sélection du meilleur modèle
Inégalité Oracle Équilibre entre biais et variance
1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle
2ˆ ( )m n
m M Y pen m
2ˆ ˆarg min ( )m n
m M
m Y pen m
( ) 2 mDpen m
n
2
( ) ,pen m pen m 2
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
( )
2
m sVn
E Y C risque Oracle Quelques critères
Cp de Mallows (1973) :
Birgé &Massart (2001) :
( )
2
m sVn
E Y C risque Oracle
2 2
,ˆ ˆ ˆarg min ( )m K Ln
m M
m Y pen m
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
20 Journées de l’IMREDD 2012
10/10/2012
Sélection du meilleur modèle
Inégalité Oracle Équilibre entre biais et variance
1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle
2ˆ ( )m n
m M Y pen m
2ˆ ˆarg min ( )m n
m M
m Y pen m
( ) 2 mDpen m
n
2
( ) ,pen m pen m 2
2
2
,
|| |||| || ( )m
m
V n
V n K L
m
Y Ym M Y Y pen m
n D
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
( )
2
m sVn
E Y C risque Oracle Quelques critères
Cp de Mallows (1973) :
Birgé &Massart (2001) :
2
2ˆ
ˆm n
m
Y
n D
( )
2
m sVn
E Y C risque Oracle
2 2
,ˆ ˆ ˆarg min ( )m K Ln
m M
m Y pen m
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
21
m M
,2( )
( ) || || 1m
K L
L V n
m
pen mCrit m Y Y
n D
Journées de l’IMREDD 2012 10/10/2012
« gaussien model selection with unknown variance »
Baraud, Giraud, Huet
1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle
Cadre non asymptotique Variance résiduelle σ inconnue
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
22
, ( ) 1, 1,1
mLm
K L m m
m
Npen m K EDkhi D N e
N
m M
K=1.1
m mN n D Solution de
l’équation (*)
3, 1 1, 1
1
3 1 1 1m
m m m m
L m
D N D N
m m m m
Nx xe P F P F x
D D N D
poids assurant le contrôle de la taille des modèles
Journées de l’IMREDD 2012 10/10/2012
1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
(*)
23 Journées de l’IMREDD 2012
10/10/2012
Sélection de variables
log log( ) log 1m m
m
NL p D
D
1 1mL
m
m M
D e
1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle
min , 2p N n
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
max , 1:m mquand L D n avec
, ( ) , max ,K L m mpen m C K L D
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
24
,2( )
ˆ arg min || || 1m
K L
V nm M m
pen mm Y Y
n D
Journées de l’IMREDD 2012 10/10/2012
1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle
2 2
ˆ
2 2
ˆ 2 ²inf max ,
1
m mn n
m mm M
KE C L D
K
Inégalité Oracle
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
26
1
n
y
Y
y
Le phénomène observé et mesuré n fois dans des milieux différents
1
n
c
C
c
-Une variable déterministe mesurée n fois dans les mêmes conditions expérimentales que Y -Liée à Y par une fonction inconnue
1. Autre cadre d’étude 2. Objectif 3. Procédure de sélection
Journées de l’IMREDD 2012 10/10/2012
Y f C ~ 0,N Id
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
27
1. Autre cadre d’étude 2. Objectif 3. Procédure de sélection
Journées de l’IMREDD 2012 10/10/2012
Estimer l’espérance de Y:
Choix d’estimation
Une fonction constante par morceaux
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
E Y E f C
CA
DR
E M
ATH
EMA
TIQ
UE Estimer la fonction f liant Y et C
=
II.
CA
DR
E M
ATH
EMA
TIQ
UE
28
1. Autre cadre d’étude 2. Objectif 3. Procédure de sélection
Journées de l’IMREDD 2012 10/10/2012
1
n
c
C
c
Ordre croissant
1
n
c
C
c
1 , nc c subdivisions
Réunions disjointes de sous-intervalles de 1 , nc c
Collection M de partitions m
Estimateur de f associé à la partition
m
ˆ ˆ 1 ( )m I I
I m
f a C
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
29
1. Autre cadre d’étude 2. Objectif 3. Procédure de sélection
Journées de l’IMREDD 2012 10/10/2012
1
log 2log 2m m
m
nL D
D
, ( ) 1, 1,
1mLm
K L m m
m
Npen m K EDkhi D N e
N
Meilleur modèle
,2( )
ˆ arg min || || 1m
K L
V nm M m
pen mm Y Y
n D
m M
'
1ˆ ˆ( ),..., ( )m m m nV f c f c
1. Cadre d’étude 2. Théorie de la sélection de
variables: contexte 3. Théorie de la sélection de
variables: méthodologie 4. Théorie de la sélection de
partitions: méthodologie
CA
DR
E M
ATH
EMA
TIQ
UE
II.
CA
DR
E M
ATH
EMA
TIQ
UE
Estimateur de f associé à la partition
m
ˆ ˆ 1 ( )m I I
I m
f a C
32
TRA
VA
UX
REA
LISE
S
Journées de l’IMREDD 2012 10/10/2012
1. Sélection de partitions: méthodologie d’application
2. Sélection de partitions : traitement des données
3. Sélection de variables: méthodologie d’application
4. Sélection de variables: traitement des données
Modèle sélectionné
Modèle validé
Tests sur les résidus
Modèle invalidé
Sélection de partitions
Programme R: mis en ordre croissant des données
Programme R: sélection de partitions
III.
TRA
VA
UX
REA
LISE
S
33
TRA
VA
UX
REA
LISE
S
1. Profil temporel 2. Estimations
Journées de l’IMREDD 2012 10/10/2012
Ph
en2
Temps (en heures cumulées)
entre h=48 et h=144
1. Sélection de partitions: méthodologie d’application
2. Sélection de partitions : traitement des données
3. Sélection de variables: méthodologie d’application
4. Sélection de variables: traitement des données
III.
TRA
VA
UX
REA
LISE
S
34
TRA
VA
UX
REA
LISE
S
Journées de l’IMREDD 2012 10/10/2012
1. Profil temporel 2. Estimations
Entre h=48 et h=72
1. Sélection de partitions: méthodologie d’application
2. Sélection de partitions : traitement des données
3. Sélection de variables: méthodologie d’application
4. Sélection de variables: traitement des données
0 A B C D E
III.
TRA
VA
UX
REA
LISE
S
35
TRA
VA
UX
REA
LISE
S
Journées de l’IMREDD 2012 10/10/2012
0 A B C D E
1. Profil temporel 2. Estimations
Entre h=76 et h=144
1. Sélection de partitions: méthodologie d’application
2. Sélection de partitions : traitement des données
3. Sélection de variables: méthodologie d’application
4. Sélection de variables: traitement des données
III.
TRA
VA
UX
REA
LISE
S
37
TRA
VA
UX
REA
LISE
S
Journées de l’IMREDD 2012 10/10/2012
Modèle sélectionné
Modèle validé
Tests sur les résidus
Modèle invalidé
Sélection de partitions
Programme R: mis en ordre croissant des données
Programme R: sélection de partitions
Sélection de variables
Programme R: centrage des données
Programme R: sélection de variables
1. Sélection de partitions: méthodologie d’application
2. Sélection de partitions : traitement des données
3. Sélection de variables: méthodologie d’application
4. Sélection de variables: traitement des données
III.
TRA
VA
UX
REA
LISE
S
38
TRA
VA
UX
REA
LISE
S
Journées de l’IMREDD 2012 10/10/2012
1. Les données 2. Variable endogène 3. Variables exogènes 4. Sélections
4 protéines de signalisation
-Protéine A -Protéine B -Protéine C -Protéine D
10 conditions expérimentales
-Condition 1 -Condition 2 -Condition 3 -Condition 4 -Condition 5 -Condition 6 -Condition 7 -Condition 8 -Condition 9 -Condition 10
Un phénomène à expliquer
1. Sélection de partitions: méthodologie d’application
2. Sélection de partitions : traitement des données
3. Sélection de variables: méthodologie d’application
4. Sélection de variables: traitement des données
III.
TRA
VA
UX
REA
LISE
S
39
TRA
VA
UX
REA
LISE
S
Journées de l’IMREDD 2012 10/10/2012
Mesure du phénomène
1. Les données 2. Variable endogène 3. Variables exogènes 4. Sélections
1. Sélection de partitions: méthodologie d’application
2. Sélection de partitions : traitement des données
3. Sélection de variables: méthodologie d’application
4. Sélection de variables: traitement des données
0 10 20 30 40 50
02
04
06
08
01
00
time
me
asu
res p
he
no
me
n
0 10 20 30 40 50
02
04
06
08
01
00
time
me
asu
res p
he
no
me
n
0 10 20 30 40 50
02
04
06
08
01
00
time
me
asu
res p
he
no
me
n
0 10 20 30 40 50
02
04
06
08
01
00
time
me
asu
res p
he
no
me
n
0 10 20 30 40 50
02
04
06
08
01
00
time
me
asu
res p
he
no
me
n
0 10 20 30 40 50
02
04
06
08
01
00
time
me
asu
res p
he
no
me
n
0 10 20 30 40 50
02
04
06
08
01
00
time
me
asu
res p
he
no
me
n
0 10 20 30 40 50
02
04
06
08
01
00
time
me
asu
res p
he
no
me
n
0 10 20 30 40 50
02
04
06
08
01
00
time
me
asu
res p
he
no
me
n
0 10 20 30 40 50
02
04
06
08
01
00
time
me
asu
res p
he
no
me
n
EGF0
gefitinib
ERK_inhib
FAK_inhib
Akt_inhib
EGF5
EGF5+gef
EGF5+MEKinhib
EGF5+FAKinhib
EGF5+Aktinhib
III.
TRA
VA
UX
REA
LISE
S
40
TRA
VA
UX
REA
LISE
S
Journées de l’IMREDD 2012 10/10/2012
0 10 20 30 40
50
01
00
01
50
02
00
02
50
03
00
0
time
me
asu
res p
rote
in A
0 10 20 30 40
50
01
00
01
50
02
00
02
50
03
00
0
time
me
asu
res p
rote
in A
0 10 20 30 40
50
01
00
01
50
02
00
02
50
03
00
0
time
me
asu
res p
rote
in A
0 10 20 30 40
50
01
00
01
50
02
00
02
50
03
00
0
time
me
asu
res p
rote
in A
0 10 20 30 40
50
01
00
01
50
02
00
02
50
03
00
0
time
me
asu
res p
rote
in A
0 10 20 30 40
50
01
00
01
50
02
00
02
50
03
00
0
time
me
asu
res p
rote
in A
0 10 20 30 40
50
01
00
01
50
02
00
02
50
03
00
0
time
me
asu
res p
rote
in A
0 10 20 30 40
50
01
00
01
50
02
00
02
50
03
00
0
time
me
asu
res p
rote
in A
0 10 20 30 40
50
01
00
01
50
02
00
02
50
03
00
0
time
me
asu
res p
rote
in A
0 10 20 30 40
50
01
00
01
50
02
00
02
50
03
00
0
time
me
asu
res p
rote
in A
condition 1
condition 2condition 3
condition 4condition 5
condition 6
condition 7condition 8
condition 9condition 10
0 10 20 30 40
20
00
30
00
40
00
50
00
60
00
time
me
asu
res p
rote
in B
0 10 20 30 40
20
00
30
00
40
00
50
00
60
00
time
me
asu
res p
rote
in B
0 10 20 30 40
20
00
30
00
40
00
50
00
60
00
time
me
asu
res p
rote
in B
0 10 20 30 40
20
00
30
00
40
00
50
00
60
00
time
me
asu
res p
rote
in B
0 10 20 30 40
20
00
30
00
40
00
50
00
60
00
time
me
asu
res p
rote
in B
0 10 20 30 40
20
00
30
00
40
00
50
00
60
00
time
me
asu
res p
rote
in B
0 10 20 30 40
20
00
30
00
40
00
50
00
60
00
time
me
asu
res p
rote
in B
0 10 20 30 40
20
00
30
00
40
00
50
00
60
00
time
me
asu
res p
rote
in B
0 10 20 30 40
20
00
30
00
40
00
50
00
60
00
time
me
asu
res p
rote
in B
0 10 20 30 40
20
00
30
00
40
00
50
00
60
00
time
me
asu
res p
rote
in B
0 10 20 30 40
50
01
00
01
50
02
00
0
time
me
asu
res p
rote
in C
0 10 20 30 40
50
01
00
01
50
02
00
0
time
me
asu
res p
rote
in C
0 10 20 30 40
50
01
00
01
50
02
00
0
time
me
asu
res p
rote
in C
0 10 20 30 40
50
01
00
01
50
02
00
0
time
me
asu
res p
rote
in C
0 10 20 30 40
50
01
00
01
50
02
00
0
time
me
asu
res p
rote
in C
0 10 20 30 40
50
01
00
01
50
02
00
0
time
me
asu
res p
rote
in C
0 10 20 30 40
50
01
00
01
50
02
00
0
time
me
asu
res p
rote
in C
0 10 20 30 40
50
01
00
01
50
02
00
0
time
me
asu
res p
rote
in C
0 10 20 30 40
50
01
00
01
50
02
00
0
time
me
asu
res p
rote
in C
0 10 20 30 40
50
01
00
01
50
02
00
0
time
me
asu
res p
rote
in C
condition 1
condition 2
condition 3
condition 4
condition 5
condition 6
condition 7
condition 8
condition 9
condition 10
0 10 20 30 40
0.1
0.2
0.3
0.4
0.5
time
me
asu
res p
rote
in D
0 10 20 30 40
0.1
0.2
0.3
0.4
0.5
time
me
asu
res p
rote
in D
0 10 20 30 40
0.1
0.2
0.3
0.4
0.5
time
me
asu
res p
rote
in D
0 10 20 30 40
0.1
0.2
0.3
0.4
0.5
time
me
asu
res p
rote
in D
0 10 20 30 40
0.1
0.2
0.3
0.4
0.5
time
me
asu
res p
rote
in D
0 10 20 30 40
0.1
0.2
0.3
0.4
0.5
time
me
asu
res p
rote
in D
0 10 20 30 40
0.1
0.2
0.3
0.4
0.5
time
me
asu
res p
rote
in D
0 10 20 30 40
0.1
0.2
0.3
0.4
0.5
time
me
asu
res p
rote
in D
0 10 20 30 40
0.1
0.2
0.3
0.4
0.5
time
me
asu
res p
rote
in D
0 10 20 30 40
0.1
0.2
0.3
0.4
0.5
time
me
asu
res p
rote
in D
condition 1
condition 2
condition 3
condition 4
condition 5
condition 6
condition 7
condition 8
condition 9
condition 10
1 1 1 1
2 2 3 4
10 10 10 10
A B C D
A B C D
A B C D
x x x x
x x x x
X
x x x x
1. Les données 2. Variable endogène 3. Variables exogènes 4. Sélections
1. Sélection de partitions: méthodologie d’application
2. Sélection de partitions : traitement des données
3. Sélection de variables: méthodologie d’application
4. Sélection de variables: traitement des données
III.
TRA
VA
UX
REA
LISE
S
41
TRA
VA
UX
REA
LISE
S
Journées de l’IMREDD 2012 10/10/2012
Centrage des données Programme de sélection
1. Les données 2. Variable endogène 3. Variables exogènes 4. Sélections
1. Sélection de partitions: méthodologie d’application
2. Sélection de partitions : traitement des données
3. Sélection de variables: méthodologie d’application
4. Sélection de variables: traitement des données
III.
TRA
VA
UX
REA
LISE
S
43
AN
ALY
SE D
ES R
ESU
LTAT
S &
CO
NLU
SIO
N
Journées de l’IMREDD 2012 10/10/2012
1. Conclusion 2. Limites/perspectives
La sélection de modèles: • Identifier un modèle dont la variance paramétrique
est contrôlée • Identifier un modèle aux erreurs de prévisions les
plus faibles
La sélection de partitions : • Approcher de manière simple une fonction réelle • Mise en évidence de points de coupure
La sélection de variables:
• Identification de variables pertinentes dans l’explication d’un phénomène
CO
NC
LUSI
ON
, LIM
ITES
& P
ERSP
ECTI
VES
44
AN
ALY
SE D
ES R
ESU
LTAT
S &
CO
NLU
SIO
N
Journées de l’IMREDD 2012 10/10/2012
1. Conclusion 2. Limites/perspectives
CO
NC
LUSI
ON
, LIM
ITES
& P
ERSP
ECTI
VES
La sélection de variables:
• la construction des variables reste arbitraire • aucune théorie pour justifier de la pertinence des caractéristiques
apporter une justification théorique de l’utilisation des caractéristiques temporelles
(« Functional Brain Imaging with M/EEG Using Structured Sparsity in Time-Frequency Dictionaries” - Alexandre Gramfort, Daniel Strohmeier, Jens Haueisen,Matti Hamalainen, and Matthieu Kowalski)
Perspectives