Soutenance de stage - math.unice.frbinard/IMREDD.pdf · 10/10/2012 4 Etymologie ANGIO- : vaisseau...

45
Présenté par: Carole BINARD ([email protected]) Doctorante (1 ère année) à l’Université Nice Sophia-Antipolis (LJAD équipe de probabilité et statistiques) Journées de l’IMREDD 8-10 octobre 2012 Modélisation statistique de l’influence de protéines de signalisation sur l’ angiogénèse

Transcript of Soutenance de stage - math.unice.frbinard/IMREDD.pdf · 10/10/2012 4 Etymologie ANGIO- : vaisseau...

Présenté par:

Carole BINARD ([email protected])

Doctorante (1ère année) à l’Université Nice Sophia-Antipolis

(LJAD – équipe de probabilité et statistiques)

Journées de l’IMREDD 8-10 octobre 2012

Modélisation statistique de l’influence de protéines de signalisation sur

l’angiogénèse

SOM

MA

IRE

2 Journées de l’IMREDD 2012

10/10/2012

I. Cadre biologique 1. Définitions 2. Objectifs

II. Cadre mathématique 1. Théorie de sélection de variables pour l’identification

de cibles 2. Théorie de la sélection de partitions pour

l’estimation d’une fonction réelle

III. Travaux réalisés 1. Illustration de la sélection de partitions 2. Illustration de la sélection de variables

SOM

MA

IRE

Partie I:

Cadre

biologique

10/10/2012 4

Etymologie

ANGIO- : vaisseau (grec) - GENESE : naissance, source, origine (grec) Définition

Création de nouveaux vaisseaux sanguins à partir de vaisseaux préexistants

CA

DR

E B

IOLO

GIQ

UE

1. L’angiogénèse 2. L’angiogénèse tumorale 3. Objectifs

Journées de l’IMREDD 2012

I.C

AD

RE

BIO

LOG

IQU

E

5

Tumeur cancéreuse

Appauvrissement du milieu

Appauvrissement du milieu

Milieu cellulaire Journées de l’IMREDD 2012

10/10/2012

Membrane basale Cellules endothéliales

CA

DR

E B

IOLO

GIQ

UE

1. L’angiogénèse 2. L’angiogénèse tumorale 3. Objectifs

I.C

AD

RE

BIO

LOG

IQU

E

6

Tumeur cancéreuse

Diffusion de facteurs de croissance

Appauvrissement du milieu

Appauvrissement du milieu

Activation de voies de

signalisation

Milieu cellulaire Journées de l’IMREDD 2012

10/10/2012

Membrane basale Cellules endothéliales

CA

DR

E B

IOLO

GIQ

UE

1. L’angiogénèse 2. L’angiogénèse tumorale 3. Objectifs

I.C

AD

RE

BIO

LOG

IQU

E

7

Tumeur cancéreuse

Appauvrissement du milieu

Appauvrissement du milieu

Activation de voies de

signalisation

Nouveaux vaisseaux

Nouveaux vaisseaux

Apports en nutriments et oxygène

Milieu cellulaire Journées de l’IMREDD 2012

10/10/2012

Membrane basale Cellules endothéliales

CA

DR

E B

IOLO

GIQ

UE

1. L’angiogénèse 2. L’angiogénèse tumorale 3. Objectifs

I.C

AD

RE

BIO

LOG

IQU

E

8 Journées de l’IMREDD 2012

10/10/2012

CA

DR

E B

IOLO

GIQ

UE

1. L’angiogénèse 2. L’angiogénèse tumorale 3. Objectifs

Inhiber les voies de signalisation

Biologiques Mathématiques

Sélectionner les variables pertinentes dans l’explication d’un

phénomène

Comprendre le lien entre phénomène

angiogénique et concentrations en

facteurs croissance

Estimer une fonction par une fonction

constante par morceaux

I.C

AD

RE

BIO

LOG

IQU

E

Sélection de variables

Sélection de partitions

Partie II:

Cadre

mathématique

CA

DR

E M

ATH

EMA

TIQ

UE

10 Journées de l’IMREDD 2012

10/10/2012

on observe le phénomène:

2~ ,Y N I 0n et inconnues

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

II.

CA

DR

E M

ATH

EMA

TIQ

UE

(1) ( )

1 ... p

pY X X ( )Y f C

Estimer les paramètres Estimer la fonction f

Estimer μ à partir des observations

Sélection de variables Sélection de partitions

Sélection de

variables

12

1 variable réponse Y à n observations centrée N variables explicatives centrées à n observations chacune et les sont déterministes

Le bruit est gaussien

L’espérance de Y notée μ appartient à

σ connue

( )j

ix1 i n 1 j N

1 ~ (0,1)ii n N

(1) ( ): ,..., NV vect X X

10/10/2012

( )jX

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

1. Hypothèses générales 2. Remarque 3. Evaluer l’estimateur 4. Objectifs

CA

DR

E M

ATH

EMA

TIQ

UE

Journées de l’IMREDD 2012

II.

CA

DR

E M

ATH

EMA

TIQ

UE

13 Journées de l’IMREDD 2012

10/10/2012

(1) ( ),..., NVect X X ( )

1

Nj

j

j

X

Estimer μ = estimer les

Cadre linéaire gaussien

1ˆ ( ' ) 'X X X Y

( )

1

ˆ ˆˆN

j

j

j

X X

D’où

j

1. Hypothèses générales 2. Remarque 3. Evaluer l’estimateur 4. Objectifs

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

14 Journées de l’IMREDD 2012

10/10/2012

(1) ( ),..., NVect X X ( )

1

Nj

j

j

X

Estimer μ = estimer les

Cadre linéaire gaussien

1ˆ ( ' ) 'X X X Y

D’où

j

1ˆ ( ' ) 'X X X X Y

V (1) ( ): ,..., NV vect X X

1. Hypothèses générales 2. Remarque 3. Evaluer l’estimateur 4. Objectifs

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

15

2 2 2 dim( )ˆ

Vn n

VE E Y

n

Terme de variance

Journées de l’IMREDD 2012 10/10/2012

La qualité d’un estimateur se mesure par son erreur quadratique

moyenne:

ˆ ˆ²EQM Biais Var

ˆVY

1. Hypothèses générales 2. Remarque 3. Evaluer l’estimateur 4. Objectifs

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

16

Déterminer des sous-ensembles de l’ensemble

Identifier celui qui fournit les prévisions les plus fiables

(1) ( ),..., NX X

Journées de l’IMREDD 2012 10/10/2012

1. Hypothèses générales 2. Remarque 3. Evaluer l’estimateur 4. Objectifs

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

17 Journées de l’IMREDD 2012

10/10/2012

Sous-ensembles de

(1) ( ),..., NX X

Sous-espace vectoriel

m M

( ) ;mV vect X m

m M

ˆmm V Y

Sous-ensembles m de

1,..., N

dimm mD V

Collection M de sous-ensembles m

Collection S de sous-espaces mV

2

2 2m

N si N nD p

n si N n

1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

18

Meilleur modèle: m(s)

( )

2 22

diminf

m s m

m

V Vnm Mn

VE Y

n

Journées de l’IMREDD 2012 10/10/2012

2 22

dimm m

m

V Vn n

Vm M E Y

n

biais variance

1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle

Egalité Oracle

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

19 Journées de l’IMREDD 2012

10/10/2012

Sélection du meilleur modèle

Inégalité Oracle Équilibre entre biais et variance

1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle

2ˆ ( )m n

m M Y pen m

2ˆ ˆarg min ( )m n

m M

m Y pen m

( ) 2 mDpen m

n

2

( ) ,pen m pen m 2

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

( )

2

m sVn

E Y C risque Oracle Quelques critères

Cp de Mallows (1973) :

Birgé &Massart (2001) :

( )

2

m sVn

E Y C risque Oracle

2 2

,ˆ ˆ ˆarg min ( )m K Ln

m M

m Y pen m

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

20 Journées de l’IMREDD 2012

10/10/2012

Sélection du meilleur modèle

Inégalité Oracle Équilibre entre biais et variance

1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle

2ˆ ( )m n

m M Y pen m

2ˆ ˆarg min ( )m n

m M

m Y pen m

( ) 2 mDpen m

n

2

( ) ,pen m pen m 2

2

2

,

|| |||| || ( )m

m

V n

V n K L

m

Y Ym M Y Y pen m

n D

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

( )

2

m sVn

E Y C risque Oracle Quelques critères

Cp de Mallows (1973) :

Birgé &Massart (2001) :

2

ˆm n

m

Y

n D

( )

2

m sVn

E Y C risque Oracle

2 2

,ˆ ˆ ˆarg min ( )m K Ln

m M

m Y pen m

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

21

m M

,2( )

( ) || || 1m

K L

L V n

m

pen mCrit m Y Y

n D

Journées de l’IMREDD 2012 10/10/2012

« gaussien model selection with unknown variance »

Baraud, Giraud, Huet

1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle

Cadre non asymptotique Variance résiduelle σ inconnue

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

22

, ( ) 1, 1,1

mLm

K L m m

m

Npen m K EDkhi D N e

N

m M

K=1.1

m mN n D Solution de

l’équation (*)

3, 1 1, 1

1

3 1 1 1m

m m m m

L m

D N D N

m m m m

Nx xe P F P F x

D D N D

poids assurant le contrôle de la taille des modèles

Journées de l’IMREDD 2012 10/10/2012

1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

(*)

23 Journées de l’IMREDD 2012

10/10/2012

Sélection de variables

log log( ) log 1m m

m

NL p D

D

1 1mL

m

m M

D e

1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle

min , 2p N n

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

max , 1:m mquand L D n avec

, ( ) , max ,K L m mpen m C K L D

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

24

,2( )

ˆ arg min || || 1m

K L

V nm M m

pen mm Y Y

n D

Journées de l’IMREDD 2012 10/10/2012

1. Construction des modèles 2. Evaluer un modèle 3. Critère pénalisé 4. Forme de la pénalité 5. Poids associés 6. Inégalité Oracle

2 2

ˆ

2 2

ˆ 2 ²inf max ,

1

m mn n

m mm M

KE C L D

K

Inégalité Oracle

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

Sélection de

partitions

26

1

n

y

Y

y

Le phénomène observé et mesuré n fois dans des milieux différents

1

n

c

C

c

-Une variable déterministe mesurée n fois dans les mêmes conditions expérimentales que Y -Liée à Y par une fonction inconnue

1. Autre cadre d’étude 2. Objectif 3. Procédure de sélection

Journées de l’IMREDD 2012 10/10/2012

Y f C ~ 0,N Id

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

27

1. Autre cadre d’étude 2. Objectif 3. Procédure de sélection

Journées de l’IMREDD 2012 10/10/2012

Estimer l’espérance de Y:

Choix d’estimation

Une fonction constante par morceaux

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

E Y E f C

CA

DR

E M

ATH

EMA

TIQ

UE Estimer la fonction f liant Y et C

=

II.

CA

DR

E M

ATH

EMA

TIQ

UE

28

1. Autre cadre d’étude 2. Objectif 3. Procédure de sélection

Journées de l’IMREDD 2012 10/10/2012

1

n

c

C

c

Ordre croissant

1

n

c

C

c

1 , nc c subdivisions

Réunions disjointes de sous-intervalles de 1 , nc c

Collection M de partitions m

Estimateur de f associé à la partition

m

ˆ ˆ 1 ( )m I I

I m

f a C

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

29

1. Autre cadre d’étude 2. Objectif 3. Procédure de sélection

Journées de l’IMREDD 2012 10/10/2012

1

log 2log 2m m

m

nL D

D

, ( ) 1, 1,

1mLm

K L m m

m

Npen m K EDkhi D N e

N

Meilleur modèle

,2( )

ˆ arg min || || 1m

K L

V nm M m

pen mm Y Y

n D

m M

'

1ˆ ˆ( ),..., ( )m m m nV f c f c

1. Cadre d’étude 2. Théorie de la sélection de

variables: contexte 3. Théorie de la sélection de

variables: méthodologie 4. Théorie de la sélection de

partitions: méthodologie

CA

DR

E M

ATH

EMA

TIQ

UE

II.

CA

DR

E M

ATH

EMA

TIQ

UE

Estimateur de f associé à la partition

m

ˆ ˆ 1 ( )m I I

I m

f a C

Partie III:

Travaux

réalisés

Sélection de

partitions

32

TRA

VA

UX

REA

LISE

S

Journées de l’IMREDD 2012 10/10/2012

1. Sélection de partitions: méthodologie d’application

2. Sélection de partitions : traitement des données

3. Sélection de variables: méthodologie d’application

4. Sélection de variables: traitement des données

Modèle sélectionné

Modèle validé

Tests sur les résidus

Modèle invalidé

Sélection de partitions

Programme R: mis en ordre croissant des données

Programme R: sélection de partitions

III.

TRA

VA

UX

REA

LISE

S

33

TRA

VA

UX

REA

LISE

S

1. Profil temporel 2. Estimations

Journées de l’IMREDD 2012 10/10/2012

Ph

en2

Temps (en heures cumulées)

entre h=48 et h=144

1. Sélection de partitions: méthodologie d’application

2. Sélection de partitions : traitement des données

3. Sélection de variables: méthodologie d’application

4. Sélection de variables: traitement des données

III.

TRA

VA

UX

REA

LISE

S

34

TRA

VA

UX

REA

LISE

S

Journées de l’IMREDD 2012 10/10/2012

1. Profil temporel 2. Estimations

Entre h=48 et h=72

1. Sélection de partitions: méthodologie d’application

2. Sélection de partitions : traitement des données

3. Sélection de variables: méthodologie d’application

4. Sélection de variables: traitement des données

0 A B C D E

III.

TRA

VA

UX

REA

LISE

S

35

TRA

VA

UX

REA

LISE

S

Journées de l’IMREDD 2012 10/10/2012

0 A B C D E

1. Profil temporel 2. Estimations

Entre h=76 et h=144

1. Sélection de partitions: méthodologie d’application

2. Sélection de partitions : traitement des données

3. Sélection de variables: méthodologie d’application

4. Sélection de variables: traitement des données

III.

TRA

VA

UX

REA

LISE

S

Sélection de

variables

37

TRA

VA

UX

REA

LISE

S

Journées de l’IMREDD 2012 10/10/2012

Modèle sélectionné

Modèle validé

Tests sur les résidus

Modèle invalidé

Sélection de partitions

Programme R: mis en ordre croissant des données

Programme R: sélection de partitions

Sélection de variables

Programme R: centrage des données

Programme R: sélection de variables

1. Sélection de partitions: méthodologie d’application

2. Sélection de partitions : traitement des données

3. Sélection de variables: méthodologie d’application

4. Sélection de variables: traitement des données

III.

TRA

VA

UX

REA

LISE

S

38

TRA

VA

UX

REA

LISE

S

Journées de l’IMREDD 2012 10/10/2012

1. Les données 2. Variable endogène 3. Variables exogènes 4. Sélections

4 protéines de signalisation

-Protéine A -Protéine B -Protéine C -Protéine D

10 conditions expérimentales

-Condition 1 -Condition 2 -Condition 3 -Condition 4 -Condition 5 -Condition 6 -Condition 7 -Condition 8 -Condition 9 -Condition 10

Un phénomène à expliquer

1. Sélection de partitions: méthodologie d’application

2. Sélection de partitions : traitement des données

3. Sélection de variables: méthodologie d’application

4. Sélection de variables: traitement des données

III.

TRA

VA

UX

REA

LISE

S

39

TRA

VA

UX

REA

LISE

S

Journées de l’IMREDD 2012 10/10/2012

Mesure du phénomène

1. Les données 2. Variable endogène 3. Variables exogènes 4. Sélections

1. Sélection de partitions: méthodologie d’application

2. Sélection de partitions : traitement des données

3. Sélection de variables: méthodologie d’application

4. Sélection de variables: traitement des données

0 10 20 30 40 50

02

04

06

08

01

00

time

me

asu

res p

he

no

me

n

0 10 20 30 40 50

02

04

06

08

01

00

time

me

asu

res p

he

no

me

n

0 10 20 30 40 50

02

04

06

08

01

00

time

me

asu

res p

he

no

me

n

0 10 20 30 40 50

02

04

06

08

01

00

time

me

asu

res p

he

no

me

n

0 10 20 30 40 50

02

04

06

08

01

00

time

me

asu

res p

he

no

me

n

0 10 20 30 40 50

02

04

06

08

01

00

time

me

asu

res p

he

no

me

n

0 10 20 30 40 50

02

04

06

08

01

00

time

me

asu

res p

he

no

me

n

0 10 20 30 40 50

02

04

06

08

01

00

time

me

asu

res p

he

no

me

n

0 10 20 30 40 50

02

04

06

08

01

00

time

me

asu

res p

he

no

me

n

0 10 20 30 40 50

02

04

06

08

01

00

time

me

asu

res p

he

no

me

n

EGF0

gefitinib

ERK_inhib

FAK_inhib

Akt_inhib

EGF5

EGF5+gef

EGF5+MEKinhib

EGF5+FAKinhib

EGF5+Aktinhib

III.

TRA

VA

UX

REA

LISE

S

40

TRA

VA

UX

REA

LISE

S

Journées de l’IMREDD 2012 10/10/2012

0 10 20 30 40

50

01

00

01

50

02

00

02

50

03

00

0

time

me

asu

res p

rote

in A

0 10 20 30 40

50

01

00

01

50

02

00

02

50

03

00

0

time

me

asu

res p

rote

in A

0 10 20 30 40

50

01

00

01

50

02

00

02

50

03

00

0

time

me

asu

res p

rote

in A

0 10 20 30 40

50

01

00

01

50

02

00

02

50

03

00

0

time

me

asu

res p

rote

in A

0 10 20 30 40

50

01

00

01

50

02

00

02

50

03

00

0

time

me

asu

res p

rote

in A

0 10 20 30 40

50

01

00

01

50

02

00

02

50

03

00

0

time

me

asu

res p

rote

in A

0 10 20 30 40

50

01

00

01

50

02

00

02

50

03

00

0

time

me

asu

res p

rote

in A

0 10 20 30 40

50

01

00

01

50

02

00

02

50

03

00

0

time

me

asu

res p

rote

in A

0 10 20 30 40

50

01

00

01

50

02

00

02

50

03

00

0

time

me

asu

res p

rote

in A

0 10 20 30 40

50

01

00

01

50

02

00

02

50

03

00

0

time

me

asu

res p

rote

in A

condition 1

condition 2condition 3

condition 4condition 5

condition 6

condition 7condition 8

condition 9condition 10

0 10 20 30 40

20

00

30

00

40

00

50

00

60

00

time

me

asu

res p

rote

in B

0 10 20 30 40

20

00

30

00

40

00

50

00

60

00

time

me

asu

res p

rote

in B

0 10 20 30 40

20

00

30

00

40

00

50

00

60

00

time

me

asu

res p

rote

in B

0 10 20 30 40

20

00

30

00

40

00

50

00

60

00

time

me

asu

res p

rote

in B

0 10 20 30 40

20

00

30

00

40

00

50

00

60

00

time

me

asu

res p

rote

in B

0 10 20 30 40

20

00

30

00

40

00

50

00

60

00

time

me

asu

res p

rote

in B

0 10 20 30 40

20

00

30

00

40

00

50

00

60

00

time

me

asu

res p

rote

in B

0 10 20 30 40

20

00

30

00

40

00

50

00

60

00

time

me

asu

res p

rote

in B

0 10 20 30 40

20

00

30

00

40

00

50

00

60

00

time

me

asu

res p

rote

in B

0 10 20 30 40

20

00

30

00

40

00

50

00

60

00

time

me

asu

res p

rote

in B

0 10 20 30 40

50

01

00

01

50

02

00

0

time

me

asu

res p

rote

in C

0 10 20 30 40

50

01

00

01

50

02

00

0

time

me

asu

res p

rote

in C

0 10 20 30 40

50

01

00

01

50

02

00

0

time

me

asu

res p

rote

in C

0 10 20 30 40

50

01

00

01

50

02

00

0

time

me

asu

res p

rote

in C

0 10 20 30 40

50

01

00

01

50

02

00

0

time

me

asu

res p

rote

in C

0 10 20 30 40

50

01

00

01

50

02

00

0

time

me

asu

res p

rote

in C

0 10 20 30 40

50

01

00

01

50

02

00

0

time

me

asu

res p

rote

in C

0 10 20 30 40

50

01

00

01

50

02

00

0

time

me

asu

res p

rote

in C

0 10 20 30 40

50

01

00

01

50

02

00

0

time

me

asu

res p

rote

in C

0 10 20 30 40

50

01

00

01

50

02

00

0

time

me

asu

res p

rote

in C

condition 1

condition 2

condition 3

condition 4

condition 5

condition 6

condition 7

condition 8

condition 9

condition 10

0 10 20 30 40

0.1

0.2

0.3

0.4

0.5

time

me

asu

res p

rote

in D

0 10 20 30 40

0.1

0.2

0.3

0.4

0.5

time

me

asu

res p

rote

in D

0 10 20 30 40

0.1

0.2

0.3

0.4

0.5

time

me

asu

res p

rote

in D

0 10 20 30 40

0.1

0.2

0.3

0.4

0.5

time

me

asu

res p

rote

in D

0 10 20 30 40

0.1

0.2

0.3

0.4

0.5

time

me

asu

res p

rote

in D

0 10 20 30 40

0.1

0.2

0.3

0.4

0.5

time

me

asu

res p

rote

in D

0 10 20 30 40

0.1

0.2

0.3

0.4

0.5

time

me

asu

res p

rote

in D

0 10 20 30 40

0.1

0.2

0.3

0.4

0.5

time

me

asu

res p

rote

in D

0 10 20 30 40

0.1

0.2

0.3

0.4

0.5

time

me

asu

res p

rote

in D

0 10 20 30 40

0.1

0.2

0.3

0.4

0.5

time

me

asu

res p

rote

in D

condition 1

condition 2

condition 3

condition 4

condition 5

condition 6

condition 7

condition 8

condition 9

condition 10

1 1 1 1

2 2 3 4

10 10 10 10

A B C D

A B C D

A B C D

x x x x

x x x x

X

x x x x

1. Les données 2. Variable endogène 3. Variables exogènes 4. Sélections

1. Sélection de partitions: méthodologie d’application

2. Sélection de partitions : traitement des données

3. Sélection de variables: méthodologie d’application

4. Sélection de variables: traitement des données

III.

TRA

VA

UX

REA

LISE

S

41

TRA

VA

UX

REA

LISE

S

Journées de l’IMREDD 2012 10/10/2012

Centrage des données Programme de sélection

1. Les données 2. Variable endogène 3. Variables exogènes 4. Sélections

1. Sélection de partitions: méthodologie d’application

2. Sélection de partitions : traitement des données

3. Sélection de variables: méthodologie d’application

4. Sélection de variables: traitement des données

III.

TRA

VA

UX

REA

LISE

S

Conclusion

Limites & Perspectives

43

AN

ALY

SE D

ES R

ESU

LTAT

S &

CO

NLU

SIO

N

Journées de l’IMREDD 2012 10/10/2012

1. Conclusion 2. Limites/perspectives

La sélection de modèles: • Identifier un modèle dont la variance paramétrique

est contrôlée • Identifier un modèle aux erreurs de prévisions les

plus faibles

La sélection de partitions : • Approcher de manière simple une fonction réelle • Mise en évidence de points de coupure

La sélection de variables:

• Identification de variables pertinentes dans l’explication d’un phénomène

CO

NC

LUSI

ON

, LIM

ITES

& P

ERSP

ECTI

VES

44

AN

ALY

SE D

ES R

ESU

LTAT

S &

CO

NLU

SIO

N

Journées de l’IMREDD 2012 10/10/2012

1. Conclusion 2. Limites/perspectives

CO

NC

LUSI

ON

, LIM

ITES

& P

ERSP

ECTI

VES

La sélection de variables:

• la construction des variables reste arbitraire • aucune théorie pour justifier de la pertinence des caractéristiques

apporter une justification théorique de l’utilisation des caractéristiques temporelles

(« Functional Brain Imaging with M/EEG Using Structured Sparsity in Time-Frequency Dictionaries” - Alexandre Gramfort, Daniel Strohmeier, Jens Haueisen,Matti Hamalainen, and Matthieu Kowalski)

Perspectives

Bibliographie

Y. Baraud, C. Giraud et S. Huet, « Gaussian Model Selection with an unknown variance », Université de Nice Sophia Antipolis et INRA, 2009. L. Birgé et P. Massart, « Gaussian model selection », Journal of the European Mathematical Society, vol. 3, no. 3, p. 203-268, 2001.