Roger Phan-Tan-Luu Université Paul Cézanne - France METHODOLOGIE DE LA RECHERCHE EXPERIMENTALE...

Post on 04-Apr-2015

117 views 0 download

Transcript of Roger Phan-Tan-Luu Université Paul Cézanne - France METHODOLOGIE DE LA RECHERCHE EXPERIMENTALE...

Roger Phan-Tan-LuuRoger Phan-Tan-Luu

Université Paul Cézanne - FranceUniversité Paul Cézanne - France

METHODOLOGIE DE LA RECHERCHE EXPERIMENTALE

Méthodologie de la Recherche Méthodologie de la Recherche ExpérimentaleExpérimentale

* Ce résultat doit nous

apporter une

information qui

correspond bien à

l’information demandée

* L’information ainsi

obtenue doit être de

bonne qualité, pour que

nous puissions, à partir de

celle-ci, prendre une

décision avec un risque

minimum

Cas ideal : il n’y a pas d’erreur expérimentale

Le résultat de la mesure nous donne

Cas normal : l’erreur expérimentale existe

yi = I + ei

Le résultat de la mesure ne nous donne

que y

yi est une estimation de i

* Pour améliorer la qualité de

l’information obtenue, il suffit

d’augmenter le nombre

d’essais

* Pour améliorer la qualité de

l’information obtenue à partir

du modèle, en plus de la

qualité apportée par la

mesure,il faudra aussi compter

avec les conditions

d’expérimentations

* Pour améliorer la qualité de l’information obtenue, il suffit

d’augmenter le nombre d’essais

Soit N essais répétés (honnêtement)

y1, y2, …, yN

Ymoyen = yi/N Var (ymoyen) = 2 / N

* Pour améliorer la qualité de l’information obtenue à partir du

modèle, en plus de la qualité apportée par la mesure,il faudra

aussi compter avec les conditions d’expérimentations

Cas normal : l’erreur expérimentale existe

y2 = 0 + 1 x2 + e2

y1 = 0 + 1 x1+ e1

(y2 - y1) / (x2 – x1) = (2+ e2 - 1 – e1) / (x2 – x1)

= (2 - 1 + e2 – e1) / (x2 – x1)

= (2 -1) / (x2 – x1) + (e2 – e1) / (x2 – x1)

b1= 1 + (e2 – e1) / (x2 – x1)

yi = i+ ei= 0 + 1 xi+ ei

b1= 1 + (e2 – e1) / (x2 – x1)

Pour obtenir une bonne estimation de 1  :

b1 1

Il faut et il suffit que :

(e2 – e1) / (x2 – x1) 0

  (x2 – x1) doit être le plus grand possible

La qualité de l’information obtenue dépend de la

position des points expérimentaux.

Y

X

yexp, 3

x1

y1

x6

y6

x7

y7

x2

y2

ycalc, 3

yexp, 3 - ycalc, 3

x3

y3

y5

x5x4

y4

S. C. E = (yexp, i - ycalc, i )2

L = (yi – 0 – 1xi )2

Nb0 + b1 xi = yi

b0 xi + b1 xi 2 = yi xi

0)(2

0)(2

101

100

xxy

xy

iii

ii

L

L

b0 = y moyen – b1 x moyen

b1 = Sxy / SxxSxy = yi (xi - x moyen )2

Sxx = (xi - x moyen )2

Var(b1) = Var (Sxy / Sxx) = Var (Sxy) / S2xx

Var(b1) = Var ( yi (xi - x moyen )2 ) / S2xx

Var ( yi (xi - x moyen )2 ) = 2 (xi - x moyen )2

Var (b1 ) = 2 / Sxx

Var (b0 ) = 2 [ 1/N + x moyen 2 / Sxx ]

REPRESENTATION VECTORIELLE

Définitions :

Y : vecteur colonne de la réponse expérimentales yi

Y' : { y1, y2,…… yN }

: vecteur colonne de la réponse théoriques i

' : { 1, 2, ….. N }

REPRESENTATION VECTORIELLE suite

: vecteur colonne des coefficients du modèle à estimer i

' : { 0 , 1 , 2 , …. p}

B : vecteur colonne des estimateurs bi

B' : {b0 , b1 , b2 , …. bp}

: vecteur colonne des erreurs expérimentales ei

' : {e1 , e2 , ..... eN}

Notation matricielle classique

= X y = X +

METHODE DES MOINDRES CARRES

La méthode des moindres carrés ne nécessite aucune hypothèse

sur la distribution des erreurs expérimentales

L = (Y – X ) ‘(Y – X )

X'X B = X'Y

B = (X'X)-1 X'Y si det (X'X) 0

0L

METHODE DES MOINDRES CARRES

Si la matrice (X’X) n’est pas singulière, nous obtenons le vecteur

des estimations :

B = (X'X)-1 X'Y

X’X : matrice d’information

(X’X)-1 : matrice de dispersion

Si le modèle y = X + est correct, B est une estimation non

biaisée de ,

MATRICE DE VARIANCE – COVARIANCE DE B

Var [B ] = (X’X)-1 2

Var [B ] : matrice de variance-covariance de B

(X’X)-1 : matrice de dispersion : { c ij }

cjj : coefficient de variance

La variance de l’estimateur bj est obtenue en multipliant la variance de

l’erreur expérimentale 2 par le terme diagonal correspondant cjj de la

matrice de dispersion

var [bj ] = cjj 2

covar [bj , bi] = cji 2

matrice de dispersion

(X'X)-1-

- 1

Var (B) = (X'X)-1

facteurs d’inflation

fonctions de variance

plan d’expérimentation

expérimentation

Y

B = (X'X)-1X'Y

tests statístiques

REGRESSION

MULTILINEAIRE

matriced’expériences

N

modèle

matrice du modèle

X

matrice d’ information

X'X

La variance et la covariance d’un estimateur dépendent

seulement de:

- la variance de l’ erreur expérimentale 2

- des éléments de la matrice de dispersion (X’X)-1,

* donc des éléments de la matrice d’information (X’X),

* donc de la structure de la matrice d’expériences et

de la forme analytique du modèle,

La qualité des estimateurs est indépendante de la valeur

des résultats expérimentaux (éléments du vecteur Y),

* Le modèle doit

représenter au mieux

l’ensemble des

résultats

expérimentaux

* Le modèle doit nous

permettre de faire, dans

tout le domaine

expérimental défini, une

prévision de bonne qualité

Quelques critères a posteriori

R2 = 1 – (yi – ycalc,i)2 / (yi – ymoyen)

2

R2 : coefficient de détermination multiple

R2A : coefficient de détermination multiple adjusté

R2A = 1 – [ (yi – ycalc,i)

2 / (N – p)] / [ (yi – ymoyen)2 / (N – 1)]

Analyse des résidus

Résidus

analyse graphique

ei = yi - y calc, i

Résidus normés

Les résidus normés ont une moyenne nulle et

une variance approximativement égale à 1.

ri = ei / s

s  : écart-type de la réponse

ei  : résidu au point i

Si ri > 3 la valeur de la réponse au point i

doit être examinée avec soin (erreur de

transcription, artéfact, validité du modèle en ce

point,…)

Au point i y calc, i = XB

y calc, i = X(X’X)-1X’Y H = X(X’X)-1X’ (hat matrice)

y calc, i = HY

E : {ei, ei, ..., eN}

E = Y - Ycalc

E = Y – XB = Y – HY = (I - H)Y

ei = (1 – di) yi

Var (E) = Var [(I - H)Y] = (I – H) Var(Y) (I – H)’

Var (E) = 2 (I – H)

Var (ei) = 2 (1 – di) = (1 – di) 2

ri = ei / s(1 - di)

Student-R

R-student

s2(i) = [(N – p) s2 - ei

2 / (1 - di) ] / (N - p -1)

ti = ei / s2

(i) (1 - di)

si ti est très différent de ri, alors le point i a

une grande influence sur le calcul des

coefficients du modèle

ri = ei / s(1 - di)

PRESS (Prediction Error Sum of Square)On fait la régression en enlevant le point i et en chacun des (N – 1) points on calcule Y calc, (i)

au point i e (i) = yi - y calc, i

La procédure est répétée pour chaque point (i : 1,., N)

e(1), …e(i), … e(N)

PRESS = e(i)2 = [ei /(1 - di)]

2

R2

Prédiction

R2 prédiction = 1 – PRESS / yi2

Ces critères permettent de choisir, de construire, un ensemble d’expériences qui nous apporteront les informations désirées avec une qualité acceptable.

Elaborer une stratégie Elaborer une stratégie expérimentaleexpérimentale

choisir une stratégie expérimentale

adéquateadéquate

C’est une

droite

Est-ce une droite

?

Une expérience apporte toujours une information

Mais, cette information est-elle utile ?

Dominio de validaciónC’est une droite

Dominio de validación

Est-ce une droite ?

N = 2N = 2N = 2

Et si nous faisions 50

points ?

25 25

N = 50

Dominio de validación

Est-ce une droite ?

N = 2N = 2N = 2

N = 3

Toute l’information se trouve dans la

distribution des points expérimentaux

Dominio de validación

C’est une droite

var (b1) = 2 / (xi – xmoyen)2

(xi–xmoyen)2 = (x1–xmoyen)2

+

5 (xj–xmoyen)2 +

(xn–xmoyen)2

1 j n

Modéles linéaires, …

* Nous voulons connaître les

estimations des coefficients

du modèle avec une qualité

acceptable

* Nous voulons connaître en

n’importe quel point du domaine

expérimental d’intérêt, la valeur

de la réponse étudiée avec une

qualité acceptable

Modéles linéaires, …

* Nous voulons connaître les

estimations des coefficients

du modèle avec une qualité

acceptable

* Nous voulons connaître en

n’importe quel point du domaine

expérimental d’intérêt, la valeur

de la réponse étudiée avec une

qualité acceptable

Le criblage des facteurs

Les études quantitatives des

facteurs

rechercher rapidement, parmi un ensemble de facteurs potentiellement influents, ceux qui le sont effectivement dans un domaine expérimental fixé.

étudier les effets principaux et les effets d’interaction des facteurs.

Facteurs d’inflation

Le criblage des facteurs

Les études quantitatives des

facteurs Nous voulons connaître les estimations des coefficients du modèle :

poids des facteurs, effets principaux et effets d’intéraction,..

avec une qualité acceptable.

Modéles linéaires, …

* Nous voulons connaître les

estimations des coefficients

du modèle avec une qualité

acceptable

* Nous voulons connaître en

n’importe quel point du domaine

expérimental d’intérêt, la valeur

de la réponse étudiée avec une

qualité acceptable

Les études quantitatives des réponses

Les mélanges

Connaître en n'importe quel point du domaine expérimental d'intérêt la valeur d'une ou plusieurs réponses

expérimentales .

Connaissance d'une ou plusieurs propriétés, dépendant de la proportion de chaque constituant dans le mélange étudié.

Connaître en n'importe quel point du domaine

expérimental d'intérêt la valeur d'une ou

plusieurs réponses expérimentales

Trouver, s’il existe, le domaine dans lequel

toutes les réponses expérimentales respectent

les contraintes imposées par le cahier des

charges

zone de compromis acceptable

Que voulons-nous ?

Le modèle doit bien représenter le

phénomène étudié dans le domaine

expérimental d’intérêt

Si cela est vérifié, il doit permettre de

prévoir, en n’importe quel point de ce

domaine expérimental d’intérêt, la valeur de

la réponse expérimentale étudiée avec une

bonne qualité prévisionnelle

Quelles doivent être les qualités du modèle ?

Si le modèle est vérifié, il doit permettre de

prévoir, en n’importe quel point de ce

domaine expérimental d’intérêt, la valeur de

la réponse expérimentale étudiée avec la

même qualité que celle que nous aurions eue

si nous avions fait l’expérience en ce même

point.

Que voulons nous ?

2750 g2500 g 3000 g

360 sec

270 sec

2500 g

A

180 sec

Var (y exp ,A) = 2

Var (y calc ,A) = dA2

Si le modèle est vérifié, il doit permettre de

prévoir, en n’importe quel point de ce

domaine expérimental d’intérêt, la valeur de

la réponse expérimentale étudiée avec la

même qualité que celle que nous aurions eue

si nous avions fait l’expérience en ce même

point.

Que voulons nous ?

d Max 1

Les études quantitatives des réponses

Les mélanges

Fonction de variance maximale dans tout le domaine d’intérêt

dMax

Connaître, en n’importe quel point du domaine expérimental d’intérêt, la valeur de la réponse expérimentale étudiée avec une qualité acceptable.

Les expériences coûtent cher, prennent du temps,

consomment des produits, de l’énergie ....

et en plus, ne sont pas importantes

Il n’y a aucune information dans le résultat

d’une expérience !

Toute l’information se trouve dans la

distribution des points expérimentaux

Comment savoir si l’objectif est atteint ?

mesure

réponse expérimentale

Description du problèmeDescription du problème

Les objectifsLes objectifs

Etablir la liste des réponses

Réponse expérimentale

Qualités:

pertinente, reproductibleconnue avec une précision acceptable.

La réponse est un résultat et il n’est pas

possible d’agir directement sur sa valeur

SORTIE

REPONSES EXPERIMENTALES

Etude d’un procédé CVD tungstène vitesse de dépôt, résistivité,

réflectance, adhésion, recouvrement, tension.

Optimisation de la géométrie d’une boîte de boisson résistance au choc, quantité d’aluminium, volume utile.

Fabrication d’un comprimé dureté, friabilité, indice de cohésion, granulométrie, rapport de transmission

Catalyse par transfert de phase rendement de la réaction

Comment modifier la réponse expérimentale ?Il faut agir

indirectement

Facteurs

ENTREE

L’expérimentateur peut agir directement sur

la valeur que peut prendre un facteur

contrôlé.

ENTREEENTREE SORTIESORTIEPhénomènePhénomène

RéponsesRéponsesFacteursFacteurs

Granulométrie

Friabilité

Dureté

Rapport de transmissionIndice de cohésion

- Liquide de mouillage- Temps de malaxage

Etablir la liste des facteurs

étudiés non étudiés

Etablir la liste des réponses

Description du problèmeDescription du problème

Les objectifsLes objectifs

Domaine de variation des facteurs

L'ensemble des niveaux (ou états) que peut prendre un facteur, peut être défini :

en extension

tous les niveaux (ou états) sont énumérés

en compréhension

énoncé de propriétés caractéristiques

Type de fruits secs : 40 % noisettes du Piémont noisettes turques amandes de Valence amandes de Sfax

Type de matières grasses : 15 % beurre de cacao beurre concentré biscuitine toffita

Type de produits de chocolat : 15 %

chocolat noir chocolat au lait masse de cacao

Type de produits / matière sèche : 30 % sucre glace lactosérum dextrose farine de soja

E

T

U

D

E

D

U

N

C

H

O

C

O

L

A

T

Les différents états que peut prendre un facteur

Nous devons, avant toute expérimentation bien définir sa taille, sa

forme, les possibilités d'extension, les discontinuités

soupçonnées du phénomène...

DOMAINE EXPERIMENTAL D’INTERET

Le domaine expérimental possible (ou domaine d'opérabilité) est le

sous-ensemble du domaine des facteurs contenant les

expériences réalisables. Dans la pratique, ce domaine est souvent

lui-même réduit au domaine expérimental d'intérêt dans lequel

nous recherchons les informations désirées.

Domaine expérimental d’intérêt

Etablir la liste des facteurs

étudiés non étudiés

Etablir la liste des réponses

Description du problèmeDescription du problème

Les objectifsLes objectifs

Nous devons faire des expériences

Lesquelles ?

Celles qui nous amènent les informations désirées

Stratégie expérimentale

Elaborer une stratégieElaborer une stratégie

Etablir la liste des facteurs

étudiés non étudiés

Etablir la liste des réponses

Description du problèmeDescription du problème

Les objectifsLes objectifs

Domaine expérimental d’intérêt

Stratégie expérimentale

Plan d’expériences

Ensemble d’expériences dont la réalisation apporte des informations bien définies

Construire un plan Construire un plan d’expériencesd’expériences

Etablir la liste des facteurs

étudiés non étudiés

Etablir la liste des réponses

Description du problèmeDescription du problème

Les objectifsLes objectifs

Domaine expérimental d’intérêt

Recherche exploratoire

Elaborer une stratégie Elaborer une stratégie expérimentaleexpérimentale

choisir une stratégie expérimentale

adéquateadéquate

Criblage de facteurs

Optimisation

Etude quantitative de facteurs

La recherche exploratoire :

cerner le domaine expérimental, s'assurer de la maîtrise du phénomène, choisir les grandeurs qui serviront de réponses et contrôler la répétabilité.

Le criblage des facteurs :

rechercher rapidement, parmi un ensemble de facteurs potentiellement influents, ceux qui le sont effectivement dans un domaine expérimental fixé.

Les études quantitatives des facteurs :

étudier les facteurs retenus d'une façon plus fine : interactions possibles entre les différents facteurs.

Les études quantitatives des réponses Rechercher l'optimum d'une ou plusieurs réponses expérimentales

Connaître en n'importe quel point du domaine expérimental d'intérêt la valeur d'une ou plusieurs

réponses expérimentales .

Les mélanges :

formulation = étude de l'influence des proportions de plusieurs constituants sur les manifestations d'un phénomène physico-chimique.

Connaissance d'une ou plusieurs propriétés, dépendant de la proportion de chaque constituant

dans le mélange étudié.