Etalonnage et modélisation

46
Etalonnage e MIEC - 21ème JIREC dia et Informatique dans l'Enseignement de la Chimie s pour l'innovation et la Recherche dans l'Enseignement de la 1er, 2 et 3 Juin 2005 à Autr

description

Etalonnage et modélisation. 11ème MIEC - 21ème JIREC Multimédia et Informatique dans l'Enseignement de la Chimie Journées pour l'innovation et la Recherche dans l'Enseignement de la Chimie 1er, 2 et 3 Juin 2005 à Autrans. Standards de calibration: Fonction réponse. - PowerPoint PPT Presentation

Transcript of Etalonnage et modélisation

Page 1: Etalonnage et modélisation

Etalonnage

11ème MIEC - 21ème JIRECMultimédia et Informatique dans l'Enseignement de la Chimie Journées pour l'innovation et la Recherche dans l'Enseignement de la Chimie

1er, 2 et 3 Juin 2005 à Autrans

Page 2: Etalonnage et modélisation

Etalonnage

sig

na

l

ImpuretésProduits de dégradation

Standards de calibration: Fonction réponse

Contrôle qualité: Linéarité, Répétabilité, fidélité intermédiaire, exactitude

domaine

OBJECTIFS

Déterminer une procédure d’étalonnage inverse adapté.

1a. Intervalle de dosage1b. Fonction réponse2. Evaluation des limites de

détection et de quantification3. Prédire une incertitude de

mesure à l’aide de QC (exactitude et précision)

Simulation du travail de routine à l'aide d'échantillons de concentrations connues.

Etalonnage/modélisation en sciences analytiques

Page 3: Etalonnage et modélisation

Etalonnage

Réponse analytique

Teneur

LOQ

Gamme linéaire

Gamme dynamique

LOD

Détermination de la borne supérieure du domaine linéaire

Permission J. Vial – Paris

Estimation LOD/LOQ

Domaine d’analyses

Page 4: Etalonnage et modélisation

Etalonnage

Modéliser : utiliser des données expérimentales pour prévoir une

information quantitative inconnue Y à partir de mesures de X via une

certaine « fonction mathématique » :

Le modèle mathématique postulé peut être :

Sinon un polynôme de

degré convenable.

Ajustement polynomialY

X

Modèle Y = f(X) avec un

polynôme de degré convenable

Une droite si Y varie

linéairement avec X.

Ajustement linéaireY

X Y= b1X + b0Modèle

Modélisation

Page 5: Etalonnage et modélisation

Etalonnage

Dans le cas les plus simple il existe une

relation linéaire entre :

et une seule grandeur physique Y

généralement donnée par un

appareil.

la grandeur à quantifier X

(ici la teneur de l’échantillon en un

composant donné)

Y = b1X + b0

Etalonnage/Relation linéaire

Page 6: Etalonnage et modélisation

Etalonnage

Conclusion : les deux variables X et Y ne jouent pas le même rôle.

Quand on trace la courbe d’étalonnage d’une méthode d’analyse à partir d’étalons choisis par l’expérimentateur,

En revanche, la réponse Y obtenue est une variable aléatoire dans la mesure où elle dépend non seulement de X,

la concentration X de l’analyte n’est pas considérée comme variable aléatoire puisqu’elle est connue avec précision.

mais aussi de l’aléa de l’erreur expérimentale.

Régression

Page 7: Etalonnage et modélisation

Etalonnage

On peut disposer de n couples [xi,yi] pour deux variables X et Y que l’on

suppose liées : à chaque valeur de X est associée une valeur de Y avec la relation :

(Y = ß1X + ß0)

Y représente le résultat observé,

X représente une teneur connue en analyte

Mais, expérimentalement, à chaque valeur xi de X, on obtient une valeur

yi entachée de l’erreur expérimentale εi. On a en réalité :

yi = ß1xi + ß0 + εi

Régression linéaire

Page 8: Etalonnage et modélisation

Etalonnage

Y représente le résultat observé,

X représente une teneur connue en analyte

la relation linéaire postulée devient : Y = b1X + b0

Avec uniquement une « estimation » des coefficients a et b du modèle postulé.

Y = ß1X + ß0

Ces données sont toujours en nombre limité,

elles ne représentent donc qu’un échantillon de la population de toutes les mesures de la teneur en analyte de l’étalon que l’on pourrait effectuer.

Analyse Quantitative et Etalonnage

Page 9: Etalonnage et modélisation

Etalonnage

A cause de cette erreur εi associée à chaque couple [xi,yi], si on

représente graphiquement yi en fonction de xi,

mais un «nuage» de points plus ou moins écartés de cette droite idéale.

on ne va pas obtenir des points “idéalement alignés”,

Régression linéaire

Page 10: Etalonnage et modélisation

Etalonnage

Avec une seule variable X le modèle s ’écrit :

Y

X1 X2 X3 X4 X5

Y1

Y2

Y3

Y4

Y5

X

Y= 0 + 1 X + r

Modèle linéaire

Page 11: Etalonnage et modélisation

Etalonnage

Y

X1 X2 X3 X4 X5

Y1

Y2

Y3

Y4

Y5

X

r1

r2

r3

r4

r5

Y1

^

Avec une seule variable X le modèle s ’écrit : Y= 0 + 1 X + r

On mesure la somme des carrés des écarts ri

(écarts appelés "résidus") entre la valeur vraie et la valeur

estimée ŷn sur la

courbe.

Faire un ajustement c'est minimiser la "distance" S = [Yi -f( Xi)]2 = r i

2

Ajustement linéaire

Page 12: Etalonnage et modélisation

Etalonnage

Pour minimiser S,

il suffit d'annuler les

dérivées partielles

de S par rapport à

0 et à 1 :

S/0 = S/1 = 0.

La somme S des carrés des écarts entre les valeurs expérimentales et les valeurs calculées par le modèle s’écrit :

S = Σ [yi - (0 + 1xi )]2 est une fonction de 0 et 1.

Droite des moindres carrés et efficacité d’un ajustement

Page 13: Etalonnage et modélisation

Etalonnage

Soit un jeu de calibration dans la gamme de 0 à 6 nanomoles

(les unités de fluorescence mesurées sont exprimées dans une échelle arbitraire dépendante de la gamme de concentration).

N° desessais

Conc. Xen nM

Unités deFluoresc. Y

1234567

0123456

0,13,8

10,014,420,726,929,1

Régression linéaire exemple : Fluorescence

Page 14: Etalonnage et modélisation

Etalonnage

La droite des moindres carrés correspondant aux données a donc pour équation :

Y = 5,139 X – 0,418

Droite d’étalonnage

0

10

20

30

0 1 2 3 4 5 6 7

nMUn

ité

de

flu

ore

scen

ce

Régression linéaire exemple : Fluorescence

Page 15: Etalonnage et modélisation

Etalonnage

Dans ce système les i sont les inconnues que nous devons estimer :

(bi est l ’estimation calculée de i ).

1. Au sens des moindres carrés (résolution algébrique) :

(yi - y)(xi - x) 1 = b1 =^

(xi - x)2 0 = b0 = y - b1 Xet ^

2. Au sens des moindres carrés (résolution matricielle) :

Estimation des coefficients

Page 16: Etalonnage et modélisation

Etalonnage

Avec Excel:

1. Fonction graphique : courbe de tendance

2. Fonctions algébriques (pente, ordonnee.origine)

3. Fonction matricielle : Droitereg

Y = 5,139 X – 0,418

Régression linéaire

Page 17: Etalonnage et modélisation

Etalonnage

Quelle confiance peut-on avoir :

d’une part globalement pour la régression,- Analyse de variance / coefficients- Examen des résidus- Manque d’ajustement (Lack of fit)

d’autre part individuellement pour les estimateurs ?- Simplification du modèle- Pertinence quadratique (global)

Les variations observées pour Y sont-elles dues globalement, aux variations de X ou bien ne sont-elles que du bruit expérimental ?

Ŷi = b1Xi + b0

Analyse de la régression linéaire

Page 18: Etalonnage et modélisation

Etalonnage

Y-

(yi - y)2

Variation totale

SCET

r1

r2r3

r4

r5

SCERVariation résiduelle

(yi - yi)2^

+Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

SCEL=

Analyse globale : Analyse de variance

Page 19: Etalonnage et modélisation

Etalonnage

Base de l’analyse de variance

Toute dispersion d’une série de données étant exprimée par la somme des carrés des écarts à la moyenne, on démontre la relation suivante sur laquelle est basée l’analyse de variance :

SCET = SCEL + SCER

Variation totale

(yi - y)2

Variation résiduelle

(yi - yi)2^Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

Analyse globale : Analyse de variance

Page 20: Etalonnage et modélisation

Etalonnage

Régression

Sources de variation

Sommes desCarrés des Ecarts

Degrés de lib.

Carrés moyens

Résidus

Total

2-1=1

7-2=5

7-1=6

SCEL = 739,56 739,56

SCER = 6,175 1,235

SCET = 745,72

Y-Y-Y-

(yi - y)2

Variation totale

SCET

(yi - y)2

Variation totale

SCET

r1

r2r3

r4

r5

r1

r2r3

r4

r5

SCERVariation résiduelle

(yi - yi)2^

+ SCERVariation résiduelle

(yi - yi)2^

SCERVariation résiduelle

(yi - yi)2^

+Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

SCEL=Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

SCELVariation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

SCEL=

Fluorescence : Analyse de la variance

Page 21: Etalonnage et modélisation

Etalonnage

Pour savoir si les variances des deux échantillons sont identiques ou différentes, il faut effectuer un test de comparaison de variances.

Loi de Fisher (dite aussi de Fisher-Snedecor)

Si deux échantillons de tailles n1 et n2 proviennent de lois normales de même variance,

le rapport F des variances estimées suit une loi de Fisher avec ν1 = n1 – 1 et ν2 = n2 – 1 qui sont les degrés de liberté pour chacun des échantillons 

s12

s22 = F (1

2 , 22)

Test de comparaison des variances

Page 22: Etalonnage et modélisation

Etalonnage

Les distributions de la loi F sont caractérisées par une dissymétrie gauche.

f(F)

FCourbe pour 1 et 2 donnés 0

f(F)

FCourbe pour 1 et 2 donnés

f(F)

FCourbe pour 1 et 2 donnés 0

Fcalculé =Variance s2

1

Variance s22

estimée avec ν1 degrés de liberté

estimée avec ν2 degrés de liberté

0,08

0,06

0,04

0,02

00 1 2 3 4 5 6

Exemple pour1 = 5 et 2 = 5

Fi

0,08

0,06

0,04

0,02

00 1 2 3 4 5 6

Exemple pour1 = 5 et 2 = 5

0,08

0,06

0,04

0,02

00 1 2 3 4 5 6

Exemple pour1 = 5 et 2 = 5

0,08

0,06

0,04

0,02

00 1 2 3 4 5 6

0,08

0,06

0,04

0,02

00 1 2 3 4 5 6

0,08

0,06

0,04

0,02

00 1 2 3 4 5 6

Exemple pour1 = 5 et 2 = 5

Fi

On détermine la probabilité pour qu’une valeur de F soit inférieure à la valeur Fi portée en abscisse

S21 > S2

2 la plus grande variance au numérateur

Test de comparaison des variances

Page 23: Etalonnage et modélisation

Etalonnage

Régression

Sources de variation

Sommes desCarrés des Ecarts

Degrés de lib.

Carrés moyens

Résidus

Total

2-1=1

7-2=5

7-1=6

SCEL = 739,56 739,56

SCER = 6,175 1,235

SCET = 745,72

Fcalc

598,8

F 1;5;0,05 = 6,608

Signif.

2,12.10-6

Y-Y-Y-

(yi - y)2

Variation totale

SCET

(yi - y)2

Variation totale

SCET

r1

r2r3

r4

r5

r1

r2r3

r4

r5

SCERVariation résiduelle

(yi - yi)2^

+ SCERVariation résiduelle

(yi - yi)2^

SCERVariation résiduelle

(yi - yi)2^

+Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

SCEL=Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

SCELVariation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

SCEL=

Fluorescence : Analyse de la variance

Page 24: Etalonnage et modélisation

Etalonnage

La mesure de l'efficacité de l'ajustement peut être exprimée par un coefficient appelé “coefficient de détermination”  ou “coefficient de régression multiple”.

Si le modèle expliquait “idéalement” les résultats expérimentaux,

nous aurions SCET = SCEL

ou sous une autre forme SCEL/SCET =1

Pour un modèle parfait : SCER = 0 (il n'y a pas de différence entre valeurs expérimentales et valeurs calculées).

SCET = SCEL + SCER

Analyse globale : coefficients de régression

Page 25: Etalonnage et modélisation

Etalonnage

R2 = SCEL / SCET

R2 = 1 -SCER

SCET

R2 = (SCET–SCER)/ SCET

SCEL=SCET – SCER

R2 est la part de la dispersion expliquée par le modèle.

Pour un modèle parfait, R2 = 1 car SCER = 0 (il n'y a pas de différence entre valeurs expérimentales et valeurs calculées).

Coefficient de détermination R²

Page 26: Etalonnage et modélisation

Etalonnage

R2 = 0.820

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

0 2 4 6 8 10 12 14

R2 = 0.820

0

0.2

0.4

0.6

0.8

1

1.2

1.4

0 2 4 6 8 10 12 14

R2 = 0.820

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

0 2 4 6 8 10 12 14

R2 = 0.820

0

0.5

1

1.5

2

2.5

3

0 2 4 6 8 10 12 14

R2 = 0.820

R2 = 0.820 R2 = 0.820

R2 = 0.820

Fonction réponse : R²

Page 27: Etalonnage et modélisation

Etalonnage

Pour tenir compte du nombre d'essais, c'est à dire du nombre de degrés de liberté,

il existe un coefficient de régression "ajusté"

symbolisé par R2a et défini par :

Le rapport R2 n’est pas une garantie de la qualité d’un modèle (dépendance du nombre d’essais et du modèle choisi)

Ex. Avec deux points, droite; R2 = 1Avec trois points , droite; R2 < 1 mais 2ème degré R2 = 1

SCER /(n-p)

SCET /(n-1)R2a = 1-

Coefficient de détermination ajusté R²a

Page 28: Etalonnage et modélisation

Etalonnage

R2 = 1 – (6,175/745,72) = 0,9917

R2a = 1 – ((6,175/5)/(745,72/6) = 0,9900

R2 = 1 -SCER

SCET

R2 = 1 -SCER

SCET

R2 = 1 -SCER

SCET

SCER /(n-p)

SCET /(n-1)R2a = 1-

SCER /(n-p)

SCET /(n-1)R2a = 1-

Fluorescence : coefficients de régression

Page 29: Etalonnage et modélisation

Etalonnage

Résidus = écarts entre les points expérimentaux et la droite de régression

0

50000

100000

150000

200000

Y

0 0,5 1 1,5 2

X

-1500-1000-500

0500

10001500

Res

idua

l

0 0,5 1 1,5 2

X

Les résidus devraient suivre une loi normale centrée sur 0.

Un examen visuel permet généralement de déceler un problème de modèle (homoscédasiticité, courbure, ordre supérieur, etc.).

Analyse globale : examen des résidus

Page 30: Etalonnage et modélisation

Etalonnage

Une courbe en cloche asymptotique à l’axe des x, dont le

maximum est pour x = x ,

Le graphe de la Loi Normale est caractérisé par :

Une symétrie par rapport à l’axe x = x,

Deux points d’inflexion à une distance de x égale à σ.

Moyenne

n

ii 1

1x x

n

n

22i

i 1

1ˆ x x

n 1

Variance

x x,

2

2

2

2

f x

f x

IC x

ICx

Propriétés de la loi Normale

Page 31: Etalonnage et modélisation

Etalonnage

Probabilité = 68,27% pour que x soit compris dans l’intervallex 1

0,6827 0,9545

Probabilité = 95,45% pour que x soit compris dans l’intervallex 2

0,9973

Probabilité = 99,73% pour que x soit compris dans l’intervallex 3

Propriétés de la loi Normale

Page 32: Etalonnage et modélisation

Etalonnage

99,73 %

En moyenne, l’erreur est nulle :

Distribution de Gauss centrée sur zéro(échelle des abscisses en unités d’écart-type)

95,45 %

La dispersion de « ri" est mesurée par sa variance : var(ri) = 2

68,27 %

o

-3 -2 -1 1 2 3

l’espérance mathématique E(ri) =0.

ou par l’écart-type .

s

Caractéristiques de l’erreur expérimentale ri

Page 33: Etalonnage et modélisation

Etalonnage

Concentration Graphique des résidus

-1.5

-1

-0.5

0

0.5

1

1.5

2

0 1 2 3 4 5 6 7

Concentration

Rés

idu

s

ANALYSE DES RÉSIDUS

ObservationPrévisions

Signal Résidus1 -0.41785714 0.517857142 4.72142857 -0.921428573 9.86071429 0.139285714 15 -0.65 20.1392857 0.560714296 25.2785714 1.621428577 30.4178571 -1.31785714

Fluorescence : examen des résidus

Page 34: Etalonnage et modélisation

Etalonnage

Quelle confiance peut-on avoir :

d’une part globalement pour la régression,- Analyse de variance / coefficients- Examen des résidus- Manque d’ajustement (Lack of fit)

d’autre part individuellement pour les estimateurs ?- Simplification du modèle- Pertinence quadratique (global)

Les variations observées pour Y sont-elles dues globalement, aux variations de X ou bien ne sont-elles que du bruit expérimental ?

Ŷi = b1Xi + b0

Analyse de la régression linéaire

Page 35: Etalonnage et modélisation

Etalonnage

b0 estimation de β0 de moyenne β0 et de variance var(b0)

b1 estimation de β1 de moyenne β1 et de variance var(b1)

(xi - x)2Var(b1) =2

exp. [ ]2 1n +et Var(b0) =

x2

(xi - x)2

Comme la variable Y qui intervient dans ces calculs est une variable aléatoire de variance σ2

exp.

cette dispersion va se répercuter sur les variances de b0 et b1.

Significativité des coefficients

Page 36: Etalonnage et modélisation

Etalonnage

On appelle cette estimation variance de la régression ou variance résiduelle

n-2̂2 =ri

2

n-2̂2 = s2 =yib0 b1xi)2

La variance expérimentale peut être obtenue par 1. la répétition des essais ou 2. « estimée » à partir des résidus, selon la relation

suivante :

Estimation de la variance expérimentale

Page 37: Etalonnage et modélisation

Etalonnage

Calcul de la variance des estimateurs (coefficients)(en utilisant la variance résiduelle comme estimation de σ2

exp. )

var(b1) = σ2résid . * (1/28) = 1,235 * 0,036 = 0,044

var(b0) = σ2résid . * (1/7 + 3*3/28) = 1,235* 0,464 = 0,574

Coefficient Ecart-type

b0 -0,418 0.757

b1 5,139 0.21

Fluorescence : Significativité des coefficients

Page 38: Etalonnage et modélisation

Etalonnage

Le coefficient bi est distribué selon une distribution de Student de moyenne i, d'écart-type e.t.(bi) et (n-2) degrés de liberté.

Intervalle de confiance pour bi : bi tc e.t.(bi)

-tc tc

Moyenne = i

pour= n-2

Significativité des coefficients

Page 39: Etalonnage et modélisation

Etalonnage

Intervalles de confiance des bi :

b1 ± tc e.t. (b1)b0 ± tc e.t. (b0)

Il s’agit ici du tthéorique avec ν = 5 Pour le risque choisi (0,05) t = 2,57)

-2,36 < b0 < 1,53 4,98 < b1 < 5,30

-0,418 ± 2,57*0,757 5,139 ± 2,57*0,21

Si l’intervalle inclus le zéro, le coefficient n’est pas significatif(au risque choisi)

Fluorescence : Significativité des coefficients

Page 40: Etalonnage et modélisation

Etalonnage

La significativité va être déterminée en

prenant βi0 = 0 d’où :

t =bi

é.type (bi)

D’où le test suivant :

la différence bi - βi0 suit une statistique de

Student à ν = (n-2) degrés de liberté avec :

t =bi - β0

i

é.type (bi)

Significativité des coefficients

Page 41: Etalonnage et modélisation

Etalonnage

Etalonnage de la méthode d’analyse de traces par fluorescence, avec un risque =0,05 et avec =7-2=5 degrés de liberté,

coefficients écart-type tcalculé significativité

-0,418

5,139

0,757

0,210

-0,552

24,41

0,6046

0,0036

b0

b1

t5, 0.05 =2,57

(calculé avec LOI.STUDENT.INVERSE d'EXCEL).

Fluorescence : Significativité des coefficients

Page 42: Etalonnage et modélisation

Etalonnage

Avec Excel: Outil, Utilitaire d’analyse

Régression linéaire

1. Coefficients de régression

2. Analyse de variance (test de F1)

3. Calcul, significativité et intervalles de confiances

des coefficients

4. Analyse des résidus

Régression linéaire

Page 43: Etalonnage et modélisation

Etalonnage

B = (X'X)-1 X'YB = (X'X)-1 X'Y

Coefficients du modèle

C'est une matrice où les variances sont disposées sur la diagonale et les covariances de part et d'autre de cette diagonale (matrice carrée symétrique) :

Matrice de variance-covariance des coefficients

Résolution matricielle

Page 44: Etalonnage et modélisation

Etalonnage

n

22i

i 1

1ˆ x x

n 1

x

n

22i

i 1

1ˆ x x

n 1

y yi - y

n

22i

i 1

1ˆ x x

n 1

x,y yi - y

n22

ii 1

1ˆ x x

n 1

Variance de x

Variance de y

Covariance xy

Variance-covariance

Page 45: Etalonnage et modélisation

Etalonnage

var (b0)cov (b1,b0) var (b1)

var (B) =

Var(B) = 2 (X'X)-1

Variance expérimentale Variance expérimentale

Conséquence: le choix des points expérimentaux conditionne la qualité de l’estimation la meilleure estimation consiste à annuler la covariance et minimiser les variances sur les coefficients Plan d’expériences

Matrice de variance-covariance des coefficients

Page 46: Etalonnage et modélisation

Etalonnage

LOD = 1) Plus petite quantité d’analyte dont on puisse dire avec un niveau de confiance donné qu’il est présent dans l’échantillon2) Plus petite quantité de l’élément à analyser pouvant être détectée, mais non quantifiée par une valeur précise (ICH).3) …, mais non quantifiée par une valeur exacte (SFSTP 1997).

LOQ = 1) Plus petite quantité d’analyte qui peut être quantifiée avec un niveau de confiance donné.2) Plus faible concentration de l’analyte dans l’échantillon qui puisse être déterminée quantitativement avec une justesse et une précision convenables (ICH).3) Plus petite quantité à examiner dans un échantillon pouvant être dosé dans des conditions expérimentales décrites avec une fidélité et une exactitude définies (SFSTP 1997)

Définitions LOD/LOQ