Download - Analyse des données

Transcript
Page 1: Analyse des données

Analyse des données

Page 2: Analyse des données

Plan

• Lien entre les statistiques et l’analyse des données

• Propagation des erreurs

• Ajustement de fonctions

Page 3: Analyse des données

Échantillon vs population

• Une mesure échantillonne une population

• La distribution de l’échantillon approxime celle de la population

• La précision sur les estimations augmente avec la taille de l’échantillon N

Page 4: Analyse des données

Exemple de comptage

Page 5: Analyse des données

n = 100

09,0/

92,0

07,0

100

n

µ

n

Page 6: Analyse des données

n = 1000

03,0/

01,1

03,0

1000

n

µ

n

Page 7: Analyse des données

n = 1 000 000

001,0/

0003,1

00076,0

1000000

n

µ

n

Page 8: Analyse des données

Précision sur la moyenne

• L’estimation de la moyenne s’affine avec N

µxN

µxN

xN

µ

i

i

i

22

22

1

1

1

1

Population

Échantillon

Page 9: Analyse des données

Erreur sur une variable dépendante

3,3

10

3/

y

x

xy

Page 10: Analyse des données

Erreur sur une variable dépendante

15

5

3

y

x

xy

Page 11: Analyse des données

Erreur sur une variable dépendante

x

yxy

Page 12: Analyse des données

Propagation d’erreurs

?

),(

1

1

f

yyy

xxx

yxff

Page 13: Analyse des données

Propagation d’erreurs

Page 14: Analyse des données

Propagation d’erreurs

• x et y sont des variables indépendantes

• Et x et y sont des erreurs indépendantes

• Leurs effets s’additionnent quadratiquement

Page 15: Analyse des données

Propagation d’erreur

...22

2

y

fy

x

fxf

pour des incertitudes indépendantes

Page 16: Analyse des données

Propagation d’erreurs

xbf

aef

yxfaxyf

babyaxf

fbx

yxf

yxf

2

2

2

2

2

2

22222

(sans corrélations)

Page 17: Analyse des données

Moyenne pondérée

• Plusieurs mesures de x (x1, x2, ... xi,, ... xn)

• Différentes précisions (1, 2, ... i,, ... n)

• On cherche la meilleure évaluation de la moyenne µ

• Les mesures précises doivent contribuer davantage

Page 18: Analyse des données

Moyenne pondérée

2

2

2

2

11

1

i

µ

i

i

ix

µ

Si tous les i sont égaux,

NN

xµ i

µi

22

Page 19: Analyse des données

Ajustement de courbes

• Soit f(x) une fonction physique

• On fait une mesure de f(x) en x = x1

• On cherche la probabilité que la mesure soit bonne

Page 20: Analyse des données

2

2

1

1

1

1

2

1

yy

eP

Page 21: Analyse des données

2)(

2

1

2

1

i

ii yxf

ii eP

Page 22: Analyse des données

• La probabilité totale est

222

2

2

2)(

2

1

)(

2

1exp

2

1

)(

2

1exp

2

1

2

1

i

i

i

ii

i

i

ii

i

yxf

ii

yyxf

yxf

ePP i

ii

Page 23: Analyse des données

• La valeur de P ou de 2 nous dit si les mesures représentent bien la théorie

Page 24: Analyse des données

Ajustement

• En général, la situation est inversée

• On ne connaît pas f(x)

• Mais on connaît (ou on essaye) une forme– droite– polynôme– fonction arbitraire

Page 25: Analyse des données

Ajustement

• On cherche les ai qui maximisent P– Vraisemblance maximale– Maximum likelihood

• Ou qui minimisent 2

– Moindres carrés

),(,...),,,()( iaxfcbaxfxf

Page 26: Analyse des données

Régression linéaire

• On veut passer la meilleure droite à travers n points expérimentaux

bxaxf )(

Page 27: Analyse des données

Régression linéaire

• On cherche a et b qui minimisent 2

• 2 équations, 2 inconnus (a et b)

0 022

ba

Page 28: Analyse des données

Régression linéaire

02

02

)(

2

2

2

2

22

2

i

iii

i

ii

i

ii

i

ii

ybxax

b

ybxa

a

ybxayxf

Page 29: Analyse des données

0

01

22

2

22

2

2222

i

ii

i

i

i

i

i

iiii

i

i

i

i

ii

ii

yxxb

xa

yxbxax

yxba

ybxa

2222

2222

2

2

22

2

2

11

1

1

i

i

i

i

i

ii

i

i

ii

i

i

i

i

i

i

i

i

i

i

i

yxyxb

yxxyxa

xx

Page 30: Analyse des données

Incertitudes égales(votre calculatrice)

iiii

iiiii

ii

i

yxyxNb

yxxyxa

xxN

1

1 2

22

Page 31: Analyse des données

Régression linéaire

• 5 mesures

• f(x) = 3x + 7• a=7 b=3

2 = 10,1

• a = 5,9 b = 2,9

2min = 5,9

Page 32: Analyse des données

Contours du 2

Page 33: Analyse des données

Incertitude sur les paramètres

• a et b dépendent des yi

• a et b dépendent des i

• On applique la règle de propagation

égaux) ( 1

égaux) ( 11

égaux) ( 1

22

2

2

2

2

2

2

22

2222

2

iiii

i

i

i

i

iii

ib

iii

i

iia

xxNxx

Ny

b

xx

y

a

Page 34: Analyse des données

Incertitude sur les paramètres

2

2

2

2

2

22

222

1

11

1

i

i

i

i

i

iiib

i

i

iia

xx

y

b

x

y

a

170

41

92,2

5,9

,

,

b

a

b

a

Page 35: Analyse des données

Incertitude et 2

87,61

87,52min

2min

Page 36: Analyse des données

Incertitude et 2

• La régression linéaire trouve le minimum du 2

• Un écart-type sur les paramètres correspond à une augmentation de 1 du 2. Pourquoi ?

• Les courbes de niveau indiquent la corrélation entre les paramètres

Page 37: Analyse des données

Incertitude et 2

2

22

2

2

1exp

2

1

)(

i

i

i

i

ii

P

yyxf

Gaussienne d’écart-type = 1L’incertitude représente une variation de 1 du 2

Page 38: Analyse des données

Corrélation linéaire

• On peut toujours passer une droite par des points

• Mais ces points peuvent-ils être décrits par une droite ?

• Le coefficient de corrélation linéaire r nous donne la réponse

Page 39: Analyse des données

Corrélation linéaire

• b = 2,7 b’ = 0,33• r = sqrt(bb’) = 0,95

• b = 0,29 b’ = 0,33• r = sqrt(bb’) = 0,31

Page 40: Analyse des données

Élimination de données suspectesCritère de Chauvenet (pp. 154-156)

• Soit 5 mesures : 38 35 39 39 34 18• Faut-il rejeter la dernière valeur ?• Si on peut expliquer notre erreur, oui.• Sinon, il faut réfléchir• <x> = 34 =8• Si on enlève, on a <x> = 37• La valeur de 18 s’écarte de 2 de la moyenne

Page 41: Analyse des données

• Ceci n’est jamais impossible et devrait se produire ~ 1 fois sur 20

• Mais on n’a que 6 données• On attend donc ~ 0,3 données de ce type et on

l’écarte• Critère de Chauvenet

• On écarte si 5,0NPn

Page 42: Analyse des données

Attention à l’auto-censure

• Expérience de Millikan

• e = 1,592 × 10-19 C

• e = 1,602 × 10-19 C

• Temps de vie du muon