S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle...

29
TC – Mathématiques – S2 1. Introduction 3 5 10 Y : recette (k€) 150 120 100 80 1.1 Objectifs 2 caractères Pour chaque individu : un couple (x, y) de valeurs X et Y sont-elles liées ? Modéliser la relation Estimer de nouvelles valeurs inconnues Etude Série de données : 2 variables 12 ? « corrélation » « prévision » « ajustement », « régression » X : dépense (k€)

Transcript of S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle...

Page 1: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

1. Introduction

3 5 10

Y : recette (k€)

150

120

100

80

1.1 Objectifs

2 caractères

⇓Pour chaque individu :

un couple (x, y)

de valeurs

� X et Y sont-elles liées ? � Modéliser la relation � Estimer de nouvelles

valeurs inconnues

Etude

⇓Série de données :

2 variables 12

?

« corrélation »

« prévision »

« ajustement »,

« régression »

X : dépense (k€)

Page 2: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

1. Introduction 1.2 Mises en forme

� Séries « listes »

quantité d'engrais

production recueillie

parcelle n°

X (kg.ha-1) Y (q.ha-1)

1 150 462 80 373 120 464 220 515 100 43

X : année 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017

Y : dépense 41 60 55 66 87 61 90 95 82 120 125 118

Série chronologique

� Tableaux de contingence

X : âge

20 40 50 60

Y : acuité

3/10 1 5 10 20

6/10 8 12 25 18

9/10 55 26 14 6

Page 3: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

� Séries

« listes »

X : année 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017

Y : dépense 41 60 55 66 87 61 90 95 82 120 125 118

Série de données xi et yi

Ensemble de points Mi(xi ; yi)

« nuage de points »

1. Introduction 1.3 Nuage de points

Page 4: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

1. Introduction 1.3 Nuage de points

� Tableaux de contingence

X : âge

20 40 50 60

Y : acuité

3/10 1 5 10 20

6/10 8 12 25 18

9/10 55 26 14 6

Page 5: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

2. Test d’indépendance du Khi-deux

Exemple d’approche

1. Résultats d’un échantillon

de 8 hommes et 12 femmes :

Evaluer la différence entre observation et théorie par un paramètre global : χ²calc

Ce paramètre est le χ²calc de

l’expérience.Calculer un χ² : (obs – th)² / th

Deux variables sont croisées.

Ex : Hypothèse à tester, H0 : « genre et QI sont indépendants (dans la population) »

<100 >100

F 3 9 12

H 6 2 8

9 11 20

2. Résultats théoriquement

attendus (sous H0) :

<100 >100

F 12

H 8

9 11 20

5,4 6,6

3,6 4,4

3. Différences :

χ² partiels et χ² total

<100 >100

F

H

1,067 0,873

1,6 1,309

L’hypothèse à tester est celle de leur indépendance.

4,85

Page 6: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

Quelle que soit l’expérience et sous l’hypothèse nulle « H0 » (ex : « sexe et QI indépendants »),

on sait donner la probabilité que telle valeur du χ² soit (ou ne soit pas) dépassée.

densité de

probabilité

valeurs possibles

du χ² d’un

échantillon en cas

d’indépendance

0 4,85

97,23 %

2,77 %

notre exemple

La loi du χ²

la réalité

densité de

probabilité

valeurs

possibles

du χ²0 4,85

? %

? %

notre

exemple

vos possibilités

6,6

4

1%

5,4

1

2%

3,8

4

5%

2,7

1

10%

2. Test d’indépendance du Khi-deux

Page 7: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

1. On teste l’hypothèse nulle d’indépendance « H0 » (ex : « sexe et QI indépendants »).

densité de

probabilité

0 χ²calc

2. Le χ² de l’expérience décrite est calculé : χ²calc.

3. On situe notre χ²calc en probabilité grâce au formulaire.

Objectif : peut-on se permettre de la rejeter ?

Objectif : évaluer son importance, dans l’hypothèse H0

Objectif : le comparer aux χ² donnés par le formulaire

Test d’indépendance à r lignes et k colonnes :

ddl = (r – 1)(k – 1)

4. Selon le seuil de risque α choisi, une

décision est prise (rejet ou non-rejet de H0).

Méthodologie

2. Test d’indépendance du Khi-deux

Page 8: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

5,3

χ²calc

TC – Mathématiques – S2

1. Hypothèse nulle « H0 » : sexe et rapport au tabac sont indépendants.

densité de probabilité

0

??

2. χ²calc =

3. nombre de ddl : (3-1)(2-1) = 2

valeurs du formulaire

9,2

1

1%

7,8

2

2%

5,9

9 5%

4,6

1

10%

4. Au seuil de 10% , on peut rejeter H0.

seuil de risque : α = 10%

χ²lim = 4,61

5,3

Sh Sf

Tj 12 23Tf 31 26Ta 8 17

35

57

25

11751 66

Sh Sf

Tj 35

Tf 57

Ta 25

51 66 117

distribution observée distribution théorique sous H0

15,26

10,9032,1514,10

24,8519,74

Sh Sf

Tj

Tf

Ta

valeurs des χ²

0,695071,524170,77038

0,537101,177770,59529

5,300

4,6

1

10%

Exercice 1

2. Test d’indépendance du Khi-deux

Page 9: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

3.1 Moyennes mobiles

TC – Mathématiques – S2

3. Ajustement, Mayer

Exercice 6

x : 1 à 16

Page 10: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

3. Ajustement, Mayer

3.2 Problématique de l’ajustement linéaire

Une infinité de formes possibles pour un nuage de points.

Parfois, une droite le représente correctement. « ajustement linéaire »

Dans d’autres cas, c’est une courbe. « ajustement non linéaire »

TC – Mathématiques – S2

Page 11: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

3.2 Problématique de l’ajustement linéaire

Une fois une droite tracée :

Dans le nuage de points :

Par définition du point Mi,

xi et yi sont associés.

xi

yi

y’i

A xi est associé y’i = axi + b

Définition : on appelle résidu le nombre ei = yi – y’i

ei

ei > 0 : Mi au-dessus de la droite ei < 0 : Mi en-dessous de la droite

(D) : droite de régression (ou d’ajustement) ; déterminer (D) : faire un ajustement linéaire.

TC – Mathématiques – S2

3. Ajustement, Mayer

Page 12: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

1. Partager équitablement le nuage (de gauche à

droite)

2. Déterminer G1 et G2, points moyens des demi-

nuages

3. (D) = (G1G2)

3.3 Méthode de Mayer

Principe de Mayer :1

0n

i

i=

=∑e

Equivalent à : G ∈ (D)

Méthode de Mayer (trouver une droite cohérente) :

G1

G2

GG

A noter :

Dans tous les

cas, G ∈ (G1G2).

Ainsi, (D) est une

droite de Mayer.

(D)

TC – Mathématiques – S2

3. Ajustement, Mayer

Page 13: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

3.3 Méthode de Mayer

1

1

80 100 120100

3

37 43 4642

3

x

y

+ += =

+ += =

G

G

engrais récolte

(kg.ha-1) (q.ha-1)

1 150 46

2 80 37

3 120 46

4 220 51

5 100 43

80

100

120

x : engrais

(kg/ha)

y : récolte

(q/ha)

40

80 150

60

50

30220120

×

×

×

×

××

G1

×

G2

DM

2

2

150 220185

2

46 5148,5

2

x

y

+= =

+= =

G

G

;1 1

48,5 420,07647 34,35

185 100y x

−= ≈ = − ≈− G G

a b a

TC – Mathématiques – S2

3. Ajustement, Mayer

Exercice 7

Page 14: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

3.3 Méthode de Mayer

Droite de Mayer

...

...

1

1

1 2 84,5

8

28 45 4040

8

x

y

+ + += =

+ + += =

G

G

...

...

2

2

9 10 1612,5

8

28 46 3941,125

8

x

y

+ + += =

+ + += =

G

G

TC – Mathématiques – S2

3. Ajustement, Mayer

Exercice 8

×

G1

×

G2

N N+1 N+2 N+3

tri1 tri2 tri3 tri4 tri1 tri2 tri3 tri4 tri1 tri2 tri3 tri4 tri1 tri2 tri3 tri4

(M€) 28 45 49 36 30 44 48 40 28 46 52 37 31 42 54 39

Page 15: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

4.1 Paramètres des séries à deux variables

TC – Mathématiques – S2

Moyennesn

i

i

x

xn

==∑

1

n

i

i

y

yn

==∑

1

Variances

( )

r

i

i

x

X xn

== −∑

2

21V

( )2

1 2V

k

j

j

y

Y yn

== −∑

Covariance

( ), 1

n

i i

i

x y

Cov X Y x yn

== −∑

Ecarts types

( ) ( )VX Xσ =

( ) ( )VY Yσ =

Sur calculatrice

X : List 1

Y : List 2

(nij : List 3)

Saisir CALC >

SET

CALC >

2Var

CALC >

Stat2Var L1,L2(,L3)

Résultats

, , , ,

, , , ,

2

2

X

Y

x x x

y y y n

xy

σ

σ∑ ∑

∑ ∑

4. Ajustement, moindres carrés

Page 16: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

4.1 Paramètres des séries à deux variables

Cov(X,Y) = 203,6

TC – Mathématiques – S2

4. Ajustement, moindres carrés

Exercice 9

engrais récolte

(kg.ha-1) (q.ha-1)

1 150 46

2 80 37

3 120 46

4 220 51

5 100 43

YX [15 ; 25[ [25 ; 50[ 50 et plus

aucune 4 6 13

1 à 11 10 16 15

12 à 23 13 8 4

≥ 24 6 3 2

E(X) = 134

Σx = 670

Σx² = 101700

σX = 48,826

V(X) = 2384

E(Y) = 44,6

Σy = 223

Σy² = 10051

σY = 4,5869

V(Y) = 21,04

Σxy = 30900

E(X) = 39,375

Σx = 3937,5

Σx² = 182006,25

σX = 16,422

V(X) = 269,67

E(Y) = 10,795

Σy = 1079,5

Σy² = 23388,25

σY = 10,833

V(Y) = 117,35

Cov(X,Y) = -56,15

Σxy = 36890

Page 17: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

A. La droite de régression est unique

B. Dans tous les cas, G ∈ (D)

C.

4.2 Méthode des moindres carrés

Principe :

n

i

i=∑

2

1

e Equivalent à : formules de a et b

Résultats :

G

est minimale

( )( )

,Cov X Y

X=

Va y x= −b a

(D)

TC – Mathématiques – S2

4. Ajustement, moindres carrés

Page 18: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

4.2 Méthode des moindres carrés

V(X) =

1 2 3 4 5 6 7 8 9 10 11 12année (1 : 2006)

dépense

(k€)

120

100

80

60

40 +

++

+

+

+

++

+

++

+

CALC >

REG > X

CALC >

LinReg L1,L2

11,91667 V(Y) = 701,3889

Cov(X,Y) = 84,1667

( )( )

,Cov X Y

X= ≈ 7,0629

Va ≈ 37,42b

(D) : y = 7,0629x + 37,42

(D)

TC – Mathématiques – S2

4. Ajustement, moindres carrés

Exercice 10

Page 19: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

4.3 Coefficient de corrélation linéaire

0.75 < r < 1

( )( ) ( )

,X Y

X Yρ

σ σ= = =

Covr R

0 < r < 0.5 -0.75 < r < -0.5 -0.5 < r < 0

-1 < r < -0.75 -0.5 < r < 0.5 0.5 < r < 0.75 0 < r < 0.5

TC – Mathématiques – S2

4. Ajustement, moindres carrés

Page 20: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

4.3 Coefficient de corrélation linéaire

TC – Mathématiques – S2

4. Ajustement, moindres carrés

Page 21: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

5. Ajustement non linéaire

1. remplacement

de X ou Y par une

autre variable

(T ou U)

Etude ⇒ X, Y

2. corrélation linéaire

après remplacement

3. modèle final de la

relation entre X et Y

Méthodologie

3.

(DY/T) : y = 1.02526 t + 3.856

y = 1.02526 x² + 3.856

X 2 3 5 8Y 9 13 28 70

1. On propose le changement de variable T = X².

Exemple

T 4 9 25 64Y 9 13 28 70

2. Ici, il s’agit de déterminer une équation de droite de type y = at + b.

Ex avec la méthode des moindres carrés, calculatrice en mode Stat :

Page 22: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

5. Ajustement non linéaire

1. remplacement

de X ou Y par une

autre variable

(T ou U)

Etude ⇒ X, Y

2. corrélation linéaire

après remplacement

3. modèle final de la

relation entre X et Y

Méthodologie

X 10 20 30 40 50 60 70 80 90

T

Y 15.2 11.6 9.3 7.8 7 6.6 6.9 8 9.6

2500 1600 900 400 100 0 100 400 9001.

2.

3.

(DY/T) : y = 0.00336 t + 6.535

y = 0.00336 (x – 60)² + 6.535

Exercice 15

Page 23: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

1. Introduction

3 5 10

Y : recette (k€)

150

120

100

80

1.1 Objectifs

2 caractères

⇓Pour chaque individu :

un couple (x, y)

de valeurs

� X et Y sont-elles liées ? � Modéliser la relation � Estimer de nouvelles

valeurs inconnues

Etude

⇓Série de données :

2 variables 12

?

« corrélation »

« prévision »

« ajustement »,

« régression »

X : dépense (k€)

Page 24: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

6. Estimation

1. Trouver l’équation d’une droite (ou courbe) de régres-sion : y’ = ax + b (ou y’ = f(x))

Etude ⇒ X, Y

2. Lire la nouvelle donnéex0 (ou y0)

3. Avec l’équation, calculer sa valeur associée

y’0 (ou x’0)

Méthodologie

1.

2.

3.

6.1 Estimation ponctuelle

Exercice 10

y’ = 7.0629x + 37.42

x0 = 14

y’0 = 136.3 k€

1.

2.

3.

Exercice 7

y’ = 0.07647x + 34.35

y’0 = 60 q/ha

x’0 = 335.4 kg/ha

1.

2.

3.

Exercice 15

y’ = 0.00336 (x – 60)² + 6.535

x0 = 100 km/h

y’0 = 11.91 L/100km

Exercice 19

Page 25: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

1. Introduction

3 5 10

Y : recette (k€)

150

120

100

80

1.1 Objectifs

2 caractères⇓

Pour chaque individu :un couple (x, y)

de valeurs

� X et Y sont-elles liées ? � Modéliser la relation � Estimer de nouvelles valeurs inconnues

Etude

⇓Série de données :

2 variables 12

y’0

« corrélation »

« prévision »

« ajustement »,

« régression »

X : dépense (k€)

Page 26: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

6. Estimation

Droite

R > 0

y’0

2d

eam

plif

.

Amplification : il faut calculer un écart type RELATIF

À l’aide des rapports z = y / y’

2de amplification : l’intervalle bleu donne une estimation à un degré de confiance trop moyen (68,3%). On doit l’amplifier par un facteur u relié à un niveau de confiance plus élevé (ex : 95%)

Page 27: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

6. Estimation

1. a. Calculer les valeurs y’iassociées aux xi du tableau

b. Calculer les valeurs zi = yi/y’id’une nouvelle variable Z

c. Obtenir la moyenne et l’écart type de Z

Méthodologie 1. a.

6.2 Intervalle de confiance

Exercice 10

4. Intervalle : par la formule

3. Avec le niveau de confiance, donner le coefficient u

2. Calculer l’estimation

ponctuelle y’0

b.

1. c. z = 1.000971

σZ = 0.125286

2. y’0 = 136.3 k€

3. niveau de confiance : 95% u = 1.96

( ) ( );z z

y z u y z uα ασ σ′ ′− + 0 0

4.

[136.3(1.000971 – 1.96×0.125286) ;

136.3(1.000971 + 1.96 × 0.125286)]

= [102,8 ; 169,8]

TC – Mathématiques – S2

Exercice 20

Page 28: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

6. Estimation

1. a.

6.2 Intervalle de confiance

Exercice 7

b.1. c. z = 0,9991106

σZ = 0,0472554

2. y’0 = 0,07647x + 34,35= 57,29

3. niveau de confiance : 99% u = 2.58

( ) ( );z z

y z u y z uα ασ σ′ ′− + 0 0

4.

[57,29(0,9991 – 2,58×0,047255) ;

57,29(0,9991 + 2,58×0,047255)]

= [50,25 ; 64,22]

TC – Mathématiques – S2

1. a. Calculer les valeurs y’iassociées aux xi du tableau

b. Calculer les valeurs zi = yi/y’id’une nouvelle variable Z

c. Obtenir la moyenne et l’écart type de Z

Méthodologie

4. Intervalle : par la formule

3. Avec le niveau de confiance, donner le coefficient u

2. Calculer l’estimation

ponctuelle y’0

Exercice 21

Page 29: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

6. Estimation

204050602040506020405060

0.30.30.30.30.60.60.60.60.90.90.90.9

xiyj nij

15

10208

1225185530146

y’ = -0.008430x + 1.0424List5List1 List2 List3 List4

y’i zi z = y/y’

z = 0.9989 σZ = 0.2962

y’0 = -0.008430x + 1.0424 = 0.368

niveau de confiance : 99% u = 2.58

( ) ( );z z

y z u y z uα ασ σ′ ′− + 0 0

= [0.0864 ; 0.6488]

x0 = 80

[0.368(0.9989 – 2.58×0.2962) ;

0.368(0.9989 + 2.58×0.2962)]

Exercice 226.2 Intervalle de confiance

0,8738

0,7052

0,6209

0,5366

0,8738

0,7052

0,6209

0,5366

0,8738

0,7052

0,6209

0,5366

0,3433

0,4254

0,4832

0,5591

0,6867

0,8508

0,9664

1,1182

1,03

1,2763

1,4495

1,6772