TC – Mathématiques – S2
1. Introduction
3 5 10
Y : recette (k€)
150
120
100
80
1.1 Objectifs
2 caractères
⇓Pour chaque individu :
un couple (x, y)
de valeurs
� X et Y sont-elles liées ? � Modéliser la relation � Estimer de nouvelles
valeurs inconnues
Etude
⇓Série de données :
2 variables 12
?
« corrélation »
« prévision »
« ajustement »,
« régression »
X : dépense (k€)
TC – Mathématiques – S2
1. Introduction 1.2 Mises en forme
� Séries « listes »
quantité d'engrais
production recueillie
parcelle n°
X (kg.ha-1) Y (q.ha-1)
1 150 462 80 373 120 464 220 515 100 43
X : année 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017
Y : dépense 41 60 55 66 87 61 90 95 82 120 125 118
Série chronologique
� Tableaux de contingence
X : âge
20 40 50 60
Y : acuité
3/10 1 5 10 20
6/10 8 12 25 18
9/10 55 26 14 6
TC – Mathématiques – S2
� Séries
« listes »
X : année 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017
Y : dépense 41 60 55 66 87 61 90 95 82 120 125 118
Série de données xi et yi
Ensemble de points Mi(xi ; yi)
« nuage de points »
1. Introduction 1.3 Nuage de points
TC – Mathématiques – S2
1. Introduction 1.3 Nuage de points
� Tableaux de contingence
X : âge
20 40 50 60
Y : acuité
3/10 1 5 10 20
6/10 8 12 25 18
9/10 55 26 14 6
TC – Mathématiques – S2
2. Test d’indépendance du Khi-deux
Exemple d’approche
1. Résultats d’un échantillon
de 8 hommes et 12 femmes :
Evaluer la différence entre observation et théorie par un paramètre global : χ²calc
Ce paramètre est le χ²calc de
l’expérience.Calculer un χ² : (obs – th)² / th
Deux variables sont croisées.
Ex : Hypothèse à tester, H0 : « genre et QI sont indépendants (dans la population) »
<100 >100
F 3 9 12
H 6 2 8
9 11 20
2. Résultats théoriquement
attendus (sous H0) :
<100 >100
F 12
H 8
9 11 20
5,4 6,6
3,6 4,4
3. Différences :
χ² partiels et χ² total
<100 >100
F
H
1,067 0,873
1,6 1,309
L’hypothèse à tester est celle de leur indépendance.
4,85
TC – Mathématiques – S2
Quelle que soit l’expérience et sous l’hypothèse nulle « H0 » (ex : « sexe et QI indépendants »),
on sait donner la probabilité que telle valeur du χ² soit (ou ne soit pas) dépassée.
densité de
probabilité
valeurs possibles
du χ² d’un
échantillon en cas
d’indépendance
0 4,85
97,23 %
2,77 %
notre exemple
La loi du χ²
la réalité
densité de
probabilité
valeurs
possibles
du χ²0 4,85
? %
? %
notre
exemple
vos possibilités
6,6
4
1%
5,4
1
2%
3,8
4
5%
2,7
1
10%
2. Test d’indépendance du Khi-deux
TC – Mathématiques – S2
1. On teste l’hypothèse nulle d’indépendance « H0 » (ex : « sexe et QI indépendants »).
densité de
probabilité
0 χ²calc
2. Le χ² de l’expérience décrite est calculé : χ²calc.
3. On situe notre χ²calc en probabilité grâce au formulaire.
Objectif : peut-on se permettre de la rejeter ?
Objectif : évaluer son importance, dans l’hypothèse H0
Objectif : le comparer aux χ² donnés par le formulaire
Test d’indépendance à r lignes et k colonnes :
ddl = (r – 1)(k – 1)
4. Selon le seuil de risque α choisi, une
décision est prise (rejet ou non-rejet de H0).
Méthodologie
2. Test d’indépendance du Khi-deux
5,3
χ²calc
TC – Mathématiques – S2
1. Hypothèse nulle « H0 » : sexe et rapport au tabac sont indépendants.
densité de probabilité
0
??
2. χ²calc =
3. nombre de ddl : (3-1)(2-1) = 2
valeurs du formulaire
9,2
1
1%
7,8
2
2%
5,9
9 5%
4,6
1
10%
4. Au seuil de 10% , on peut rejeter H0.
seuil de risque : α = 10%
χ²lim = 4,61
5,3
Sh Sf
Tj 12 23Tf 31 26Ta 8 17
35
57
25
11751 66
Sh Sf
Tj 35
Tf 57
Ta 25
51 66 117
distribution observée distribution théorique sous H0
15,26
10,9032,1514,10
24,8519,74
Sh Sf
Tj
Tf
Ta
valeurs des χ²
0,695071,524170,77038
0,537101,177770,59529
5,300
4,6
1
10%
Exercice 1
2. Test d’indépendance du Khi-deux
3.1 Moyennes mobiles
TC – Mathématiques – S2
3. Ajustement, Mayer
Exercice 6
x : 1 à 16
3. Ajustement, Mayer
3.2 Problématique de l’ajustement linéaire
Une infinité de formes possibles pour un nuage de points.
Parfois, une droite le représente correctement. « ajustement linéaire »
Dans d’autres cas, c’est une courbe. « ajustement non linéaire »
TC – Mathématiques – S2
3.2 Problématique de l’ajustement linéaire
Une fois une droite tracée :
Dans le nuage de points :
Par définition du point Mi,
xi et yi sont associés.
xi
yi
y’i
A xi est associé y’i = axi + b
Définition : on appelle résidu le nombre ei = yi – y’i
ei
ei > 0 : Mi au-dessus de la droite ei < 0 : Mi en-dessous de la droite
(D) : droite de régression (ou d’ajustement) ; déterminer (D) : faire un ajustement linéaire.
TC – Mathématiques – S2
3. Ajustement, Mayer
1. Partager équitablement le nuage (de gauche à
droite)
2. Déterminer G1 et G2, points moyens des demi-
nuages
3. (D) = (G1G2)
3.3 Méthode de Mayer
Principe de Mayer :1
0n
i
i=
=∑e
Equivalent à : G ∈ (D)
Méthode de Mayer (trouver une droite cohérente) :
G1
G2
GG
A noter :
Dans tous les
cas, G ∈ (G1G2).
Ainsi, (D) est une
droite de Mayer.
(D)
TC – Mathématiques – S2
3. Ajustement, Mayer
3.3 Méthode de Mayer
1
1
80 100 120100
3
37 43 4642
3
x
y
+ += =
+ += =
G
G
engrais récolte
(kg.ha-1) (q.ha-1)
1 150 46
2 80 37
3 120 46
4 220 51
5 100 43
80
100
120
x : engrais
(kg/ha)
y : récolte
(q/ha)
40
80 150
60
50
30220120
×
×
×
×
××
G1
×
G2
DM
2
2
150 220185
2
46 5148,5
2
x
y
+= =
+= =
G
G
;1 1
48,5 420,07647 34,35
185 100y x
−= ≈ = − ≈− G G
a b a
TC – Mathématiques – S2
3. Ajustement, Mayer
Exercice 7
3.3 Méthode de Mayer
Droite de Mayer
...
...
1
1
1 2 84,5
8
28 45 4040
8
x
y
+ + += =
+ + += =
G
G
...
...
2
2
9 10 1612,5
8
28 46 3941,125
8
x
y
+ + += =
+ + += =
G
G
TC – Mathématiques – S2
3. Ajustement, Mayer
Exercice 8
×
G1
×
G2
N N+1 N+2 N+3
tri1 tri2 tri3 tri4 tri1 tri2 tri3 tri4 tri1 tri2 tri3 tri4 tri1 tri2 tri3 tri4
(M€) 28 45 49 36 30 44 48 40 28 46 52 37 31 42 54 39
4.1 Paramètres des séries à deux variables
TC – Mathématiques – S2
Moyennesn
i
i
x
xn
==∑
1
n
i
i
y
yn
==∑
1
Variances
( )
r
i
i
x
X xn
== −∑
2
21V
( )2
1 2V
k
j
j
y
Y yn
== −∑
Covariance
( ), 1
n
i i
i
x y
Cov X Y x yn
== −∑
Ecarts types
( ) ( )VX Xσ =
( ) ( )VY Yσ =
Sur calculatrice
X : List 1
Y : List 2
(nij : List 3)
Saisir CALC >
SET
CALC >
2Var
CALC >
Stat2Var L1,L2(,L3)
Résultats
, , , ,
, , , ,
2
2
X
Y
x x x
y y y n
xy
σ
σ∑ ∑
∑ ∑
∑
4. Ajustement, moindres carrés
4.1 Paramètres des séries à deux variables
Cov(X,Y) = 203,6
TC – Mathématiques – S2
4. Ajustement, moindres carrés
Exercice 9
engrais récolte
(kg.ha-1) (q.ha-1)
1 150 46
2 80 37
3 120 46
4 220 51
5 100 43
YX [15 ; 25[ [25 ; 50[ 50 et plus
aucune 4 6 13
1 à 11 10 16 15
12 à 23 13 8 4
≥ 24 6 3 2
E(X) = 134
Σx = 670
Σx² = 101700
σX = 48,826
V(X) = 2384
E(Y) = 44,6
Σy = 223
Σy² = 10051
σY = 4,5869
V(Y) = 21,04
Σxy = 30900
E(X) = 39,375
Σx = 3937,5
Σx² = 182006,25
σX = 16,422
V(X) = 269,67
E(Y) = 10,795
Σy = 1079,5
Σy² = 23388,25
σY = 10,833
V(Y) = 117,35
Cov(X,Y) = -56,15
Σxy = 36890
A. La droite de régression est unique
B. Dans tous les cas, G ∈ (D)
C.
4.2 Méthode des moindres carrés
Principe :
n
i
i=∑
2
1
e Equivalent à : formules de a et b
Résultats :
G
est minimale
( )( )
,Cov X Y
X=
Va y x= −b a
(D)
TC – Mathématiques – S2
4. Ajustement, moindres carrés
4.2 Méthode des moindres carrés
V(X) =
1 2 3 4 5 6 7 8 9 10 11 12année (1 : 2006)
dépense
(k€)
120
100
80
60
40 +
++
+
+
+
++
+
++
+
CALC >
REG > X
CALC >
LinReg L1,L2
11,91667 V(Y) = 701,3889
Cov(X,Y) = 84,1667
( )( )
,Cov X Y
X= ≈ 7,0629
Va ≈ 37,42b
(D) : y = 7,0629x + 37,42
(D)
TC – Mathématiques – S2
4. Ajustement, moindres carrés
Exercice 10
4.3 Coefficient de corrélation linéaire
0.75 < r < 1
( )( ) ( )
,X Y
X Yρ
σ σ= = =
Covr R
0 < r < 0.5 -0.75 < r < -0.5 -0.5 < r < 0
-1 < r < -0.75 -0.5 < r < 0.5 0.5 < r < 0.75 0 < r < 0.5
TC – Mathématiques – S2
4. Ajustement, moindres carrés
4.3 Coefficient de corrélation linéaire
TC – Mathématiques – S2
4. Ajustement, moindres carrés
TC – Mathématiques – S2
5. Ajustement non linéaire
1. remplacement
de X ou Y par une
autre variable
(T ou U)
Etude ⇒ X, Y
2. corrélation linéaire
après remplacement
3. modèle final de la
relation entre X et Y
Méthodologie
3.
(DY/T) : y = 1.02526 t + 3.856
y = 1.02526 x² + 3.856
X 2 3 5 8Y 9 13 28 70
1. On propose le changement de variable T = X².
Exemple
T 4 9 25 64Y 9 13 28 70
2. Ici, il s’agit de déterminer une équation de droite de type y = at + b.
Ex avec la méthode des moindres carrés, calculatrice en mode Stat :
TC – Mathématiques – S2
5. Ajustement non linéaire
1. remplacement
de X ou Y par une
autre variable
(T ou U)
Etude ⇒ X, Y
2. corrélation linéaire
après remplacement
3. modèle final de la
relation entre X et Y
Méthodologie
X 10 20 30 40 50 60 70 80 90
T
Y 15.2 11.6 9.3 7.8 7 6.6 6.9 8 9.6
2500 1600 900 400 100 0 100 400 9001.
2.
3.
(DY/T) : y = 0.00336 t + 6.535
y = 0.00336 (x – 60)² + 6.535
Exercice 15
TC – Mathématiques – S2
1. Introduction
3 5 10
Y : recette (k€)
150
120
100
80
1.1 Objectifs
2 caractères
⇓Pour chaque individu :
un couple (x, y)
de valeurs
� X et Y sont-elles liées ? � Modéliser la relation � Estimer de nouvelles
valeurs inconnues
Etude
⇓Série de données :
2 variables 12
?
« corrélation »
« prévision »
« ajustement »,
« régression »
X : dépense (k€)
TC – Mathématiques – S2
6. Estimation
1. Trouver l’équation d’une droite (ou courbe) de régres-sion : y’ = ax + b (ou y’ = f(x))
Etude ⇒ X, Y
2. Lire la nouvelle donnéex0 (ou y0)
3. Avec l’équation, calculer sa valeur associée
y’0 (ou x’0)
Méthodologie
1.
2.
3.
6.1 Estimation ponctuelle
Exercice 10
y’ = 7.0629x + 37.42
x0 = 14
y’0 = 136.3 k€
1.
2.
3.
Exercice 7
y’ = 0.07647x + 34.35
y’0 = 60 q/ha
x’0 = 335.4 kg/ha
1.
2.
3.
Exercice 15
y’ = 0.00336 (x – 60)² + 6.535
x0 = 100 km/h
y’0 = 11.91 L/100km
Exercice 19
TC – Mathématiques – S2
1. Introduction
3 5 10
Y : recette (k€)
150
120
100
80
1.1 Objectifs
2 caractères⇓
Pour chaque individu :un couple (x, y)
de valeurs
� X et Y sont-elles liées ? � Modéliser la relation � Estimer de nouvelles valeurs inconnues
Etude
⇓Série de données :
2 variables 12
y’0
« corrélation »
« prévision »
« ajustement »,
« régression »
X : dépense (k€)
TC – Mathématiques – S2
6. Estimation
Droite
R > 0
y’0
2d
eam
plif
.
Amplification : il faut calculer un écart type RELATIF
À l’aide des rapports z = y / y’
2de amplification : l’intervalle bleu donne une estimation à un degré de confiance trop moyen (68,3%). On doit l’amplifier par un facteur u relié à un niveau de confiance plus élevé (ex : 95%)
6. Estimation
1. a. Calculer les valeurs y’iassociées aux xi du tableau
b. Calculer les valeurs zi = yi/y’id’une nouvelle variable Z
c. Obtenir la moyenne et l’écart type de Z
Méthodologie 1. a.
6.2 Intervalle de confiance
Exercice 10
4. Intervalle : par la formule
3. Avec le niveau de confiance, donner le coefficient u
2. Calculer l’estimation
ponctuelle y’0
b.
1. c. z = 1.000971
σZ = 0.125286
2. y’0 = 136.3 k€
3. niveau de confiance : 95% u = 1.96
( ) ( );z z
y z u y z uα ασ σ′ ′− + 0 0
4.
[136.3(1.000971 – 1.96×0.125286) ;
136.3(1.000971 + 1.96 × 0.125286)]
= [102,8 ; 169,8]
TC – Mathématiques – S2
Exercice 20
6. Estimation
1. a.
6.2 Intervalle de confiance
Exercice 7
b.1. c. z = 0,9991106
σZ = 0,0472554
2. y’0 = 0,07647x + 34,35= 57,29
3. niveau de confiance : 99% u = 2.58
( ) ( );z z
y z u y z uα ασ σ′ ′− + 0 0
4.
[57,29(0,9991 – 2,58×0,047255) ;
57,29(0,9991 + 2,58×0,047255)]
= [50,25 ; 64,22]
TC – Mathématiques – S2
1. a. Calculer les valeurs y’iassociées aux xi du tableau
b. Calculer les valeurs zi = yi/y’id’une nouvelle variable Z
c. Obtenir la moyenne et l’écart type de Z
Méthodologie
4. Intervalle : par la formule
3. Avec le niveau de confiance, donner le coefficient u
2. Calculer l’estimation
ponctuelle y’0
Exercice 21
TC – Mathématiques – S2
6. Estimation
204050602040506020405060
0.30.30.30.30.60.60.60.60.90.90.90.9
xiyj nij
15
10208
1225185530146
y’ = -0.008430x + 1.0424List5List1 List2 List3 List4
y’i zi z = y/y’
z = 0.9989 σZ = 0.2962
y’0 = -0.008430x + 1.0424 = 0.368
niveau de confiance : 99% u = 2.58
( ) ( );z z
y z u y z uα ασ σ′ ′− + 0 0
= [0.0864 ; 0.6488]
x0 = 80
[0.368(0.9989 – 2.58×0.2962) ;
0.368(0.9989 + 2.58×0.2962)]
Exercice 226.2 Intervalle de confiance
0,8738
0,7052
0,6209
0,5366
0,8738
0,7052
0,6209
0,5366
0,8738
0,7052
0,6209
0,5366
0,3433
0,4254
0,4832
0,5591
0,6867
0,8508
0,9664
1,1182
1,03
1,2763
1,4495
1,6772
Top Related