Les principaux résumés de la statistique Les résumés de position et de valeur centrale...
-
Upload
alphonsine-duchene -
Category
Documents
-
view
107 -
download
2
Transcript of Les principaux résumés de la statistique Les résumés de position et de valeur centrale...
Les principaux résumés de la statistique
Les résumés de position et de valeur centraleLes résumés de position et de valeur centrale
DESCRIPTIVEDESCRIPTIVE
Année 2005-2006
LA STATISTIQUELA STATISTIQUE
MENU GENERALMENU GENERAL
COURSCOURS
EXERCICEEXERCICE
Veuillez cliquer sur l’un des boutonsVeuillez cliquer sur l’un des boutons
FractalFractal
FINFIN
Menu du coursMenu du cours
Veuillez cliquer sur l’un des boutonsVeuillez cliquer sur l’un des boutons
MENU MENU GENERALGENERAL
Forme des distributions
Dispersion
Valeurs centrales
FractalFractal
Menu des résumés de positions et de valeurs Menu des résumés de positions et de valeurs centralescentrales
Médiane
Mode
Moyenne Arithmétique
Moyenne Géométrique
Moyenne Harmonique
Moyenne quadratique
Veuillez cliquer sur l’un des boutonsVeuillez cliquer sur l’un des boutons
RETOUR RETOUR MENUMENU
Quartiles
Déciles et centiles
Conditions de YULE
FractalFractal
Propriétés souhaitables
RETOUR RETOUR MENUMENU
Les distributions statistiques à une variable sont représentées par un petit nombre d'indicateurs (résumés numériques) qui doivent être représentatifs de la distribution statistique. Il est souhaitable que les paramètres ou résumés numériques possèdent certaines propriétés, appelées conditions de Yule :
•être définis de manière objective,•dépendre de toutes les observations,•avoir une signification concrète,•être facilement calculables et interprétables,•être peu sensibles aux fluctuations d'échantillonnage,•se prêter aisément aux calculs algébriques.
La médiane
La médiane XM d'une distribution statistique est la valeur de la
variable qui partage l'effectif total de la distribution en deux
parties égales, telles que la première moitié des observations soit
inférieures (ou égales) à XM et la seconde moitié soit supérieures
(ou égales) à XM.
DéfinitionDéfinition
RETOUR MENURETOUR MENU
Voir exerciceVoir exercice
La médiane (suite)
X x aF
F Fx a
F
fM i ii
i ii i
i
i= +
−−
⎛
⎝⎜
⎞
⎠⎟ = +
−⎛
⎝⎜
⎞
⎠⎟−
−
−−
−1
1
11
10 5 0 5
, ,
Si (xi , Fi(x)) est la distribution des fréquences cumulées d'une
variable statistique, alors la médiane est donnée par l'équation :
F(XM) = 1/2
Si la variable est continue on effectue une interpolation à l’intérieure de la classe médiane.
Calcul de la médianeCalcul de la médiane
RETOUR RETOUR MENUMENU
Voir exerciceVoir exercice
Les quartiles, déciles et centiles
Les quartiles Q1, Q2, Q3, sont les valeurs d'une série ou d'une distribution statistique rangée par ordre croissant (ou décroissant) qui partagent l'effectif total en quatre parties égales. Si (xi , Fi(x)) représente la distribution de fréquences relatives cumulées d'une variable statistique, alors les quartiles sont donnés par les équations :
F(Q1) = 0.25 F(Q2) = 0.5 F(Q3) = 0.75
Le quartile Q2 d'une variable statistique est égale à la médiane XM
Définition des quartilesDéfinition des quartiles
RETOUR MENURETOUR MENU
Les quantiles (suites)
Les déciles, notés D1, D2, D3 ,..., D9 (resp. les centiles ou percentiles, souvent notés C1, C2, C3,..., C99 ) partagent l'effectif total d'une série ou d'une distribution statistique rangée par ordre croissant (ou décroissant) en dix (resp. cent) parties égales. Si l'on reprend les notations ci-dessus nous avons la relation :
C50 = D5 = Q2 = XM ; C10 = D1 ; C90 = D9 .
Définition des déciles et centilesDéfinition des déciles et centiles
RETOUR RETOUR MENUMENU
Le mode
Définition restrictiveDéfinition restrictive Le mode Xm d'une série ou d'une distribution statistique est la valeur de la variable pour laquelle l'effectif est le plus élevé ; on parle alors de mode absolu.
Définition élargieDéfinition élargie Le mode Xm d'une série ou d'une distribution statistique est la valeur de la variable dont l'effectif ou la fréquence est encadré par deux valeurs qui lui sont inférieures ; on parle alors de mode relatif.
Lorsqu'une série ou une distribution statistique possède un seul mode on dit que la série ou la distribution est unimodale, en possède plusieurs, on dit qu'elle est multimodale
RETOUR MENURETOUR MENU
Voir exerciceVoir exercice
Le mode (suite)
Lorsque les variables sont groupées en classes il est parfois utile de remplacer la notion de classe modale par la notion de mode, pour cela on effectue une interpolation linéaire à l'intérieur de la classe modale ; la détermination se fait de la façon suivante :
Calcul du mode
X x ad
d dm i i= ++
⎛
⎝⎜
⎞
⎠⎟−1
1
1 2
RETOUR RETOUR MENUMENU
Voir exerciceVoir exercice
La moyenne arithmétique
Soit x1, ..., xi, ..., xr les r observations numériques d'une variable
statistique X et soit les effectifs respectifs n1, ..., ni, ..., nr de ces
r valeurs numériques avec :
Définition
Xn x n x n x
n n n
n x
N Nn xi i r r
i r
i ii
i r
i ii
i r
=+ + + ++ + + +
= ==
=
=
=∑∑1 1
1
1
1
1... ...... ...
RETOUR MENURETOUR MENU
Voir exerciceVoir exercice
La moyenne géométrique
loglog ... log ... log
... ...log logG
n x n x n x
n n n Nn x f xi i r r
i ri i
i
i r
i ii
i r
=+ + + +
+ + + += =
=
=
=
=
∑ ∑1 1
1 1 1
1
Soit x1, ..., xi, ..., xr les r observations numériques d'une variable
statistique X et soit les effectifs respectifs n1, ..., ni, ..., nr de ces
r valeurs numériques avec :
DéfinitionDéfinition
RETOUR RETOUR MENUMENU
La moyenne harmonique
Soit x1, ..., xi, ..., xr les r observations numériques d'une variable
statistique X et soit les effectifs respectifs n1, ..., ni, ..., nr de ces
r valeurs numériques avec :
DéfinitionDéfinition
1
1 1 1
111
1 1H
nx
nx
nx
n n n N
n
x
ii
rr
i r
i
ii
i r
=+ + + +
+ + + +=
=
=
∑... ...
... ...
RETOUR MENURETOUR MENU
La moyenne quadratique
Soit x1, ..., xi, ..., xr les r observations numériques d'une variable
statistique X et soit les effectifs respectifs n1, ..., ni, ..., nr de ces
r valeurs numériques avec :
DéfinitionDéfinition
Qn x n x n x
n n n Nn x f xi i r r
i ri
i
i r
i i ii
i r2 1 1
2 2 2
1 1
2 2
1
1=
+ + + ++ + + +
= ==
=
=
=
∑ ∑... ...... ...
RETOUR MENURETOUR MENU
Menu des résumés des valeurs de dispersionMenu des résumés des valeurs de dispersion
Étendue
Variance – écart type
Veuillez cliquer sur l’un des boutonsVeuillez cliquer sur l’un des boutons
RETOUR MENURETOUR MENU
FractalFractal
L’étendue
Les résumés de dispersionLes résumés de dispersion
L'étendue est la mesure la plus simple de la dispersion (ou
variabilité ou étalement) des observations faites sur une
variable. L'étendue ne dépend que très indirectement de
l'ensemble des valeurs xi de la variable X. L'étendue est très
influencée par les valeurs extrêmes de la variable statistique qui
sont parfois aberrantes, ce qui en fait une mesure peu utilisée.
DéfinitionDéfinition
RETOUR MENURETOUR MENU
La variance et l’écart-type
DéfinitionDéfinition
Soit X une variable statistique de distribution (xi, ni) où , on
appelle variance (mesure de dispersion ou de variabilité), notée,
la moyenne arithmétique pondérée des carrés des écarts à la
moyenne arithmétique pondérée :
( )sN
n x XX ii
i r
i2
1
21= −
=
=
∑
( ) ( )s sN
n x X f x XX X ii
i r
i ii
i r
i= = − = −=
=
=
=
∑ ∑2
1
2
1
21
On appelle écart-type de la variable X, noté, la racine carrée de la variance :
Voir exerciceVoir exercice
RETOUR MENURETOUR MENU
Les moments non-centrés d’ordre r
Soit la distribution statistique (xi, ni) où , on appelle moment
non centré d’ordre r de la variable statistique X ,la quantité
définie par :
DéfinitionDéfinition
mN
n np i ip
i
i r
ii
i r
= ==
=
=
=
∑ ∑1
1 1 x avec N
Voir exerciceVoir exercice
RETOUR MENURETOUR MENU
Les moments centrés d’ordre r
( )μp i ip
i
i r
ii
i r
Nn x X n= − =
=
=
=
=
∑ ∑1
1 1
avec N
Soit la distribution statistique (xi, ni) où , on appelle moment
non centré d’ordre r de la variable statistique X ,la quantité
définie par :
DéfinitionDéfinition
Voir exercice p=2Voir exercice p=2
Voir exercice p=3Voir exercice p=3
Voir exercice p=4Voir exercice p=4
RETOUR MENURETOUR MENU
Menu des caractéristiques asymétrie Menu des caractéristiques asymétrie et d’aplatissementet d’aplatissement
Moment non centré
Moment centré
Asymétrie
Aplatissement
Veuillez cliquer sur l’un des boutonsVeuillez cliquer sur l’un des boutons
Présentation
RETOUR MENURETOUR MENU
FractalFractal
Les caractéristiques de forme
RETOUR MENURETOUR MENU
Les différents indicateurs d’asymétrie et d’aplatissement permettent en premier lieu la comparaison entre les distributions statistiques.
• l’asymétrie d’une distribution peut être approchée par une comparaison entre le mode, la médiane et la moyenne arithmétique (vision empirique).• l’aplatissement peut être approchée par l’étude des observations aux alentours du mode. Plus le nombre d’individus ayant une valeur proche du mode de la distribution, plus la courbe sera concentrée et plus l’aplatissement sera faible.
Le coefficient d'asymétrie de Pearson
L'approche de la mesure de l’asymétrie est réalisée grâce à la notion de moment centré.
DéfinitionDéfinition
AP =μμ32
23
Si AP est nul alors la distribution est symétrique. Si AP est
positif alors il y a asymétrie. Le signe est donné par le
moment centré d’ordre 3
Voir asymétrie de Fisher
Voir exerciceVoir exercice
RETOUR MENURETOUR MENU
Le coefficient d'asymétrie de Fisher
A AsF P
X
= = =μμ
μ32
23
33
L'approche de la mesure de l’asymétrie pour Fisher est réalisée à partir de la définition de Pearson.
DéfinitionDéfinition
S’il est calculé directement, alors il est possible d’écrire :
Si AF = 0 alors la distribution est symétrique,
Si AF > 0 alors la distribution est étalée vers la droite,
Si AF < 0 alors la distribution est étalée vers la gauche.
RETOUR MENURETOUR MENU
Le coefficient d'aplatissement de Pearson
APP =μμ4
22
Si APP = 3 alors la distribution est dite « normale » ou mésokurtique
(de mêmes paramètres),,
Si APP < 3 alors la distribution est dite plus aplatie que la « normale » ou platykurtique (de mêmes paramètres),,
Si APP > 3 alors la distribution est dite moins aplatie que la « normale » ou leptokurtique (de mêmes paramètres).
L'approche de la mesure de l’aplatissement est réalisée grâce à la notion de moment centré.
DéfinitionDéfinition
Voir aplatissement de Fisher RETOUR MENURETOUR MENU
Le coefficient d'aplatissement de Fisher
APF = −μμ4
22 3
L'approche de la mesure de l’asymétrie pour Fisher est réalisée à partir de la définition de Pearson.
DéfinitionDéfinition
Si APP = 0 alors la distribution est dite « normale » ou mésokurtique
(de même paramètres),
Si APP < 0 alors la distribution est dite plus aplatie que la « normale » ou platykurtique (de même paramètres),
Si APP > 0 alors la distribution est dite moins aplatie que la « normale » ou leptokurtique (de même paramètres).
Voir exerciceVoir exercice
RETOUR MENURETOUR MENU
Menu exerciceMenu exercice
Veuillez cliquer sur l’un des boutonsVeuillez cliquer sur l’un des boutons
Les calculs
L’histogramme
Les effectifs
Le mode
La médiane
La moyenne
La variance
Les moments - m
Le moment – μ3
Asymétrie
Le moment – μ4
Aplatissement
MENU MENU COURSCOURS
FractalFractal
Age Somme Centre de classe ni x i ni x i _ ni x i3 ni x i4 r
20 à 40 ans 44 30 1320 39600 1188000 35640000 040 à 60 ans 26 50 1300 65000 3250000 162500000 1
60 à 75 ans 20 67,5 1350 91125 6150937,5 415188281 275 ans et plus 10 80 800 64000 5120000 409600000 3
Total 100 4770 259725 15708937,5 1022928281
Présentation d’un exerciceVariable statistique continue groupée en classes
LE TABLEAU DES CALCULS
∑=
=
=ri
iinN
1
∑=
=
ri
iii xn
1
∑=
=
ri
iii xn
1
2
L’ensemble de ces sommes permettent de déterminer les principaux résumés : moyenne, variance, moments, asymétrie et aplatissement
r est le nombre de classesMENU EXERCICE
∑=
=
ri
iii xn
1
3
∑=
=
ri
iii xn
1
4
211 +− +
= iii
xxx
xi est la borne de classe ni est l’effectif de classe
L’histogramme
Age Somme Centre de classe Amplitude rapport correction20 à 40 ans 44 30 20 4 11,040 à 60 ans 26 50 20 4 6,560 à 75 ans 20 67,5 15 3 6,775 à 85 ans 10 80 10 2 5,0
0,0
2,0
4,0
6,0
8,0
10,0
12,0
20 à 40 ans 40 à 60 ans 60 à 75 ans 75 à 85 ans
HISTOGRAMME
Mode
L’amplitude de base est de 5 unités
MENU EXERCICE
Age Somme Centre de classe ni x i ni x i _ ni x i3 ni x i4 r
20 à 40 ans 44 30 1320 39600 1188000 35640000 040 à 60 ans 26 50 1300 65000 3250000 162500000 1
60 à 75 ans 20 67,5 1350 91125 6150937,5 415188281 275 ans et plus 10 80 800 64000 5120000 409600000 3
Total 100 4770 259725 15708937,5 1022928281
La somme des effectifs ou effectif total
Cette somme correspond au nombre d’individus de l’échantillon ou qui ont un age entre 20 ans et plus de 75 ans C’est l’effectif total.
MENU EXERCICE
∑=
=
=ri
iinN
1
ni est l’effectif de classe
Age Somme Centre de classe ni x i ni x i _ ni x i3 ni x i4 r
20 à 40 ans 44 30 1320 39600 1188000 35640000 040 à 60 ans 26 50 1300 65000 3250000 162500000 1
60 à 75 ans 20 67,5 1350 91125 6150937,5 415188281,3 275 ans et plus 10 80 800 64000 5120000 409600000 3
Total 100 4770 259725 15708937,5 1022928281,3
Le mode (regroupement en classe)
Le mode XM d'une série ou d'une distribution statistique est la valeur de la variable pour laquelle l'effectif est le plus
élevé. Ici la distribution est unimodale. FAIRE LE CALCUL SUR LES EFFECTIFS CORRIGES
⎟⎟⎠
⎞⎜⎜⎝
⎛
++= −
21
11
dd
daxX iiM
Le mode n’existe pas. Nous avons un intervalle modal. Néanmoins, nous pouvons calculer une valeur qui par définition est obtenue par :
La classe modale
ansX M 2,342,14205,411
11.2020 =+=⎟
⎠
⎞⎜⎝
⎛+
+=MENU EXERCICE
La médiane
Age Somme Centre de classe ni x i ni x i _ ni x i3 ni x i4 Ni
20 à 40 ans 44 30 1320 39600 1188000 35640000 44
40 à 60 ans 26 50 1300 65000 3250000 162500000 7060 à 75 ans 20 67,5 1350 91125 6150937,5 415188281 90
75 ans et plus 10 80 800 64000 5120000 409600000 100Total 100 4770 259725 15708937,5 1022928281
La classe médianeLa médiane Xm d'une distribution statistique est la valeur de la variable qui partage l'effectif total
de la distribution en deux parties égales, telles que la première moitié des observations soit
inférieures (ou égales) à Xm et la seconde moitié soit supérieures (ou égales) à Xm.
⎟⎟⎠
⎞⎜⎜⎝
⎛
−−
+=−
−−
1
11
)2/(
ii
iiim NN
NNaxX
ansX m 62.4462.4404470
44502040 =+=⎟
⎠
⎞⎜⎝
⎛−−
+=
Effectifs cumulés croissants
DéfinitionDéfinition
MENU EXERCICE
Age Somme Centre de classe ni x i ni x i _ ni x i3 ni x i4 r
20 à 40 ans 44 30 1320 39600 1188000 35640000 040 à 60 ans 26 50 1300 65000 3250000 162500000 1
60 à 75 ans 20 67,5 1350 91125 6150937,5 415188281 275 ans et plus 10 80 800 64000 5120000 409600000 3
Total 100 4770 259725 15708937,5 1022928281
La moyenne arithmétique
Le rapport de ces deux quantités donne la moyenne arithmétique de la
distribution statistique
On obtient la moyenne arithmétique :
∑∑ =
=
=
= ==++++++++
=ri
iii
ri
iii
ri
rrii xnNN
xn
nnn
xnxnxnX
1
1
1
11 1
......
......
annéesxnN
Xri
iii 7,47
100
47701 1
0
=== ∑−=
=
MENU EXERCICE
∑=
=
ri
iii xn
1
∑=
=
=ri
iinN
1
Age Somme Centre de classe ni x i ni x i _ ni x i3 ni x i4 r
20 à 40 ans 44 30 1320 39600 1188000 35640000 040 à 60 ans 26 50 1300 65000 3250000 162500000 1
60 à 75 ans 20 67,5 1350 91125 6150937,5 415188281 275 ans et plus 10 80 800 64000 5120000 409600000 3
Total 100 4770 259725 15708937,5 1022928281
La variance ou dispersion
Le rapport de ces deux quantités donne la variance de la distribution statistique.
On obtient :
On obtient : 221
0
2 1Xxn
Ns i
ri
iiX −= ∑
−=
=
( )21
0
2 1Xxn
Ns i
ri
iiX −= ∑
−=
=
222 )(96,327)7,47(100
259725anssX =−=
ansXxnN
s i
ri
iiX 94,1796,327
1 221
0
2 ==−= ∑−=
=
Voir également moment centré 2 MENU EXERCICE
∑=
=
=ri
iinN
1
∑=
=
ri
iii xn
1
2
Age Somme Centre de classe ni x i ni x i _ ni x i3 ni x i4
20 à 40 ans 44 30 1320 39600 1188000 3564000040 à 60 ans 26 50 1300 65000 3250000 162500000
60 à 75 ans 20 67,5 1350 91125 6150937,5 415188281,375 ans et plus 10 80 800 64000 5120000 409600000
Total 100 4770 259725 15708937,5 1022928281
Moments non centré d’ordre 2, 3 et 4
Moment non centré d’ordre ssi
ri
iis xn
Nm ∑
=
=
=1
1
( ) 22 )(25,2597259725
100
1ansm ==
33 )(37,157089
100
5,15708937ansm ==
44 )(81,10229282
100
1022928281ansm ==
MENU EXERCICE
2212
221
0
2 )(96,3271
ansmmXxnN
s i
ri
iiX =−=−= ∑
−=
=
Age Somme Centre de classe ni x i ni x i _ ni x i3 ni x i4
20 à 40 ans 44 30 1320 39600 1188000 3564000040 à 60 ans 26 50 1300 65000 3250000 162500000
60 à 75 ans 20 67,5 1350 91125 6150937,5 41518828175 ans et plus 10 80 800 64000 5120000 409600000
Total 100 4770 259725 15708937,5 1022928281
Le moment centré d’ordre 2
Le moment centré d’ordre : correspond à la variance
La variance est un moment non centré d’ordre 2 moins un moment non centré d’ordre 1 élevé au carré.
221
02 )(25,2597
1ansxn
Nm i
ri
ii == ∑
−=
=
annéesxnN
Xmri
iii 7,47
1 1
01 === ∑
−=
=
MENU EXERCICE
Age Somme Centre de classe ni x i ni x i _ ni x i3 ni x i4
20 à 40 ans 44 30 1320 39600 1188000 3564000040 à 60 ans 26 50 1300 65000 3250000 162500000
60 à 75 ans 20 67,5 1350 91125 6150937,5 41518828175 ans et plus 10 80 800 64000 5120000 409600000
Total 100 4770 259725 15708937,5 1022928281
Le moment centré d’ordre 3
CalculCalcul
312133 23 mmmm +−=μEn fonction des moments non centrésEn fonction des moments non centrés
56,248566,21706247,37166637,1570893 =+−=μ
33 )(56,2485 ans=μ
SolutionSolution
MENU MENU EXERCICEEXERCICE
Age Somme Centre de classe ni x i ni x i _ ni x i3 ni x i4
20 à 40 ans 44 30 1320 39600 1188000 3564000040 à 60 ans 26 50 1300 65000 3250000 162500000
60 à 75 ans 20 67,5 1350 91125 6150937,5 41518828175 ans et plus 10 80 800 64000 5120000 409600000
Total 100 4770 259725 15708937,5 1022928281
Le moment centré d’ordre 4
En fonction des moments non centrésEn fonction des moments non centrés412
213144 364 mmmmmm −+−=μ
CalculCalcul
0,1827798,155308337,354569818,299726518,102292824 =−+−=μ
44 )(182779 ans=μ
SolutionSolution
MENU EXERCICE
Age Somme Centre de classe ni x i ni x i _ ni x i3 ni x i4
20 à 40 ans 44 30 1320 39600 1188000 3564000040 à 60 ans 26 50 1300 65000 3250000 162500000
60 à 75 ans 20 67,5 1350 91125 6150937,5 41518828175 ans et plus 10 80 800 64000 5120000 409600000
Total 100 4770 259725 15708937,5 1022928281
Asymétrie de Pearson
Le coefficient de PearsonLe coefficient de Pearson 32
23
μμ
=PA
Coefficient sans dimensionCoefficient sans dimension
CalculCalcul175,0
5,35274643
48,6178013==PA
Décision :Décision :
La distribution est asymétrique étalée vers la droite. Le coefficient est positif (asymétrie) et le moment centré d’ordre 3 est positif (étalée vers la droite ou oblique à gauche)
MENU EXERCICE
Age Somme Centre de classe ni x i ni x i _ ni x i3 ni x i4
20 à 40 ans 44 30 1320 39600 1188000 3564000040 à 60 ans 26 50 1300 65000 3250000 162500000
60 à 75 ans 20 67,5 1350 91125 6150937,5 41518828175 ans et plus 10 80 800 64000 5120000 409600000
Total 100 4770 259725 15708937,5 1022928281
Aplatissement de Fisher
Le coefficient de FisherLe coefficient de Fisher
Coefficient sans dimensionCoefficient sans dimensionCalculCalcul
30,1376,107557
0,182779−=−=PAP
322
4 −=μμ
FAP
Décision :Décision :
La distribution est plus aplatie que la loi normale de mêmes paramètres. La distribution est « platykurtique ». Les paramètres sont ici :
anssX 94,17=ansX 7,47= MENU EXERCICE
Fin des définitions & Graphiques
MENU MENU GENERALGENERAL
Année 2005-2006
LA STATISTIQUELA STATISTIQUE
DESCRIPTIVEDESCRIPTIVE