Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST...

48
Statistique Descriptive Chapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : www.el-mouatasim.webs.com

Transcript of Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST...

Page 1: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Statistique DescriptiveChapitre 2: Paramètres de tendance centrale

Pr. Abdelkrim EL MOUATASIM

EST & FSE de Guelmim

Maroc

Site internet : www.el-mouatasim.webs.com

Page 2: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Les paramètres statistiques ont pour but de résumer, à partir de quelques nombres clés, l'essentiel de l'information relative à l'observation d'une variable quantitative.

Page 3: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Principales grandeurs économiques du

secteur industriel dérivé de la pêche

Indicateurs A terre En mer

Effective unités 391 353

Effective emplois 70 000 10 000

Production (en tonne) 343 000 64 500

Chiffre d’affaires (en Dh) 11 milliards 3,7 milliards

Source: Etude des schémas régionaux d’aménagement du territoire des provinces du sud, 2010.

Page 4: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

On définira plusieurs sortes de paramètres : Certains, comme la moyenne, seront dits de

tendance centrale car ils représentent une valeur numérique autour de laquelle les observations sont réparties.

D'autres, par exemple, seront dits de dispersion car ils permettent de résumer le plus ou moins grand étalement des observations de part et d'autre de la tendance centrale.

Page 5: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Objectifs de ce chapitre

Pouvoir résumer une série de données par un ou plusieurs paramètres représentatifs (moyenne, médiane…)

Statistiques descriptives à une variable : paramètres de position

Page 6: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Plan de la partie

1. Mode. 2. Médiane.3. Moyennes.

Voici les chapitres que nous allons aborder :

Paramètres de tendance centrale

Page 7: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Introduction

Les tableaux et graphiques contiennent la totalité des données : ils sont parfois durs à interpréter.

On va chercher à résumer les données par quelques valeurs numériques.

Dans cette partie, on s’intéresse aux paramètres de tendance centrale, i.e. aux paramètres mesurant le « centre » des séries statistiques.

Page 8: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

2.1 Le mode (Mo)

Cas d'une variable discrète : Le mode est facilement repérable. Sur le tableau statistique, c'est la valeur xi pour laquelle la fréquence est la plus élevée

C'est la valeur dont la fréquence est la plus élevée.

Détermination du mode :

Page 9: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Exemple

Soit la série de chiffres

{8, 8, 8, 7, 4, 4, 4, 4, 4, 5, 5, 5, 5, 6}

La valeur la plus fréquente est le 4

Mode

Page 10: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Cas d'une variable continue :

les données sont groupées en classes ; on définit la classe modale comme la classe correspondant à la fréquence la plus élevée ni. En peut calculer le Mode par la formule suivante:

Borne inférieure de la classe modale Amplitude de classe d1=ni –ni-1 et d2=ni –ni+1

21

1infi dd

daxMo

Page 11: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Exemple : Le Mode Exemple : Le Mode (valeurs groupées) (valeurs groupées)

[0.08,0.25] est la classe modale pour le débit .D’après la formule de le modeMo = 0.08 + a(d1/(d1+d2))avec a = 0.25-0.08 = 0.17 d1 = 22-0 = 22 et d2 = 22-8 = 14donc Mo = 0.08 + 0.17*22/36 = 0.184

Page 12: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Si la distribution présente 2 ou plus maxima relatifs, on dit qu'elle est bimodale ou plurimodale.

Si la série n’a qu’un seul mode, elle est dite unimodale.

On peut définir de même le mode pour un caractère qualitatif.

Page 13: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .
Page 14: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

2.2 La médiane : Me

Si la série brute des valeurs observées est triée par ordre croissant :

La médiane Me d’un série statistique est la valeur qui partage cette série en deux séries de même effectif.

Page 15: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .
Page 16: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

c'est-à-dire que Si n est impair, soit n = 2 p + 1 ,

Me = x(p+1)

Si n est pair, soit n = 2 p, toute valeur de l'intervalle médian [ x(p) ; x(p+1) ] répond à la question.Afin de définir Me de façon unique, on choisit souvent

soit le centre de l'intervalle médian.

Page 17: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Par exemple, la médiane de la série de tailles ci-contre est : Me = (m)

Aurait-elle été différente si on avait noté par erreur la plus petite taille 0.55 m au lieu de 1.55 ?

Page 18: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

* Cas d'une variable continue:

Pour des données groupées en classes, la classe médiane est la classe qui contient la médiane. On détermine la médiane par interpolation linéaire.

Page 19: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

De manière générale, si a et b sont les bornes de la classe contenant la médiane, F(a) et F(b) les valeurs de la fréquence cumulée croissante en a et b, alors

Page 20: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Dans le cas d'une variable groupée en classes, en peut

calculer la médiane par la formule suivante :

ni

Nn

aiMe

i

L)

2( 1

0

Lo : Limite inférieure de la classe médiane

ai : Amplitude de la classe médiane

n : Nombre total des observations

Ni‑1 effectif cumulé croissant de la classe inférieure à la classe médiane

ni : effectif de la classe médiane

Page 21: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Salaire horaire ni ni cumulées croissantes 2-4 5 5 4-6 8 13 6-8 12 25 8-10 10 34 10-12 8 43 Total 43

La médiane est la valeur de rang (43 + 1) / 2 c’est à dire 22, celle ci se trouve dans la classe 6‑8, la classe 6 ‑ 8 est donc la classe médiane.

Me = 6 + 2(21.5 +13)/12

Page 22: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .
Page 23: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Moyenne Arithmétique

Appelée moyenne notée Paramètre central qui concerne bien évidemment

uniquement des variables quantitatives. Dans l’unité de la variable. Calculable quelque soit la loi qui régit la distribution. Suivant la forme de présentation des observations,

différentes formules de calcul peuvent être employées.

Population m (mean) Echantillon x (average)

x

Page 24: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Moyenne arithmétique

On note : n : Nombre total de

mesures. k : Nombre de valeurs

différentes observées.

ni : Nombre d’occurrences de la valeur observée i.

fi : Fréquence relative (pourcentage) de la valeur observée i.

k

1iii

k

1iii

k

1iii

n

1ii

k

1ii

ii

k

1ii

xfn

Tx

xfnxnxT

1fn

nfnn

Page 25: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

2.3 La moyenne arithmétique

La moyenne arithmétique d'une série statistique (xi, ni) se calcule de la manière suivante :

La moyenne s'exprime toujours dans la même unité que les observations xi . Elles peut être

décimale, même si les xi sont entiers par nature.

Page 26: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Ainsi la moyenne arithmétique du nombre d'appels reçus à un standard est : 2,97

appels

Nombre d'appels xi

Fréquences relative f i

% f i x 100

0 0.0208 2.08

1 0.1458 14.58

2 0.2396 23.96

3 0.2500 25.00

4 0.1875 18.75

5 0.0938 9.38

6 0.0625 6.25

Total : 1 100

Page 27: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Classes de valeur

Eff ectif s Centre de classe

[ e1 e2 [ n1 x1

[ e2 e3 [ n2 x2

... ... ...

[ ei ei+1 [ ni xi = ei + ei+1 / 2

... ... ...

[ eK eK+1 [ nK xK

Total : n

Plus généralement, lorsqu'on ne dispose que de la distribution regroupée en classes

Page 28: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

on calculera la moyenne par :

xi étant le centre de classe.

Page 29: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Exemple

Soit la série correspondant aux tailles en cm de 6 étudiants : 160,170,180,180, 190, 200.

n = 6; T = 160+170+180+180+190+200 = 1080

cm 1806

1080x

Page 30: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

nombre d'enfants

(xi)

nombre de familles

(ni) ni*xi

0 10 01 20 202 15 303 5 154 3 12

Total 53 77

Le nombre de familles enquêtées est de 53.Le nombre total d’enfants est de 77.

La moyenne du nombre d’enfants par famille est de 77/53 = 1,45.

Attention aux arrondis ici si on arrondit à une décimale la moyenne est de 1,5 enfants par famille.

Exemple

Page 31: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Remarque 1:

Pour plusieurs populations d'effectifs n1, n2, ....., nk, de moyennes respectives :

moyenne globale = moyenne des moyennes

Page 32: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Comparons le salaire moyen dans 2 entreprises

Entreprise A : 1/ 3 de femmes , salaire moyen 8000Dh 2/3 hommes, salaire moyen 11000Dans l'entreprise A le salaire moyen est de : ….

Entreprise B : 2/ 3 de femmes , salaire moyen 9000Dh 1/3 hommes, salaire moyen 12000Dans l'entreprise B le salaire moyen est de : ….

Page 33: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

On constate donc que le salaire moyen de B est égal à celui de A. Pourtant le salaire moyen des hommes est supérieur en B à celui des hommes en A. Il en est de même pour les femmes.

D'où vient ce résultat paradoxal ? Il s'agit d'un effet de structure : cela vient

du fait que les femmes (au salaire plus bas) sont plus nombreuses en B qu'en A.

Page 34: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Les étudiants de première année de L1 santé sont répartis dans 3 amphithéâtres avec les données ci-dessous. Quelle est la moyenne de l’âge en L1 santé ?

  Effectifs

Moyenne de l'âge en années

Amphi 1 1000 18,1Amphi 2 500 19,5Amphi 3 1000 18,3

Les effectifs étant différents dans les 3 groupes, la moyenne recherchée n’est pas la moyenne des moyennes.

•On calcule le total de l’âge des 3 groupes réunis : T = 18,1*1000+ 500*19,5+ 18,3*1000 =46 150. •L’effectif total est de 2 500.•La moyenne recherchée est 46150/2500 =18,5 ans

Exemple

Page 35: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Moyenne arithmétique

Propriétés : Centre de gravité de la distribution. La somme des écarts à la moyenne est nulle.

La moyenne minimise les distances au carré

0)xx( i

n

1i

2i

n

1i)xA(

Page 36: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

3. Moyennes

Avantages

Elle a de bonnes propriétés calculatoires comme la linéarité :

si est la moyenne d’une série (xi, ni) alors la moyenne de la série (axi+b, ni) est

Elle prend en compte l’ensemble des valeurs (contrairement au mode).

ax b ax b

x

Page 37: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

3. Moyennes

Inconvénient

Elle est très sensible aux valeurs « extrêmes ».

Exemple : si dans votre entreprise les 10 salariés (dont vous faites partie) gagnent chacun 1500€ par mois et que le patron gagne lui 7000€ par mois, le salaire moyen mensuel est de 2000€…

Page 38: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Dans une entreprise de 100 salariés, le salaire moyen est égal à 8 400 Dh.Supposons qu'une erreur se soit glissée lors de la transcription des salaires.Monsieur Dahbi est crédité d'un salaire de 108 000 DH au lieu de 8 000 Dh.De combien augmenterait la moyenne ?

Exemple

Page 39: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

La nouvelle moyenne est de : …….

Une seule valeur (sur 100) peut donc beaucoup modifier la moyenne.

La moyenne arithmétique est sensible aux valeurs extrêmes.

Page 40: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Les autres moyennes

Moyenne géométrique d'une série de valeurs positives est la racine nième du produit des n valeurs. Elle est toujours inférieure ou égale à la moyenne arithmétique.

Moyenne harmonique d'une série de valeurs positives est égale à l'inverse de la moyenne des inverses.

Moyenne quadratique est la racine carré de la moyenne arithmétique des carrés.

Page 41: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

3. Moyennes

Moyenne géométrique

Avec les notations précédentes :

est la moyenne géométrique de la série statistique.

k nk

n1

k1 x...xG

Pour le calcul, on applique: Log G = n1Logx1+n2Logx2+….+nkLogxk

Page 42: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

3. Moyennes

ExempleL’essence a augmenté de 10% l’an dernier et de 30%

cette année. Quelle est le taux d’augmentation annuelle ?

Ce n’est pas 20% ! La moyenne arithmétique ne convient pas.

Si t est ce taux, on a bien sûr :

et donc t =0,196=19,6%.

La « bonne » moyenne est ici la moyenne géométrique.

1 t 1,11,3

Page 43: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

3. Moyennes

Moyenne harmonique

Toujours avec les notations précédentes :

est la moyenne harmonique de la série statistique.

H n

ni / x i

i

Page 44: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

3. MoyennesExempleSi je fais un trajet aller-retour avec une vitesse v1 à

l’aller et une vitesse v2 au retour, quelle est ma vitesse moyenne sur l’ensemble du trajet ?

La réponse n’est pas

Mais qui est la moyenne harmonique de

v1 et v2.

v1 v2

2

21

v1

1

v2

Page 45: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

Positions respectives du mode, de la médiane et de la moyenne pour une distribution unimodale. 

Lorsque la distribution est symétrique les trois paramètres sont confondus.

Lorsque la distribution est asymétrique, la médiane est généralement située entre le mode et la moyenne et plus proche de cette dernière.

Page 46: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .
Page 47: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

47

Exemple

Ex: Absentéisme dans le service Achats

Le mode Le mode = 1

La médiane Médiane= 2

La moyenne arithmétique Moyenne = 2

Jours absentéisme

Nb. employés

Fréquencesrelative %

Fréquencesrelative % cumulées

0 5 19 19

1 8 30 49

2 6 22 71

3 3 11 82

4 2 7 89

5 1 4 93

6 2 7 1001 1

/n n

i i ii i

X n X n

Page 48: Statistique Descriptive C hapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : .

48

Quelle mesure de tendance retenir ?

Tout dépend de ce qu’on veut étudier.

Le mode: peu utilisé Médiane: stable Moyenne: informative

mais instable

Nb. employés / jours d'absentéisme

0

1

2

3

4

5

6

7

8

9

0 1 2 3 4 5 6