Post on 13-Sep-2018
1
Module : STATISTIQUE DESCRIPTIVE
Eléments du cours
INTODUCTION ET CHAPITRE 1
2
INTRODUCTION AU COURS
I- Définitions et Objectifs de la statistique
1- les objectifs de la statistique
La statistique a pour objet l’étude, à l’aide de traitements mathématiques, de
nombreux faits correspondant à l’observation d’un phénomène , dans le but de
rendre compte de la réalité, d’essayer de l’expliquer et d’aider à la prise de
décision.
Les objectifs de la statistique descriptive sont de décrire, de synthétiser, de
comparer des données recueillies sur un phénomène donné au cours des
différentes périodes ou en différents endroits.
2- Définitions
La statistique est une méthode de collecte, de présentation et d’analyse des
observations relatives à des individus appartenant à un même ensemble défini de
manière précise afin de mettre en évidence certaines propriétés générales de cet
ensemble.
La statistique descriptive est la partie de la statistique dont le rôle est de décrire un
phénomène ; en d’autres termes ; à le mesurer, à l’évaluer, à classer les mesures, à
présenter ces mesures sous forme de tableaux ou graphiques, à synthétiser ces
mesures par quelques indicateurs de manière à avoir une idée rapide et simple du
phénomène étudié et aussi pour permettre de faire des comparaisons.
Remarque : Il faut faire une distinction entre les statistiques et la statistique.
Les statistiques désignent les données quantitatives (chiffrés), c’est
l’information brute sous forme de données numérique
Exemple : Les statistiques de FMI , les statistiques de l’OMC ….
La statistique est la discipline qui s’attache à étudier ces données
numériques brutes dans le but de fournir le maximum des renseignements
sur le phénomène en question. Donc la statistique est une méthode
scientifique qui vise la description quantitative des chiffres bruts
3
II- Apport de la statistique à la science économique :
a) La statistique est indispensable aux théoriciens de l’économie, puisqu’elle permet de
mettre en évidence l’interdépendance des phénomènes économiques et de vérifier la
validité de certaines hypothèses par confrontation de la théorie à la réalité.
b) La statistique est indispensable aux praticiens de l’économie, elle permet : aux
pouvoirs publics d’agir correctement en matière de politique économique et d’éviter le
déclenchement des cycles économiques négatifs (crises économiques) et permet aussi une
aide précieuse aux opérateurs privés dans leurs processus de prise de décisions en vue
d’une rationalisation optimale de la gestion des entités économiques.
III- Méthodes d’observation statistique
Deux méthodes principales pour collecter des données :
1- Recensement (enquête exhaustive)
Le recensement est une opération de collecte d’information qui porte sur toutes les
unités formant la population étudiée.
Exemple : Le Recensement général de la population en 2004 et en 2014
2- Enquête par sondage (enquête partielle)
C’est une opération portant sur une partie de la population. Les unités statistiques
concernées par ce sondage constituent un échantillon. Ce dernier est choisi de
manière à représenter la population mère
Exemple : L’enquête nationale sur la dépense des ménages en 2012
IV- Vocabulaire utilisé en statistique descriptive :
La statistique utilise comme toute science qui se respecte un vocabulaire et des
concepts spécifiques qu’il faut présenter et définir avant tout propos.
1- Population statistique (ou univers statistique) : c’est l’ensemble de tous les
individus auxquels l’étude statistique s’intéresse.
Exemples : étudiants de La faculté de droit
Parc de voiture de la wilaya de casa
Population urbaine
2- Unité statistique (ou individu statistique) : un élément de cet ensemble ou plus
précisément élément qui composent la population
Exemple : un étudiant de la faculté de droit
Une voiture de parc de la wilaya de casa
4
3- L’échantillon : c’est une partie ou un sous ensemble de la population mère
Exemple : les étudiants de master de la faculté de droit
Les voitures de marque peugeot de la wilaya de casa
4- Caractère statistique : c’est la propriété retenue pour développer l’étude
statistique
Exemple : l’âge, la taille ; le poids, le niveau d’instruction…….
5- La Modalité : les modalités sont les différents états possibles d’un caractère ;
Exemple : Le caractère : sexe des étudiants
Modalités : féminin ou masculin
s
Un caractère peut être qualitatif ou quantitatif
a. Il est qualitatif lorsqu’ il ne peut être exprimé en valeur, on ne peut pas le
mesurer ou le quantifier mais seulement le repérer.
Exemple : la couleur des voitures
b. Il est quantitatif quand il peut être exprimé en valeur, il est mesurable ;
chiffrable.
Exemple : Le nombre d’enfants d’un couple
Un caractère peut être quantitatif discret (discontinu) ou quantitatif continu.
Il est quantitatif discret si ses modalités sont des nombres entiers isolés ;
Exemple : Le nombre de pièces dans un logement
Il est quantitatif continu si ses modalités sont exprimées par des intervalles
de valeurs ;
Exemple : Les classes de revenus
6- Variable statistique : chaque modalité d’un caractère est constituée par un
nombre ou un ensemble de valeurs, appelé variable. Selon la nature de la
variable il y a variable discrète et variable statistique continue.
Variable discrète prend des valeurs entières
Variable continue prend toute valeur dans un intervalle de mesure
5
7- Classe : c’est un groupement de valeurs selon les intervalles qui peuvent être
– ou non – égaux ; une classe se définit par deux limites : la limite inférieure
appartient à la classe, la limite supérieure est exclue de la classe. La différence
entre les deux limites donne l’amplitude.
Exemple : les classes de salaires
8- L’effectif ou fréquence absolu : c’est le nombre d’individus ayant une valeur
de la modalité.
Exemple : 18 Femmes et 12 hommes
9- Fréquence relative : c’est la part de l’effectif de la modalité à l’effectif total
Exemple : f1=18/30 f2=12/30
10- Série statistique : c’est l’ensemble des valeurs qui mesurent le caractère.
V- Symboles mathématiques utilisés en STATISTIQUE.
1- les valeurs de caractère sont symbolisées par ni xxxx ......,,...,, 21 on parle des xi
Si la série est une série avec des classes les xi représenteront les centres de classes.
2- les effectifs sont symbolisés par ni nnnn .,.................,, 21 on parle des ni
L’effectif total est symbolisé par N .
3- la fréquence relative s’écrit : N
nf i
i
4-L’opérateur somme ∑ (se lit Sigma) ; On utilise ce symbole pour designer
l’opération Somme.
n
i
ini xxxxx1
21 ..........
Exemple : on a : 4321 xxxx =
4
1i
ix
5
2
5
2
5
2
44)(i
i
i i
ii bxabaxbax = a(x 2 )-(b) + ax 3 - b + ax 4 -b + ax 5 -b
= a ( 5432 xxxx ) – 4b.
Propriétés du sigma
ana .
ii xaax
naxax ii
iiii yxyx
5- - L’opérateur somme (se lit Pi).
On utilise ce symbole si la variable se multiplie.
n
n
i
i xxxx
....21
1
Exemple :x 1 x 2 x 3 =
3
1i
ix ; ax 2 ax 3 ax 4 =a 3
4
2i
ix
6
Chapitre I : Elaboration des tableaux statistiques
et représentation graphique.
Avant toute représentation graphique des données statistiques, il est primordial de faire
une classification de ses données dans des tableaux statistiques
I- Présentation des tableaux statistiques. Le dépouillement (dénombrement) des données statistiques permet de les synthétiser dans
des tableaux statistiques.
A- Présentation générale du tableau statistique
Considérons une population statistique P composé de n individu et décrite suivant le
caractère C dont les modalités sont : m1 , m2, ……,mk .on désigne par ni le nombre
présentant la modalité mi d’effectif ou fréquence absolue. Ainsi nous aurons le
tableau suivant :
Caractère étudié Effectif ou
fréquence absolue
Fréquence relative Pourcentage
(%)
m1
m2
.
.
mi
.
.
.
mk
n1
n2
.
.
ni
.
.
.
nk
f1= n1/N
f2= n2/N
.
.
fi= ni/N
.
.
.
fk= nk/N
P1=f1 x100
P2=f2 x100
Pi=fi x100
.
.
.
Pk=fk x100
TOTAL Nn
k
i
i 1
11
k
i
if 1001
k
i
iP
N= effectif total
ni = nombre d’observation correspondant à la modalité mi
N = ki
k
i
i nnnnn
.........21
1
B- Cas d’un caractère qualitatif :
Une enquête sur la nationalité des touristes visitant le Maroc a concerné un échantillon de
500 touristes
Unité statistique : un touriste ;
Population : l'ensemble des touristes visitant le Maroc ;
Caractère étudié : nationalité ;
Type de caractère : qualitatif.
Les résultats obtenus sont condensés dans le tableau suivant :
7
Nationalité Effectif (fréquence
absolue)
Fréquence
relative
Fréquence relative
En %
Française
Allemande
Italienne
Hollandaise
Belge
Américaine
autres
85
106
62
44
40
70
93
0.17
0.212
0.124
0.088
0.08
0.14
0.186
17
21.2
12.4
8.8
8
14
18.6
Total 500 1 100
B- cas d’un caractère quantitatif discret :
Exemple :
Une enquête chez 1000 commerçants porte sur le nombre d'employés.
-Unité statistique : un commerçant ;
-Population : l'ensemble des 1000 commerçants ;
-Caractère étudié : nombre d'employés ;
-Type de caractère : variable statistique discrète.
Les résultats obtenus sont condensés dans la distribution de fréquences suivante
8
C- Cas d’un caractère quantitatif continu
Dans ce cas chaque modalité est une classe,[L1-L2[ et les classes peuvent être a
amplitudes égales ou inégales.- La limite inférieure de la classe fait partie de cette classe,
alors que la limite supérieure est exclue, mais fait partie de la classe suivante : [L1-L2[
- La 1ère
et la dernière classe de la série peuvent avoir des amplitudes indéterminées,
il convient de préciser leur limite.
- La colonne fi℅ cumulées croissante nous donne le ℅ des individus ayant une valeur
inférieure à xi.
- La colonne fi℅ cumulées décroissante nous donne le ℅ des individus ayant une
valeur supérieure à xi.
Exemple : On a mesuré le poids en kilogramme de 80 personnes.
-Unité statistique : une personne ;
-Population : l'ensemble des 80 personnes ;
-Caractère : poids en kilogramme ;
-Type de caractère : variable statistique continue.
POIDS Effectif(ni) ni c ni c fi% fic
croissant
fi c
décroissant
50-55
55-60
60-65
65-70
70-75
75-80
80-85
85-90
90-95
95-100
1
2
11
10
12
21
6
9
4
4
1
3
14
24
36
57
63
72
76
80
80
79
77
66
56
44
23
17
8
4
1.25
2.5
13.75
12.5
15
26.25
7.5
11.25
5
5
1.25
3.75
17.5
30
45
71.25
78.75
90
95
100
100
98.75
96.25
82.5
70
55
28.75
21.25
10
5
Total 80 - - 100 - -
I) Représentations Graphiques.
Les graphiques constituent un mode de présentation de résultats statistiques sous forme
de tracé géométrique qui permet une description immédiate et complète. Selon la nature
du caractère, il y’a différents types de représentations graphiques.
9
A- Représentation graphique d’un caractère qualitatif :
Plusieurs types de graphiques sont utilisés pour représenter ce caractère, nous retenons 2
types : Les tuyaux d’orgue et le diagramme circulaire ou semi circulaire.
1-le diagramme en tuyaux d’orgue :
Ce sont des tuyaux dont les bases sont égales, alors que la hauteur est proportionnelle
à l’effectif ou à la fréquence relative de la modalité.
Exemple1 : 200 chefs de ménages sont répartis selon l’état matrimonial.
0
20
40
60
80
100
C M V D
ni
2-diagramme circulaire
Dans le diagramme à secteurs chaque modalité est représentée par un secteur dont
l'angle est proportionnel à l'effectif correspondant. La totalité de la circonférence
correspond à l'effectif total.
Pour calculer les secteurs angulaires on a la formule suivante αi=fix360°
Exemple : Pour le même exemple précédent, on doit déterminer pour chaque
nationalité l'angle proportionnel à l'effectif correspondant
Nationalité ni fi% αi°
Française
Allemande
Italienne
Hollondaise
Américaines
Belge
autres
85
106
62
44
40
70
93
17
21.2
12.4
8.8
8
14
18.6
61.2
76.32
44.46
31.68
28.8
50.4
66.96
TOTAL 500 100 360°
Caractère Effectif ni Fréquence fi
Célibataire (C) Marié (M)
Veuf (V) Divorcé (D)
70 90
10 30
0,35 0,45
0,05 0,15
∑ 200 1
10
B- Représentation graphique d’un caractère quantitatif discret :
Il peut être représenté par 2 types de graphiques :
Le digramme en bâtons utilisant des effectifs ou des fréquences relatives.
La courbe cumulative qui nécessite des fréquences cumulées croissantes ou
décroissantes.
1- le diagramme en bâtons :
Chaque bâton issu d’une modalité à une longueur proportionnelle à l’effectif ou à
la fréquence de la modalité.
Exemple : 50 logements sont répartis selon les pièces par logement
Pièces
xi Effectif
ni fi % < a xi > a xi
fi % cum fi % cum
1 2
3
4 5
5 20
15
8 2
10 40
30
16 4
0 10
50
80 96
100
100
90 50
20
4 0
∑ 50 100 — —
DIAGRAMME CIRCULAIRE
Française
Allemande
Italienne
Hollondaise
Américaines
Belge
autres
11
2- la courbe cumulative croissante et décroissante.
C’est la courbe qui représente la fonction de répartition F(x).C’est une courbe en
escaliers.
Définition :on appelle fonction cumulative ou fonction de répartition la fonction
F(x) qui à toute valeur, associe la portion des individus dont le caractère est
strictement inférieur ( <) à x.
F(x) est définie pour toute valeur réelle de x telle que : x < xi
F(-∞) = 0 et F(+∞) = 1
0102030405060708090
100110
0 1 2 3 4 5 6 7 8xi
fi %
-∞
+∞
12
C- Représentation graphique d’un caractère quantitatif continu.
On a 2 types de graphiques :
- l’histogramme pour représenter les effectifs ou les fréquences relatives.
- La courbe cumulative pour représenter les effectifs ou les fréquences
cumulées croissantes ou décroissantes.
1- l’histogramme :
c’est un ensemble de rectangles adjacents ayant des bases égales aux amplitudes
des classes et des hauteurs correspondant aux effectifs ou aux fréquences
relatives.
1er
cas : les classes ont des amplitudes égales.
13
2ème
cas : les classes ont des amplitudes inégales. Il faut corriger les effectifs
ou les fréquences relatives en choisissant une amplitude de base a0 (en général
la plus petite)
i
ii
an
acorrigéna
ancorigénii
i
0. 0
Exemple : les 200 ouvriers répartis selon le salaire.
0
20
40
60
80
100
120
1 2 3 4 5 6 7
2- La courbe cumulative :
C’est le graphique représentant la fonction de réparation F(x)
Les valeurs de x sont les limites des classes, les valeurs de y sont les fi % cumulés
croissantes ou décroissantes
Si la courbe cumulative est croissante elle a pour coordonnées les limites supérieurs
des classes et les fi % cumulés croissantes
Exemple : soit la série statistique relative à la répartition de 200 salariés selon le salaire en 103
DH.
Salaire DH 103 ni ni corrigé
[0-2[ [2-3[
[3-5[ [5-7[
50 100
30 20
25 100
15 10
∑ 200 –
14
Salaire
103 DH
Effectifs
ni
fi % =
ni x 100 ∑ ni
fi %
cum
fi %
cum
1 – 2
2 – 4 4 – 6
6 – 8 8 – 14
20
100 30
40 10
10
50 15
20 5
10
60 75
95 100
100
90 40
25 5
∑ 200 100 X X
0
25
50
75
100
0 2 4 6 8 10 12 14 16
fi %
xi
c. cum.
c. cum.
Remarque : l’intersection des 2 courbes donne la valeur médiane Me