Tableaux de distributions
et
histogramme
Certaines distributions de données peuvent être très longues.
Ainsi, il est souvent nécessaire de condenser ces données sous une forme plus propice à l’analyse statistique.
Les tableaux de distribution et les diagrammes sont des outils qui permettent une meilleure compréhension des phénomènes étudiés.
Ils permettent de faire de meilleures prédictions et de prendre de meilleures décisions.
Les listes de distribution sont importantes car elles permettent d’obtenir des informations précises.
Cependant, il n’est pas facile de voir ce qui ressort le plus.
6
Exemple:
La même étude ( synthétisée ) fait apparaître un phénomène très clair.
Le tableau à données condensées.
Lorsqu’une distribution comporte un petit nombre de données différentes et qu’elles ont tendance à se répéter, il convient de les compiler dans un tableau dont les données sont condensées.
Total
Âge Effectif
23456789
101112
Répartition des enfants d’une garderie
21162221211
21
Le tableau à données condensées.
Exemple : Voici une liste de données représentant l’âge d’un groupe d’enfants à une garderie.
2, 2, 3, 4, 5, 5, 5, 5, 5, 5, 6, 6, 7, 7, 8, 8, 9, 10, 10, 11, 12.
Voici le tableau de distribution :
Total
Âge Effectif
23456789
101112
Répartition des enfants d’une garderie
On place le caractère de l’étude ( les données ).
Ici, l’âge.Ce sont les effectifs.
Cette colonne indique le nombre de fois que la donnée se répète.
Il reste à compiler.
21162221211
21
Il faut toujours indiquer le nombre total de données.
Il faut toujours donner un titre.
Total
Âge Effectif
23456789
101112
Répartition des enfants d’une garderie
21162221211
21
Le tableau est complété.
Il donne plusieurs informations.
n = 21 données
Mo = 5 ans
Médiane :
La médiane est donc la 11e donnée en partant du début.
On compte les effectifs à partir du début.
n ÷ 2 = 10,5
10 données
11e donnée
Md = 6 ans
La moyenne :
On fait :
( 2X2 + 3X1 + 4X1 + 5X6 + 6X2 + 7X2 + 8X2 + 9X1 + 10X2 + 11X1 + 12 X 1 )
21
x ≈ 6,43
total des effectifs
la somme des produits des valeurs par leur effectif
On utilise ce type de tableau lorsque les données de la distribution n’ont pas tendance à se répéter et qu’il y a un très grand nombre de possibilités.
Le tableau de données groupées en classes
Consommation d’eau hebdomadaire
[ 0 , 10 [
[ 10 , 20 [
[ 20 , 30 [
[ 30, 40 [
[ 40 , 50 [
Quantité (L)
Total
Effectif
10
9
7
11
13
50
Le tableau de données groupées en classes
Voici les données recueillies lorsqu’on a demandé à 50 élèves la quantité d’eau qu’ils consomment par semaine :
Exemple :
2, 2, 5, 5, 6, 6, 6, 7, 7, 8, 10, 11, 11, 13, 13, 13, 13, 15, 17, 24, 24, 24, 26, 27, 27, 29, 30, 30, 30, 32, 33, 33, 34, 36, 37, 38, 39, 40, 41, 42, 44, 44, 45, 45, 46, 46, 47, 47, 47, 47.
La 1ère étape est d’écrire la liste en ordre croissant.
Ce qui est fait ici.
La 2e étape est de regrouper toutes ces données en classes.
Déterminer les classes
1) Calculer l’étendue : Max. – min. =
2, 2, 5, 5, 6, 6, 6, 7, 7, 8, 10, 11, 11, 13, 13, 13, 13, 15, 17, 24, 24, 24, 26, 27, 27, 29, 30, 30, 30, 32, 33, 33, 34, 36, 37, 38, 39, 40, 41, 42, 44, 44, 45, 45, 46, 46, 47, 47, 47, 47.
47 – 2 = 45
2) Déterminer le nombre de classes :
Il n’y a pas de règle stricte pour trouver le nombre de classes;
un tableau compte habituellement entre 5 et 10 classes.
Il s’agit de faire une représentation facile à lire.
3) Déterminer la largeur des classes.
On divise l’étendue par le nombre de classes retenues.
S’il y a 5 classes.
Largeur d’une classe : étenduenombre de classes
=
455
≈ 9
La largeur de chaque classe pourrait être de 10 unités.
Les classes seront donc : [ 0 , 10 [
[ 10 , 20 [
[ 20 , 30 [
[ 30 , 40 [
[ 40 , 50 [
La façon d’écrire les classes doit respecter des règles.
Les classes doivent avoir la même largeur.
Ici, chaque classe a une largeur de 10 unités.
La classe [ 0 , 10 [ signifie que toutes les données comprises entre 0 inclus et 10 exclu y seront inscrites.
La classe [ 10 , 20 [ signifie que toutes les données comprises entre 10 inclus et 20 exclu y seront inscrites.
Les classes doivent être choisies de telle sorte que la plus petite et la plus grande données y soient incluses.
2, 2, 5, 5, 6, 6, 6, 7, 7, 8, 10, 11, 11, 13, 13, 13, 13, 15, 17, 24, 24, 24, 26, 27, 27, 29, 30, 30, 30, 32, 33, 33, 34, 36, 37, 38, 39, 40, 41, 42, 44, 44, 45, 45, 46, 46, 47, 47, 47, 47.
2 sera inclus dans [ 0 , 10 [ et 47 sera inclus dans [ 40 , 50 [ donc correct.
Chaque classe débute par un crochet fermé et se termine par un crochet ouvert.
2, 2, 5, 5, 6, 6, 6, 7, 7, 8, 10, 10, 11, 13, 13, 13, 13, 15, 17, 24, 24, 24, 26,
27, 27, 29, 30, 30, 30, 32, 33, 33, 34, 36, 37, 38, 39, 40, 41, 42, 44, 44,
45, 45, 46, 46, 47, 47, 47, 47.
On peut maintenant compiler les données.
Consommation d’eau hebdomadaire
[ 0 , 10 [
[ 10 , 20 [
[ 20 , 30 [
[ 30, 40 [
[ 40 , 50 [
Quantité (L)
Total
Effectif
10
9
7
11
13
50
Le tableau est complété.
Il donne plusieurs informations.
n = 50 données
Mode :
Dans un tableau à données groupées en classe, on peut avoir une classe modale .
Il s’agit de la classe possédant le plus d’effectifs.
Ici, la classe modale est [ 40 , 50 [.
On ne peut pas connaître avec précision le mode.
Cependant, on peut l’estimer.
On prend alors le milieu de la classe modale : ( 40 + 50 ) ÷ 2 = 45
Mo ≈ 45 L
Consommation d’eau hebdomadaire
[ 0 , 10 [
[ 10 , 20 [
[ 20 , 30 [
[ 30, 40 [
[ 40 , 50 [
Quantité (L)
Total
Effectif
10
9
7
11
13
50
Le tableau est complété.
Il donne plusieurs informations.
Médiane :
n ÷ 2 = 25
La médiane est donc la moyenne de la 25e et 26e donnée.
On compte les effectifs à partir du début.
19 données
+ 6 données
La classe contenant la médiane s’appelle la classe médiane.
On ne peut pas connaître avec précision la médiane.
Cependant, on peut l’estimer.
On prend alors le milieu de la classe médiane : ( 20 + 30 ) ÷ 2 = 25
Md ≈ 25 L
Ici, la classe médiane est [ 20 , 30 [.
Consommation d’eau hebdomadaire
[ 0 , 10 [
[ 10 , 20 [
[ 20 , 30 [
[ 30, 40 [
[ 40 , 50 [
Quantité (L)
Total
Effectif
10
9
7
11
13
50
Le tableau est complété.
Il donne plusieurs informations.
La moyenne :
On ne peut pas calculer précisément la moyenne dans un tableau de données groupées en classes.
Cependant, on peut l’estimer.
On fait :
la somme des produits des milieux des classes par leur effectiftotal des effectifs
( 5 X 10 + 15 X 9 + 25 X 7 + 35 X 11 + 45 X 13 )
50=
1 330
50≈ 26,6
x ≈ 26,6 L
Remarque : Comme le milieu de la première classe est 5 et que les classes ont toutes une largeur de 10, le milieu de chacune des classes augmentera de 10 unités.
Consommation d’eau hebdomadaire
[ 0 , 10 [
[ 10 , 20 [
[ 20 , 30 [
[ 30 , 40 [
[ 40 , 50 [
Quantité (L)
Total
Effectif
10
9
7
11
13
50
L’histogramme
10 20 30 40 50
2
4
6
8
10
12
14
Litres0
Élèves
Consommation d’eau hebdomadaire
L’histogramme est la représentation graphique d’un tableau de données groupées en classes.
L’histogramme
Reprenons notre exemple :
Pour construire l’histogramme, il faut :
2
4
6
8
10
12
14
En abscisse, on place les classes.
On utilise la limite inférieure de chaque classe.
10 20 30 40 50 Litres
En ordonnée, on place les effectifs.
Élèves
- tracer, graduer également et identifierles axes;
On trace des rectangles de même largeur et de hauteur correspondant à l’effectif de chaque classe.
0
Consommation d’eau hebdomadaire
[ 0 , 10 [
[ 10 , 20 [
[ 20 , 30 [
[ 30, 40 [
[ 40 , 50 [
Quantité (L)
Total
Effectif
10
9
7
11
13
50
Il ne faut pas oublier le titre.Consommation d’eau hebdomadaire
L’histogramme donne aussi beaucoup d’informations.
Le total des données : n = 50
109
13
11
7
La classe modale :
et le mode en prenant le milieu de la classe modale : Mo ≈ 45 L
[ 40 , 50 [
2
4
6
8
10
12
14
10 20 30 40 50 Litres
Élèves
0
Consommation d’eau hebdomadaire
109
13
8
11
n ÷ 2 = 50 ÷ 2 = 25
19 + 6
Md ≈ 25 L
La classe médiane :
La médiane est donc la moyenne de la 25e et 26e donnée.
On compte les effectifs à partir du début.
On ne peut pas connaître avec précision la médiane.
Cependant, on peut l’estimer.
On prend alors le milieu de la classe médiane : ( 20 + 30 ) ÷ 2 = 25
La classe médiane est donc [ 20 , 30 [.
2
4
6
8
10
12
14
10 20 30 40 50 Litres
Élèves
0
7
la somme des produits des milieux des classes par leur effectiftotal des effectifs
La moyenne :
On ne peut pas calculer précisément la moyenne dans un histogramme.
Cependant, on peut l’estimer.
On fait :
Consommation d’eau hebdomadaire
109
13
8
11
2
4
6
8
10
12
14
10 20 30 40 50 Litres
Élèves
0
7
( 5 X 10 + 15 X 9 + 25 X 7 + 35 X 11 + 45 X 13 )
50=
1 330
50≈ 26,6
x ≈ 26,6 L
Remarque :
[ 30 , 40 [
[ 40 , 50 [
[ 50 , 60 [
[ 60 , 70 [
[ 70 , 80 [
Données
Total
Effectif
[ 20 , 30 [ 3
6
10
12
8
5
44
S’il n’y a pas de classe qui débute à 0,
Il faudra penser à mettre une coupure d’axe.
20 30 40 50 60 70
2
4
6
8
10
12
14
080
Interprétation
Mo ≈ 45 L Md ≈ 25 L x ≈ 26,6 L
-19 individus sont au-dessous de la moyenne.
Dans ce groupe d’élèves :
- La classe modale n’est pas centrale.
- La médiane ou la moyenne sont représentatives de la quantité moyenne de litres d’eau consommée par semaine.
- Il y a plus d’élèves qui boivent beaucoup d’eau.
- 24 individus sont au-dessus de la moyenne.
Il serait intéressant d’en comprendre la raison.
Consommation d’eau hebdomadaire
109
13
8
11
2
4
6
8
10
12
14
10 20 30 40 50 Litres
Élèves
0
7
Top Related