Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic...

23
Dénombrement et représentations graphiques d’un caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004

Transcript of Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic...

Page 1: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

Dénombrement et représentations graphiques d’un caractère

continu

TD Statistique 2 - Ludovic Méasson

3 novembre 2004

Page 2: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

Rappel TD précédent

Exemple d’un caractère continu : les altitudes d ’une chaîne de montagne.2312, 1985, 1642, 1340, 1854, 1789, 1891, 2210, 2425, 1956, 1970, 2003, 1515, 2102, 2010, 2412

Produire un tableau de dénombrement avec la même méthode que pour les caractères discrets aurait peu de sens :

• nombre important de modalités• effectifs très faibles (en général, comme ici, 1 seul individu par valeur)

Ainsi, pour les caractères continus, le dénombrement passe soit par :

• une analyse élémentaire• une analyse par classes

Page 3: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

1 - L ’analyse élémentaire

Lorsque la population n’est pas trop nombreuse, on ordonne les valeurs du caractère X. Dans ce nouveau tableau élémentaire , on peut associer à chaque modalité xi un rang, qui est sa position dans le classement des valeurs de la plus petite à la plus grande

Ex : rendement en blé de différentes parcelles agricoles

Parcelle Rdt (q/ha)A 25B 22C 51D 62E 75F 20G 49H 78I 68J 50

Rang X (q/ha)1 202 223 254 495 506 517 628 689 7510 78

Page 4: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

Une fois ce tableau réalisé, on réalise un diagramme de distribution :

X (q/h) 20 50 80

Rang X (q/ha)1 202 223 254 495 506 517 628 689 7510 78

Rmq : chaque individu est représenté par sa modalité sur un axe gradué. Si deux individus ont des modalités identiques ou très proches, on procède à un empilement des points

Page 5: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

Réalisez ce même travail avec les tailles des étudiants d’IUP.(Tableau élémentaire élèves IUP + Exo 1)

• Le tableau• Le diagramme de distribution (sur papier)

Page 6: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

2 - La partition en classes

Ex : Tailles des IUP en cours de stat.

Ce mode de traitement est le plus fréquent.

Inconvénient par rapport à l’analyse élémentaire : on perd de l’information puisque chaque valeur n’est pas représentée. Toutes les valeurs tombant dansune même classe sont considérées comme identiques.

Avantage : on gagne en lisibilité

Condition : chaque individu doit appartenir à une classe et une seule.

Taille Effectifs

[150,160[ 1

[160,170[ 5

[170,180[ 6

[180,190[ 2

[190,200[ 1

Page 7: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

n1

n2

ni

nk

X1

X2

Xi

Xk

[eo, e1[

[e1, e2[

[ei-1, ei[

[ek-1, ek[

EffectifCentre de la classeModalités du caractère X

Rappel :

Où xi = (ei-1 + ei) / 2

Amplitude d’une classe : Ai = ei - ei-1

Etendue de la distribution : Valeur max - valeur mini

Fréquence simple des classes : fi = ni / n

Fréquence moyenne ou densité d ’effectif : fmi = fi / Ai => cet indicateur sert à comparer deux classes qui n’ont pas la même amplitude.

Page 8: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

A - Les méthodes de « discrétisation » (création des classes) :

1. Le nombre de classes

Il n’y a pas réellement de règles si ce n’est qu’il ne doit pas être trop important.Trop de classes réduit la lisibilité du graphique. Le nombre de classes doitêtre définit en fonction du message recherché.

2. Le type de classes :

• Méthodes des seuils naturels : consiste à placer les limites de classes dans les zones de discontinuités (milieux des « marches d’escalier » des courbes de fréquences cumulées).

• Méthode des amplitudes égales : consiste à diviser l’étendue en classes demême amplitude

• Méthode des effectifs égaux : consiste à placer les bornes de façon à avoir approximativement le même effectif dans chacune des classes.

Page 9: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

B - Les enseignements des courbes de fréquences cumulées pour la construction des classes avec la méthode des « seuils naturels ».

Rappel :• Fréquence cumulée ascendante (% des individus ayant des modalités de valeur inférieure ou égale)• Fréquence cumulée descendante (% des individus ayant des modalités de valeur supérieure ou égale).

Taille (cm) Eff ectif s

Eff ectif s

cumulés

Fréquences

cumulées Taille (cm) Eff ectif s

Eff ectif s

cumulés

Fréquences

cumulées

159 1 1 1,67 168 6 20 33,33

160 0 1 1,67 169 7 27 45,00

161 0 1 1,67 170 7 34 56,67

162 0 1 1,67 171 9 43 71,67

163 2 3 5,00 172 6 49 81,67

164 3 6 10,00 173 5 54 90,00

165 3 9 15,00 174 2 56 93,33

166 0 9 15,00 175 1 57 95,00

167 5 14 23,33 176 2 59 98,33

177 1 60 100,00

Total : 60

Page 10: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

Fréquences cumulées en %

0,00

20,00

40,00

60,00

80,00

100,00

120,00

158 160 162 164 166 168 170 172 174 176 178

Taille en cm

1

4

3

2

Que nous disent ces phénomènes sur la courbe au niveau de la distribution des individus ?

Page 11: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

Fréquences cumulées en %

0,00

20,00

40,00

60,00

80,00

100,00

120,00

158 160 162 164 166 168 170 172 174 176 178

Taille en cm

1

4

3

2

Que nous disent ces phénomènes sur la courbe au niveau de la distribution des individus ?

Zones de concentration :

Une pente forte indique qu’il y a beaucoup

d’individus sur un intervalle donné.

Les zones de dispersion :

Inversement, une pente faible indique

qu’il y a peu d’individus sur l’intervalle

Les discontinuités :

Zones de dispersion séparant deux zones de

concentration : milieu des « marches d’escalier ».

Page 12: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

3 – Les représentations graphiques des variables quantitatives

A - Le cas des séries chronologiques est particulier : l'ordre des individus étant primordial, on n'effectue pas de tri à plat, et on représente directement les données brutes en ordonnée, l'échelle dutemps étant placée en abscisse. Le temps étant continu, on relie par des segments de droite les points obtenus.

Si un phénomène saisonnier apparaît (même type de variations d'année en année par exemple), il est possible de superposer plusieurs graphiques, ou de les remplacer par des moyennes.

Page 13: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

B - Pour une variable discrète (valable également pour les variables qualitatives), après un tri à plat conduisant à la distribution observée, on représente celle-ci par un diagramme en bâtons les xi sont placés suivant une échelle sur l'axe des abscisses,

et les effectifs ni sont matérialisés par un "bâton" de longueur ni(axe

des ordonnées). Ex : nombre d’enfants par famille.

Le fait d'avoir des "bâtons" séparés les uns des autres permet de voir l'aspect ponctuel et discontinu des valeurs de la variable sur lesquelles l'effectif total est réparti.

Nombre d'enfants

xi

Effectifs

niFréquences fi

0 6 0.33

1 4 0.22

2 5 0.28

3 2 0.11

4 1 0.06

Total :18 1

                                                                             

Page 14: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

On peut aussi tracer la courbe cumulative croissante, appelé également fonction de répartition. On utilise alors les effectifs cumulés. Elle se présente généralement comme une courbe« en escalier » (pour bien montrer le caractère discret de la variable).Par convention, le segment de droite se place à gauche de la valeur xi.Ce segment est fermé à gauche et ouvert à droite.

Nombre d'enfan

ts xi

Effectifs ni

Effectifs

cumulés

croissants Ni

Effectifs cumulés décroissa

nts N'i

0 6 6 18

1 4 10 12

2 5 15 8

3 2 17 3

4 1 18 1

Cette représentation offre un moyen pratique de savoir par exemple :• Combien de familles ont deux enfants maximum ?• Combien de familles ont 3 enfants maximum ?

Page 15: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

De même, on peut réaliser une courbe cumulative décroissante (ci-dessous) et les courbes des fréquences cumulées.

Ici, on saura par exemple :• Combien de familles ont au moins 1 enfants ?• Combien de familles on au moins 2 enfants ?

Page 16: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

Exercice :

A partir du tableau élémentaire de l’âge des étudiants d’IUP, représenter graphiquement les effectifs, les effectifs cumulés croissants et décroissants et les fréquences cumulées croissantes et décroissantes.

Et répondez aux deux questions :

• Quel pourcentage des élèves a 21 ans ou moins ?

• Quel pourcentage des élèves a 21 ans ou plus ?

Enregistrer votre travail sous votre nom dans :Z:/Public/Measson/Exercices en classe

Page 17: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

C – Représentation graphique d'une variable continue,

On a vu que si l'on compte les effectifs par valeur on risque souvent d'avoir un trop grand nombre de valeurs différentes, avec de trop faibles effectifs, et qu'il convient de regrouper les données en classes.

Il existe souvent un moyen simple d'effectuer simultanément un tri à plat des données et un graphique : c'est le diagramme tige-feuilles.

Ex : les tailles ci-dessous se situent entre 159 et 177. Les deux premiers chiffres sont 15, 16, ou 17 (la tige) et les suivants différencient les valeurs (ce sont les feuilles).

                                      

 

Page 18: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

On peut diviser de 5 en 5 pour avoir plus de classes :

On peut ordonner ensuite les valeurs pour mieux voir la répartition des feuilles sur chaque tige.

Page 19: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

Si le nombre de données est trop important ou que l’on veut un autre type de représentation graphique, il fait organiser les données en classes.

Avec l’exemple précédent, on peut avoir :

Classes de tailles (en cm) Effectifs

[ 155 - 160 [ 1

[ 160 - 165 [ 5

[ 165 - 170[

[ 170 - 175 [

[ 175 - 180 [ 4

21

29

Page 20: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

A partir de la distribution précédente, on peut construire un histogramme des effectifs : les classes étant de même amplitude, en plaçant en ordonnée les effectifs on obtient des rectangles dont la surface est proportionnelle à l'effectif associé.

Page 21: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

Mais supposons qu'on veuille détailler davantage :

L'effectif 21 entre 1.65 m et 1.70 m se répartit en 8 dans [1.65 ; 1.675 [ et 13 dans [1.675 ; 1.70 [. Quel graphique est exacte ?

Page 22: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

Quand on représente une variable continue sous forme d’histogramme, c’estla surface du rectangle qui représente la valeur de l’effectif.

La surface (l’effectif ni en fait) dépend de l’amplitude de la classe (ai ou largeur) et de la hauteur (y).

Or, pour ni = 1 ; y = 1 quand ai = 5 cm (ex. entre 155 et 160).

Quel doit être y pour ai = 2,5 ?

Page 23: Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

Exercice :

A partir du tableau élémentaire de la taille des étudiants d’IUP :1. Construisez la courbe des fréquences cumulées2. Opérez la discrétisation des données et argumentez votre choix3. Représentez graphiquement les effectifs, les effectifs cumulés

croissants, et les fréquences cumulées croissantes.

Enregistrer votre travail sous votre nom dans :Z:/Public/Measson/Exercices en classe