Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker...

14
ALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques descriptives: Le Diagramme en Boîtes ou Boîte à Moustaches (Box Diag. or Whisker Diag.)

Transcript of Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker...

Page 1: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 47

La boîte à outils statistiques.

Statistiques descriptives: Le Diagramme en Boîtes ou Boîte à Moustaches

(Box Diag. or Whisker Diag.)

Page 2: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 48

Statistiques Descriptives: Caractéristiques des distributions.

Position (ou tendance

centrale)

Dispersion

Forme

Page 3: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 49

Caractéristiques des distributions.

Tendance Centrale

Position

Dispersion

• Moyenne arithmétique

• Médiane

• Mode

• Etendue

• Ecart-type

• Coefficient de variation

• Quantile

A quoi ça sert ?

Les plus utilisées

Page 4: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 50

Quantiles remarquables:

a) les 4 Quartiles.(multiples de ¼)

• Quartile n°1: position pour laquelle la fréquence cumulée des valeurs est égale à 25%.

• Quartile n°2 (= Médiane) : position pour laquelle la fréquence cumulée des valeurs est égale à 50%.

• Quartile n°3: position pour laquelle la fréquence cumulée des valeurs est égale à 75%

b) Les 10 Déciles.(multiples de 1/10)

• Décile n°8: position pour laquelle la fréquence cumulée des valeurs est égale à 80% � décision pour l’analyse de Pareto.

Page 5: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 51

Médiane & Quartiles:

262,1 262,9 263,6 264,3 264,7 265,9 266,1 267,1267,7 267,9 268,6 269,1 269,2 269,3 269,3 269,4270,0 270,5 270,6 270,7 271,3 271,7 271,9 272,1273,2 273,9 275,5 275,7 277,1 277,2 279,1 280,2

Série de données (poids d’une pièce)

Histogramme

1

34

12

9

34

0

2

4

6

8

10

12

14

260,4 263,7 267 270,3 273,6 276,9 ou plus...

Classes

Fr

é

,00%

25,00%

50,00%

75,00%

100,00%

Q1 Q2 Q3

Page 6: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 52

Diagramme en Boîtes:

Q2Q1 Q3

25%

25%25%

50%

75%

25% 25%

25% 25%

Q1Q2

Q3

Max(non abérrant)

Min(non abérrant)

Diagramme en boîtes

Page 7: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 53

Critères* de jugement pour les extrema:

25% 25%

Q3 – Q1

Valeur aberrante si:

X > Q3 + 1,5 (Q3 – Q1) ou X < Q1 – 1,5 (Q3 – Q1)

1,5(Q3 – Q1) 1,5(Q3 – Q1)

Valeu

rs aberran

tes

Valeu

rs aberran

tes* Rule of thumb pour une évaluation rapide!Sinon utiliser le Box-whisker plot!

Page 8: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 54

Comment évaluer les quartiles:

1. Par leurs formules mathématiques:

2. Par évaluation graphique:

3. Avec un logiciel:- MS EXCEL � fonctions statistiques.- SSS-STAT � Box-whisker plot.

Page 9: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 55

Calcul des quartiles avec EXCEL:

Sélectionner la fonction statistique « Quartile »

Indiquer la zone des données.

Indiquer le Quartile (valeurs 0,1,2,3 ou 4)

Sélectionner une cellule et « insérer » une fonction f(x)

Page 10: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 56

Example (simple):

260,4 262,1 262,9 263,6 264,3 264,7 265,9 266,1 267,1267,6 267,7 267,9 268,6 269,1 269,2 269,3 269,3 269,4269,8 270,0 270,5 270,6 270,7 271,3 271,7 271,9 272,1273,0 273,2 273,9 275,5 275,7 277,1 277,2 279,1 280,2

Q1 267,475 Q3-Q1= 4,850 Min 260,4Q2 269,600 L Inf 260,2 Max 280,2 279,1Q3 272,325 L Sup 279,6

Histogramme

0

2

4

6

8

10

12

14

260,4 263,7 267 270,3 273,6 276,9 ouplus...

Classes

Fr

é

Fréquence

Valeur aberrante!

Limite Inférieure = 260,2Limite Supérieure = 279,6

Page 11: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 57

Diagramme en boîtes:

25% 25%

260,4 267,475 269,6 272,325 279,1

Autres caractéristiques statistiques:

Moyenne arithmétique: Xmean= 269,964 (269,671*)

Ecart-type: s = 4,682 (4,404*)

Etendue: R = 19,8 (18,7*)

* Sans la valeur aberrante

Page 12: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 58

Avantages des Quartiles:

• Détection de valeurs aberrantes �analyse des causes assignables,traitement de cas particuliers.

• Evaluation de la dispersion si distribution asymétrique (non-gaussienne).

• Evaluation plus « palpable » que l’écart-type (probabilité = 50% entre Q1 et Q3)

Cas général(Processus « Normal »)

Cas particuliers

Page 13: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 59

Un exemple pratique: problème.

0

100

200

300

400

500

600

700

NB CASE_ID

CASE_ID%

NB CASE_ID 14 65 20 92 91 74 28 34 22 19 9 7 1 3 2 1 2 2 1 2 1 1 1 2 2 3 4 5 1 1 3 1 1 1 2 1 2

CASE_ID% 10 46 146%6%5%2%2%2%1%1%0%0%0%0%0%0%0%0%0%0%0%0%0%0%0%0%0%0%0%0%0%0%0%0%0%0%

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 28 34 37 38 39 40 41 42 46 47 48 49 50 55 76 79

PRODUCT TYPE PCG WARRANTY Yes WARRANTY_F Yes

FRT_ALS_WD

Données

VAIO IW FRT (July 2003 )

Cas particuliers ?

Page 14: Statistiques descriptives: Le Diagramme en Boîtes ou Boîte ...hades.lone.free.fr/Box Whisker Diag.pdfALSACE EMCS-E Alsace TEC M.BELLEZIT 47 La boîte à outils statistiques. Statistiques

ALSACE

EMCS-E Alsace TEC M.BELLEZIT 60

Un example pratique: solution.Classes Fréquence % cumulé

0 14 10,29%1 65 58,09%2 20 72,79%3 9 79,41%4 9 86,03%5 7 91,18%6 3 93,38%7 1 94,12%8 2 95,59%9 2 97,06%

10 1 97,79%11 1 98,53%12 0 98,53%13 0 98,53%14 1 99,26%15 0 99,26%16 0 99,26%17 0 99,26%18 1 100,00%

ou plus... 0 100,00%

Q1 1,00Q2 1,00Q3 3,00L Inf -2,00

L Sup 6,00Min 0Max 18

[Applicable data]Data range: [Exercice Box-whisker.xls]Feuil1'!A1:A136

Item-1No. of items 136Mean 2,3Standard deviation (n) 2,7Maximum 18,0Upper internal boundary point 6,0Upper hinge 3,0Median 1,0Lower hinge 1,0Lower internal boundary point 0,0Minimum 0,0

No/Name Item-1Lower hinge 1Upper internal boundary point6Lower internal boundary point0Upper hinge 3Median 1Extra1 7Extra2 8Extra3 8Extra4 9Extra5 9

Histogramme

0

10

20

30

40

50

60

70

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18ou

plu

s...

Classes

Fr

é

,00%

25,00%

50,00%

75,00%

100,00%

Fréquence% cumulé

Box-Whisker plot

-2

-10

1

23

4

56

7

8

910

11

1213

14

1516

17

1819

20

Item-1

-1

1

3

5

7

9

11

13

15

17

19

Conclusion:

Si réparation > 6 jours, alors il s’agit d’un cas particulier!

Liste des valeurs aberrantes (extras).

Diagramme en boîtes