Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques...

36
initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Transcript of Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques...

Page 1: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Deuxième partie : initiation au traitement quantitatif des

données ; éléments de statistiques descriptives

Introduction à la statistique

Page 2: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Tableau individu/variable

Caractère 1

sexe

Caractère 2

âge

Caractère 3

profession

… Caractère X

Individu 1

Individu 2

Individu n

Page 3: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

I La statistique à une dimension : principaux types

de variables et leur représentation

P : population X : la variable xi : symbole d’une modalité i de chaque variable x1, x2, …xp : ensemble des modalités pour i allant

de 1 à p. ni : nombre d’individus ayant répondu xi à la

variable X n1, n2,…np : effectifs correspondant aux

modalités N : total des effectifs fi : fréquence soit ni/N

Page 4: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Distribution statistique de la population selon une

variable

Modalités xi

effectifs

Fréquence fi %

x1 n1 f1 = n1/N f1 *100

x2 n2 f2 = n2/N f2 *100

… …

xp np fp = np/N fp *100

Total N 1 100

Page 5: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Exemple

Modalité xi Effectifs ni

Fréquence fi %

Homme ; x1

40 40/110 = 0,36

36 %

Femme ; x2 70 70/110 = 0,64

64 %

Total 110 1 100 %

Page 6: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Autres conventions de notation

N = n1+ n1+…+ n1=p

iin

1

14070110/1110

70

110

40

1/.../1......

1/1/

21

11

1

111

NNexemple

NNNNN

ou

NN

nn

nnnnff

nnf

p

p

p

p

ii

p

ii

p

ii

Page 7: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

I1 Les variables qualitatives

A/ Définition

B/ Les variables nominales

C/ Les variables ordinales

D/ La représentation des variables qualitatives

Page 8: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Origine sociale des étudiants de 1ère année de sociologie (1994-1995)

Modalités ni fi angle

indépendants

31 0,1 36°

Cadres et prof intellec sup

70 0,23 82,8°

Prof interm 76 0,24 86,4°

employés 26 0,08 28,8°

Ouvriers et inactifs

108 0,35 126°

Total 329 1 360°

Page 9: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

• les diagrammes circulaires

Angle = 100 fi * 360/100 = 360 * fi

répartition des étudiants de sociologie selon l'origine sociale (enquête 1994-95)

10%

23%

24%

8%

35%

indépendants

cadres et pro intellecsup

prof interm

employés

ouvriers et inactifs

Page 10: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

• Les tuyaux d’orgue

Page 11: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

I2 Les variables quantitatives

Les variables discrètes

modalités effectifs

fréquence Effectifs cumulés Fréquence cumulée

0 n0 F0=n0/N n0 N0/N

1 n1 F1=n1/N n0+n1 (n0+n1)/N

…. … … …

xi ni Fi=ni/N n0+n1+…+ni (n0+n1+…+ni)/N

…. … … …

xp np Fp=np/N n0+n1+…+np= N (n0+n1+…+np)/N=1

Total N 1

Page 12: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Exemple : nombre d’enfants par couple

modalités

effectifs fréquence Effectifs cumulés

Fréquence cumulée

0 8 0,27 8 0,27

1 10 0,33 18 0,60

2 5 0,17 23 0,77

3 0 0 23 0,77

4 4 0,13 27 0,90

5 3 0,1 30 1

Total 30 1

Page 13: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Représentations des variables discrètes : les diagrammes en bâton

Page 14: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Les variables continues

- Données brutes non groupées

- Données groupées en classes

Page 15: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Variables continues groupées en classes

classes ni fi Centre de classe Ci

[y0-y1] n1 n1/N C1=(y0+y1)/2

[y1-y2] n2 n2/N C2=(y1+y2)/2

[yi-1-yi] ni ni/N Ci=(yi-1+yi)/2

[yp-1-yp] np np/N Cp=(yp-1+yp)/2

N 1

Page 16: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Exemple : résultat d’un amphi à un examen (cas de l’amplitude constante)

classes ni fi Centre de

classe Ci

[0-5] 39 39/145 = 0,27 2,5

[5-10] 58 58/145 = 0,4 7,5

[10-15] 36 36/145 = 0,25 12,5

[15-20] 12 12/145 = 0,08 17,5

145 1

Page 17: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Histogramme (amplitude constante)

Page 18: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Exemple : répartition des effectifs en 3 tranches d’âge d’amplitude variable

ni fi amplitude Ci

[20;30[ 2000 0,36 10 25

[30;50[ 3000 0,54 20 40

[50;55[ 500 0,09 5 52,5

Total 5500 1

Hi = ni/amplitude

Page 19: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Histogramme (amplitude variable)

Page 20: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Histogramme des fréquences (amplitude variable)

Page 21: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Tableau récapitulatifTypes de variables Type de tableaux Représentation

qualitatives

nominales

Effectifset

Fréquences

Diagramme circulaire

Tuyaux d’orgueordinales

quantitatives

discrètes

Effect, fréq, effect et fréq cumulés

Diagrammes en bâtons

continues

Non groupées : xi et ni ordonnés

Fonction FRE

Groupées en classes : effect, fréq, centre, amplitude

Histogrammes et histogrammes normés (amplitude variable)

Page 22: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

II Les paramètres de position

II1 Le mode

Définition

Le mode M est la modalité de la variable qui correspond au plus grand effectif

Variables qualitatives

Page 23: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Modalités (xi) ni %

Indépendants 31 10 %

Cadres 70 23 %

Professions intermédiaires 76 24 %

Employés 26 8 %

Ouvriers et inactifs 108 35 %

total 329 100 %

Exemple : Origine sociale des étudiants de 1ère année de

sociologie (1994-1995)

Mode : ouvriers et inactifs

Page 24: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

• Les variables quantitatives discrètes

Modalités (xi) Effectif ni Fréquence fi

0 8 0,27

1 10 0,33

2 5 0,17

3 0 0

4 4 0,13

5 3 0,1

Total 30 1

Mode : 1 enfant

Page 25: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

• Les variables quantitatives continues (amplitude constante)

CM Li

21

1

M = mode

Li = borne inférieure de la classe modale

C = amplitude de la classe modale

∆1 = effectif classe modale – effectif classe précédente

∆2 = effectif classe modale – effectif classe suivante

Page 26: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Exemple : résultat d’un amphi à un examen (cas de l’amplitude constante)

Classes ni

[0;5[ 39

[5;10[ 58

[10;15[ 36

[15;20[ 12

145

M = 5 + (19/19+22)*5 = 7,32

Page 27: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

• Les variables quantitatives continues (amplitude variable)

ni amplitude

hi

[20;30[ 2000 10 200

[30;50[ 3000 20 150

[50;55[ 500 10 100

5500

Même formule avec∆1 = valeur hi de la classe modale – valeur hi de la classe précédente∆2 = valeur hi de la classe modale – valeur hi de la classe suivanteM = 20 + (200/200+50)*10 = 28 ans

Page 28: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

II2 La moyenne arithmétique

Les variables discrètes

NX

p

iii xn

1

Page 29: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Exemple : nombre d’enfants par couple

Modalités (xi)

Effectif ni

nixi

0 8 0

1 10 10

2 5 10

3 0 0

4 4 16

5 3 15

total 30 51

Moyenne = 51/30 = 1,70

Page 30: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

• Les variables continues

Non groupées Groupées en classes

NX

p

iix

1

NX

p

iiiCn

1

Page 31: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Exemple : résultat d’un amphi à un examen

Classes ni Ci niCi

[0;5[ 39 2,5 97,5

[5;10[ 58 7,5 435

[10;15[ 36 12,5 450

[15;20[ 12 17,5 210

145 1192,5

Moyenne = 1192,5/145 = 8,22

Page 32: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

II3 La médiane

La médiane est la valeur de la variable qui partage en 2 parties égales ou en 2 sous-ensemble égaux la population

La médiane est plus stable que la moyenne car elle n’est pas influencée par les valeurs extrêmes

Page 33: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

• Les variables discrètes

x¡ n¡ effectifs cumulés

0 10 10

1 30 40

2 40 80

3 10 90

4 5 95

5 4 99

6 1 100

100

Nombre d’enfants par couple exemple 1

Page 34: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

x¡ n¡ effectifs cumulés

0 5 5

1 25 30

2 20 50

3 15 65

4 15 80

5 12 92

6 8 100

100

Nombre d’enfants par couple exemple 2

Page 35: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

• Les variables continues groupées en classes

C

NLiMe

nnn

i

i

11

...2

AvecLi : borne inférieure de la classe médianeni : effectif de la classe médianeC : amplitude de la classe médianen1+…+ni-1 : effectifs cumulés des classes précédant la classe médiane

Page 36: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique.

Exemple : distribution de salaires

x¡ n¡ effectif cumulé

[0,2000[ 10 10

[2000,4000[ 30 40

[4000,6000[ 40 80

[6000,8000[ 10 90

[8000,10000[ 5 95

[10000,12000[ 4 99

≥ 12000 1 100

N=100

N/2 = 50 ===> intervalle médian correspond à l’effectif cumulé 80 soit [4000,6000[.L¡ = 4000

Me = 4000 + ((50-40)/40) 2000 = 4500 Frs