1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision...

49
1 Statistiques 1. Introduction.

Transcript of 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision...

Page 1: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

1

Statistiques

1. Introduction.

Page 2: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

2

11. Utilité.

Aider à comprendre la complexité d’un environnement ;

Aider à la prise de décision ;

Disposer de moyens susceptibles de

prévoir et d’anticiper.

Page 3: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

3

12. Schéma d ’une étude.

Modélisation

Décision

Statistiques et informatique

Dépouillem ent de l'inform ation recueillie.

Tableaux statistiques. Graphiques. Valeurs caractéristiques. Autres analyses.

Prévision. Décision.

Com m entaires et recom m andations.

Recherche d'inform ation à propos des variables choisies.

C h oix d e variab les .

Phénom ène étudié.

Risque

Page 4: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

4

121. Modélisation.

Choix de variables.

Phénom ène étudié.

1. Etude de la rentabilité financière d’un projetd’investissement ;

2. Construction d’un S.I.A.D.A. ;

3. Fabrication et mise en place d’un baromètre susceptible demesurer dans le temps le sentiment d’une population sur unepopularité, l’insécurité ou une image ;

4. Typologie d’une clientèle ;

5. Liaison entre le chiffre d’affaires et les besoins en maind’œuvre.

Page 5: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

5

122. Statistique, informatique et traitement de l’information ;

Dépouillem ent de l'inform ation recueillie .

Tableaux statistiques. Graphiques. Valeurs caractéristiques. Autres analyses.

Recherche d'inform ation à propos des variables choisies.

Page 6: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

6

123. Décision.

Prévis ion. D éc is ion.

C om m enta ires e t recom m andations .

Risque

Page 7: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

7

13. Mots clés.

131. Population : référentiel sur lequel porte l’étude. Ensemble d’individus, d’objets, de faits, d’unités de temps, de codes…;

Page 8: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

8

132.Variable : une caractéristique que l’on désire étudier sur chaque individu de la population.

Qualitative

Discret Continu

Type.

Quantitative

Nature

Variable.

Page 9: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

9

Exemples.

- Catégorie professionnelle d’une personne : variable qualitative ; - Le nombre d’enfants à charge d’un foyer ou le nombre de pièces d’un appartement :variables quantitatives discrètes ; - l’âge d’un individu ou le revenu d’un foyer fiscal : variables quantitatives continues.

Page 10: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

10

133. Information.

Interne à l'entreprise. Externe à l'entreprise.

Existe.

Inform ation à créer.

N'existe pas.

Inform ation.

Page 11: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

11

Principales sources internes :

- Données comptableset budgétaires ;

- Informations commerciales ;- Données concernant la production ;- Sources du service du personnel.

Principales sources externes :

- Les sources professionnelles ;- Les sources publiques ;- Les organismes spécialisés.

Page 12: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

12

I n f o r m a t i o n à c r é e r : o n p e u t a v o i r r e c o u r s à d e ss o n d a g e s :

A 2 degrés En grappe

A 2 niveaux Statifié

Non sim ple Sim ple

Aléatoire

M éthode des tinéraires M éthode des quotas

Em pirique

Echantillons.

Page 13: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

13

134. Dépouillements.

- T r i à p l a t : t a b l e a u s i m p l e e n t r é e ;

Nom enc la ture .

V ariab le q ua lita tive

S érie s ta tis tique

V ariab le q uan tita tive

T ri à p la t

- T r i c r o i s é : t a b l e a u 2 e n t r é e s o ut a b l e a u d e c o n t i n g e n c e ;

Page 14: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

14

- Mentions obligatoires dans la constitution d’un tableau :

Le titre ; La source d’information avec les références complètes ; Les unités utilisées ; Les intitulés des lignes et des colonnes.

Page 15: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

15

1

Méthodes statistiques.

2. Tris, imagerie, position.

Page 16: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

16

21. Tris211. Tri à plat.

a. Nomenclature. Par exemple:

On a relevé la couleur des yeux de 10 individus d’une population. Les résultats sont présentés dans l’ordre où ils ont été obtenus.

Vert ; bleu ; marron ; marron ; marron ; bleu ; bleu ; marron ; marron ; bleu.

Page 17: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

17

Modalités : Couleurs effectifs fréquence Pourcentage

( %) vert 4 0.4 40 bleu 5 0.5 50

marron 1 0.1 10 10 1 100

Le tri à plat (nomenclature) nous est donné dans le tableau ci-après, en utilisant la fréquence absolue, la fréquence relative et le pourcentage.

Page 18: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

18

b. Série statistique.

Par exemple:

Semaines 1 2 3 4 5 6 7 Nombre d’absents 0 2 1 3 0 2 3

Semaines 8 9 10 11 12 13 Nombre d’absents 1 0 2 1 0 4

On relève sur 13 semaines le nombre d’individus absents. Les résultats sont présentés dans le tableau suivant.

Page 19: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

19

Modalités : nombre

d’absents

Effectifs : nombre de semaines

fréquence Pourcentage

( % )

0 4 0.308 30.8 1 3 0.254 25.4 2 3 0.254 25.4 3 2 0.174 17.4 4 1 0.090 9.0 13 1 100.

La série statistique est donnée dans le tableau suivant, accompagnée de la fréquence et des pourcentages.

Page 20: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

20

Nous remarquons que les formes des 2 tableaux sont les mêmes; mais que dans un cas il n ’est pas possible d ’ordonner les modalités alors que dans l ’autre, les modalités sont ordonnées de manière croissante.

On peut également choisir de classer les modalités dans des classes de même amplitude ou d’amplitudes différentes.

Page 21: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

21

212. Tri croisé.Exemple:On relève pour 10 livraisons les quantités

livrées et le montant des factures correspondantes. Les résultats sont présentés dans le tableau suivant :

Page 22: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

22

Numéro de livraison.

Modalités de la variable 1 :

quantité

Modalités de la variable 2 : montant facturé (1 000 euros )

1 12 31 2 20 35 3 15 29 4 13 18 5 14 31 6 17 35 7 11 31 8 12 18 9 13 35 10 12 18

Page 23: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

23

Le tri croisé de ces 2 variables peut-être réalisé de la manière suivante:

Modalités de la variable X

Modalités de la variable Y

X Y 18 19 31 35

11 1

12 2 1

13 1 1

14 1

15 1

17 1

20 1

Page 24: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

24

D ’un tableau de contingence on peut extraire:a. deux tableaux marginaux;b. k tableaux conditionnels avec k égal au

nombre de modalités de la variable X + nombre de modalités de la variable Y

Page 25: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

25

D ’un tableau de contingence on peut également déduire deux tableaux profilés:

a. Tableau des profils/lignes;b. Tableau des profils/ colonnes

Ces tableaux peuvent être utilisés dans le cadre de l’étude de proximités mais aussi en analyse des correspondances.

Page 26: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

26

Premiers éléments visuels importants pour l ’analyse.

22. Imagerie.

Page 27: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

27

221.Variable qualitativeIl y a trois possibilités:

a. diagramme à barres;b. diagramme à bandes;c. diagramme à secteurs.

Page 28: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

28

Le chiffre d’affaires réalisé sur 3 produits par une entreprise est donné dans le tableau suivant :

Produits. A B C total C.A. (1000 euros) 40 160 200 400

C.A. (%) 10 40 50 100

Par exemple, si on considère la statistique suivante:

Page 29: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

29

A

B

C

Diagramme à barres.

Diagramme à bandes.

Diagramme à secteurs.

CB

A

C B

A

Page 30: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

30

222. Variable quantitative discrète: « diagramme à bâtons ».

Sur 60 jours d’observation, nous avons relevé le nombre d’employés absents. L’ensemble des résultats est donné dans le tableau ci-après.

Nombre d’absents par jour

0 1 2 3 4 5 Total

Nombre de jours. 10 18 20 6 4 2 60

Page 31: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

31

La représentation est un diagramme à bâtons.

Nombre deJours. 20

10

0 1 2 3 4 5 Nombre d’absents par jour.

Page 32: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

32

223. Variable quantitative classée:Histogramme dont le principe de représentation

est le suivant:

« L’aire de l’histogramme et de chaque rectangle construit est proportionnelle à l’effectif total et à l’effectif de chaque classe. »

Page 33: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

33

Par exemple, si on considère la statistique suivante:

La statistique suivante donne l’âge de 40 individus ventilé en 6 classes.

Modalités : classes d’âge.

Effectifs : individus.

[18 – 20[ 4 [20 – 22[ 10 [22 – 24[ 12 [24 – 26[ 8 [26 – 28[ 4 [28 – 30[ 2

40

Page 34: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

34

L ’amplitude des classes est la même pour toutes les classes et l ’histogramme a une représentation simple:

Nombre d’individus.

18 20 22 24 26 28 30 âge

Page 35: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

35

Admettons maintenant que les deux dernières classes soient regroupées en une classe unique d’amplitude 4 années et d’effectif 6.

Page 36: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

36

Nombre d’individus.

18 20 22 24 26 30 âge

4 10 12 8 3 3

Nombre d’individus.

18 20 22 24 26 30 âge

4 10 12 8 6 6

Image correcte.

Image incorrecte.

Page 37: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

37

Classes Effectifs

[18, 20[ 40

[20, 22[ 100

[22, 25[ 120

[25, 30[ 80

[30, 40[ 50

[40, 50[ 45

[50, 55[ 30

[55, 60[ 15

[60, 65[ 5

Soit à représenter la variable classée:

Page 38: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

38

Utilisation d’une macro

Page 39: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

39

Classes d’âge

Effectifs

0

20

40

60

80

100

120

140

[18, 20[ [20, 22[ [22, 25[ [25, 30[ [30, 40[ [40, 50[ [50, 55[ [55, 60[ [60, 65[

Page 40: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

40

23. Valeurs caractéristiques:la position.

3 types:

• Le mode;

• la médiane;

• les moyennes.

Page 41: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

41

231. Le mode.C ’est la modalité de la variable la plus fréquemment

rencontrée.

• Ne se calcule pas;

• peut-être conventionnel;

• n ’est pas unique;

• n’a d’intérêt que s ’il domine véritablement;

• c ’est la modalité la plus probable.

Page 42: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

42

232. La médiane.Valeur de la variable qui divise les observations en

deux groupes de même importance.

• On peut l’obtenir graphiquement en utilisant les cumuls croissants; ou par le calcul, si la variable est classée;

• 50 % des observations ont une valeur inférieure à la médiane.

Page 43: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

43

Par exemple:a. 50 % des français ont un revenu salarié inférieur à

1350 euros;b. 50 % des salariés d ’une entreprise ont plus de 32

ans. c. Avec 50 % de nos clients on réalise un chiffre

d ’affaires inférieur à 15 500 euros.

Page 44: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

44

233. Les moyennes:

Moyenne arithmétique : n

xnx

pi

iii

1

Moyenne harmonique : Moyenne géométrique : G xi

n

i

i p

ni

1

1

Moyenne quadratique : Q =n x

n

i ii

i p n2

1

1

Hnn

xi

ii

i n

1

Page 45: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

45

Exemple de moyenne géométrique:On dispose de l’information concernant le chiffre d’affaires d’une entreprise sur 4 trimestres consécutifs.

Trimestres. Chiffre d’affaires (1000 euros)

1 100 2 140 3 152 4 190

Page 46: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

46

Notons t le taux de croissance cherché, c’est à dire le taux de croissance trimestriel moyen sur l’année. La relation que t doit vérifier est donnée par :

19031100 t

Ainsi, la valeur de t peut-être calculée:

31

3

111

i

i itt

Page 47: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

47

Exemple de moyenne harmonique: Considérons 3 individus qui ont sur l’exécution d’un certain type d’opérations des rendements horaires différents.

Individu rendement horaire 1 50 2 80 3 100

Page 48: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

48

Il est connu qu’un rendement horaire est égal auquotient suivant :

Nombre total d’opérations à traiter.r =

Temps mis pour réaliser cesopérations.

La valeur ensuite dépend des circonstances danslesquelles le travail est réalisé.

Page 49: 1 Statistiques 1. Introduction.. 2 11. Utilité. 3 12. Schéma d une étude. Modélisation Décision Statistiques et informatique Risque.

49

Ce nombre peut-être arithmétique si le travail à réaliser est affecté globalement; mais il est harmonique si il est réparti également par exemple.