Statistiques et probabilités

66
L’enseignement des statistiques

Transcript of Statistiques et probabilités

Page 1: Statistiques et probabilités

L’enseignement des statistiques

Page 2: Statistiques et probabilités
Page 3: Statistiques et probabilités

Un Vendredi noir à la Bourse !

3760

3770

3780

3790

3800

3810

3820

3830

3840

3850

3860

Page 4: Statistiques et probabilités

L’indice des valeurs est en repli de 2%

3500

3550

3600

3650

3700

3750

3800

3850

3900

Page 5: Statistiques et probabilités

Pour manger, un salarié sur dix a recours aux associations !

Dans le journal Libération du 17-18 juin 2006 , un

titre page 14 :

« Pour manger, un salarié sur dix a recours aux associations. »

Il y a environ 24 millions de salariés en France, donc 2,4 millions auraient recours aux associations pour manger ?

Mais dans l’article, on lit que parmi les personnes faisant appel aux banques alimentaires, une sur dix est salariée. C’est bien différent !

Page 6: Statistiques et probabilités

« Aujourd’hui, il n’est pas exagéré de considérer la statistique en France comme une discipline émergeant difficilement ».

(Rapport de l’Académie des Sciences, juillet 2000).

Page 7: Statistiques et probabilités

Les problématiques conduisant à des questions de nature statistique sont variées. La prise en compte de l’aléatoire a gagné presque tous les domaines : le contrôle de qualité en milieu industriel, la prévision des petits et des grands risques, l’élaboration de politiques de santé publique, les calculs financiers, etc…

Pour comprendre l’actualité, une formation à la statistique est aujourd’hui indispensable ; c’est une formation qui développe les qualités d’analyse et de synthèse et exerce le regard critique.

Page 8: Statistiques et probabilités

« La statistique enseignée dans le secondaire voudrait être de la statistique descriptive, mais consiste le plus souvent en une fastidieuse série d’exercices de calculs de moyenne, d’écart – types et de tracés d’histogrammes – c’est à peu près aussi intéressant que de lire un annuaire du téléphone sans aucune raison de le faire ».

(Claudine Robert 1996)

Page 9: Statistiques et probabilités

? Préféreriez vous travailler dans

une entreprise où le salaire moyen est de 1 500 € ou bien dans une entreprise où le salaire moyen est de 3 000 € ?

Page 10: Statistiques et probabilités

Est – il possible de faire de la plongée dans un lac dont la profondeur moyenne est 50 cm ?

Page 11: Statistiques et probabilités

Un domaine d’enseignement « jeune »

• Apparaît en 1965 en Première A, B et D et en 1970 en Première C.

• Apparaît en Seconde en 1981.

• Apparaît au Collège seulement en 1986.

• Une évolution en 1992: on demande de réaliser (au moins une fois) une étude statistique de A à Z.

• « Révolution » en 2000 : le programme de Seconde demande de consacrer 1/8 du temps à l’enseignement des statistiques.

Page 12: Statistiques et probabilités

Des fonctions données à l’enseignement des statistiques dans les programmes

• Une fonction sociale

• Une fonction institutionnelle, qui présente deux composantes : - une composante disciplinaire ; - une composante interdisciplinaire.

• Une fonction de formation générale

Page 13: Statistiques et probabilités

Une distinction

• Les statistiques : ce sont des dénombrements de sujets, d’objets, d’évènements dans des populations ou des sous – populations.

• La statistique : c’est un mode de pensée permettant de recueillir, de traiter et d’interpréter les données qu’on rencontre dans divers domaines.

Page 14: Statistiques et probabilités

Enseigner les statistiques et les probabilités ?

Que ce soit dans le domaine des statistiques ou dans celui des probabilités, notre enseignement français accuse un certain retard sur d’autres pays, en particulier sur les pays anglo-saxons. Différentes raisons peuvent expliquer ce retard :

• impression que ce ne sont pas de « vraies

mathématiques » • manque de formation des enseignants • manque de temps

Page 15: Statistiques et probabilités

Le traitement statistique

• Les statistiques vont transformer les données brutes en les représentant de façon « classée » pour pouvoir en faire des « résumés ».

• Ces « résumés » vont pouvoir donner des interprétations du phénomène empirique.

• Problème fondamental de la statistique: concilier le mieux possible deux pôles antagonistes : la « fidélité » et la « clarté »

Phénomène empirique :

données brutes

Statistiques

données traitées

Page 16: Statistiques et probabilités

Dans les programmes

Page 17: Statistiques et probabilités

Les programmes de l’école primaire

Cycle 2

Organisation et gestion des données

• Lire ou compléter un tableau dans des situations concrètes simples

• Utiliser un tableau, un graphique.

• Organiser les informations d’un énoncé

Page 18: Statistiques et probabilités

Cycle 3 Organisation et gestion des données

• Savoir organiser les données d’un problème en vue de sa résolution.

• Construire et utiliser un tableau ou un graphique en vue d’un traitement des données.

• Interpréter un tableau ou un graphique.

Page 19: Statistiques et probabilités

• Un graphique est donné. On doit : - soit commenter les données qui sont représentées; - soit élaborer ou compléter un tableau à partir du graphique.

• Un tableau de données est fourni. On doit: - soit commenter ces données; - soit élaborer ou compléter un graphique.

• Les données sont fournies dans un texte. On doit: - soit élaborer ou compléter un tableau; - soit élaborer ou compléter un graphique.

Problèmes pouvant être posés aux élèves en fin de cycle 3

Page 20: Statistiques et probabilités

Un graphique est donné

Cela peut être:

-Un diagramme en barres ;

-Un diagramme en bandes ;

-Un diagramme circulaire ;

-Un diagramme cartésien ;

- …….

Page 21: Statistiques et probabilités

CM2

On donne un diagramme en barres On extrait des informations à partir du graphique

Page 22: Statistiques et probabilités

Euromaths

On donne un diagramme en bandes On extrait des informations à partir du graphique

Page 23: Statistiques et probabilités

CM1

On donne un diagramme cartésien. On extrait des informations à partir du graphique. On complète un tableau à partir des données lues sur le graphique.

Page 24: Statistiques et probabilités

CM2 On donne un diagramme circulaire. On extrait des informations à a partir du graphique.

Page 25: Statistiques et probabilités

Un tableau est donné

On demande de construire ou de compléter un diagramme à partir d’un tableau de valeurs numériques.

Page 26: Statistiques et probabilités

CE2 Construction d’un diagramme en barres

Page 27: Statistiques et probabilités

CM1

Quelle notion doivent maîtriser les élèves pour mener à bien cette tâche ?

On donne un tableau. On doit construire un diagramme en barres.

Page 28: Statistiques et probabilités

CM1 O n donne un tableau. Il faut compléter un diagramme en barres.

Page 29: Statistiques et probabilités

Sixième Organisation et représentation des données

• Représentations usuelles : tableaux

(tableaux en deux ou plusieurs colonnes, tableaux à double entrée)

• Représentations usuelles (lire, utiliser, interpréter): - diagrammes en bâtons - *diagrammes circulaires ou demi – circulaires - graphiques cartésiens Utilisation de calculatrices et de logiciels

Page 30: Statistiques et probabilités

Cinquième Représentation et traitement des

données • Effectifs

• *Fréquences

• Classes : regroupement des données en classes d’égale amplitude

• Tableaux de données, représentations graphiques de données (diagrammes divers, histogramme) Utilisation d’un tableur

Page 31: Statistiques et probabilités

Tableau récapitulant l’évolution des tonnages et des chiffres d’affaire de la pêche dans le département des Côtes d’Armor de

1991 à 1998.

Page 32: Statistiques et probabilités

Etude des tonnages par catégorie

Page 33: Statistiques et probabilités

Des questions qui se posent …

• - Quel est le tonnage de poissons pêchés en 1998 ?

• - Quelle est la catégorie la plus pêchée en 1992, en 1998 ?

• - Quelles sont les différences les plus significatives entre les deux années ?

Page 34: Statistiques et probabilités

Quelles sont les différences les plus significatives entre les deux années ?

Page 35: Statistiques et probabilités

Résumé de la pêche par catégorie en 1986

Page 36: Statistiques et probabilités

Evolution du tonnage de la pêche à l’araignée entre 1991 et 1998

Page 37: Statistiques et probabilités

ou bien ….

Page 38: Statistiques et probabilités

Cinquième Représentation et traitement des données

• Effectifs *Fréquences Classes (de même amplitude)

• Tableau de données, représentations graphiques de données (diagrammes divers, histogrammes)

Page 39: Statistiques et probabilités

Attention aux histogrammes …

Page 40: Statistiques et probabilités

Quatrième Traitement des données

• Moyennes pondérées

Créer, modifier une feuille de calcul, insérer une formule.

Créer un graphique à partir des données d’une feuille de calcul.

Usage du tableur et de la calculatrice

Page 41: Statistiques et probabilités

Troisième Statistique

• Caractéristiques de position • Approche de caractéristiques de dispersion :

- médiane ; - premier et troisième quartiles ; - étendue.

Travail en liaison avec les autres disciplines Utilisation d’un tableur

Page 42: Statistiques et probabilités

La médiane et les quartiles … dans les manuels

Page 43: Statistiques et probabilités

Définitions actuelles

• Médiane. La série des données est ordonnée par ordre croissant. Si la série est de taille impaire (2n+1), la médiane est la valeur du terme de rang n+1. Si la série est de taille paire (2n), la médiane est la demi - somme des valeurs des termes de rang n et n+1.

• Quartiles. Le premier (respectivement le troisième) quartile est le plus petit élément Q1 (respectivement Q3) des valeurs des termes de la série ordonnée par ordre croissant, tel qu’au moins 25%(respectivement 75%) de ces valeurs soient inférieures ou égales à Q1 (respectivement Q3).

Page 44: Statistiques et probabilités

Seconde Statistique descriptive, analyse de données

• Caractéristiques de position et de dispersion : - médiane, quartiles ; - moyenne.

• Utiliser un logiciel (tableur) ou une calculatrice pour étudier une série statistique.

• Effectifs cumulés, fréquences cumulées.

• Représentations graphiques: nuage de points, courbe des fréquences cumulées.

Page 45: Statistiques et probabilités

Durée annuelle du travail en heures

0

500

1 000

1 500

2 000

2 500

Pays-Bas Allemagne France Italie Suède Royaume-Uni Espagne Japon États-Unis

1950

2007

Comparaison de deux séries à l’aide d’un logiciel

Page 46: Statistiques et probabilités

Des écueils de cet enseignement

• Exercice du serveur Wims (Seconde)

• Soit la série statistique suivante:

Calculer pour cette série statistique:

- la moyenne; - la valeur maximale; - la valeur minimale; - l’étendue statistique

Valeurs 6.5 7 8 2.5 10.5 2 1 0.5 9.5 4.5 3 4 6 0 10.5 9.5

Page 47: Statistiques et probabilités
Page 48: Statistiques et probabilités

Une série d’exercices issus d’un manuel de

BTS

Page 49: Statistiques et probabilités

Premières générales ES et L S

Statistique descriptive, analyse de données Caractéristiques de dispersion : variance, écart-type. Diagramme en boîte.

Statistique descriptive, analyse de données Caractéristiques de dispersion : variance, écart-type. Diagramme en boîte.

Page 50: Statistiques et probabilités
Page 51: Statistiques et probabilités

Un diagramme en boîte

Page 52: Statistiques et probabilités

Premières technologiques

STG ST2S STI 2D - STL Séries de données Histogrammes, diagrammes en boîte, en secteurs ou en bâtons. Tendance centrale : - moyenne - médiane. Dispersion : - quartiles, déciles. - Intervalle interquartile, intervalle interdécile. - écart type. Tableau croisé d’effectifs Etude fréquentielle, notion de fréquence de A sachant B

Présentation des données Histogrammes à pas non constants Tableau à double entrée Indicateurs de centralité - moyenne ; calcul à partir des moyennes des sous – populations. - Médiane Indicateurs de dispersion - quantiles, décile, intervalle interquartile, intervalle interdécile - diagramme en boîte - écart type

Statistique descriptive, analyse de données Caractéristiques de dispersion : variance, écart-type.

Page 53: Statistiques et probabilités
Page 54: Statistiques et probabilités

Terminales (en 2011-2012) ES STG ST2S STL

Nuage de points associé à une série statistique à deux variables numériques. Point moyen. Ajustement affine par moindres carrés.

Etude de séries de données statistiques quantitatives à deux variables Nuage de points, point moyen Ajustement affine Séries chronologiques

Séries statistiques à deux variables -qualitatives : tris croisés étude fréquentielle, notion de fréquence de A sachant B. -quantitatives : tableaux d’effectifs, nuage de points associés, points moyens. Exemples d’ajustements.

Séries statistiques à deux variables quantitatives : tableaux d'effectifs, nuage de points associés, point moyen.

Page 55: Statistiques et probabilités

Problème de l’ajustement affine

Page 56: Statistiques et probabilités

56

Petite étude d’un fichier de mesures corporelles

Variables du fichier des mesures corporelles

252 hommes

• densité (gr/cm3)

• Pourcentage de masse graisseuse : BF%

• Age en année

• Poids en kg

• Taille m : hauteur en mètres

• IMC =poids en kg/(taille en m) 2

Tours en cm de

• Cou

• Poitrine

• taille

• Hanche

• Cuisse

• Genou

• Cheville

• Biceps

• avant bras

• Poignet

Page 57: Statistiques et probabilités

57

Résumés numériques

1,1 1,9E-2 250 1,0 1,1 1,1

19,0 8,3 250 0,0 47,5 19,2

44,8 12,5 250 22,0 81,0 43,0

81,1 13,3 250 53,8 164,7 79,9

1,8 ,1 250 1,6 2,0 1,8

38,0 2,4 250 31,1 51,2 38,0

100,8 8,4 250 79,3 136,2 99,6

92,4 10,7 250 69,4 148,1 90,9

99,8 7,1 250 85,0 147,7 99,3

59,4 5,2 250 47,2 87,3 59,0

38,6 2,4 250 33,0 49,1 38,5

23,1 1,7 250 19,1 33,9 22,8

32,3 3,0 250 24,8 45,0 32,0

28,7 2,0 250 21,0 34,9 28,7

18,2 ,9 250 15,8 21,4 18,3

25,4 3,6 250 18,0 48,9 25,0

71,4 5,0 250 59,4 85,6 71,1

Moy. Dév. Std Nombre Minimum Maximum Médiane

densité

body fat %

age

Poids kg

taille m

cou

poitrine

taille

hanches

cuisse

genou

cheville

biceps

avant bras

poignet

IMC

Lorentz

Page 58: Statistiques et probabilités

58

Poids et BF

40 60 80 100 120 140 160 180

Poids kg

0 5 10 15 20 25 30 35 40 45 50

body fat %

Page 59: Statistiques et probabilités

59

Résumés numériques

1,1 1,9E-2 250 1,0 1,1 1,1

19,0 8,3 250 0,0 47,5 19,2

44,8 12,5 250 22,0 81,0 43,0

81,1 13,3 250 53,8 164,7 79,9

1,8 ,1 250 1,6 2,0 1,8

38,0 2,4 250 31,1 51,2 38,0

100,8 8,4 250 79,3 136,2 99,6

92,4 10,7 250 69,4 148,1 90,9

99,8 7,1 250 85,0 147,7 99,3

59,4 5,2 250 47,2 87,3 59,0

38,6 2,4 250 33,0 49,1 38,5

23,1 1,7 250 19,1 33,9 22,8

32,3 3,0 250 24,8 45,0 32,0

28,7 2,0 250 21,0 34,9 28,7

18,2 ,9 250 15,8 21,4 18,3

25,4 3,6 250 18,0 48,9 25,0

71,4 5,0 250 59,4 85,6 71,1

Moy. Dév. Std Nombre Minimum Maximum Médiane

densité

body fat %

age

Poids kg

taille m

cou

poitrine

taille

hanches

cuisse

genou

cheville

biceps

avant bras

poignet

IMC

Lorentz

1,1 1,9E-2 249 1,0 1,1 1,1

19,0 8,3 249 0,0 47,5 19,2

44,8 12,5 249 22,0 81,0 43,0

80,7 12,2 249 53,8 119,2 79,8

1,8 ,1 249 1,6 2,0 1,8

37,9 2,3 249 31,1 43,9 38,0

100,6 8,1 249 79,3 128,3 99,6

92,2 10,2 249 69,4 126,2 90,9

99,6 6,4 249 85,0 125,6 99,3

59,2 4,9 249 47,2 74,4 58,9

38,5 2,3 249 33,0 46,0 38,4

23,1 1,6 249 19,1 33,9 22,8

32,2 2,9 249 24,8 39,1 32,0

28,7 2,0 249 21,0 34,9 28,7

18,2 ,9 249 15,8 21,4 18,3

25,3 3,3 249 18,0 39,1 25,0

71,4 5,0 249 59,4 85,6 70,9

Moy. Dév. Std Nombre Minimum Maximum Médiane

densité

body fat %

age

Poids kg

taille m

cou

poitrine

taille

hanches

cuisse

genou

cheville

biceps

avant bras

poignet

IMC

Lorentz

Page 60: Statistiques et probabilités

60

Taille en m moyenne=médiane=1,8m

0

5

10

15

20

25

30

Pourc

enta

ge

1,6 1,65 1,7 1,75 1,8 1,85 1,9 1,95 2

hauteur

0

2

4

6

8

10

12

14

Pourc

enta

ge

1,62 1,66 1,7 1,74 1,78 1,82 1,86 1,9 1,94 1,98

hauteur

1,6

1,64

1,68

1,72

1,76

1,8

1,84

1,88

1,92

1,96

2

taille m

Page 61: Statistiques et probabilités

61

Age Moyenne 44,8 ans, médiane 43 ans

0

5

10

15

20

25

Pourc

enta

ge

20 25 30 35 40 45 50 55 60 65 70 75 80 85

age

20

28

36

44

52

60

68

76

84

age

Page 62: Statistiques et probabilités

62

Mesures corporelles

40

50

60

70

80

90

100

110

120

130

poitrine taille hanches cuisse

15

20

25

30

35

40

45

50

cou

genou

cheville

bic

eps

avant bra

s

poig

net

Page 63: Statistiques et probabilités

63

Poids en kg Moyenne 80,7 médiane 79,8

0

2

4

6

8

10

12

14

16

18

Pourc

enta

ge

50 60 70 80 90 100 110 120

Poids kg

50

58

66

74

82

90

98

106

114

122

Poids kg

Page 64: Statistiques et probabilités

64

Indice de masse corporelle IMC=poids en kg/(taille en m) 2

• Insuffisance pondérale IMC<18,5

• Surpoids : IMC entre 25 et 30

• Obésite à partir de 30

0

5

10

15

20

25

30

35

40

45

50

Pourc

enta

ge

15 20 25 30 35 40 45 50

IMC

0

20

40

60

80

100

Pourcenta

ge

10 15 20 25 30 35 40

IMC

Page 65: Statistiques et probabilités

65

Lien taille poids

50

60

70

80

90

100

110

120

130

Poid

s k

g

1,6 1,65 1,7 1,75 1,8 1,85 1,9 1,95 2

taille m

50

60

70

80

90

100

110

120

130

Poid

s k

g

1,6 1,65 1,7 1,75 1,8 1,85 1,9 1,95 2

taille m

Y = -88,45 + 94,736 * X; R^2 = ,265

Page 66: Statistiques et probabilités

66

Liens âge poids

40

60

80

100

120

140

160

180

poid

s

20 30 40 50 60 70 80 90

age

Nuage de points