Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

37
Isabelle ABOU Professeure Formatrice 1 STATISTIQUE STATISTIQUE INFERENTIELLE INFERENTIELLE STAGE ACADEMIQUE STAGE ACADEMIQUE LA REUNION LA REUNION

Transcript of Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Page 1: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU Professeure Formatrice

1

STATISTIQUE STATISTIQUE INFERENTIELLEINFERENTIELLESTATISTIQUE STATISTIQUE

INFERENTIELLEINFERENTIELLESTAGE ACADEMIQUESTAGE ACADEMIQUE

LA REUNIONLA REUNION

Page 2: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 2

OBJECTIFS DU STAGE

• Poser les bases de la théorie de la statistique inférentielle.

• En comprendre les enjeux, leur utilité, et leur domaine d’intervention pour justifier son introduction dans les programmes.

• Donner quelques exemples d’application en classe.

Page 3: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 3

PLAN DE L’EXPOSE• 1ière PARTIE: GÉNÉRALITÉS• I. INTRODUCTION• II. SITUATIONS PROBLEMES• III. LA STATISTIQUE INFERENTIELLE• IV. LE PROGRAMME DE SECONDE• 2ième PARTIE: LA THÉORIE• I. LOI NORMALE• II. THEORIE DE L’ECHANTILLONNAGE• III. PRISE DE DECISION • IV. THEORIE DE L’ESTIMATION• V. ESTIMATION D’UNE PROPORTION• VI. EVALUATION DE TRAVAUX AVEC TIC• 3ième PARTIE: APPROFONDISSEMENT• I. TESTS STATISTIQUES• II. COMPLEMENTS

Page 4: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 4

11ièreière PARTIE: PARTIE:GÉNÉRALITÉSGÉNÉRALITÉS11ièreière PARTIE: PARTIE:

GÉNÉRALITÉSGÉNÉRALITÉS

Page 5: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 5

I. INTRODUCTIONI. INTRODUCTIONI. INTRODUCTIONI. INTRODUCTION

Page 6: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 6

LES METHODES STATISTIQUES

• Les méthodes statistiques sont utilisées dans presque tous les secteurs.

• Parmi ses applications, citons • - dans le domaine industriel: la fiabilité des

matériels, le contrôle de qualité, l’analyse des résultats de mesure et leur planification, la prévision, et

• - dans le domaine de l’économie et des sciences de l’homme: les modèles économétriques, les sondages, les enquêtes d’opinion, les études quantitatives de marché.

Page 7: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 7

LA DEMARCHE STATISTIQUE

• Après le recueil de données, la démarche statistique consiste à traiter et interpréter les informations recueillies.

• Elle comporte deux grands aspects: l’aspect descriptif ou exploratoire et l’aspect inférentiel ou décisionnel.

Page 8: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 8

Statistique descriptive Statistique mathématique

Etude du débit d’une rivière pendant 50 ans.

Prévisions sur la hauteur des crues pour la construction d’un barrage.

Etude des caractéristiques de pièces d’une chaine de fabrication.

Contrôle de qualité.

Etudes de données économiques sur les dépenses des ménages.

Prévoir l’évolution de la vente d’un produit.

Page 9: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 9

LA STATISTIQUE EXPLORATOIRE• Son but est de synthétiser, résumer, structurer

l’information contenue dans les données.• Elle utilise pour cela des représentations de données sous

forme de tableaux, de graphiques, d’indicateurs numériques.

• Connue sous le nom de statistique descriptive, elle s’est enrichie de techniques de visualisation de données multidimensionnelles, c’est l’analyse de données.

• Son rôle est de mettre en évidence les propriétés de l’échantillon et de suggérer des hypothèses.

• Les principales méthodes :• - les méthodes de classification pour réduire la taille de

l’ensemble des individus en formant des groupes homogènes.

• - les méthodes factorielles qui cherchent à réduire le nombre de variables en les résumant à un petit nombre de composantes, analyse des composantes principales pour les variables numériques, analyse des correspondances pour les variables qualitatives.

Page 10: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 10

LA STATISTIQUE INFERENTIELLE

• Son but est d’étendre les propriétés constatées sur l’échantillon à la population tout entière et de valider ou d’infirmer des hypothèses à priori ou formulées après une phase exploratoire.

• Le calcul des probabilités y joue souvent un rôle fondamental.

• Quelques exemples:• - l’estimation d’une moyenne,• - la vérification d’une hypothèse ou test,• - la modélisation et la prévision statistique.

Page 11: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 11

II. SITUATIONS II. SITUATIONS PROBLEMESPROBLEMES

II. SITUATIONS II. SITUATIONS PROBLEMESPROBLEMES

Page 12: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 12

QUELQUES SITUATIONS PROBLEMES

• Les exemples utilisés dans ce stage sont extraits de:

• documents ressources - pour la classe de seconde- Probabilités et Statistiques-

• http://media.education.gouv.fr/file/Programmes/17/9/Doc_ressource_proba-stats_109179.pdf

• documents ressources - pour la voie professionnelle (lycée).

• http://www.ac-grenoble.fr/maths/docresseconde/Proba_stat_LP.doc

• - manuels de BTS.

Page 13: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 13

DEFAUTS DE PEINTURE• Dans une usine automobile, on

contrôle les défauts de peinture de type

• « grains ponctuels sur le capot ». • Lorsque le processus est sous contrôle, • on a 20 % de ce type de défauts.• Lors du contrôle aléatoire de 50

véhicules, on observe 26 % de défauts• (13 sur 50). • Faut-il s’inquiéter ?

Page 14: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 14

RESPECT DE LA PARITE• Deux entreprises A et B recrutent dans

un bassin d’emploi où il y a autant de femmes que d’hommes, avec la contrainte du respect de la parité.

• Dans l’entreprise A, il y a 100 employés dont 43 femmes.

• Dans l’entreprise B, il y a 2500 employés dont 1150 femmes.

• Quelle est l’entreprise qui respecte le mieux la parité ?

Page 15: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 15

TAUX ANORMAL DE LEUCEMIES

• Une petite ville des États-Unis a connu 9 cas de leucémie chez de jeunes garçons en l’espace de 10 années.

• Doit-on, comme l’ont alors affirmé les autorités, en accuser le hasard ?

• Woburn est une petite ville industrielle du Massachusetts, au Nord-Est des États-Unis.

• Du milieu à la fin des années 1970, la communauté locale s’émeut d’un grand nombre de leucémies infantiles survenant en particulier chez les garçons dans certains quartiers de la ville.

• Les familles se lancent alors dans l’exploration des causes et constatent la présence de décharges et de friches industrielles ainsi que l’existence de polluants.

• Dans un premier temps, les experts gouvernementaux concluent qu’il n’y a rien d’étrange.

• Mais les familles s’obstinent et saisissent leurs propres experts. • Une étude statistique montre qu’il se passe sans doute quelque chose

« d’étrange ».

Page 16: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 16

TABLEAU DE DONNEES• Le tableau suivant résume les données

statistiques concernant les garçons de moins de 15 ans, pour la période 1969-1979 (Source : Massachusetts Department of Public Health).

Population des garçons de moins de 15 ans à Woburn selon le recensement de 1970 : n

Nombre de cas de leucémie infantile observés chez les garçons à Woburn entre 1969 et 1979

Fréquence des leucémies aux Etats-Unis (garçons) : p

5 969 9 0,000 52

Page 17: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 17

NAISSANCES• Les données statistiques suivantes ont été

relevées :• en 2000, dans le village de Xicun, en Chine, il

est né 20 enfants, parmi lesquels 16 garçons,• dans la réserve indienne d’Aamjiwnaag, située

au Canada à proximité d’industries chimiques, il est né entre 1999 et 2003, 132 enfants dont 46 garçons.

• Ces naissances sont-elles le seul fruit du hasard ?

Page 18: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 18

CONTESTER UN JUGEMENT

• En Novembre 1976 dans un comté du sud du Texas, Rodrigo Partida était condamné à huit ans de prison.

• Il attaqua ce jugement au motif que la désignation des jurés de ce comté était discriminante à l’égard des Américains d’origine mexicaine.

• Alors que 79,1% de la population de ce comté était d’origine mexicaine, sur les 870 personnes convoqués pour être jurés lors d’une certaine période de référence, il n’y eut que 339 personnes d’origine mexicaine.

Page 19: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 19

CONSTESTER UN JUJEMENT (suite)

• 1. Quelle est la fréquence des jurés d’origine mexicaine observée dans ce comté du Texas ?

• 2. La simulation sur un tableur du prélèvement d’échantillons aléatoires de taille n = 870 dans une population où la fréquence des habitants d’origine mexicaine est p = 0,791.

• Les fréquences des habitants d’origine mexicaine observées sur 100 échantillons simulés sont représentées ci-dessous.

Page 20: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 20

• a) Calculer les bornes de l’intervalle [ p – , p + ]. (Arrondir à 10–²).

• b) Quel est le pourcentage des simulations fournissant une fréquence en dehors de l’intervalle précédent ?

• 3. Sur les simulations, est-il arrivé au hasard de fournir une fréquence d’habitants d’origine mexicaine comparable à celle des jurés d’origine mexicaine observée dans ce comté du Texas ?

• 4. Comment expliquez-vous cette situation ?

n1

n1

Page 21: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 21

SONDAGE• Un candidat à une élection effectue un sondage

dans sa circonscription comportant 85842 électeurs : sur 1068 personnes interrogées, 550 déclarent vouloir voter pour ce candidat.

• Pour gagner les élections au premier tour, un candidat doit obtenir 50% des voix.

• Le candidat affirme : « si les élections avaient eu lieu le jour du sondage et si les réponses au sondage étaient sincères, alors j’aurais été élu au premier tour ».

• Qu’en pensez-vous ?

Page 22: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 22

III. III. LA STATISTIQUE LA STATISTIQUE INFERENTIELLEINFERENTIELLE

III. III. LA STATISTIQUE LA STATISTIQUE INFERENTIELLEINFERENTIELLE

PROBLEMATIQUE PROBLEMATIQUE MODELISATIONMODELISATION

Page 23: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 23

STATISTIQUE INFERENTIELLE et ECHANTILLONNAGE

• PROBLEMATIQUE: • Etudier les caractéristiques d’une population

de grande taille, en vue d’en prévoir l’évolution.

• Une étude statistique portant sur tous les éléments d’une population étant soit impossible à réaliser car la taille de la population est trop grande, ou étant trop onéreuse, il faut obtenir des résultats fiables en se limitant à l’étude des éléments ou unités d’un échantillon.

Page 24: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 24

OBJECTIF DE L’ECHANTILLONNAGE:

• Disposant d’observations sur un échantillon de taille n, on désire en déduire des propriétés de la population dont il est issu.

• On cherchera par exemple à estimer la moyenne m d’une population à partir de la moyenne d’un échantillon.

• Mais, comment déterminer l’échantillon de la population que l’on va observer?

ex

Page 25: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 25

PROBLEMES LIES A L’ECHANTILLONNAGE

• Cet échantillon doit donner des estimations non biaisées des paramètres mais permettre, de plus, d’évaluer la marge d’erreurs dues aux fluctuations d’échantillonnage.

• L’échantillon doit être représentatif de la population: il en résulte que chaque unité doit avoir une probabilité non nulle d’être tirée, un tel échantillon est qualifié d’aléatoire.

Page 26: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 26

ECHANTILLON REPRESENTATIF

• Il faut que l’échantillon ait été tiré selon des règles destinées à en assurer la représentativité.

• Le mode de tirage le plus simple et le plus important est l’échantillonnage aléatoire simple correspondant à des tirages équiprobables et indépendants les uns des autres.

• Dans ces conditions, les observations deviennent des variables aléatoires, il convient donc d’en chercher les lois de probabilité avant de tenter d’extrapoler à la population.

Page 27: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 27

EN CONCLUSION• Toute démarche statistique consiste à:• - prélever un échantillon représentatif de la

population par des techniques appropriées. Les différentes méthodes utilisées relèvent de la théorie de l’échantillonnage,

• - étudier les principales caractéristiques d’un échantillon, issu d’une population dont on connaît la loi de probabilité,

• - savoir réaliser des échantillons de variables aléatoires pour vérifier des conclusions en utilisant des techniques de simulation.

Page 28: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 28

ETUDE SUR UN EXEMPLE• On prélève n ampoules électriques dans une

production, et on mesure leur durée de fonctionnement.

• Si les caractéristiques de fabrication d’une ampoule à l’autre n’ont pas varié, les différences entre les durées xi peuvent être considérées comme des fluctuations de nature aléatoire.

• Ceci justifie l’hypothèse fondamentale de la théorie de l’échantillonnage: les valeurs observées xi sont des réalisations d’une même v.a X appelée variable parente (ou mère).

• Ceci suppose l’existence d’une variable aléatoire abstraite, « la durée de vie d’une ampoule », de type donné, fabriquée dans des conditions données.

Page 29: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 29

MODELISATION• On introduira le modèle suivant: • à chaque individu tiré i, on associe une v.a Xi

dont on observe une seule réalisation xi.

• Dans l’exemple précédent, Xi est la durée de vie de l’ampoule i, qui une fois l’expérience faite a pris la valeur xi.

• L’hypothèse précédente revient à dire que les Xi sont des v.a ayant toutes la même distribution, celle de X.

• Pour des raisons de commodité, les Xi seront supposées mutuellement indépendantes.

Page 30: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 30

CADRE THEORIQUE• Les valeurs observées (x1,x2,…,xn) sont n

réalisations indépendantes d’une v.a X mère, ou encore, une réalisation unique du n-uple (X1,X2,…,Xn) où les Xi sont n v.a indépendantes et de même loi que X.

• On appellera n-échantillon de la v.a X, le n-uple (X1,X2,…,Xn) ainsi défini.

• La théorie de l’échantillonnage se propose d’étudier les propriétés du n-uple (X1,X2,…,Xn), en particulier quand n est élevé.

• Une statistique T est une v.a, fonction mesurable de X1,X2,…,Xn : T = f(X1,X2,…,Xn).

Page 31: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 31

IV. LE PROGRAMME IV. LE PROGRAMME DE SECONDEDE SECONDE

IV. LE PROGRAMME IV. LE PROGRAMME DE SECONDEDE SECONDE

Page 32: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 32

OBJECTIFS VISES DANSL’ECHANTILLONNAGE

• Faire réfléchir les élèves à la conception et la réalisation d’une simulation.

• Sensibiliser les élèves à la fluctuation d’échantillonnage, aux notions d’intervalle de fluctuation et d’intervalle de confiance, et à l’utilisation qui peut en être faite.

Page 33: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 33

ECHANTILLONNAGECONTENUS CAPACITES ATTENDUES

Notion d’échantillon. Concevoir, mettre en œuvre et exploiter des simulations de situations concrètes à l’aide du tableur ou d’une calculatrice

Intervalle de fluctuation d’une fréquence au seuil de 95%.

Utiliser les fonctions logiques d’un tableur.Mettre en place des instructions conditionnelles dans un algorithme.

Réalisation s’une simulation

Exploiter et faire une analyse critique d’un résultat d’échantillonnage.

Page 34: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 34

COMMENTAIRES

• L’objectif est d’amener les élèves à un questionnement lors des activités suivantes:

• - L’estimation d’une proportion inconnue à partir d’un échantillon

• - La prise de décision à partir d’un échantillon.

Page 35: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 35

INTERVALLE DE FLUCTUATION AU SEUIL DE 95%

• Relatif aux échantillons de taille n, est l’intervalle centré autour de p, proportion d’un caractère dans la population, où se situe, avec une probabilité égale à 0,95, la fréquence observée dans un échantillon de taille n.

• Cet intervalle peut être obtenu, de façon approchée par simulation.

• Le professeur peut indiquer aux élèves le résultat suivant, utilisable dans la pratique pour les échantillons de taille n>=25, et des proportions p du caractère comprise entre 0,2 et 0,8.

• Si f désigne la fréquence du caractère dans l’échantillon, f appartient à l’intervalle: avec une probabilité d’au moins 0,95.

• Le professeur peut faire percevoir expérimentalement la validité de cette propriété mais elle n’est pas exigible.

n

pn

p1

;1

Page 36: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 36

PENDANT LE STAGE• Nous allons donner les justifications

mathématiques, basées sur la théorie de la statistique inférentielle, qui permettent de justifier la construction de l’intervalle de fluctuation.

• Nous préciserons les approximations qui sont faites dans le programme de seconde.

• Nous aborderons la théorie de l’échantillonnage et ses deux applications principales, dont il faut bien comprendre les hypothèses de départ.

• 1/ La prise de décision à partir d’un échantillon, où l’on connaît la proportion dans la population entière.

• 2/ L’estimation d’une proportion inconnue dans la population, à partir d’un échantillon.

Page 37: Isabelle ABOU Professeure Formatrice 1 STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION.

Isabelle ABOU 37

A SUIVRE…A SUIVRE…22ièmeième PARTIE PARTIEA SUIVRE…A SUIVRE…22ièmeième PARTIE PARTIE

LA THÉORIELA THÉORIE