De la troisième à la seconde dans le champ du programme probabilités et statistiques Année...

23
De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010

Transcript of De la troisième à la seconde dans le champ du programme probabilités et statistiques Année...

Page 1: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

De la troisième à la seconde dans le champ du programme

probabilités et statistiques

Année scolaire 2009-2010

Page 2: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Programme de troisième [BO du 28 Août 2008] Programme de seconde [BO du 23 Juillet 2009]

Statistiques – Probabilités 

Pour les séries statistiques, l’étude des paramètres de position est poursuivie : médiane et quartiles. Une première approche de la dispersion est envisagée. L’éducation mathématique rejoint ici l’éducation du citoyen : prendre l’habitude de s’interroger sur la signification des nombres utilisés, sur l’information apportée par un résumé statistique. De même, c’est pour permettre au citoyen d’aborder l’incertitude et le hasard dans une perspective rationnelle que sont introduits les premiers éléments relatifs à la notion de probabilité.

Statistiques et probabilités 

Pour des questions de présentation du programme, les cadres relatifs à l’enseignement des statistiques et des probabilités sont présentés séparément à la suite l’un de l’autre. Pour autant, ces enseignements sont en relation étroite l’un avec l’autre et doivent faire l’objet d’allers et retours.

Objectifs visés par l’enseignement des statistiques et probabilités à l’occasion de résolutions de problèmes

dans le cadre de l’analyse de données, rendre les élèves capables:

- de déterminer et interpréter des résumés d’une série statistique ;

- de réaliser la comparaison de deux séries statistiques à l’aide d’indicateurs de position et de dispersion, ou de la courbe des fréquences cumulées ;

dans le cadre de l’échantillonnage

- faire réfléchir les élèves à la conception et la mise en œuvre d’une simulation ;-sensibiliser les élèves à la fluctuation d’échantillonnage, aux notions

d’intervalle de fluctuation et d’intervalle de confiance et à l’utilisation qui peut en être faite.

Connaissances Capacités Commentaires Contenus Capacités attendues Commentaires

 

1.3. Statistique

 

Caractéristiques de position.

 

Approche de caractéristiques de dispersion.

[Thèmes de convergence]

- Une série statistique étant donnée (sous forme de liste ou de tableau ou par une représentation graphique) : 

• déterminer une valeur médiane de cette série et en donner la signification ;

• déterminer des valeurs pour les premier et troisième quartiles et en donner la signification ; 

• déterminer son étendue. 

- Exprimer et exploiter les résultats de mesures d’une grandeur.

Le travail est conduit aussi souvent que possible en liaison avec les autres disciplines dans des situations où les données sont exploitables par les élèves.

L’utilisation d’un tableur permet d’avoir accès à des situations plus riches que celles qui peuvent être traitées « à la main ».

La notion de dispersion est à relier, sur des exemples, au problème posé par la disparité des mesures d’une grandeur, lors d’une activité expérimentale, en particulier en physique et chimie.

Statistique descriptive,

analyse de données

Caractéristiques de position et de dispersion

- médiane, quartiles ;

- moyenne.

-Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier une série statistique.

- Passer des effectifs aux fréquences, calculer les caractéristiques d’une série

définie par effectifs ou fréquences.

-Calculer des effectifs cumulés, des fréquences cumulées.

- Représenter une série statistique graphiquement (nuage de points, histogramme, courbe des fréquences cumulées).

L’objectif est de faire réfléchir les élèves sur des données réelles, riches et variées (issues, par exemple, d’un fichier mis à disposition par l’INSEE),

synthétiser l’information et proposer des représentations pertinentes.

 

 

 

Échantillonnage

Notion d’échantillon.

Intervalle de fluctuation

d’une fréquence au seuil

de 95%*.

Réalisation d’une

simulation.

- Concevoir, mettre en œuvre et

exploiter des simulations de situations concrètes à l’aide du tableur ou d’une calculatrice

- Exploiter et faire une analyse

critique d’un résultat d’échantillonnage.

Un échantillon de taille n est constitué des résultats de n répétitions indépendantes de la même expérience.

Page 3: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

À l’occasion de la mise en place d’une simulation, on peut :-utiliser les fonctions logiques d’un tableur ou d’une calculatrice,

- mettre en place des instructions conditionnelles dans un algorithme.

L’objectif est d’amener les élèves à un questionnement lors des activités suivantes:

- l’estimation d’une proportion

inconnue à partir d’un échantillon ;

- la prise de décision à partir d’un échantillon.

* L’intervalle de fluctuation au seuil de 95%, relatif aux échantillons de taille n, est l’intervalle centré autour de p, proportion du caractère dans la population, où se situe, avec une probabilité égale à 0,95, la fréquence observée dans un échantillon de taille n. Cet intervalle peut être obtenu, de façon approchée, par simulation.

Le professeur peut indiquer aux élèves le résultat suivant, utilisable dans la pratique pour des échantillons de taille n 25 et des proportions p du caractère comprises entre 0,2 et 0,8 : si f désigne la fréquence du caractère dans l’échantillon, f appartient à l’intervalle [p-1/rac(n);p+1/rac(n )]

avec une probabilité d’au moins 0, 95. Le professeur peut faire percevoir expérimentalement la validité de cette propriété mais elle n’est pas exigible.

Objectifs visés par l’enseignement des statistiques et probabilités à l’occasion de résolutions de problèmes

dans le cadre des probabilités, rendre les élèves capables :

- d’étudier et modéliser des expériences relevant de l’équiprobabilité (par exemple, lancers de pièces ou de dés, tirage de cartes) ;

- de proposer un modèle probabiliste à partir de l’observation de fréquences dans des situations simples ;

- d’interpréter des événements de manière ensembliste ;

- de mener à bien des calculs de probabilité.

Les situations étudiées concernent des expériences à une ou plusieurs épreuves.

- La répétition d’expériences aléatoires peut donner lieu à l’écriture d’algorithmes (marches aléatoires).

Connaissances Capacités Commentaires Contenus Capacités attendues Commentaires

1.4. Notion de probabilité

 

 

[Thèmes de convergence]

- Comprendre et utiliser des notions élémentaires de probabilité.

 

- Calculer des probabilités dans des contextes familiers.

La notion de probabilité est abordée à partir d’expérimentations qui permettent d’observer les fréquences des issues dans des situations familières (pièces de monnaie, dés, roues de loteries, urnes, etc.).

La notion de probabilité est utilisée pour modéliser des situations simples de la vie courante. Les situations étudiées concernent les expériences aléatoires à une ou à deux épreuves.

Probabilité sur un

ensemble fini

Probabilité d’un événement.

Réunion et intersection de

deux événements,

formule :

p(A B) + p(A B) = p(A) + p(B).

- Déterminer la probabilité

d’événements dans des situations d’équiprobabilité.

-Utiliser des modèles définis à partir de fréquences observées.

- Connaître et exploiter cette formule.

La probabilité d’un événement est définie comme la somme des probabilités des événements

élémentaires qui le constituent.

Pour les calculs de probabilités, on utilise des arbres, des diagrammes ou des tableaux.

Page 4: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Trois parties : Statistiques descriptives : études et calculs

portant sur des données réelles, riches et variées

Probabilités : démarche de modélisation de phénomènes réels, calculs dans le modèle

Statistiques inférentielles: démarche permettant d’inférer des informations sur toute la population à partir de l’observation d’échantillons.

Page 5: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Les statistiques descriptives en collège organisation et gestion de données :

choisir un mode de représentation adapté

lecture, interprétation, élaboration de tableaux

étude de quelques paramètres conduisant à l’élaboration d’un résumé statistique (moyenne, médiane, quartiles, étendue).

Page 6: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Les statistiques descriptives en lycée effectifs cumulés, fréquences cumulées

travail sur des séries définies par fréquences

représentations graphiques d’une série statistique

comparaison de deux séries statistiques utilisation d’un logiciel ou d’une calculatrice

pour étudier une série statistique

Page 7: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Les probabilités

En troisième : appréhender les « certitudes du hasard » par

observation des fréquences calculs de probabilités sans « formalisme »

En seconde : construction de modèles probabilistes validés par

une démarche statistique ou un raisonnement notion d’événement sous forme ensembliste calculs de probabilités

Page 8: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Statistiques inférentielles (en seconde) Échantillonnage

Intervalle de fluctuation

Intervalle de confiance

Estimation d’une proportion

Preuve statistique

Page 9: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Statistiques inférentielles (en seconde) Notion d’échantillon

Un échantillon de taille n est la liste des n résultats obtenus par n répétitions indépendantes de la même expérience.

En seconde, on se limite à une expérience n’ayant que 2 issues que l’on peut noter ici « succès » et « échec ».

Page 10: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Notion de fluctuation d’échantillonnageSoit une expérience de Bernoulli dont laprobabilité de succès est p.On réalise plusieurs échantillons de taille n decette expérience.

On note Fn la variable aléatoire donnant la fréquencedu succès dans un échantillon.Fn prend ses valeurs dans [0;1] et pour n suffisammentgrand, Fn suit approximativement une loi normale demoyenne p et d’écart type = rac(p(1-p)/n).

Page 11: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Notion de fluctuation d’échantillonnageOn démontre ainsi que :

P( Fn[p-1/rac(n); p+1/rac(n)] ) 0,95(pour n assez grand et p entre 0,2 et 0,8)

Ainsi, l’intervalle de fluctuation au seuil de 95%est le plus petit intervalle, centré en p, où sesituent les fréquences observées avec uneprobabilité au moins égale à 0,95.

Dans la pratique, on utilise : [p-1/rac(n) ; p+1/rac(n)].

Page 12: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Notion de fluctuation d’échantillonnage

On peut faire percevoir expérimentalement cette propriété en classe :

On réalise 500 observations de la fréquence du succès dans un échantillon de taille 100 associé à un modèle de Bernoulli de paramètre p = 0,4.

Page 13: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Trouver, à partir de ce diagramme,

l’intervalle de fluctuation au seuil de 95 %.

Page 14: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Simulation de 1000 échantillons de taille 100 d’un modèle de Bernoulli avec p=0,4

Page 15: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Statistiques inférentielles :étude de deux exemples

Estimation d’une proportion

On cherche à estimer une proportion p à partir de la connaissance d’un échantillon de taille n.

Exemple :

estimation du résultat d’un référendum

Page 16: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

1) Observation du phénomène : On recueille la liste des n résultats obtenus par

interrogation de n personnes : on obtient un échantillon de taille n (on dispose ainsi d’un échantillon parmi tous ceux qu’on aurait pu obtenir).

On calcule pobs la proportion de ces personnes votant pour S.

2) Étude quantitative : On sait qu’environ 95 % des fréquences

observées sont dans l’intervalle

[p-1/rac(n) ; p+1/rac(n)].

Page 17: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

3) Exploitation mathématique : On remarque que

pobs [p-1/rac(n) ; p+1/rac(n)]

équivaut à

p J=[pobs-1/rac(n) ; pobs+1/rac(n)]

ce qui permet de dire que, parmi tous les

échantillons de taille n possibles, 95 % des

intervalles associés contiennent le nombre p.

J est un intervalle de confiance ou fourchette de

sondage.

Page 18: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Fourchettes associées à 20 échantillons de taille 100 dans

le cas p=0,5.

Page 19: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Estimation d’une proportion Ainsi, en faisant une observation, on décide

que :p J=[pobs-1/rac(n) ; pobs+1/rac(n)]

On a obtenu une estimation de p par intervalle de confiance.

La probabilité que cette décision soit erronée estinférieure à 0,05.

Page 20: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Prise de décision à partir d’un échantillon Exemple :

L’entreprise A compte 43 femmes sur 100

employés (soit 43%).

L’entreprise B compte 1150 femmes sur 2500

employés (soit 46%).

Quelle est l’entreprise qui respecte le mieux le

principe de parité?

Page 21: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Prise de décision à partir d’un échantillon Observation du phénomène :

Nous sommes en présence de 2 échantillons : l’un de taille 100, l’autre de taille 2500.

Les fréquences observées sont respectivement de 0,43 et de 0,46.

Étude quantitative : S’il y a parité, les échantillons sont assimilables à un

échantillon de taille similaire du modèle de Bernoulli avec p=0,5.

Les intervalles de fluctuation sont donc respectivement :IA = [0,4 ; 0,6] et IB = [0,48 ; 0,52]

Page 22: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Prise de décision à partir d’un échantillon Exploitation mathématique :

On remarque pA=0,43 est dans l’intervalle de fluctuation IA mais pB=0,46 n’est pas dans l’intervalle de fluctuation IB.

Dans un tel modèle, ce type d’observation ne s’observerait que dans 5 % des échantillons.

Ainsi, on rejette l’hypothèse que l’entreprise B respecte la parité, ceci avec le risque de prendre la mauvaise décision dans 5 % des cas.

On ne rejette pas l’hypothèse que l’entreprise A respecte la parité.

Remarque : on ne parle pas d’accepter ou de ne pas accepter

l’hypothèse, mais de non rejet de l’hypothèse formulée.

Page 23: De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire 2009-2010.

Document ressource•eduscol.education.fr/ D0015

Mathématiques Lycée

Ressources pour la classe de seconde

- Probabilités et Statistiques -

Ce document peut être utilisé librement dans le cadre des enseignements et de la formation des enseignants.

Toute reproduction, même partielle, à d'autres fins ou dans une nouvelle publication, est soumise à l'autorisation du directeur général de l'Enseignement scolaire.

Juin 2009