Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français...

12
1 Lycée Français de DOHA 1 ère S2 Année 2018 2019 M. Evanno Statistiques A) Vocabulaire. Population et individu : La population est l’ensemble des individus sur lequel vont porter les observations. Caractère : Le caractère est la propriété étudiée. Le caractère est qualitatif s’il n’est pas une valeur numérique. Le caractère est quantitatif s’il peut être mesuré : 1) il est discret s’il ne prend que des valeurs isolées (en général entières). 2) il est continu s’il peut prendre toutes les valeurs dans un intervalle donné. Modalités : Les modalités sont les valeurs prises par le caractère. Effectifs et fréquences : L’effectif d’une modalité est le nombre d’individus présentant cette modalité. La fréquence d’une modalité est le rapport entre l’effectif de cette modalité et l’effectif total de la population. Une fréquence est donc un nombre compris entre 0 et 1 (elle peut aussi être donnée en pourcentage). La somme de toutes les fréquences est 1 (100 avec les pourcentages). Fréquence (ou effectif) cumulée croissante : La fréquence cumulée croissante d'une valeur est la somme des fréquences des valeurs qui lui sont inférieures ou égales. B) Caractéristiques de position et de dispersion. 1. Caractéristiques de position. a) Mode : Le mode est la valeur du caractère ayant le plus grand effectif. Dans le cas de répartition en classe, on parle de classe modale. b) La médiane : La médiane est la valeur du caractère qui partage l’effectif total en deux parties de même effectif. On considère une série de données rangées dans l’ordre croissant. Dans le cas d’un caractère discret, si : l’effectif total est impair : la médiane est la valeur du caractère située au milieu de la série. l’effectif total est pair, la médiane est la moyenne des deux valeurs centrales. Dans le cas d’un caractère continu : la médiane peut être obtenue par lecture, sur le polygone des effectifs cumulés croissants, de l’abscisse du point ayant pour ordonnée 2 N (N étant l’effectif total). c) La moyenne : Si p x x x ...; ; ; 2 1 sont les valeurs du caractère étudié et p n n n ...; ; ; 2 1 les effectifs correspondants, la moyenne de la série statistique est : p p p n n n x n x n x n x + + + + + + = ... ... 2 1 2 2 1 1 . Si la série statistique est continue, i x est le centre de chacune des classes.

Transcript of Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français...

Page 1: Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français de DOHA ère 1 S2 ... Statistiques A) Vocabulaire. ... Déterminer le premier quartile,

1

Lycée Français de DOHA 1ère S2

Année 2018 – 2019 M. Evanno

Statistiques

A) Vocabulaire.

• Population et individu :

La population est l’ensemble des individus sur lequel vont porter les observations.

• Caractère :

Le caractère est la propriété étudiée.

Le caractère est qualitatif s’il n’est pas une valeur numérique.

Le caractère est quantitatif s’il peut être mesuré :

1) il est discret s’il ne prend que des valeurs isolées (en général entières).

2) il est continu s’il peut prendre toutes les valeurs dans un intervalle donné.

• Modalités :

Les modalités sont les valeurs prises par le caractère.

• Effectifs et fréquences :

L’effectif d’une modalité est le nombre d’individus présentant cette modalité.

La fréquence d’une modalité est le rapport entre l’effectif de cette modalité et l’effectif total de la

population. Une fréquence est donc un nombre compris entre 0 et 1 (elle peut aussi être donnée en

pourcentage). La somme de toutes les fréquences est 1 (100 avec les pourcentages).

• Fréquence (ou effectif) cumulée croissante :

La fréquence cumulée croissante d'une valeur est la somme des fréquences des valeurs qui lui

sont inférieures ou égales.

B) Caractéristiques de position et de dispersion.

1. Caractéristiques de position.

a) Mode :

Le mode est la valeur du caractère ayant le plus grand effectif.

Dans le cas de répartition en classe, on parle de classe modale.

b) La médiane :

La médiane est la valeur du caractère qui partage l’effectif total en deux parties de même

effectif. On considère une série de données rangées dans l’ordre croissant.

Dans le cas d’un caractère discret, si :

• l’effectif total est impair : la médiane est la valeur du caractère située au milieu de la série.

• l’effectif total est pair, la médiane est la moyenne des deux valeurs centrales.

Dans le cas d’un caractère continu :

la médiane peut être obtenue par lecture, sur le polygone des effectifs cumulés croissants, de

l’abscisse du point ayant pour ordonnée 2N (N étant l’effectif total).

c) La moyenne :

Si pxxx ...;;; 21 sont les valeurs du caractère étudié et pnnn ...;;; 21 les effectifs correspondants,

la moyenne de la série statistique est : p

pp

nnn

xnxnxnx

+++

+++=

...

...

21

2211.

Si la série statistique est continue, ix est le centre de chacune des classes.

Page 2: Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français de DOHA ère 1 S2 ... Statistiques A) Vocabulaire. ... Déterminer le premier quartile,

2

Lycée Français de DOHA 1ère S2

Année 2018 – 2019 M. Evanno

Exemple :

La répartition des accidents corporels de la route selon les heures de la journée est décrite par le

tableau suivant, pour l'année 1999.

• Classe modale : [18; 21[.

• Calcul de la moyenne : on prend le centre de chacune des classes.

1280000

5,22100505,1916820...5,782205,432305,14550=

+++++=x .

• On calcule les effectifs cumulés croissants associés à cette série.

• Médiane : Lecture sur le polygone des effectifs cumulés croissants.

• Quartiles : Lectures sur le polygone des effectifs cumulés croissants.

• Afin de déterminer la médiane on se place à la moitié de l’effectif total à savoir 40000 puisque

nous sommes ici en présence d’un polygone des effectifs cumulés croissants.

• Afin de déterminer la médiane sur un polygone des fréquences cumulées croissantes on se place

à 50% pour effectuer la lecture graphique.

La médiane est l’abscisse du point du polygone ayant pour ordonnée 40000, ici on obtient

environ 10.

• Afin de déterminer les quartiles on se place au quart (resp aux trois-quarts) de l’effectif total à

savoir 20000 (resp 60000) pour effectuer la lecture graphique.

• Afin de déterminer les quartiles sur le polygone des fréquences cumulées croissantes on se place

à 25% (resp 75%) pour effectuer la lecture graphique.

Page 3: Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français de DOHA ère 1 S2 ... Statistiques A) Vocabulaire. ... Déterminer le premier quartile,

3

Lycée Français de DOHA 1ère S2

Année 2018 – 2019 M. Evanno

2. Caractéristiques de dispersion.

a) Etendue :

L’étendue d’une série statistique est la différence entre la plus grande et la plus petite valeur du

caractère (dans le cas d’un caractère quantitatif discret).

b) Quartiles :

On considère une série de données rangées dans l’ordre croissant. Les quartiles sont des données

de la série qui la partagent en quatre parties à peu près de même effectif.

Le premier quartile est noté 1Q représente les 25 premiers pourcents de la série.

Le troisième quartile est noté 3Q représente les 75 premiers pourcents de la série.

• L’effectif total est divisible par 4 :

On considère une série de 60 données (par exemple) rangées dans l’ordre croissant.

15604

1= donc

1Q est la 15ème donnée de cette série.

45604

3= donc 3Q est la 45ème donnée de cette série.

• L’effectif total n’est pas divisible par 4 :

On considère une série de 41 données (par exemple) rangées dans l’ordre croissant.

25,10414

1= donc

1Q est la 11ème donnée de cette série.

75,30414

3= donc 3Q est la 31ème donnée de cette série.

• Dans le cas continu on se reportera au polygone des fréquences (ou effectifs) cumulées

croissantes afin d’y lire les abscisses des points correspondants respectivement au quart et

au trois-quarts de l’ordonnée maximale.

c) Intervalle et écart interquartiles :

• L'intervalle 31 ; QQ est appelé l'intervalle interquartile.

• L'écart 13 QQ − est appelé l'écart interquartile.

d) Diagramme en boîte ou diagramme à moustaches ou boîte à moustaches :

0 1

Remarque : Ce diagramme est aussi parfois appelé diagramme de Tukey (du nom du statisticien

américain John Wilder Tukey (1915 – 2000)).

valeur

minimale

valeur

maximale

1er quartile 3ème quartile médiane moyenne

étendue

Page 4: Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français de DOHA ère 1 S2 ... Statistiques A) Vocabulaire. ... Déterminer le premier quartile,

4

Lycée Français de DOHA 1ère S2

Année 2018 – 2019 M. Evanno

3. Variance et écart-type.

On considère la série statistique suivante et on note x sa moyenne :

Valeur 1x 2x …

ix … px Total

Effectif 1n 2n …

in … pn N

Fréquences 1f 2f …

if … pf

Définitions :

La variance d’une série statistique donnée mesure la dispersion de la série par rapport à sa

moyenne x . La variance est la moyenne des carrés des écarts par rapport à la moyenne.

• La variance de cette série statistique est le réel : ( ) ( )

N

xxnxxnV

pp

22

11 ... −++−= .

• L’écart-type est la racine carrée de la variance : V= . La lettre se lit « sigma ».

Propriétés : Autres formules pour calculer la variance

• La variance de cette série statistique est le réel : ( )2

22

11 ...x

N

xnxnV

pp−

++= .

• La variance de cette série statistique est le réel : ( ) ( )22

11 ... xxfxxfV pp −++−= .

Remarque : On peut aisément obtenir ces formules mais nous ne les démontrerons pas ici sauf si

certains éprouvent des difficultés à les établir.

Notations : Autre façon d’écrire les formules de la variance

• La variance de cette série statistique est le réel : ( )=

−=p

i

ii xxnN

V1

21.

• La variance de cette série statistique est le réel : 2

1

21xxn

NV

p

i

ii −

=

=

.

• La variance de cette série statistique est le réel : ( ) = =

=−=

p

i

p

i

iiii xxfxxfV1

2

1

22.

Remarque : Ces calculs seront le plus souvent réalisés par la calculatrice !

4. Résumé d’une série statistique.

On résume souvent une série statistique par une mesure de tendance centrale associée à une mesure de

dispersion. Deux choix sont couramment proposés :

• le couple moyenne et écart-type ( );x qui a l’inconvénient d’associer deux mesures sensibles aux

valeurs extrêmes.

• le couple médiane écart interquartile ( )13; QQmed − qui a moins de défaut mais dont la

détermination est moins pratique.

Page 5: Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français de DOHA ère 1 S2 ... Statistiques A) Vocabulaire. ... Déterminer le premier quartile,

5

Lycée Français de DOHA 1ère S2

Année 2018 – 2019 M. Evanno

Exercice n°1 : Javelot.

1) La classe de terminale B passe l’évaluation de l’épreuve de sport au lancer de javelot. Voici

les différentes performances relevées (en mètres) :

37 – 45 – 61 – 43 – 21 – 19 – 41 – 27 – 52 – 34 – 66 – 35 – 24 – 27 – 51 – 42.

2) A l’aide de la calculatrice, donner la moyenne et l’écart type de cette série statistique

arrondis au centième près.

3) On admet dans cette question que la moyenne des lancers des élèves de la terminale B est

de 39m et que cette classe est composée de 16 élèves. A la fin de son évaluation, le

professeur remarque que la terminale A possède une moyenne de 35m et que les deux classes

ensembles possèdent une moyenne générale de 36,6m.

Déterminer le nombre d’élèves présents dans la classe de terminale A.

4) Lors du bilan de l’épreuve, on a rassemblé les résultats des quatre classes de terminales dans

le tableau ci-dessous :

a) Compléter, dans le tableau, les lignes des fréquences et des fréquences cumulées

croissantes en arrondissant les résultats au centième près.

b) Dans le repère ci-dessous, tracer le polygone des fréquences cumulées croissantes :

c) Graphiquement, déterminer la valeur de la médiane et des quartiles (on laissera présent

les traits de construction).

Page 6: Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français de DOHA ère 1 S2 ... Statistiques A) Vocabulaire. ... Déterminer le premier quartile,

6

Lycée Français de DOHA 1ère S2

Année 2018 – 2019 M. Evanno

Exercice n°2 : Prix du téléphone portable.

Dans un lycée, on a interrogé 400 élèves sur le prix de leur téléphone portable. Les résultats

sont regroupés dans l’histogramme ci-dessous dont l’axe horizontal est gradué en centaines

d’euros.

1) Recopier et compléter le tableau ci-dessous.

2) Tracer la courbe des fréquences cumulées croissantes correspondant à cette série.

3) Dans la suite, toutes les valeurs seront données en euros.

a) Lire les quartiles et la médiane et calculer l’écart interquartile.

b) Tracer le diagramme en boîte.

c) Calculer la moyenne et l’écart-type. Pour cela, on assimilera chaque classe à la moyenne

de ses bornes.

d) Du couple moyenne-écart-type et médiane-écart interquartile, quel résumé intéressera

le plus :

• un fabricant de portable milieu de gamme cherchant à fixer le prix de son prochain

modèle ?

• un organisme étudiant les disparités d’équipement entre les différents élèves.

Page 7: Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français de DOHA ère 1 S2 ... Statistiques A) Vocabulaire. ... Déterminer le premier quartile,

7

Lycée Français de DOHA 1ère S2

Année 2018 – 2019 M. Evanno

Exercice n°3 : IMC.

Une enquête a été menée auprès d’un échantillon de 1 000 personnes (600 hommes et 400

femmes) afin d’étudier un des facteurs prédisposant aux affections cardio-vasculaires. Pour

chaque personne, on définit l’indice de masse corporelle, noté IMC, qui se calcule de la manière

suivante : 2T

PIMC = où P est la masse (en kg ) et T est la taille (en m ) de la personne. Pour

un IMC strictement supérieur à 22 chez la femme et strictement supérieur à 23 chez l’homme,

la personne est déclarée « à risque élevé ».

On a représenté par le diagramme en boîte correspondant à l’IMC des 600 hommes de cette

étude :

1) Dans cette question, on s’intéresse à la série statistique formée par les 600 hommes de

l’étude.

a) Donner l’étendue, la médiane et les quartiles de cette série.

b) Au vu du diagramme et en justifiant chaque réponse, répondre au vrai ou faux à chacune

des deux affirmations suivantes :

A : moins de 20% des hommes sont déclarés « à risque élevé » :

B : au moins 25% des hommes sont déclarés comme n’étant pas « à risque ».

2) Dans cette question, on s’intéresse aux IMC des 400 femmes de l’échantillon initial.

On a obtenu le tableau suivant :

a) Compléter, dans le tableau précédent, la ligne des effectifs cumulés croissants.

b) Déterminer le premier quartile, la médiane, le troisième quartile et l’étendue de cette

série.

c) Calculer l’écart type de cette série.

d) Tracer, en utilisant la graduation donnée, un diagramme en boîte pour cette série

e) Peut-on affirmer, au vu des résultats, que le pourcentage des femmes déclarées comme

n’étant pas « à risque » est supérieur à celui des hommes ? Justifier.

Page 8: Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français de DOHA ère 1 S2 ... Statistiques A) Vocabulaire. ... Déterminer le premier quartile,

8

Lycée Français de DOHA 1ère S2

Année 2018 – 2019 M. Evanno

Exercice n°4 : Interrogation sur les dérivées.

Voici les notes obtenues par la 1°S–A lors d’une interrogation sur les dérivées :

7,5 – 11 – 17 – 12 – 10 – 12 – 5 – 13 – 2,5 – 9 – 8 – 2 – 9,5 – 7 – 6 – 10 – 17,5 – 18,5 – 7 – 14

– 13,5 – 6 – 7,5 – 5,5 – 8 – 15,5 – 2,5.

1) A l’aide de la calculatrice, donner la moyenne et l’écart type de cette série statistique

arrondis au centième près.

2) Déterminer le premier quartile, la médiane et le troisième quartile.

3) Tracer dans le repère ci-dessous le diagramme en boîtes :

Répondre aux questions suivantes :

a) Dans quelle(s) classe(s) au moins 50% des élèves a une note inférieure à 9 ?

b) Dans quelle(s) classe(s) au moins le quart des élèves a une note inférieure à 7 ?

c) Donner l’étendue et l’écart interquartile pour ces deux classes ?

d) Comparer le quart des meilleurs élèves dans chacune des classes.

Exercice n°5 : Apiculteur

Un apiculteur amateur fait le bilan en 2008 de la production de miel de ses ruches.

Pour chacune d’elles, il note la quantité de miel produite (en kg).

Il obtient les résultats ci-dessous.

1) Déterminer la médiane et les quartiles de cette série.

2) Calculer la quantité totale de miel produite.

3) Calculer la production moyenne par ruche et l’écart type (arrondir au dixième) de cette série.

4) L’apiculteur a retrouvé le diagramme en boîtes qu’il avait établi pour l’année 2007.

a) Tracer le diagramme en boîtes de la série précédente au-dessus de celui-ci.

b) En 2007, à quel pourcentage peut-on estimer la part du nombre de ruches ayant produit 25

kg ou plus de miel ? 20 kg ou moins de miel ?

c) À l’aide des deux diagrammes en boîte, comparer les productions des deux années.

Page 9: Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français de DOHA ère 1 S2 ... Statistiques A) Vocabulaire. ... Déterminer le premier quartile,

9

Lycée Français de DOHA 1ère S2

Année 2018 – 2019 M. Evanno

Exercice n°6 : Efficacité d’un médicament.

On mesure la quantité d'une certaine molécule M dans le sang, sur un groupe de 40 individus

souffrant d'une même maladie P.

Ces individus sont répartis au hasard en deux groupes :

• un groupe A de 20 individus qui reçoivent un placebo.

• un groupe B de 20 individus qui reçoivent un traitement.

La quantité est mesurée en Lg / (microgramme par litre).

Partie A : Etude du groupe A.

Le tableau ci-dessous donne les résultats obtenus pour le Groupe A.

1) Calculer la moyenne et l’écart-type arrondie de cette série de notes.

2) Calculer la médiane, le premier et le troisième quartile de cette série de note.

3) Calculer l’étendue et le mode de cette série.

4) Quel est le mode de cette série ?

5) Construire le diagramme en boîte de cette série.

6) Pour quel pourcentage des individus du groupe A, la quantité mesurée est-elle dans la plage

175;145 ?

Partie B : Etude du groupe B avec un caractère discret.

Les données recueillies par le groupe B ont été résumées dans le diagramme en boîte tracé ci-

dessous :

1) Déterminer le premier et le troisième quartile.

2) Déterminer l’étendue de cette série et une valeur approchée de la médiane.

3) Déterminer approximativement pour quel pourcentage des individus du groupe B la quantité

mesurée est-elle dans la plage [130 ; 160]?

4) Quel semble être l'effet du traitement sur les individus du groupe B par comparaison avec

ceux du groupe A ?

Page 10: Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français de DOHA ère 1 S2 ... Statistiques A) Vocabulaire. ... Déterminer le premier quartile,

10

Lycée Français de DOHA 1ère S2

Année 2018 – 2019 M. Evanno

Exercice n°7 : Ecole de journalisme.

Le directeur d’une école de journalisme cherche à comparer ses deux dernières promotions. Il

obtient :

1) Tracer les diagrammes en boîte de ces quatre séries sur le même graphique.

2) Comparer les résultats en français, puis en histoire d’une promotion sur l’autre.

3) Les résultats précédents sont-ils confirmés par le couple moyenne-écart-type ?

Exercice n°8 : Fabrique des fers cylindriques.

Une machine fabrique des fers cylindriques pour le béton armé de diamètre théorique 25mm.

On contrôle le fonctionnement de la machine en prélevant un échantillon de 100 pièces au

hasard dans la fabrication. Les mesures des diamètres ont donné les résultats suivants à 0,1mm

près :

On note x la moyenne de cette série et son écart-type.

On estime que la machine a un fonctionnement "normal" si :

• l’étendue de la série reste inférieure à 10 % de la valeur moyenne.

• l’écart entre la moyenne et la médiane est inférieur à 0,2.

• 95 % des diamètres au moins sont dans l’intervalle [ x − 2 ; x + 2].

Cette machine a-t-elle un fonctionnement « normal » ?

Page 11: Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français de DOHA ère 1 S2 ... Statistiques A) Vocabulaire. ... Déterminer le premier quartile,

11

Lycée Français de DOHA 1ère S2

Année 2018 – 2019 M. Evanno

Exercice n°9 : Paradoxe de Simpson.

Un laboratoire pharmaceutique étudie l'efficacité de deux médicaments contre le Cancer.

Voici les résultats du Pr. Lauriet :

1) Calculer ( )Af1 et ( )Bf1

les fréquences de succès respectives des médicaments A et B.

Le Pr. Bas a fait de son côté une autre étude et il publie les résultats suivants :

2) Calculer ( )Af2 et ( )Bf2

les fréquences de succès respectives des médicaments A et B.

3) Quel médicament vous semble le plus efficace ?

4) Les professeurs Lauriet et Bas décident de publier leurs résultats en unissant leur test.

Compléter le tableau ci-dessous :

5) Calculer ( )Af et ( )Bf les fréquences de succès respectives des médicaments A et B de

l'ensemble de l'étude.

6) Confirmez-vous les résultats du 3) ?

Exercice n°10 : pellicules photographiques.

Quand on représente une série statistique par un diagramme en bâtons ou un histogramme et

que celui-ci est quasi symétrique en forme de cloche, on peut penser que les données sont

gaussiennes. Dans ce cas, environ 95 % des valeurs se trouvent dans l’intervalle

2;2 +− xx , appelé plage de normalité au niveau de confiance de 95 %.

Un fabricant de pellicules photographiques a fait mesurer la sensibilité (sur l’échelle ISO) d’un

échantillon de 1 000 pellicules prélevées dans sa production. Il obtient les résultats suivants :

1) Représenter, sur le repère donné page suivante) cette série par un diagramme en bâtons.

2) Que peut-on penser du type de données de cette série ?

3) Déterminer l’intervalle 2;2 +− xx .

4) Quel pourcentage des valeurs appartient à cet intervalle ?

5) Est-ce cohérent avec le modèle proposé à la question 2) ?

Page 12: Statistiques A) Vocabulaire.scf0e512586f6de82.jimcontent.com/download/version...1 Lycée Français de DOHA ère 1 S2 ... Statistiques A) Vocabulaire. ... Déterminer le premier quartile,

12

Lycée Français de DOHA 1ère S2

Année 2018 – 2019 M. Evanno