I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le...

41
LES STATISTIQUES I Vocabulaire et définitions Définition n°1. Population, individus La population, c'est l’ensemble des individus sur lesquels portent l’étude statistique. Exemple n°1. On étudie le nombre d'arbres malades dans une forêt. Les individus sont les arbres, la population est la forêt. Définition n°2. Caractère (ou variable) C'est une propriété étudiée sur chaque individu. Exemple n°2. Pour notre notre forêt, le caractère est le fait d'être malade ou non.

Transcript of I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le...

Page 1: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

I Vocabulaire et définitions

Définition n°1. Population, individusLa population, c'est l’ensemble des individus sur lesquels portent l’étudestatistique.

Exemple n°1. On étudie le nombre d'arbres malades dans une forêt. Les individus sont les arbres, la population est la forêt.

Définition n°2. Caractère (ou variable)C'est une propriété étudiée sur chaque individu.

Exemple n°2. Pour notre notre forêt, le caractère est le fait d'être malade ou non.

Page 2: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E01EXERCICE N°1

Une usine fabrique des pièces métalliques qu'elleréférence par un code (A 42.00 par exemple). Letableau ci-contre indique le nombre de piècesfabriquées pour chaque référence.1) Quelle est la population ?2) Quels sont les individus ?3) Quel est le type du caractère étudié?

Référence despièces

Quantité

A42.00 3800A 38.01 2700

E 27.05 2200C15.00 1300

Page 3: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E01 Corrigé de l’exercice n°1

Une usine fabrique des pièces métalliques qu'elleréférence par un code (A 42.00 par exemple). Letableau ci-contre indique le nombre de piècesfabriquées pour chaque référence.1) Quelle est la population ?La population est l’ensemble des pièces métalliques.2) Quels sont les individus ?Les individus sont les pièces métalliques.3) Quel est le caractère étudié?Le caractère étudié est le code de la pièce.

Référence despièces

Quantité

A42.00 3800A 38.01 2700

E 27.05 2200C15.00 1300

Page 4: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

Définition n°3. Nature du caractère, valeur ou modalitéLe caractère est quantitatif quand il prend des valeurs (ou modalités)numériques. Il peut alors être quantitatif discret si les valeurs sont isolées ouquantitatif continu dans le cas contraire.Le caractère est qualitatif quand les modalités qu'il prend ne sont pasnumériques.

Remarque n°1. On a tendance à utiliser le terme « valeur » pour un caractère quantitatif etplutôt le terme « modalité » pour un caractère qualitatif.

Page 5: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUESExemple n°3. Qualitatif

Pour notre forêt, le caractère est qualitatif.

Page 6: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUESExemple n°4. Quantitatif discret

On étudie le nombre de stylos par élève dans notre classe.La population est la classe, les individus sont les élèves, le caractère est lenombre de stylos. C'est un caractère quantitatif discret.

Page 7: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUESExemple n°5. Quantitatif continu

On étudie la hauteur en mètres des bâtiments d'une ville.La population est l’ensemble des bâtiments de la ville, les individus sont lesbâtiments, le caractère est la hauteur en mètres. C'est un caractère quantitatifcontinu.

Page 8: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E01

EXERCICE N°2 Les questions suivantes ont été posées par l'institut de sondage IFOP. Déterminer dans chaque cas la nature du caractère étudié :

1) Dans quels lieux utilisez-vous Internet le plus souvent ?QUALITATIF2) En 2004, combien de livres avez-vous lus ?QUANTITATIF DISCRET3) Combien de véhicules possédez-vous au sein de votre foyer ?QUANTITATIF DISCRET4) Quelles sont les activités que vous pratiquez le plus souvent sur Internet ?QUALITATIF5) À votre avis, combien dépensez-vous par an, en moyenne, pour votre voiture ?QUANTITATIF CONTINU

Page 9: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUESRemarque n°2. Regroupement par classe

Dans le cas d'un caractère quantitatif continu, on regroupe les valeurs parclasses (qui sont des intervalles). On peut également le faire quand lecaractère est quantitatif discret.

Définition n°4. Centre de classeLe centre de la classe, c’est la moyenne des extrémités de la classe

Définition n°5. EffectifC’est le nombre d’individus qui possèdent le caractère étudié.

Définition n°6. Mode, Valeur modale, classe modaleOn appelle mode ou valeur (resp classe) modale, la valeur (resp classe) quipossède le plus grand effectif.

Page 10: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

II Fréquences, distribution des fréquences

Soit p un nombre entier.On considère une série statistique, dont le caractère étudié peut prendre lesvaleurs (ou modalités) x1 , x2 , x3 , ... , x p . On note n1 , n2 , n3 , ... , n p les effectifs correspondants et on pose N=n1+n2+n3+...+np (N est l'effectif total, c'est à dire le nombre d'individus qui composent lapopulation)

▪ Pour i ∈ ⟦1 ; p⟧ , on pose f i=n i

N ,

f i est alors la fréquence associée à x i

▪ L'ensemble de ces fréquences est appelé la distribution des fréquences.

Exemple n°6. Série A

Voici les notes obtenues à un contrôle dans une classe de 30 élèves :2 − 3 − 3 − 4 − 5 − 6 − 6 − 7 − 7 − 7 8 − 8 − 8 − 8 − 8 − 9 − 9 − 9 − 9 − 9 9 − 10 − 10 − 11 − 11 − 11 − 13 − 13 − 15 − 16On peut représenter cette série par un tableau d’effectifs, et le compléter par ladistribution des fréquences :

Notes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Eff. 0 1 2 1 1 2 3 5 6 2 3 0 2 0 1 1 0 0 0

Fréq en %

0 3 7 3 3 7 10 17 20 7 10 0 7 0 3 3 0 0 0

On peut vérifier que la somme des fréquences est égale à 1 (ou à 100% si onles exprime en pourcentage).

➔ Le mode ou la valeur modale est 9 (6 élèves ont eu 9 : c’est le plus grand effectif)

On peut aussi faire un regroupement par classe, ce qui rend l’étude moinsprécise, mais qui permet d’avoir une vision plus globale.

Notes [ 0 ; 5 [ [ 5 ; 10 [ [ 10 ; 15 [ [ 15 ; 20 [ total

Centre 0+52

=2,55+10

2=7,5

10+152

=12,515+20

2=17,5

Effectif 4 17 7 2 30

Fréquence 0, 13 0, 57 0, 23 0, 07 1

➔ La classe modale est [ 5 ; 10 [ (17 élèves ont eu entre 5 inclus et 10 exclu : c’est le plus grand effectif)

Page 11: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E01

EXERCICE N°3

À la sortie d’une agglomération, on a relevé la répartition par tranche horaire des 6400 véhiculesquittant la ville entre 16 h et 22h. Les résultats sont donnés ci-dessous.

Heure [16 ; 17[ [17 ; 18[ [18 ; 19[ [19 ; 20[ [20 ; 22[

Effectif 1100 2000 1600 900 800

1) Quelle est la population de cette série statistique ?La population est l’ensemble des véhicules quittant la ville entre 16h et 22h.2) Quel est le type du caractère étudié dans cette série ?Le caractère (l’heure à laquelle le véhicule quitte la ville) est QUANTITATIF CONTINU.3) Quelle est la classe modale ?La classe modale est : [17 ; 18[4) Calculer la fréquence de véhicules sur la tranche horaire 19-20h (donner le résultat arrondiau centième, puis exprimé en pourcentage).

9006400

= 964

≈0,14

Soit 14 %5) Calculer le pourcentage de véhicules quittant la ville à partir de 16h et avant 20h.

1100+2000+1600+9006400

=56006400

=5664

=78=0,875

Soit 87,5 %

Page 12: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

III Indicateurs de tendance centrale

Les indicateurs de tendance centrale sont le mode, la médiane et la moyenne.

Définition n°7. Moyenne pondéréeSoit une série statistique à caractère quantitatif, dont les p valeurs sont donnéespar x1 , x2 , x3 , ... , x p d'effectifs associés n1 , n2 , n3 , ... , n p avec

N=n1+n2+n3+...+np

La moyenne pondérée de cette série est le nombre x tel que :

x = n1 x1+n2 x 2+n3 x3+ ...+n p x p

n1+n2+n3+...+n p

= 1N

∑i=1

p

ni x i

Remarque n°3. Lorsque la série est regroupée en classes, on calcule la moyenne en prenantpour valeurs x i le centre de chaque classe ; ce centre est obtenu en faisantla moyenne des deux extrémités de la classe.

Page 13: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUESExemple n°7. (avec la série A)

▪ Si on note x la moyenne du contrôle alors

x = 2×1+3×2+...+16×1

30 =

25430

≈ 8,47

▪ Si on regroupe par classe d’amplitude 5 points, une estimation de la moyenne

est : x = 2,5×4+7,5×17+ ...+17,5×2

30 =

26030

≈ 8,67

Page 14: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUESRemarque n°4.

On peut aussi calculer une moyenne à partir de la distribution de fréquences :

x = f 1 x1+ f 2 x2+ f 3 x3+ ...+ f p x p = ∑i=1

p

f i x i

Page 15: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUESPropriété n°1. Linéarité de la moyenne

▪ Si on ajoute (ou soustrait) un même nombre k à toutes les valeurs d’une série,alors la moyenne de cette série se trouve augmentée (resp. diminuée) de k.

▪ Si on multiplie (ou divise) par un même nombre non nul k toutes les valeursd’une série, alors la moyenne de cette série se trouve multipliée (resp. divisée)par k.

Exemple n°8. (toujours avec la série A)▪ Si on ajoute 1, 5 points à chaque note du contrôle, alors la moyenne de classedevient x ≈ 8,47+1,5=9,97

▪ Si on augmente chaque note de 10%, cela revient à multiplier chaque notepar 1, 1, ce qui donne x ≈ 8,47×1,1=9,317

Page 16: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E01

EXERCICE N°4 1) Calculer les moyennes des séries suivantes.

Série n°1 : 3 ; 12 ; 20 ; 7 ; 20Notons m1 la moyenne de la série n°1

m1=3+12+20+7+20

5=62

5=12,4

Remarque : Si vous trouvez environ 45,33 à la calculatrice alors recommencez et cette foismettez le numérateur entre parenthèses…. Série n°2 : −3 ; 5 ; −8 ; 6 ; −10 ; 12 ; 20 ; −20Notons m2 la moyenne de la série n°1

m2=−3+5+(−8)+6+(−10)+12+20+(−20)

8=2

8=0,25

Remarque : Si vous trouvez 19,5 à la calculatrice alors recommencez et cette fois mettez lenumérateur entre parenthèses….et essayez de faire plus attention !!

2) Si on ajoute 6 à toutes les valeurs de la série n°1, quelle est la moyenne obtenue ?Si on ajoute 6 à toutes les valeurs de la série n°1 alors la moyenne augmente de 6 soit

m1+6=18,4

3) Si on multiplie par 2 et on enlève 5 à toutes les valeurs de la série n°2, quelle est la moyennede la série obtenue ?

2×m2−5=−4,5

On a va montrer pourquoi ça marche avec une série de 3 nombres et il suffira d’adapter pour 4 ,5 , … autant de nombres que l’on veut.

Soit une série de trois nombres n1 ; n2 et n3

Notons m sa moyenne. C’est à dire que m=n1+n2+n3

3On va multiplier tous les nombres de la série par un nombre qu’on appelle par exemple a puison va ajouter un nombre b à tous les résultats. On obtient une nouvelle série de trois nombres : a n1+b ; a n2+b et a n3+b

La nouvelle moyenne vaut alors :

(a n1+b)+(a n2+b)+(a n3+b)3

Bien sûr les parenthèses ne sont pas utiles (rien à voir avec celles dont on a parlées à la questionn°1, ne mélangeons pas tout…)

On obtient alors : a n1+b+a n2+b+a n3+b

3=

a n1+a n2+a n3+b+b+b

3=

a (n1+n2+n3)+3 b

3

On peut encore transformer un peu : a(n1+n2+n3)+3 b

3=a×

n1+n2+n3

3+ 3b

3=a×m+b

Pour la question 2 : a=1 et b=6 (et il y a bien sûr 5 nombres et pas trois)Pour la question 3 : a=2 et b=−5

Page 17: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUESPropriété n°2. Moyenne par sous groupe

Soit une série statistique, d'effectif total N et de moyenne x

Si on divise cette série en deux sous-groupes disjoints d'effectifs respectifs p etq (avec p + q = N) de moyennes respectives x1 et x2 alors on a :

x = pN

×x1 + qN

× x2

Page 18: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

Exemple n°9. (toujours avec la série A)ÉnoncéOn suppose que les 12 garçons de la classe de la série A ont obtenu unemoyenne globale de 8 sur 20. Déterminer la moyenne des filles.Réponse :Notons x f la moyenne des filles. x f vérifie l'égalité suivante :

9,47 = 1230

×8 + 1830

× x f .

Après résolution : x f =10,45

Page 19: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

IV Indicateurs de dispersion

Les principaux indicateurs de dispersion sont l’étendue, l’écart inter-quartile,la variance et l’écart-type.

Page 20: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

Définition n°8. Étendue On appelle étendue d’une série X le réel défini par e(X)= max(X) – min(X)

Exemple n°10. (toujours avec la série A)La plus grande valeur est 16, la plus petite est 2. Donc en notant e l'étendue de la série, on obtient : e=16−2=14

Page 21: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

Définition n°9. QuartilesSoit une série statistique ordonnée, on appelle :▪ premier quartile et on note Q1 la valeur de la série telle qu'au moins25% des valeurs soient inférieures (ou égales) à Q1

▪ troisième quartile et on note Q3 la valeur de la série telle qu'au moins75% des valeurs soient inférieures (ou égales) à Q3

Remarque n°5. On ne parle pas de Q2 , on lui préfère la médiane.

Page 22: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

Exemple n°11. (toujours avec la série A)Énoncé :Déterminer les premier et troisième quartiles de la série A :2 − 3 − 3 − 4 − 5 − 6 − 6 − 7 − 7 − 7 8 − 8 − 8 − 8 − 8 − 9 − 9 − 9 − 9 − 9 9 − 10 − 10 − 11 − 11 − 11 − 13 − 13 − 15 − 16Réponse :On pense à vérifier que les valeurs sont bien rangées dans l'ordre croissant. (sice n'est pas le cas, on le fait)La série comporte 30 valeurs :

▪ 14×30=7,5 , le premier quartile est donc la 8eme valeur de la série et

vaut : 7. Q1=7

▪ 34×30=22,5 , le troisième quartile est donc la 23eme valeur de la série

et vaut : 10. Q3=10

Page 23: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

Remarque n°6. Mais pourquoi je n’obtiens pas le « bon résultat » ?Nos connaissances, à ce niveau, nous oblige à simplifier la définition desquartiles. C’est le choix fait dans l’immense majorité des manuels scolaires etdans ce cours. Cela n’est bien sûr pas sans conséquence, car parfois lacalculatrice ou le tableur ne donneront pas les mêmes réponses que nous.Rassurez-vous (ou pas) la calculatrice et le tableur ne sont pas toujoursd’accord entre eux non plus… La preuve avec les quatre séries suivantes :Série n°1 : 46, 270, 293, 382, 630, 952Série n°2 : 49, 90, 198, 302, 387, 547, 763Série n°3 : 34, 47, 71, 263, 282, 622, 667, 968Série n°4 : 39, 174, 196, 252, 331, 401, 456, 637, 944

Pour Q1 cours calculatrice tableur

série n°1 270 270 275,5série n°2 90 90 144série n°3 47 59 65série n°4 196 185 196

Pour Q3 cours calculatrice tableur

série n°1 630 630 568série n°2 547 547 467série n°3 622 644,5 633,25série n°4 456 546 456

Page 24: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

Définition n°10. Intervalle interquartile, écart interquartile.

On appelle intervalle inter-quartiles, l’intervalle [Q 1 ; Q3 ] et l'amplitude decet intervalle : Q3−Q 1 est appelée écart inter-quartiles.

Exemple n°12. (toujours avec la série A)

L’intervalle inter-quartile est l’intervalle [7 ; 10]L'écart inter-quartile vaut 10 – 7 = 3.

Page 25: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E01

EXERCICE N°5

Luc, Samia et Rudy ont obtenu sept notes en français ce trimestre.Luc 18 2 4 3 1 19 20 1) Déterminer pour chaque élève :

1.a) sa moyenne arrondie au dixième ;1.b) une note médiane ainsi que les valeurs despremier et troisième quartiles ;

l'étendue des notes.

Samia 13 9 19 12 1 20 7

Rudy 10 13 11 10 12 13 12

2) Comment expliquer la grande différence entre la note moyenne et la note médiane de Luc ?Samia et Rudy ont des caractéristiques en commun. Ces élèves auront-ils la même appréciationsur leurs bulletins ? Justifier.

Page 26: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E01Correction de l’exercice n°5Luc, Samia et Rudy ont obtenu sept notes en français ce trimestre.Luc 18 2 4 3 1 19 20 1) Déterminer pour chaque élève :

1.a) sa moyenne arrondie au dixième ;1.b) une note médiane ainsi que les valeurs despremier et troisième quartiles ;

l'étendue des notes.

Samia 13 9 19 12 1 20 7

Rudy 10 13 11 10 12 13 12

2) Comment expliquer la grande différence entre la note moyenne et la note médiane de Luc ?Samia et Rudy ont des caractéristiques en commun. Ces élèves auront-ils la même appréciationsur leurs bulletins ? Justifier.1) 1.a)Notons M L ; M S et M R les moyennes respectives de Luc, Samia et Rudy.

M L=18+2+4+3+1+19+20

7=67

7≈9,57

M S=13+9+19+12+12+20+7=817

≈11,57

M R=10+13+11+10+12+13+12

7=81

7≈11,57

1.b) Q1 Med Q3

Luc 2 4 19

Samia 7 12 20

Rudy 10 12 13

Avant toute chose, on range les valeurs de chaque série dans l’ordre croissant.

note n°1 note n°2 note n°3 note n°4 note n°5 note n°6 note n°7

Luc 1 2 3 4 18 19 20Samia 1 7 9 12 13 19 20Rudy 10 10 11 12 12 13 13

Pour Luc : Calcul de Q1

14×7=1,75 , l’entier immédiatement supérieur est 2, on en déduit que Q1 est la deuxième

valeur de la série : 2Calcul de Q3

34×7=5,25 , l’entier immédiatement supérieur est 6, on en déduit que Q3 est la sixième

valeur de la série : 19Calcul de la médiane ( Med )Il y a 7 nombres dans la série et 7 est un nombre impair donc la médiane appartient à la série.

12×7=3,5 , l’entier immédiatement supérieur est 4, on en déduit que Med est la quatrième

valeur de la série : 4 .Pour les deux autres : C’est exactement la même chose...2) ▪ Luc n’a pas de note qui soit proche de sa moyenne, de plus la médiane appartient à la série (caril y a un nombre impair de notes) donc, dans ce cs, la médiane ne peut être proche de lamoyenne.▪ Bien que Samia et Rudy aient la même moyenne et la même médiane, ils n’auront pas la mêmeappréciation. En effet, l’écart inter-quartile de Samia vaut : 20−7=13 alors que celui de Rudyne vaut que 13 – 10=3 . On en déduit que Rudy est plus régulier que Samia.

Page 27: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

Définition n°11. La varianceLa variance d’une série statistique est la moyenne des carrés des écarts à lamoyenne.

Remarque n°7. Nous n’utiliserons pas la variance cette année, mais la définition suivante endépend.

Page 28: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

Définition n°12. L’écart-typeL’écart-type d’une série statistique est la racine carrée de la moyenne descarrés des écarts à la moyenne. Il est en général noté : σ qui se lit : « sigma »

Page 29: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

Exemple n°13. (toujours avec la série A)

Notes [ 0 ; 5 [ [ 5 ; 10 [ [ 10 ; 15 [ [ 15 ; 20 [ total

Centre 2,5 7,5 12,5 17,5

Effectif 4 17 7 2 30

Fréquence 0, 13 0, 57 0, 23 0, 07 1

▪ La moyenne est :

x = 2,5×4+7,5×17+ ...+17,5×2

30 =

26030

= 263

≈ 8,67

▪ L’écart-type vaut alors :

σ = √ 4×(2,5−263 )

2

+17×(7,5−263 )

2

+7×(12,5−263 )

2

+2×(17,5−263 )

2

4+17+7+2 ≈3,8

Page 30: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E02EXERCICE N°1

Dans une boulangerie industrielle, le poids affiché de la baguette est 250 grammes.Lors d'un contrôle, un agent du service des fraudes a prélevé 50 baguettes et a relevé leur masse.Les résultats sont dans le tableau suivant.

Masse de la baguette (en g) 247 248 249 250 251 252 253

Nombre de baguettes 2 5 11 15 8 6 3

Calculer la moyenne (notée x ) et l'écart type (noté σ ) de la série des masses des baguettesde pain.

Page 31: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E02Correction de l’exercice n°1

Dans une boulangerie industrielle, le poids affiché de la baguette est 250 grammes.Lors d'un contrôle, un agent du service des fraudes a prélevé 50 baguettes et a relevé leur masse.Les résultats sont dans le tableau suivant.

Masse de la baguette (en g) 247 248 249 250 251 252 253

Nombre de baguettes 2 5 11 15 8 6 3

Calculer la moyenne (notée x ) et l'écart type (noté σ ) de la série des masses des baguettesde pain.

x=247×2+248×5+249×11+250×15+251×8+252×6+253×32+5+11+15+8+6+3

=1250250

=250,04

On a utilisé ladéfinition n°7

Soit une série statistique à caractère quantitatif, dont les p valeurssont données par x1 , x2 , x3 , ... , x p d'effectifs associés

n1 , n2 , n3 , ... , n p avec N=n1+n2+n3+...+np

La moyenne pondérée de cette série est le nombre x tel que :

x = n1 x1+n2 x 2+n3 x3+ ...+n p x p

n1+n2+n3+...+n p

= 1N

∑i=1

p

ni x i

σ=√ 2×(247−205,04)2+5×(248−205,04)2+…+3×(253−205,04)2

50≈1,47

Des vidéos pour le faire à la calculatrice :

Avec Casio Graph ...https://www.youtube.com/watch?v=x6bV1w-3EcM

Avec TI...https://www.youtube.com/watch?v=JPTDZtSrd2o&feature=youtu.be

Page 32: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E02EXERCICE N°2

On a demandé aux employés d'une entreprise la distance qui sépare l'entreprise de leur domicile.Les résultats sont donnés dans le tableau suivant:

Distance en km [0 ; 5[ [5 ; 15[ [15 ; 30 [

Effectif 20 60 1051) Déterminer une valeur approchée de la distance moyenne qui sépare l'entreprise du domiciledes employés. Arrondir au dixième près. 2) Déterminer avec la calculatrice une valeur approchée de l'écart type σ de cette série.Arrondir dixième près.3) Calculer le pourcentage d'employés dont la distance qui sépare l'entreprise de leur domicileappartient à l'intervalle [ x−2σ ; x+2σ ] .

Page 33: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E02corrigé de l’exercice n°2

On a demandé aux employés d'une entreprise la distance qui sépare l'entreprise de leur domicile.Les résultats sont donnés dans le tableau suivant:

Distance en km [0 ; 5[ [5 ; 15[ [15 ; 30 [

Centre 2,5 10 22,5Effectif 20 60 105

1) Déterminer une valeur approchée de la distance moyenne qui sépare l'entreprise du domiciledes employés. Arrondir au dixième près. Notons x la distance moyenne recherchée.

x=2,5×20+10×60+22,5×10520+60+105

=3012,5185

≈16,3

Ici, comme les données sont groupées en classes, il faut penser à calculer les centres de ces

classes : 2,5=0+52

; 10=5+152

et 22,5=15+302

2) Déterminer avec la calculatrice une valeur approchée de l'écart type σ de cette série.Arrondir dixième près.

σ≈7,4Attention, à ne pas se tromper de valeur. C’est bien celle encadrée qu’il faut utiliser, vous verrezla signification de l’autre plus tard (pas cette année)

3) Calculer le pourcentage d'employés dont la distance qui sépare l'entreprise de leur domicileappartient à l'intervalle [ x−2σ ; x+2σ ] .

x−2σ≈1,5 et x+2σ≈31,1Et maintenant on fait quoi ?On sait que les classes [5 ; 15[ et [15 ; 30 [ sont incluses dans [1,5 ; 31,1], on peut donc déjàcompter 60 + 105 = 165 personnes.

Comment savoir combien il y a de valeurs supérieures ou égales à 1,5 de la classe [0 ; 5] ?

On décide que les effectifs sont repartis uniformément dans chaque classe…Qué ?

Page 34: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

Les effectifs augmentent régulièrement pendant qu’on parcourt la classe, ce qui donne nousdonne une fonction affine (et même linéaire ici). Il suffit ensuite de lire l’image de 1,5.On en déduit que 14 personnes (20 – 6 ) de cette classe sont à plus de 1,5 km.

Au final, on a donc 14 + 60 + 105 = 179 personnes dans l’intervalle [ x−2σ ; x+2σ ]

Et 179185

×100≈96,76

Soit environ 96,76 % personnes sont dans cet intervalle.

Qu’est ce qui nous permet de faire cette hypothèse de régularité ???

Ben en fait rien, car il n’y a pratiquement aucune chance que les valeurs se comportentexactement de cette façon. Mais, dans la pratique cela donne de bons résultats « peu » éloignés de la réalité. (Il y a des justifications théoriques à tout cela bien sûr, mais il faudra avancer dans les mathspour bien les saisir…)

Page 35: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E02

EXERCICE N°3 Le tableau ci-dessous résume les masses en kg des valises embarquées dans un avion lors d'unvol.Pour vous montrer que cela peut arriver : « les crochets sont dans l’autre sens »

Masse en kg ]10 ; 15] ]15 ; 20] ]20; 25]

Effectif 14 25 861) Quelle est, dans cet avion, la fréquence de valises pesant plus de 15 kg?Plus de 15kg donc strictement supérieur à 15.Il y a 25 + 86 = 111 valises de plus de 15 kg et il y a en tout 14 + 25 + 86 = 125

Et 111125

×100=88,8

Il y donc 88,8 % de valises de plus de 15 kg.2) Estimer la masse moyenne d'une valise dans cet avion.

Masse en kg ]10 ; 15] ]15 ; 20] ]20; 25]12,5 17,5 22,5

Effectif 14 25 86On pense à calculer les centres.Notons x la moyenne cherchée.

x=12,5×14+17,5×25+22,5×8614+25+86

=2547,8125

=20,38

On peut donc estimer la masse moyenne à 20,38 kg

L’énoncé dit « estimer » et pas « calculer » pourquoi ?

Les données étant répartie en classe, les centres ne sont que des approximations des véritablesvaleurs.

Page 36: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E02

EXERCICE N°4 Le rythme cardiaque au repos des élèves d'une classe de Seconde a été relevé lors d'une séancede TP.Les résultats sont synthétisés dans le tableau suivant (bpm signifie battements par minute).bpm 69 70 72 73 75 77 78 79

Effectif 2 1 3 1 2 1 1 2

bpm 80 82 83 84 85 86 88 90

Effectif 5 2 1 2 2 1 3 11) Préciser le caractère et la population étudiés.Le caractère étudié est rythme cardiaque au repos.La population est une classe de seconde (les individus sont alors les élèves de cette classe)2) Calculer la fréquence en pourcentage des élèves dont le nombre de bpm est :2.a) de 72 2.b) inférieur ou égal à 75 2.c) supérieur ou égal à 82

330

×100=10

Soit 10 %

2+1+3+1+230

×100=30

Soit 30 %

2+1+2+2+1+3+130

×100=40

Soit 40 %3) Dans un diagramme circulaire représentant cette série, quel serait l'angle du secteurcorrespondant aux élèves ayant un rythme cardiaque de72bpm?

10100

×360=36

La mesure de l’angle vaudrait 36°On se souvient qu’un diagramme circulaire et que pour le parcourir il faut 360°. Le reste n’estque de la proportionnalité.4) Déterminer la médiane de cette série.

Il y a 30 valeurs, la médiane sera donc la moyenne de la 15e et de la 16e valeur : 80+80

2=80

5) Déterminer les quartiles Q1 et Q3 de cette série, ainsi que l'écart interquartile.14×30=7,5 , Q1 est donc la 8e valeur de la série : 75

34×30=22,5 , Q3 est donc la 8e valeur de la série : 84

6) En utilisant la calculatrice, calculer le nombre moyen de bpm de cette classe.La moyenne vaut 79,5.Si vous ne trouvez pas cela alors vous avez oubliez un réglage.Casio vidéo à 2min32TI video à 2m30

7) Cette même étude a été menée dans une autre classe de 20 élèves. On y a alors obtenu unnombre moyen de bpm de 74. Calculer alors le nombre moyen de bpm sur l'ensemble de cesdeux classes.

20×74+30×79,520+30

=77,3

Le nombre moyen de bpm sur les deux classes est alors de 77,3.Voici un exemple d’utilisation de la propriété n° 2 : moyenne par sous groupe.

Page 37: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES E02

EXERCICE N°5 1) Construire une série statistique comportant huit valeurs telle que la médiane soit égale aupremier quartile et le troisième quartile soit égal trois fois la médiane.La série comporte huit valeurs donc

Q1 est la 2e valeur Q3 est la 6e est la médiane M est la moyenne de la 4e et de la 5e .Pour éviter les calculs inutiles, on va faire un premier choix : les valeurs n°2, 3, 4 et 5 seront lesmêmes et du coup la 6e vaudra trois fois la 5e .10 ; 11 ; 11 ; 11 ; 11 ; 33 ; 65En fait n’importe quel triplet de nombres a ; b et c avec a⩽b et 3 b⩽c fonctionne

a ; b ; b ; b ; b ; 3 b ; c Et il y a encore d’autres possibilités2) Construire une série statistique comportant cinq valeurs telle que la moyenne soit égale à dixfois sa médiane.On va choisir la médiane qui est la 3e valeur , par exemple 11. Ensuite on choisit deux valeurs inférieures ou égales 11 et deux valeurs supérieures ou égales 11de sorte que la moyenne soit égale à 110 (10 fois 11)Pour éviter les calculs, on va choisir les quatre valeurs égales à 11 (à la médiane) et on vacalculer la 5e pour obtenir la moyenne voulue.

Notons x la dernière valeur, de sorte que la série soit : 11 ; 11 ; 11 ; 11 ; x

La médiane vaut 11 donc la moyenne doit valeur 110

11+11+11+11+ x5

=110 ⇔ 44+ x=550 ⇔ x=506

ainsi la série 11 ; 11 ; 11 ; 11 ; 506 répond au problèmeIl y a bien sûr plein d’autres possibilités.3) Construire une série statistique comportant sept valeurs telle que le premier quartile soit égalà deux fois sa moyenne.

14×7=1,75 Q1 est donc la 2e valeur de la série.

Choisissons Q1=11 la moyenne vaut alors 5,5Notons x la première valeur, de sorte que la série soit : x ; 11 ; 11 ; 11 ; 11 ; 11 ; 11

x+11+11+11+11+11+117

=5,5 ⇔ x+66=38,5 ⇔ x=−27,5

Ainsi la série −27,5 ; 11 ; 11 ; 11 ; 11 ; 11 ; 11 répond à la questionEncore une fois, il y a plein d’autres possibilités.

Ici j’essaie juste de vous donner les méthodes les plus simples à mettre entre œuvre.

Page 38: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

LES STATISTIQUES

V Résumé du coursDéfinitions

Population, individusLa population, c'est l’ensemble des individus sur lesquels portent l’étudestatistique.

Caractère C'est une propriété étudiée sur chaque individu.

Nature de caractère,valeur ou modalité.

Le caractère est quantitatif quand il prend des valeurs (ou modalités)numériques. Il peut alors être quantitatif discret si les valeurs sont isoléesou quantitatif continu dans le cas contraire.Le caractère est qualitatif quand les modalités qu'il prend ne sont pasnumériques.

Classe Dans le cas d'un caractère quantitatif continu, on regroupe les valeurs parclasses (qui sont des intervalles). On peut également le faire quand lecaractère est quantitatif discret.

Centre de classe Le centre de la classe, c’est la moyenne des extrémités de la classe

Effectif C’est le nombre d’individus qui possèdent le caractère étudié.

Mode, valeur modale,classe modale

On appelle mode ou valeur (resp classe) modale, la valeur (resp classe) quipossède le plus grand effectif.

Indicateurs de tendance centrale

Les indicateurs de tendance centrale sont le mode, la médiane et lamoyenne.

Moyenne pondérée(avec les effectifs)

x = n1 x1+n2 x2+n3 x3+ ...+n p x p

n1+n2+n3+...+n p

= 1N

∑i=1

p

ni x i

Moyenne pondérée(avec les fréquences)

x = f 1 x1+ f 2 x2+ f 3 x3+ ...+ f p x p = ∑i=1

p

f i x i

Moyenne pondérée(par groupe)

x = pN

×x1 + qN

× x2

Indicateurs de dispersion

Les principaux indicateurs de dispersion sont l’étendue, l’écart inter-quartile, la variance et l’écart-type.

Étendue Étendue = plus grande valeur du caractère – plus petite valeur du caractère

Quartiles

Soit une série statistique ordonnée, on appelle :▪ premier quartile et on note Q1 la valeur de la série telle qu'au moins25% des valeurs soient inférieures (ou égales) à Q1

▪ troisième quartile et on note Q3 la valeur de la série telle qu'au moins75% des valeurs soient inférieures (ou égales) à Q3

Intervalle inter-quartile,

écart inter-quartile

On appelle intervalle inter-quartiles, l’intervalle [Q 1 ; Q3 ] et l'amplitudede cet intervalle : Q3−Q 1 est appelée écart inter-quartiles.

Écart-type

L’écart-type d’une série statistique est la racine carrée de la moyenne descarrés des écarts à la moyenne.

Il est en général noté : σ qui se lit : « sigma »

Voir l’exemple n°13

Page 39: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

COMPLÉMENT DE COURS

VI Effectifs et fréquences cumulés Quand les valeurs d’un caractère quantitatif sont rangées dans l’ordre croissant,● L’effectif cumulé croissant (respectivement décroissant) d'une valeur est la somme des effectifs des valeurs inférieures (respectivement supérieures) ou égales à cette valeur,● La fréquence cumulée croissante (respectivement décroissante) d’une valeur est la somme des fréquences des valeurs inférieures (respectivement supérieures) ou égales à cette valeur.

Exemple n°14. (toujours avec la série A)

Notes 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Eff 1 2 1 1 2 3 5 6 2 3 0 2 0 1 1

E.C.C 1 3 4 5 7 10 15 21 23 26 26 28 28 29 30

E.C.D 30 29 27 26 25 23 20 15 9 7 4 4 2 2 1

Ce tableau peut par exemple nous permettre de calculer la médiane de la série :l’effectif étant de 30, on choisit la moyenne entre la 15e et 16e note, lues dans la ligne des E.C.C. :

M = 8+9

2 = 8,5

Exemple n°15. (toujours avec la série A)

On s’intéresse cette fois-ci à la fréquence :Notes [ 0 ; 5 [ [ 5 ; 10 [ [ 10 ; 15 [ [ 15 ; 20 [

Effectif 4 17 7 2

Fréquence en % 13 57 23 7

F.C.C 13 70 93 70

F.C.D 100 87 30 7

Page 40: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

VII Représentation graphique d’une série statistique

VII.1 Histogramme

Lorsque le caractère étudié est quantitatif et lorsque les modalités sont regroupées en classes, on peut représenter la série par un histogramme : l’aire de chaque rectangle est alors proportionnelle à l’effectif (ou à la fréquence) associée à chaque classe.

Méthode n°1. Construire un histogrammeÉnoncé : On donne la série statistique suivante :

Classes [ 1 ; 4 [ [4 ; 12 [ [12 ; 14 [ [14 ; 17 [

Effectif 30 30 10 20

Fréquence en %

Construire un histogramme représentant cette série.

Réponse :

On gradue l'axe des abscisses et on y place les classes.Ensuite on choisit « la valeur d'un carreau ». Ici on a choisi : « un carreau représente 2 unités ».Il nous reste à déterminer la hauteur de chaque rectangle afin que son aire soit proportionnelle à l'effectif qu'il représente.

Classe [ 1 ; 4 [ [4 ; 12 [ [12 ; 14 [ [14 ; 17 [

Effectif n i 30 30 10 20

Amplitude encarreaux = largeur

du rectangle :l i

6 16 4 6

Hauteur durectangle hi

302×6

=2,530

2×16=0,9375

102×4

=1,2520

2×6=5

3

Si on note « la valeur d'un carreau » alors h i=ni

t×l i

Remarque n°8. Lorsque les classes ont la même amplitude, la hauteur est aussi proportionnelle à l’effectif. On rappelle que ce n’est pas le cas en général.

VII.2 Nuage de points

Page 41: I Vocabulaire et définitions - landatome.pagesperso-orange.fr · Pour notre notre forêt, le caractère est le fait d'être malade ou non. LES STATISTIQUES E01 EXERCICE N°1 Une

Lorsque le caractère étudié est quantitatif et discret, on peut représenter la série par un nuage de points : chaque couple de valeurs est représenté par un point dans un repère orthogonal.

Exemple n°16. (toujours avec la série A)

VII.3 Courbe des fréquences cumulées

Lorsque le caractère étudié est quantitatif et lorsque les modalités sont regroupées en classes, on peut effectuer la courbe des fréquences cumulées (croissantes ou décroissantes) appelée aussi polygone des fréquences cumulées.

Exemple n°17. (toujours avec la série A)

On peut grâce à ces polygones déterminer la médiane de la série de deux manières

➔ Soit en déterminant le point du polygone d’ordonnée 50% : on trouve environ M = 8, 2,➔ soit en lisant l’abscisse du point d’intersection des deux courbes.

F.C.D

F.C.C