Chap 8 Statistiques - · PDF file Chap 8 Statistiques I Médianes et quartiles...

Click here to load reader

  • date post

    13-Oct-2020
  • Category

    Documents

  • view

    0
  • download

    0

Embed Size (px)

Transcript of Chap 8 Statistiques - · PDF file Chap 8 Statistiques I Médianes et quartiles...

  • Chap 8 Statistiques I Médianes et quartiles Définitions : La médiane notée m d’une série statistique est la valeur du caractère qui partage la série en deux groupes de

    même effectif : l’un des groupe contient les valeurs inférieures ou égales à m et l’autre groupe contient les valeurs supérieures ou égales à m.

    Pour un effectif impair 2n+1 c’est la (n+1)ième Pour un effectif pair 2n c’est la moyenne de la nième et (n+1)ième valeur. Le premier quartile noté 𝑄! est la plus petite des valeurs du caractère telle qu’au moins 25% des valeurs de

    la série sont inférieures ou égales à 𝑄! : 𝑸𝟏 est la 1ère valeur de la série pour laquelle la fréquence cumulée croissante 0,25 est atteinte ou dépassée.

    Le troisième quartile noté 𝑄! est la plus petite des valeurs du caractère telle qu’au moins 75% des valeurs

    sont inférieures ou égales à 𝑄! : 𝑸𝟑 est la 1ère valeur de la série pour laquelle la fréquence cumulée croissante 0,75 est atteinte ou dépassée.

    Exemple (1 p 266) note 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 effectif 2 1 3 2 4 3 3 5 6 8 10 6 7 3 4 2 3 1 2 1 76 ECC 2 3 6 8 12 15 18 23 29 37 47 53 60 63 67 69 72 73 75 76 FCC 3 4 8 11 16 20 24 30 38 49 62 70 79 83 88 91 95 96 99 100 Q1 Med Q3 II Diagramme en boîte et écart-interquartile Définition : Diagramme en boîte Le diagramme en boîte d’une série statistique est le graphique ci dessous où l’axe est gradué régulièrement de sorte que l’on puisse y faire figurer les valeurs minimale et maximale, le 1er quartile Q1, la médiane et le 3e quartile Q3 . Valeur Valeur minimale Q1 Me Q3 maximale au moins 25% au moins 50% au moins 25%

    des valeurs des valeurs des valeurs Définition : Pour une série statistique de premier et troisième quartiles Q1 et Q3 : • l’intervalle interquartile de la série est [Q1 ; Q3] ; • l’écart interquartile est Q3 − Q1. Exemple : Dans l’exemple précédent, l’intervalle interquartile est [8 ;13] et l’écart interquartile est 13-8 = 5.

  • Remarques : • L’intervalle interquartile contient au moins la moitié des valeurs de la série. • L’écart interquartile est insensible aux valeurs extrêmes. • L’écart interquartile est un indicateur de dispersion de la série : plus il est faible, plus la série est

    homogène. III Variance et écart-type Définition : Soit x1, x2, . . . , xp les valeurs d’une série statistique d’effectif total N  et n1, n2… np leurs effectifs associés

    • La moyenne de cette série est donnée par la formule : x = n1x1 + n2x2 + ...+ npxp

    N =

    nixi i=1

    p

    ∑ N

    • La variance est la moyenne des carrés des écarts à la moyenne, elle est donnée par la formule :

    Var = n1(x1 − x )

    2 + n2 (x2 − x ) 2 + ...+ np (xn − x )

    2

    N =

    ni (xi − x ) 2

    i=1

    p

    ∑ N

    • L’écart type est la racine de la variance : 𝜎 = 𝑉𝑎𝑟

    Propriété de la variance : 𝐕𝐚𝐫 = 𝒏𝟏𝒙𝟏 𝟐!    𝒏𝟐𝒙𝟐𝟐!⋯!𝒏𝒑𝒙𝐩𝟐

    𝑵 − 𝒙𝟐

    Dem :

    V = 𝑛!(𝑥! − 𝑥)! +    𝑛!(𝑥! − 𝑥)! +⋯+ 𝑛!(𝑥! − 𝑥)!

    𝑁

    V = 𝑛!𝑥!! + 𝑛!𝑥!! +⋯+ 𝑛!𝑥!!

    𝑁 − 2 𝑛!𝑥!𝑥 + 𝑛!𝑥!𝑥 +⋯+ 𝑛!𝑥!𝑥

    𝑁 + 𝑛!𝑥! +    𝑛!𝑥! +⋯+ 𝑛!𝑥!

    𝑁

    Or     !!!!!!    !!!!!!⋯!!!!!! !

    = 𝑥 !!!!!    !!!!!⋯!!!!! !

    = 𝑥! Et !!!

    !!    !!!!!⋯!!!!!

    ! = 𝑥! !!!    !!!⋯!!!

    ! = 𝑥!×1 = 𝑥!

    Donc V = !!!! !!!!!!!!⋯!!!!!!

    ! − 2𝑥! + 𝑥! et on a bien : 𝐕 = 𝒏𝟏𝒙𝟏

    𝟐!𝒏𝟐𝒙𝟐𝟐!⋯!𝒏𝒑𝒙𝐩𝟐

    𝑵 − 𝒙𝟐

    IV Résumé d’une série statistique MÉTHODE : Pour résumer une série statistique, on utilise un indicateur de position (la médiane ou la moyenne) et un indicateur de dispersion (l’écart interquartile ou l’écart-type). On peut utiliser : • le couple médiane-écart interquartile, qui n’est pas sensible aux valeurs extrêmes : on le privilégie donc quand on étudie une série dont les valeurs extrêmes sont moins importantes ou moins significatives que les valeurs centrales ; • le couple moyenne-écart-type, qui est sensible aux valeurs extrêmes : on le privilégie donc quand on étudie une série dont les valeurs extrêmes sont aussi importantes ou aussi significatives que les autres.