Statistiques - Alternance fredet/enseignements/MathAlternanceHSE/...  Statistiques - Alternance...

download Statistiques - Alternance fredet/enseignements/MathAlternanceHSE/...  Statistiques - Alternance HSE

of 30

  • date post

    05-Jun-2018
  • Category

    Documents

  • view

    218
  • download

    0

Embed Size (px)

Transcript of Statistiques - Alternance fredet/enseignements/MathAlternanceHSE/...  Statistiques - Alternance...

  • Statistiques - Alternance HSE

    Anne Fredet, Jean-Marie Gourdon

    8 janvier 2006

    Table des matieres

    1 Statistique descriptive 21.1 Definitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Effectif, moyenne, mediane et mode . . . . . . . . . . . . . . . 31.3 Frequences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.4 Etendue et quartiles . . . . . . . . . . . . . . . . . . . . . . . 91.5 Ecarts et variance . . . . . . . . . . . . . . . . . . . . . . . . . 111.6 Presentation des resultats . . . . . . . . . . . . . . . . . . . . 131.7 Changement de variable . . . . . . . . . . . . . . . . . . . . . 161.8 Serie double . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

    2 Solutions 21

    3 References 30

    1

  • 1 Statistique descriptive

    1.1 Definitions

    Definition 1.1.1 A la base de toute etude statistique, il y a une population,formee dindividus sur lesquels on observe des caracteres.

    Pour fixer les idees, il est plus facile de penser en termes de population hu-maine. Les individus sont des personnes, et les caracteres observes peuventetre morphologiques (taille, poids, couleur des yeux), physiologiques (groupesanguin, numeration globulaire, taux de cholesterol) ou psychologiques (reactionsa des tests ou reponses a une enquete dopinion).

    Definition 1.1.2 Leffectif dune population est le nombre dindividus decette population.

    Les caracteres observes peuvent etre de plusieurs types :

    Definition 1.1.3 Un caractere est dit qualitatif, quand les valeurs ne peuvent etre ni ordonnees ni ajoutees

    (groupe sanguin, couleur des yeux, vote pour un candidat). ordinal, quand les valeurs peuvent etre ordonnees mais pas ajoutees

    (opinions exprimees sur une echelle de valeurs) quantitatif, quand les valeurs sont numeriques (mesures physiques, phy-

    siologiques, economiques).Les valeurs que peut prendre un caractere sappellent les modalites.

    La statistique intervient quand il est impossible ou inutile dobserver uncaractere sur lensemble de la population. On lobserve alors sur une sous-population, de taille reduite, en esperant tirer de lobservation des conclusionsgeneralisables a toute la population.

    Definition 1.1.4 Si les donnees dun caractere quantitatif sont recueilliessur des individus, le resultat est un n-uplet de nombres, entiers ou decimaux,que lon appelle echantillon ou serie statistique, de taille n.

    On reserve plutot le terme dechantillon au resultat de experiences meneesindependamment les unes des autres, et dans des conditions identiques (lan-cers de des, mesure du poids de nouveaux-nes,...). On appellera serie sta-tistique le resultat dexperiences qui ne sont pas interchangeables. Le cas le

    2

  • plus frequent est celui ou la population est constituee dinstants successifs(releves quotidiens de temperatures, chiffres mensuels du chomage,...). Onparle alors de serie chronologique.

    Definition 1.1.5 On distingue souvent les caracteres discrets (ceux qui neprennent que peu de modalites distinctes) des caracteres continus (pour les-quels toutes les valeurs observees sont a priori differentes).

    La frontiere entre continu et discret est beaucoup moins claire en pratiquequen theorie. Tout recueil de donnees se fait avec une certaine precision,et dans une certaine unite. Si une taille est mesuree avec une precision delordre du centimetre, tout chiffre correspondant a une quantite inferieure aucentimetre ne contient aucune information et doit etre elimine. Cela signifieque la taille en centimetres est une valeur entiere, donc un caractere discret.Differentes techniques statistiques (histogrammes, ...) imposent de regrouperles donnees en classes, ce qui revient a les rendre discretes, les nouvelles mo-dalites etant les differentes classes.

    En statistiques, on est en general en presence dun grand nombre de valeurs.Or, si lintegralite de ces valeurs forme linformation, il nest pas aise de ma-nipuler plusieurs centaines voir milliers de chiffres, ni den tirer des conclu-sions. Il faut donc calculer quelques valeurs qui vont permettre danalyser lesdonnees.

    1.2 Effectif, moyenne, mediane et mode

    Definition 1.2.1 Leffectif dune valeur est le nombre de fois ou cette valeurapparat.Leffectif cumule croissant dune valeur est le nombre de fois ou une valeurinferieure ou egale a cette valeur apparat.Leffectif cumule decroissant dune valeur est le nombre de fois ou une valeursuperieure ou egale a cette valeur apparat.

    Definition 1.2.2 Le mode est la valeur du caractere statistique qui apparaitle plus frequemment.

    Definition 1.2.3 Soient n valeurs disctinctes ou non de la variable. Si cettevariable prend p valeurs distinctes (p n) x1, , xp deffectifs respectifs

    3

  • n1, , np (avec n1 + + np = n) alors la moyenne (arithmetique) estdonnee par

    x =1

    n

    pi=1

    nixi.

    Si la serie est continue et si on travaille avec des classes, alors les valeurs xiconsiderees sont les centres des classes.

    Definition 1.2.4 La mediane est la valeur qui separe les donnees en deuxpartie egales. Cest-a-dire que 50% des valeurs sont inferieures a la medianeet 50% sont superieures.

    Exercice 1.2.1 A un partiel, les notes suivantes ont ete obtenues :

    etudiant A B C D E F G H I J K L M N O P Q R Snote 11 8 12 12 4 13 5 10 15 12 6 9 17 9 4 8 11 12 7

    Calculer leffectif de chaque note, les effectifs cumules croissants et decroissants,puis la moyenne, la mediane et le mode de cette serie.

    Exercice 1.2.2 Les 50 notes suivantes ont ete attribuees par un jury.

    note 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20effectifs 1 2 2 3 2 3 2 3 4 3 2 3 4 4 3 1 2 1 2 2 1

    Calculer les effectifs cumules croissants et decroissants, puis la moyenne et lamediane de cette epreuve.

    Exercice 1.2.3 Un jury a attribue 50 notes. Elles sont regroupees dans cetableau :

    Notes Effectifs[0; 5[ 10[5; 8[ 8[8; 12[ 12[12; 15[ 11[15; 20[ 9

    Calculer la moyenne et mediane de cette serie.

    4

  • Exercice 1.2.4 La repartition des salaires dune entreprise est la suivante :

    Salaires en francs Repartition employes[4000; 6000[ 20[6000; 8000[ 96[8000; 10000[ 52[10000; 12000[ 17[18000; 20000[ 2

    Calculer le salaire moyen puis le salaire median de cette entreprise.Refaire ces calculs en negligeant les deux plus gros salaires.

    Exercice 1.2.5 On dispose dune table de survie relative a un groupe de1000 personnes nees a la meme date (date 0) et suivies a partir de leurnaissance. On a le tableau suivant :

    epoque(exprimees en annees)

    Nombre de personnes du groupeencore vivante a cette epoque

    0 100010 93020 90030 85040 78050 68060 56070 38080 15090 20100 0

    Calculer

    1. La duree mediane dexistence des 1000 personnes observees

    2. La duree moyenne dexistence (ou esperance de vie) des 1000 personnesen question

    3. Lesperance de vie (calculee a partir de lannee 0) pour une personneayant atteint lage de 70 ans

    Remarque 1.2.1 La maniere dont les valeurs sont regroupees influe surla moyenne, la mediane et les quartiles. Par exemple, supposons que lon

    5

  • considere les tailles en centimetres de 10 personnes et que lon ait les va-leurs suivantes : 162; 173; 185; 170; 178; 175; 178; 180; 168; 183. La moyenneest donc

    162 + 173 + 185 + 170 + 178 + 175 + 178 + 180 + 168 + 183

    10= 175, 2 cm

    Imaginons que lon souhaite regrouper ces valeurs par intervalles. Plusieurschoix se presentent :

    Quelle largeur dintervalle choisir ? Les intervalles seront-ils ouverts a droite et fermes a gauche ou ouverts

    a gauche et ferme a droite ?Considerons plusieurs possibilites et regardons la moyenne dans ces cas :

    1. Si lintervalle a une largeur de 5cm et est ouvert a gauche et ferme adroite, on obtient le tableau suivant :

    intervalle effectif centre]160; 165] 11162, 5]165; 170] 2 167, 5]170; 175] 2 172, 5]175; 180] 3 177, 5]180; 185] 2 182, 5]185; 190] 0 187, 5

    La moyenne est donc

    162, 5 1 + 167, 5 2 + 172, 5 2 + 177, 5 3 + 182, 5 210

    = 174 cm

    2. Si lintervalle a une largeur de 5cm et est ferme a gauche et ouvert adroite, on obtient le tableau suivant :

    intervalle effectif centre[160; 165[ 1 162, 5[165; 170[ 1 167, 5[170; 175[ 2 172, 5[175; 180[ 3 177, 5[180; 185[ 2 182, 5[185; 190[ 1 187, 5

    6

  • La moyenne est donc

    162, 5 1 + 167, 5 1 + 172, 5 2 + 177, 5 3 + 182, 5 2 + 187, 5 110

    = 176 cm

    3. Si lintervalle a une largeur de 5cm et est ouvert a gauche et ferme adroite, on obtient le tableau suivant :

    intervalle effectif centre]160; 170] 3 165]170; 180] 5 175]180; 190] 2 185

    La moyenne est donc

    165 3 + 175 5 + 185 210

    = 174 cm

    4. Si lintervalle a une largeur de 5cm et est ferme a gauche et ouvert adroite, on obtient le tableau suivant :

    intervalle effectif centre[160; 170[ 2 165[170; 180[ 5 175[180; 190[ 3 185

    La moyenne est donc

    165 2 + 175 5 + 185 310

    = 176 cm

    On voit donc que ces choix changent la moyenne. De meme, la mediane etles quartile sont modifies.

    Il existe au moins deux autres moyennes :

    Definition 1.2.5 Soient a1, , an des nombres. La moyenne geometriquede cette serie est le nombre

    (a1 a2 an)1/n

    Exercice 1.2.6 Le prix de lessence a augmente de 20 % lan dernier et de10 % cette annee. Quelle est la hausse moyenne de lessence ?

    7

  • Exercice 1.2.7 Une societe a vu son benefice augmenter ces trois dernieresannees : de 10 % la premiere annee, de 21 % la deuxieme et de 2% la troisieme.Quelle est son augmentation annuelle moyenne ?

    Exercice 1.2.8 Si linflation dun pays est de 5% la premiere annee et de15% la suivante, calculer laugmentation moyenne des prix.

    Definition 1.2.6 Soient a1, , an des