Miage02ProbasStats

76
1 PROBABILITES et STATISTIQUES Cours et exercices C. Reder IUP2-MIAGE Bordeaux I 2002-2003

Transcript of Miage02ProbasStats

  • 1PROBABILITES et STATISTIQUES

    Cours et exercices

    C. Reder

    IUP2-MIAGE

    Bordeaux I

    2002-2003

  • 2SOMMAIREI- Le modle probabiliste

    1- Evnements2- Loi de probabilit, espace de probabilit3- Le cas o les vnements lmentaires sont quiprobables4- Exercices

    II- Probabilits conditionnelles1- Dfinition2- Deux rsultats de dcomposition3- Evnements indpendants4- Exercices

    III- Variables alatoires : gnralits1- Dfinitions2- Variables alatoires discrtes, variables alatoires densit3- Couples de variables alatoires4- Variables alatoires indpendantes5- Exercices

    IV- Caractristiques numriques des variables alatoires1- Esprance2- Variance, covariance3- Exercices

    V- Variables alatoires usuelles1- Loi de Bernoulli (p)2- Loi binomiale (n, p)3- Loi uniforme4- Loi exponentielle5- Loi de Poisson ()6- Loi normale (, )7- Exercices

    VI- Somme d'un grand nombre de variables alatoires indpendantes1- L'ingalit de Tchebychev2- Loi des grands nombres3- Thorme central-limite4- Exercices

    VII- Echantillonnage1- Description des donnes statistiques sur un caractre2- Echantillons alatoires, statistiques, estimateurs3- Estimateurs les plus usuels

  • 3a) Moyenne de l' chantillonb) Variance de l'chantillonc) Fonction de rpartition de l'chantillon

    4- Un exemple de comparaison de l'efficacit de deux estimateurs5- Statistiques issues d'une loi normale

    a) Lois issues de la loi normaleb) Moyenne et variance d'un chantillon de loi normale

    VIII- Tests d'hypothses sur les valeurs des paramtres d'une variablealatoire

    1- Valeur de l'esprance d'une variable normale de variance connue2- Valeur de l'esprance d'une variable normale de variance

    inconnue3- Valeur de la variance d'une variable normale4- Valeur de la probabilit d'un vnement5- Valeur de l'esprance d'une variable alatoire de loi quelconque6- Intervalle de confiance pour l'estimation d'un paramtre7- Exercices

    IX- Tests portant sur l'galit des esprances de plusieurs variablesalatoires

    1- Egalit des esprances de deux variables normalesa) variables normales de variances connuesb) variables normales de mme variance inconnuec) variables normales de variances inconnues

    2- Egalit de deux probabilits3- Egalit des esprances de plusieurs variables normales : mthode

    de la variance4- Exercices

    X- Tests d'hypothses non-paramtriques sur la loi d'une variablealatoire

    1- Egalit de la loi de l'chantillon et d'une loi spcifiea) Test du khi-deuxb) Test par simulation

    2- Cas o certains paramtres ne sont pas spcifis3- Egalit des lois de plusieurs chantillons4- Indpendance de deux caractres alatoires5- Test des signes6- Exercices

    Textes d'examensTables

  • 4I- Le modle probabiliste

    Voici les premires phrases d'un manuel (1): "La thorie des probabilits est une sciencemathmatique tudiant les lois rgissant les phnomnes alatoires. Un phnomne estalatoire si, reproduit maintes fois, il se droule chaque fois un peu diffremment, desorte que le rsultat de l'exprience change d'une fois l'autre d'une manire alatoire,imprvisible."L'usage mme du mot exprience sous-entend que le phnomne alatoire est observ parle biais d'un critre bien dfini, et que le rsultat de cette observation peut tre dcrit sansambigut. L'exprience peut aussi tre rpte, et on suppose que chacun des rsultatspossibles est observ avec une certaine frquence dont la valeur se stabilise si on rptel'exprience maintes et "maintes fois". C'est cette "loi" que prsuppose l'existence d'unmodle probabiliste.Ce premier chapitre est une rapide prsentation du cadre formel des modlesprobabilistes.

    1- Evnements

    Etant donne une exprience alatoire, on note l'ensemble de tous les rsultatspossibles de cette exprience.Un singleton de est appel vnement lmentaire.Un sous-ensemble A de est appel un vnement . Un vnement A est donc unensemble constitu de rsultats possibles de l'exprience. Si le rsultat d'une exprienceest dans A, on dit que A est ralis.

    Exemple 1-1 : On dtermine le sexe d'un nouveau-n. On posera : = {g, f}

    Le rsultat g signifie que le nouveau-n est un garon et f que c'est une fille.

    Exemple 1-2 : Sept tudiants doivent passer un oral d'examen. On leur distribue unnumro d'ordre. On pose :

    = {tous les alignements des sept lettres a, b, c, d, e, f, g}Le rsultat cfabdeg signifie que l'tudiant c est le premier, a le second, ....L'ensemble des arrangements qui commencent par cf est un vnement.

    1 H.Ventsel : Thorie des probabilits. (Ed.MIR, traduction franaise 1973).

  • 5Exemple 1-3 : L'exprience consiste dterminer la dose d'ansthsique minimale(exprime en ml) administrer un patient pour l'endormir. On choisit :

    = ] 0, +[L'vnement ] 2, 3] est ralis si la dose minimale administrer est comprise entre 2 et 3,c'est--dire si une quantit suprieure ou gale 3 suffit endormir le patient, mais unequantit infrieure 2 est insuffisante.

    Dans le cadre de la thorie des probabilits, un vnement est gnralement dfini commel'ensemble des rsultats ayant une proprit donne. La plupart du temps, l'ensemble Aest not comme la proprit qui le dfinit. Donnons quelques exemples de tellesassimilations :

    : vnement certain : vnement impossibleA B : vnement (A ou B)A B : vnement (A et B)Ac : (non A), vnement contraire de AA B = : les vnements A et B sont incompatibles

    Exercice 1-1 : Soit l'ensemble des rsultats possibles d'une exprience alatoire, etsoient A, B et C des vnements. Traduire en termes ensemblistes les vnements :a) les trois vnements A, B et C sont ralissb) aucun des vnements A, B ou C n'est ralisc) au moins un des vnements est ralisd) deux au plus des vnements est ralis

    2- Loi de probabilit, espace de probabilit

    On tire une boule dans une urne contenant 2 boules blanches, 1 noire, 4 vertes, 5 rouges,et on regarde sa couleur. Si on rpte cette exprience, la frquence avec laquelle onobtient une boule rouge se stabilise peu peu sur une valeur, gale ici 5/12. On ditcouramment qu'on a 5 chances sur 12 de tirer une boule rouge. Dans le cadre d'unmodle mathmatique de cette exprience alatoire, on dira que l'vnement "tirer uneboule rouge" a la probabilit 5/12. Plus gnralement, dans un modle probabiliste,chaque vnement est pondr par un nombre compris entre 0 et 1, sa probabilit. Cesprobabilits doivent respecter certaines rgles de compatibilit, naturelles si on lesinterprte en termes de "nombre de chances sur 100". L'additivit est la principale de cesrgles. Applique un cas particulier dans notre exemple, elle exprime simplement que,puisqu'on a 5 chances sur 12 de tirer une boule rouge et 2 chances sur 12 de tirer une

  • 6blanche, on a 5+2 chances sur 12 de tirer une boule soit rouge soit blanche. L'autre rgledit seulement que si on tire une boule, on a 100% de chances de tirer une boule

    Dfinition 1-1 : Soit un ensemble. Une loi de probabilit P sur est une fonction qui tout vnement A associe un nombre rel P(A), et qui a les trois proprits :

    a) 0 P(A) 1,b) P () = 1c) Pour toute famille finie ou dnombrable (An)nI d'vnements deux deux

    disjoints :P(

    nI An) =

    nI P(An) .

    (, P) s'appelle un espace de probabilit.

    Exemple 1-4 : On lance un d et on observe la face du dessus. On posera : = {1, 2, 3, 4, 5, 6}

    et on supposera que le d est parfaitement quilibr, de sorte que la probabilit de chaqueface est la mme :

    P({1}) = P({2}) = P({3}) = P({4}) = P({5}) = P({6}) = 16 .Remarquons qu'alors, la probabilit de tout vnement est calculable en utilisant laproprit c) de la dfinition. Par exemple, comme {1, 3, 4} est la runion des troisensembles 2 2 incompatibles {1}, {3} et {4}, on a :

    P({1, 3, 4}) = P({1}) + P({3}) + P({4}) = 16 + 16 +

    16 =

    36 =

    12 .

    Plus gnralement, soit un ensemble fini : = {1, 2, ...., n}

    Dfinir une loi de probabilit P sur revient se donner n rels positifs ou nuls p1, p2,

    ...., pn tels que k=1

    n pk = 1, et poser, pour tout indice k, P({k}) = pk. La loi de

    probabilit sur est alors compltement dtermine car, tant donn un vnement A,P(A) est calculable en additionnant les probabilits pk de chacun des vnementslmentaires {k} qui composent A.Il en est de mme si est un ensemble dnombrable, les sommes finies sont alorsremplaces par les sommes de sries.

    Exercice 1-2 : Soit (, P) un espace de probabilit. Rpondre aux questions en utilisant ladfinition 1-1 :a) Si A est un vnement de probabilit P(A) connue, que vaut P(Ac) ?b) Si A B, comparer P(A) et P(B).c) Calculer P(A ou B) en fonction de P(A et B), P(A) et P(B).

  • 7d) Montrer que P(A ou B) P(A)+P(B). Gnraliser cette ingalit un nombre finid'vnements.

    On pourrait aussi dmontrer les proprits suivantes :Proposition 1-1 : a) Pour toute famille finie ou dnombrable (An)nI d'vnements :

    P(nI

    An ) nI

    P(An) .

    b) Si (An)n est une suite croissante d'vnements :P(

    n An ) = lim

    n + P(An)

    c) Si (An)n une suite dcroissante d'vnements :P(

    n An ) = lim

    n + P(An)

    3- Le cas o les vnements lmentaires sont quiprobables

    Soit (, P) un espace de probabilit correspondant une exprience alatoire dontl'ensemble des rsultats possibles est fini :

    = {1, 2, ...., n}Supposons que chaque rsultat "a autant de chances d'tre ralis qu'un autre", soit, entermes probabilistes, que P est telle que :

    P({1}) = P({2}) = ... = P({n})Comme la somme de ces n nombres est 1, leur valeur commune est gale 1/n . Soitmaintenant un vnement A. Sa probabilit est :

    P(A) = k / kA

    P({k}) = card(A) . 1n = card(A)card()

    Cette loi de probabilit est souvent appele loi uniforme sur . Calculer des probabilitspar une mthode directe dans ce cas revient donc dnombrer des ensembles.

    Exercice 1-3 : Un jeune enfant qui ne sait pas lire prend les 6 jetons d'un jeu de Scrabblequi composaient le mot "CARTON". Il raligne ces jetons au hasard. Avec quelleprobabilit recompose-t-il ce mot ? Mme question s'il a pris les 8 jetons qui composaientle mot "INSTITUT".

    Exercice 1-4 : 20 sujets sont au programme d'un oral d'examen. Le candidat tire au sort3 de ces sujets et traite l'un de ces trois. Combien doit-il avoir rvis de sujets pour avoirau moins 9 chances sur 10 de pouvoir traiter un sujet qu'il a rvis ?

    Remarque sur le choix du modle probabilisteComme dans tout problme de modlisation, il n'y a pas d'automatisme qui permetted'associer un espace de probabilit une exprience alatoire "concrte". Mme dans des

  • 8cas d'cole, il n'y a jamais un seul "bon" choix : reprenons l'exemple de l'urneintroduisant le paragraphe 2. Deux modles peuvent tre considrs comme naturels :- On peut distinguer les 12 boules contenues dans l'urne en posant :

    = {B1, B2, N, V1, V2, V3, V4, R1, R2, R3, R4, R5}On munit alors de la probabilit uniforme.- On peut aussi choisir de ne reprsenter que la couleur de la boule tire, en posant :

    = {B, N, V, R}et en dfinissant P par :

    P({B}) = 2/12 P({N}) = 1/12 P({V}) = 4/12 P({R}) = 5/12 .Il est clair cependant qu'il est difficile de justifier le deuxime modle sans faire appel l'ide d'quiprobabilit des tirages, ide qui par contre est clairement exprime dans lepremier modle.Un autre exemple, celui-l clbre, est du type de celui de l'aiguille de Buffon : quelle estla longueur moyenne d'une corde d'un cercle de rayon r, comment reprsenter le tirage auhasard d'une telle corde ?Dans des cas concrets de modlisation, les hypothses sur lesquelles reposent ladfinition du modle doivent tre clairement nonces, de telle sorte qu'elles puissent trecommentes et ventuellement remises en question, soit directement, soit par leursimplications thoriques, soit par une confrontation avec des donnes exprimentales.

    4- Exercices

    Exercice 1-5 : Soit (, P) un espace de probabilit, et soient A et B deux vnements.Montrer que si P(A) = P(B) = 0,9 , alors, P(A B) 0,8 .Dans le cas gnral, montrer que P(A B) P(A)+ P(B) - 1 .

    Exercice 1-6 : Deux personnes sont tires au sort dans un groupe de 30 compos de 10femmes et 20 hommes. Avec quelle probabilit ces deux personnes sont-elles deshommes ? Avec quelle probabilit sont-elles des femmes ?

    Exercice 1-7 : Deux amis font partie d'un groupe de n personnes, auxquelles on adistribu au hasard des numros d'ordre pour constituer une file d'attente.a) Avec quelle probabilit sont-ils les deux premiers ?b) Avec quelle probabilit sont-ils distants de r places, c'est--dire spars par r-1personnes. Reprsenter ces probabilits par un diagramme en btons.

    Exercice 1-8 : Un tiroir contient en vrac les 20 chaussettes de 10 paires diffrentes. On ensort au hasard 4 chaussettes. Avec quelle probabilit obtient-on :

    a) 2 paires b) au moins une paire

  • 9II- Probabilits conditionnelles

    1- Dfinition

    Lanons un d parfaitement quilibr. Un bon modle probabiliste en est donn par : = { 1, 2, 3, 4, 5, 6 }

    muni de la loi de probabilit P uniforme.Notons A l'vnement "le d donne au moins 4 points" et B l'vnement "le rsultat estimpair". Supposons qu'on ne retienne le rsultat du lancer que s'il est dans B. Dans cettenouvelle exprience, l'vnement A est ralis quand on obtient un 5, et c'est avec laprobabilit relative P({5})P({1, 3, 5}) =

    1/63/6 = 1/3. Plus gnralement la probabilit relative

    de A sous la condition que B est ralis est P(A et B)P(B) . On l'appelle aussi probabilit deA sachant que B, ou probabilit conditionnelle de A relative B, etc

    Dfinition 2-1 : Soit (, P) un espace de probabilit, et soit B un vnement tel queP(B) 0. La probabilit de A sachant que B est note P(A | B), et est dfinie par :

    P(A | B) = P(A B)P(B)

    Exercice 2-1 : a) Soit B un vnement tel que P(B) 0. Montrer que l'application qui Aassocie P( A | B ) est une loi de probabilit sur .b) Donner une proprit de A qui implique P(A | B) = 1, qui implique P(A | B) = 0, quiimplique P( A | B ) = P(A)P(B) .

    Exercice 2-2 : Un couple a deux enfants. Sous l'une des conditions suivantes :a) l'an est un garon,b) l'un des enfants est un garon,

    avec quelle probabilit le couple a-t-il un fils et une fille ?

    2- Deux rsultats de dcomposition

    Les deux rsultats de ce paragraphe utilisent " l'envers" la dfinition 2-1, c'est--diredonnent un moyen de calcul de probabilits connaissant des probabilits conditionnelles.Ils sont trs utiles dans la pratique.

  • 10

    Exemple 2-1 : Une urne contient deux boules blanches et une boule noire. Une personnetire une boule et la garde, une deuxime personne tire une boule. Avec quelle probabilitles deux boules tires sont-elles blanches ? On peut rpondre cette question en utilisantla dfinition 2-1. En effet, notons A l'vnement "la premire personne a tir une bouleblanche" et B l'vnement "la deuxime personne a tir une boule blanche". D'aprs ladfinition, P(A et B) = P(B | A) P(A). Mais P(A) est connue, c'est 2/3. P(B | A) est aussiconnue : c'est 1/2 car, la premire personne ayant tir une boule blanche, la deuximepersonne tire une boule au hasard dans une urne qui contient une boule blanche et uneboule noire. Ainsi, P(A et B) vaut (2/3).(1/2) = 1/3 .

    La proposition suivante, parfois appel "thorme des probabilits composes",gnralise ce procd de calcul :

    Proposition 2-1 : Soit (, P) un espace de probabilit, et soient A1, A2,, An desvnements. On a :P(An et An-1 et et A1) =

    = P(An | An-1 et et A1) P(An-1 | An-2 et et A1) P(A2 | A1) P(A1).

    Cet nonc est constamment utilis dans le contexte des "chanes de Markov", quiinterviennent naturellement dans les problmes concrets o A1, A2,, An reprsente unesuccession (temporelle) d'vnements, la probabilit de ralisation du n-ime vnementAn tant conditionne par "le pass" (probabilit sachant que A1 et et An-1 ont eu lieu).En voici un exemple simple :

    Exercice 2-3: On sait que si le flash d'un appareil photo n'a pas eu panne durant les npremiers dclenchements (n entier positif ou nul), la probabilit pour qu'il fonctionne au(n+1)-ime est gale p (0 < p

  • 11

    et en utilisant la dfinition 2-1, on obtient le rsultat :

    Proposition 2-2 : Soit (, P) un espace de probabilit, et soit {C1, C2, , Cn} unsystme complet d'vnements. Soit A un vnement. On a :

    P(A) = P(A | C1) P(C1) + P(A | C2) P(C2) + + P(A | Cn) P(Cn)

    (Remarquons sans dmonstration que ce rsultat se gnralise un systme completdnombrable d'vnements.)

    Exercice 2-4 : En mars 1994 (enqute sur l'emploi INSEE 1994), la population active enFrance comprend 44,7% de femmes. Le taux de chmage chez les hommes est 10,8% ; ilest chez les femmes 14,3% . On tire au sort une personne parmi les actifs.

    a) Avec quelle probabilit est-elle au chmage ?b) Sachant qu'elle est au chmage, avec quelle probabilit est-ce une femme ?

    3- Evnements indpendants

    Il est naturel de poser que, du point de vue de leur probabilit de ralisation, deuxvnements A et B sont indpendants si le fait de savoir que B est ralis n'apporte pasd'information sur les chances de ralisation de A, c'est--dire si la probabilit de Asachant que B est gale P(A), et donc si P(A B) = P(A) P(B). Posons pour dfinitionplus gnrale la suivante :

    Dfinition 2-2 : Soit ( , P) un espace de probabilit, et soit (Ai)iI une familled'vnements. On dit que ces vnements sont indpendants dans leur ensemble si,

    quelle que soit la partie finie J de I, P(jJ Aj ) = jJP(Aj).

    Exercice 2-5 : a) Montrer que si A et B sont indpendants, A et Bc, Ac et B, Ac et Bc lesont aussi. Gnraliser cette remarque au cas d'une famille finie d'vnementsindpendants dans leur ensemble.b) Deux vnements A et B incompatibles sont-ils indpendants ?c) Par un diagramme donner un exemple d'vnements A, B, C deux deux indpendantsmais qui ne sont pas indpendants dans leur ensemble.

    Remarque : Lanons deux ds, chacun parfaitement quilibr. L'ensemble des rsultatspossibles est :

    = { (i, j), 1 i 6, 1 j 6 } = {1, , 6} {1, , 6}

  • 12

    Notons A l'vnement "le premier d donne 4". Comme le premier d est parfaitementquilibr, la probabilit de A est 1/6. Notons B l'vnement "le deuxime d donne 6".Comme le deuxime d est parfaitement quilibr, la probabilit de A est 1/6. De plus,nous pouvons sans difficult supposer que les vnements A et B sont indpendants.Donc, la probabilit de (A et B), c'est--dire de l'vnement lmentaire (4, 6), est gale (1/6).(1/6) = 1/36, et de mme bien sr pour tout autre couple (i, j). Ce raisonnementconfirme le choix de la loi uniforme sur pour reprsenter l'exprience alatoire dulancer de deux ds.

    Exercice 2-6 : On lance deux ds. Avec quelle probabilit la somme des points obtenusest-elle gale 11 ? 10 ?

    Plus gnralement, considrons une exprience alatoire dont (, P) est un modleprobabiliste. Si cette exprience est rpte n fois de faon indpendante, on choisiracomme ensemble de rsultats ~ = n , qu'on munira de la probabilit produit ~P, c'est--dire telle que, quels que soient les sous-ensembles A1, A2,, An de :

    ~P(A1 A2, An) = P(A1) P(A2) P(An) .

    4- Exercices

    Exercice 2-7 : Avec quelle probabilit une famille de 3 enfants comporte-t-elle au moinsun garon ?

    Exercice 2-8 : Dans un groupe de 20 personnes, quelle est la probabilit pour qu'il n'y aitjamais plus d'un anniversaire par jour ? Et dans un groupe de 50 personnes ? (on feracomme si toutes les annes avaient 365 jours).

    Exercice 2-9 : Une exprience est conduite pour tudier la mmoire des rats. Un rat estmis devant trois couloirs. Au bout de l'un d'eux se trouve de la nourriture qu'il aime, aubout des deux autres, il reoit une dcharge lectrique. Cette exprience lmentaire estrpte jusqu' ce que le rat trouve le bon couloir. Sous chacune des hypothses suivantes:

    (H1) le rat n'a aucun souvenir des expriences antrieures,(H2) le rat se souvient de l'exprience immdiatement prcdente,(H3) le rat se souvient des deux expriences prcdentes,

    avec quelle probabilit la premire tentative russie est-elle la k-ime ? Reprsentergraphiquement les rponses.

  • 13

    Exercice 2-10 : Pour dcider d'un traitement thrapeutique, on utilise un test qui est positif99 fois sur 100 si une personne est effectivement malade. Mais si une personne n'est pasmalade, le test est positif une fois sur 100. On sait par ailleurs que 5 personnes sur 100ont cette maladie.a) Si le test d'une personne est positif, avec quelle probabilit cette personne est-elleeffectivement malade ?b) Si le test d'une personne est ngatif, avec quelle probabilit cette personne n'est-elleeffectivement pas malade ?Calculer ces probabilits quand on sait que 5 personnes sur 1000 ont cette maladie.

    Exercice 2-11 : La probabilit de fermeture du relai i des circuits dcrits ci-dessous est pi.Tous les relais fonctionnent indpendamment. Dans chacun des cas suivants, quelle est laprobabilit pour que le courant passe entre A et B ?a) A et B sont spars par n relais relis en srie.b) A et B sont spars par n relais relis en parallle.

    c)1 2

    43

    BA

    d)

    A B1 2

    3 45

    Exercice 2-12 : On transmet un message compos de n symboles binaires '0' ou '1'. Lorsde la transmission, chaque symbole est perturb avec la probabilit p et se transformealors en symbole oppos. Par prcaution, le message est transmis deux fois. Si les deuxmessages transmis concident, l'information est considre comme correcte.

    a) Avec quelle probabilit le i-ime symbole du premier message transmis est-ilidentique au i-ime symbole du deuxime message transmis ?

    b) Avec quelle probabilit les deux messages transmis sont-ils identiques ?c) Trouver la probabilit pour que, malgr la concidence des deux messages,

    l'information s'avre errone. (Application numrique : n = 100 p = 0,001 ).

  • 14

    Exercice 2-13 : Un candidat d'un jeu tlvis amricain est face trois portes. Derrirel'une d'elles se trouve le prix, - une voiture -. Le candidat se place devant la porte de sonchoix. Le prsentateur de l'mission, qui lui sait o se trouve la voiture, ouvre alors l'unedes deux autres portes et indique au candidat que la voiture ne s'y trouve pas. Le candidatpeut son tour ouvrir une porte. S'il dcouvre la voiture, il la gagne.Un candidat dcide d'adopter l'une des trois stratgies suivantes :

    a) ouvrir la porte devant laquelle il s'est plac l'issu de son premier choix,b) ouvrir l'autre porte,c) tirer pile ou face et, s'il obtient pile, ouvrir la porte devant laquelle il s'est

    plac l'issu de son premier choix, ouvrir l'autre porte s'il obtient face.L'une de ces trois stratgies est-elle prfrable aux autres ?

  • 15

    III- Variables alatoires : gnralits

    1- Dfinitions

    Dans beaucoup de situations, le dtail du rsultat d'une exprience alatoire ne nousintresse pas, mais seulement une valeur numrique fonction de ce rsultat. Par exemple,on peut se demander quel est le nombre de pannes d'un ordinateur sur une dure d'un an,sans tre intress par les dates auxquelles ont lieu ces pannes. Etudions un exemple plussimple :

    Exemple 3-1 : On lance deux ds, et on regarde la somme des points obtenus. On choisitpour modle probabiliste du lancer des deux ds :

    = { (i, j) , 1 i 6 , 1 j 6 }muni de la loi de probabilit P uniforme, qui affecte chaque vnement lmentaire (i, j)la probabilit P{(i, j)} = 1/36. Avec quelle probabilit la somme des points obtenus est-elle gale, par exemple, 5 ? C'est la probabilit de l'ensemble des vnementslmentaires (i, j) qui ralisent cette condition.Introduisons l'application S de dans , qu'on dira tre unevariable alatoire , dfiniepar :

    (i, j) S(i, j) = i + jLa question pose est le calcul de la probabilit de l'vnement { (i, j) / S(i, j) = 5 },c'est--dire de l'vnement { (1, 4), (2, 3), (3, 2), (4, 1) }. On notera cet vnement, defaon simplifie, { S = 5 }. On trouve :P({ S = 5 }) = P({ (i, j) / S(i, j) = 5 }) = P({ (1, 4), (2, 3), (3, 2), (4, 1) }) = 4/36 .Remarquons que S prend ses valeurs dans {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} et que, parconsquent :

    k=2

    12 P({ S = k }) = P(

    k{2,,12} { S = k } ) = P() = 1 .

    Abordons maintenant le cas gnral, dans lequel l'ensemble des valeurs prises par unevariable alatoire n'est pas forcment fini ou dnombrable :

    Dfinition 3-1 : On appellevariable alatoire une application X dfinie sur un espace deprobabilit (, P) et valeurs relles.La fonction de rpartition F d'une variable alatoire X est la fonction de dans dfinie, pour tout rel x, par :

    F(x) = P({ Xx })

  • 16

    Exercice 3-1 : Reprsenter la fonction de rpartition de la variable alatoire S de l'exemple3-1.

    Exercice 3-2 : Soit X une variable alatoire, et soit F sa fonction de rpartition. Pour a et brels (a < b), exprimer en fonction de F :

    P( X > a ), P( a < X b ),P( X < a ) (utiliser la proposition 1-1-b), P( X a), P( X = a ), P( a X < b ),

    Cet exercice montre que la connaissance de la fonction de rpartition F d'une variablealatoire X permet de calculer, pour n'importe quel intervalle I de , la probabilitP({ XI }). On peut dmontrer qu'elle permet aussi, - en principe tout du moins -, decalculer la probabilit P({ XB }) pour n'importe quel sous-ensemble B de . On dit enrsum que la fonction de rpartition de X dtermine la loi ou la loi de probabilit de X.(Le vocabulaire est justifi par le fait que l'application qui un sous-ensemble B de associe P({ XB }) est une loi de probabilit sur ).On peut montrer sans difficult que, si F est la fonction de rpartition d'une variablealatoire :

    a) F est croissante,b) F est continue droite en tout point,c) lim

    x - F(x) = 0 lim

    x + F(x) = 1.

    et inversement, mais la dmonstration n'est pas lmentaire, qu'une fonction F de dans qui vrifie les proprits a), b) et c) est la fonction de rpartition d'une variable

    alatoire.

    Exercice 3-3: Soit X une variable alatoire. On suppose que sa fonction de rpartition Fest donne par :

    F(x) = 0 si x < 0=

    13 +

    23 (1- e-x ) si x 0

    a) Dessiner le graphe de F.b) Calculer :

    P( X > -2 ), P( X]1-1/n, 1] ), P( X = 1 ), P( X] -1/n, 0] ), P ( X = 0 )

    2- Variables alatoires discrtes, variables alatoires densit

    - Une variable alatoire X qui prend ses valeurs dans un sous-ensemble fini oudnombrable { xi , iI } de est dite discrte. Notons :

    pi = P(X=xi).Les pi sont des rels de [0, 1] et tels que

    iI pi = 1.

  • 17

    La donne des pi dfinit la loi de la variable alatoire X, puisque pour tout sous-ensembleA de :

    P(XA) = i / xiA

    pi .

    La fonction de rpartition F de X s'exprime, pour tout a rel, par :F(a) =

    i / xi a pi

    Nous avons vu sur un exemple (exercice 3-1) que, tout du moins quand il n'y a qu'unnombre fini de xi par intervalle born, F est constante par morceaux, et que sesdiscontinuits sont situes aux points d'abscisse xi, la hauteur du saut correspondant tantpi.

    - On dit qu'une variable alatoire X est densit s'il existe une fonction f

    de dans ,positive ou nulle, et telle que, pour tout sous-ensemble B de :

    P( X B ) = B

    f(x) dx .

    On appelle cette fonction f la fonction de densit de probabilit de la variable alatoire X.

    Exercice 3-4 : On fait tourner une aiguille autour d'un axe et on repre la position surlaquelle elle s'arrte par un angle de [0, 2pi[.a) Quelles valeurs proposer pour P( 0 < pi ), P( pi < 2pi ), P( pi/2 < 3pi/2 ) ?Et pour P(I) lorsque I est un sous-intervalle de [0, 2pi[ ?b) Peut-on proposer une fonction f qui soit la densit de la loi de ?

    Remarquons que si X est une variable alatoire densit, la densit f vrifiencessairement :

    -

    + f(x) dx = 1.

    De plus, quels que soient a et b ( a < b ) :P( X = a ) = 0

    P( a < X < b) = P( a X < b) = P( a < X b) = P( a X b) = a

    b f(x) dx

    La fonction de rpartition F de X est donne par :

    F(a) = -

    a f(x) dx

    et elle est continue.

    Exercice 3-5 : Soit X une variable alatoire densit f dfinie par : f(x) = c x si 1 x 4

    = 0 sinon

  • 18

    a) Calculer la valeur de c.b) Que vaut P( 1 X 2 ) ?c) Calculer et reprsenter graphiquement la fonction de rpartition de X.

    - Concluons ce paragraphe en signalant qu'une variable alatoire peut n'tre ni discrte, ni densit, mais mixte :

    Exercice 3-6 : Reprendre l'exemple de l'exercice 3-3, et montrer qu'on peut crire :

    P( X B ) = B

    f(x) dx si 0B

    = 13 +

    B

    f(x) dx si 0B ,

    o f est une fonction dterminer.

    3- Couples de variables alatoires

    Soit (, P) un espace de probabilit, et soient X et Y deux variables alatoires dfiniessur cet espace. Le couple (X, Y) dfinit ce que l'on peut appeler une variable alatoire valeurs dans 2 : tout de , il associe en effet le vecteur (X(), Y()).

    La loi de (X, Y), souvent appele loi conjointe de (X, Y), est dtermine par la donne,pour tout sous-ensemble C de 2, de la probabilit P({ (X, Y) C }).On montre que la loi conjointe de (X, Y) est dtermine ds qu'on connatP(XA et YB ) pour tout couple (A, B) de sous-ensembles de . On montre aussiqu'il suffit pour cela de connatre la fonction de rpartition F du couple (X, Y) qui estdfinie par :

    (x, y) 2 F(x, y) = P({ Xx et Yy }) .

    Remarquons que si la loi conjointe de (X, Y) est connue, on en dduit les lois de X et deY, appeles dans ce contexte lois marginales. En effet, pour tout sous-ensemble A de :

    { XA } = { XA et Y } = { (X, Y) A } ,et on tire :

    P ( XA ) = P ( (X, Y) A ) .

    Exercice 3-7 : Soient (X, Y) un couple de variables alatoires dont la loi est telle que, si iet j sont deux entiers tels que 0 i 2 et -i j i, P{ (X, Y) = (i, j) } = 19 .a) Reprsenter graphiquement les valeurs prises par le couple (X, Y).b) Quelle sont les lois marginales de X et Y ?

  • 19

    4- Variables alatoires indpendantes

    Dfinition 3-2 : Soient X et Y deux variables alatoires dfinies sur un espace deprobabilit (, P). On dit qu'elles sont indpendantes si pour tout couple (A, B) de sous-ensembles de , les vnements { XA } et { YB }sont indpendants, c'est--dire si :

    P ( XA et YB ) = P( XA ) P( YB )

    Exercice 3-8 : a) Soient (X, Y) un couple de variables alatoires de loi donne par :P{ (X, Y) = (-1, 0) } = P{ (X, Y) = (1, 0) } =

    = P{ (X, Y) = (0, -1) } = P{ (X, Y) = (0, 1) } = 14 . X et Y sont-elles indpendantes ?b) mme question avec les donnes de l'exercice 3-7.

    Exercice 3-9 : Supposons X et Y discrtes, et plus prcisment que X prend ses valeursdans le sous-ensemble fini ou dnombrable { xi , iI } de , et que Y prend ses valeursdans le sous-ensemble fini ou dnombrable { yj , jJ }de . Montrer que X et Y sontindpendantes si et seulement si pour tout couple (i, j) de I J :

    P(X=xi et Y=yj) = P(X=xi ) P(Y=yj).

    Dans le cas gnral, on montre la proposition :

    Proposition 3-1 : Soient X et Y deux variables alatoires dfinies sur un espace deprobabilit (, P), de fonctions de rpartitions FX et FY. X et Y sont indpendantes si etseulement si, pour tout couple (x, y) de rels :

    P( X x et Y y ) = FX(x) FY(y)

    Le rsultat suivant est utile :

    Proposition 3-2 : Soient X et Y deux variables alatoires dfinies sur un espace deprobabilit ( , P). Soient et deux applications de dans . Si X et Y sontindpendantes, alors, (X) et (Y) sont des variables alatoires indpendantes.

    Enonons enfin une extension de la dfinition :

    Considrons une famille (Xi)iI de variables alatoires dfinies sur un espace deprobabilit (, P).

  • 20

    On dit que c'est une famille de variables alatoires indpendantes si pour toute famille(Ai)iI de sous-ensembles de , les vnements {XiAi} (iI) sont indpendants dansleur ensemble, autrement dit si pour tout sous-ensemble fini J de I :

    P( jJ XjAj ) = jJP(XjAj).On dmontre que si (Xi)iI est une famille de variables alatoires indpendantes, et si J etK sont deux parties finies et disjointes de I dcrites par :

    J ={j1, , jr} K ={k1, , ks} ,si une fonction de r dans et une fonction de s dans , alors, (Xj1,, Xjr) et(Xk1,, Xks) sont indpendantes. Et on peut gnraliser ce rsultat plusieurs partiesfinies de I deux deux disjointes.

    5- Exercices

    Exercice 3-10 : On quipe un local souterrain de 5 ampoules lectriques. On suppose queles dures de vie de ces ampoules sont des variables alatoires indpendantes, et de mmedensit f donne par :

    f(x) = 200x2

    si x > 200

    = 0 sinon .On contrle l'tat des ampoules aprs 300 heures d'utilisation. Avec quelle probabilitdeux (exactement) des ampoules sont-elles hors d'usage.

    Exercice 3-11 : Une bote contient 5 transistors, dont on sait que 3 sont dfectueux. Onteste l'un aprs l'autre les transistors et on les met de ct, jusqu' avoir trouv lesdfectueux. On note N1 le nombre de tests effectus pour trouver le premier transistordfectueux, et N2 le nombre de tests complmentaires effectus pour trouver le deuxime.Dcrire la loi conjointe de N1 et N2.

    Exercice 3-12 : Soient X1,, Xn des variables alatoires indpendantes et suivant toutesla loi uniforme sur [0, 1]. On pose :

    M = max (X1,, Xn)a) Quelle est la fonction de rpartition de M ? Quelle est la densit de la loi de M ?b) Mmes questions avec min (X1,, Xn).

  • 21

    IV- Caractristiques numriques des variablesalatoires

    1- Esprance

    Soit X une variable alatoire sur un espace de probabilit (, P). L'esprance E(X) de Xest la valeur moyenne des valeurs prises par X, pondres par leur probabilit deralisation. Les mathmaticiens disposent d'une thorie, la thorie de la mesure, danslaquelle l'intgrale

    X() dP() a un sens. Ils dfinissent E(X) par cette intgrale. Si

    est fini ou dnombrable, cette intgrale est simplement la somme

    X()

    P({}),

    mais le cas gnral est plus complexe. Ici, nous nous restreignons aux deux casparticuliers des variables alatoires discrtes ou densit, et nous utiliserons commedfinition de l'esprance les caractrisations suivantes :

    - Si X est discrte et prend ses valeurs dans un sous-ensemble fini ou dnombrable{ xi , iI } :

    E(X) = i I

    x i P( X = x i )

    - Si X est densit f :

    E(X) = -

    +

    x

    f (x) dx

    Exercice 4-1 : Quelle est l'esprance de la variable alatoire qui reprsente le nombre depoints obtenus en lanant un d ?

    Exercice 4-2 : Quelle est l'esprance de la variable alatoire de l'exercice 3-4 ?

    Exercice 4-3 : Dans chacun des deux cas suivants, calculer E(X), dcrire la loi de X2 etcalculer E(X2) :a) P( X = -2 ) = 0,1 P( X = 1 ) = 0,6 P( X = 2 ) = 0,3b) X densit f dfinie par :

    f(x) = 1/2 si -1 x 1= 0 sinon .

    Pour calculer l'esprance X2 ou plus gnralement d'une fonction (X) de X, on peutviter la dtermination de la loi de (X) en utilisant le rsultat suivant :

  • 22

    Proposition 4-1 : Soit X une variable alatoire et soit une fonction de dans .- Si X est discrte et prend ses valeurs dans un sous-ensemble fini ou dnombrable{ xi , iI } :

    E((X)) = i I

    (x i) P( X = x i )

    - Si X est densit f :

    E((X)) = -

    +

    (x)

    f(x) dx

    Exercice 4-4 : Reprendre les exemples de l'exercice 4-3 et calculer E(X2) en utilisant laproposition 4-1.

    L'nonc suivant sera trs utilis par la suite :

    Proposition 4-2 : Soient X et Y deux variables alatoires sur un espace de probabilit(, P), et soient a et b deux rels. Alors :

    E(aX+b) = aE(X) + b E(X+Y) = E(X) + E(Y)

    Exercice 4-5 : Montrer la deuxime galit de cette proposition dans le cas o les lois de Xet Y sont discrtes.

    Exercice 4-6 : On lance deux ds, et on note S la variable alatoire qui reprsente lasomme des points obtenus. Quelle est l'esprance de S ?

    2- Variance, covariance

    Exemple 4-2 : Considrons les quatre variables alatoires :X1 = 0, c'est--dire la variable "alatoire" constante et nulle,X2 de loi uniforme sur [-1, 1]X3 de loi uniforme sur [-100, +100]X4 telle que P(T=-3000) = 1/2 P(T=2000) = P(T=4000) = 1/4

    Elles ont toutes quatre pour esprance 0, mais leurs lois sont clairement diffrentes. Unecaractristique qui les distingue est l'talement, la dispersion, des valeurs qu'ellesprennent autour de leur valeur moyenne E(Xi) = 0. Une faon de mesurer cette dispersionest de regarder la valeur moyenne de la distance entre Xi et E(Xi). Pour des raisonspratiques, on prfre choisir la valeur moyenne du carr de la distance entre X i et E(Xi),qu'on appelle la variance.

  • 23

    Dfinition 4-1 : Soit X une variable alatoire sur un espace de probabilit (, P). Lavariance (X) de X est :

    (X) = E[ (X-E(X))2 ]L'cart-type (X) de X est :

    (X) = (X) (Remarquons que si l'unit de mesure dans laquelle X est exprim est, par exemple, lemtre, (X) est en m2 et (X) en mtre).

    De l'galit :[X-E(X)]2 = X2 - 2 E(X) X + [E(X)]2

    on dduit :(X) = E[ X2 - 2 E(X) X + (E(X))2 ] = E( X2 ) -2 E(X) E(X) + [E(X)]2

    et finalement :(X) = E( X2 ) - [E(X)]2

    Cette galit est souvent utile dans le calcul effectif de variances.

    Exercice 4-7 : Calculer les variances des variables alatoires Xi de l'exemple 4-2.

    Exercice 4-8 : On lance un d, et on note X la variable alatoire qui reprsente le nombrede points obtenus. Quelle est la variance de X ?

    Proposition 4-3 : Soit X une variable alatoire.a) La variance de X est nulle si et seulement si il existe un rel c tel que P( X=c ) = 1. Ondit alors que X est presque srement constante.b) Soient a et b deux rels. Alors :

    (aX+b) = a2 (X) (aX+b) = a (X)

    Dans le cas o X n'est pas presque srement constante, on remarquera que la variablealatoire X - E(X)

    (X) a son esprance nulle, et un cart-type gal 1. Elle est ce qu'on

    appelle la variable alatoire centre rduite associe X. Le passage de l'une desvariables l'autre se fait tout simplement par un changement d'origine et d'unit dansl'ensemble des valeurs prises par X.

    L'expression de la variance d'une variable alatoire n'est manifestement pas linaire. Defait, si X et Y sont deux variables alatoires sur (, P), en gnral, la variance de lasomme X+Y n'est pas gale la somme des variances de X et de Y :

  • 24

    Exemple 4-3 : Soit par exemple X une variable alatoire de variance non nulle, - c'est--dire qui n'est pas presque srement constante -. On a :

    (X + (-X)) = (0) = 0 et (X) + (-X) = 2(X) 0 .

    Calculons dans le cas gnral (X+Y). Comme :(X+Y) - E(X+Y) = (X - E(X)) + (Y - E(Y)) ,

    on a :

    [ (X+Y) - E(X+Y) ]2 = [X - E(X)]2 + [Y - E(Y)]2 + 2 [X - E(X)] [Y - E(Y)]d'o :

    (X+Y) = (X) + (Y) + 2 E[ (X - E(X)) (Y - E(Y)) ]

    Introduisons la dfinition de la covariance de X et Y :cov(X, Y) = E[ (X - E(X)) (Y - E(Y)) ]

    Ce terme n'est en gnral pas nul. Cependant :

    Proposition 4-4 : Soient X et Y deux variables alatoires sur (, P). Si X et Y sontindpendantes, alors :

    cov(X, Y) = 0(X+Y) = (X) + (Y) .

    Pour montrer ce rsultat, on commence par montrer que si X et Y sont indpendantes,E(XY) = E(X) E(Y), et conlut en remarquant que sous cette mme hypothse, lesvariables alatoires (X - E(X)) et (Y - E(Y)) sont indpendantes, ou encore en montrantl'galit cov(X, Y) = E(XY) - E(X) E(Y).

    Exercice 4-9 : Dmontrer la proposition dans le cas o les lois de X et Y sont discrtes.

    Exercice 4-10 : On lance deux ds, et on note S la variable alatoire qui reprsente lasomme des points obtenus. Quelle est la variance de S ?

    Une caractristique souvent utilise en statistiques est un coefficient appel coefficient decorrlation de deux variables alatoires X et Y. C'est par dfinition, - et si ni X ni Y n'estpresque srement constante - :

    (X, Y) = cov(X, Y)(X) (Y) .

    Remarquons que c'est un coefficient sans dimension.On peut montrer par des mthodes classiques en analyse que :

    -1 (X, Y) 1 (X, Y) = 1 si et seulement si il existe a > 0 et b rel tel que Y = aX + b

  • 25

    (X, Y) = -1 si et seulement si il existe a < 0 et b rel tel que Y = aX + b.

    Mfions-nous cependant : le fait que le coefficient de corrlation de X et Y est nul nesignifie pas du tout que X et Y sont indpendantes (qu'il n'y a pas de corrlation entreX et Y). Prenons par exemple une variable X de loi symtrique par rapport 0 (parexemple de loi uniforme sur [-1, 1]), et posons Y = X2 . La loi de XY = X3 est aussisymtrique par rapport 0. Ainsi, E(XY) = 0 = E(X) E(Y), et donc (X, Y) = 0.Pourtant, X et Y ne sont pas (du tout) indpendantes, puisqu'au contraire, la donne de lavaleur prise par X dtermine compltement la valeur prise par Y.

    3- Exercices

    Exercice 4-11 : Calculer l'esprance et la variance de la variable alatoire M de l'exercice3-12.

    Exercice 4-12 : Les transistors fournis par une usine sont dfectueux dans la proportionp. On teste un transistor aprs l'autre jusqu' en obtenir un bon. On note N le nombre detests effectus. Quelle est la loi de N ? Calculer l'esprance de N.

    Exercice 4-13 : Une machine est constitue de n sous-units identiques. Elle fonctionne sitoutes ses sous-units fonctionnent. Le procd de construction des sous-units est telqu'elles sont dfectueuses dans la proportion p, et indpendamment les unes des autres.Pour construire une machine sans dfaut, deux procds sont envisags :

    a) On construit une sous-unit, on la teste, si elle est bonne, on la monte, sinon,on la jette, etc On continue jusqu' avoir mont les n sous-units de la machine. Onsuppose pour simplifier qu'il n'y a pas de problme de montage. La machine ainsiconstruite est donc bonne.

    b) On construit et monte sans les tester n sous-units, et on teste la machine ainsiconstitue. Si elle ne marche pas, on la jette, et on recommence jusqu' obtenir une bonnemachine.On note : cu le cot de construction d'une sous-unit,

    tu le cot du test d'une sous-unit,tm le cot du test d'une machine,

    et on suppose pour simplifier que le cot d'assemblage des units est nul.1) On note C le cot de construction d'une bonne machine. Calculer l'esprance de Cdans les deux cas a) et b).2) On suppose tu = tm =

    cu2 , et n = 10 (puis n = 100). Suivant la valeur de p, quel est le

    procd de fabrication qui est prfrable ?

  • 26

    V- Variables alatoires usuelles

    Voici une liste de dfinitions et proprits de quelques lois connues. On pourra trouverbeaucoup d'autres lois classiques dans la "littrature" : les lois gomtrique (exercice 4-12), hypergomtrique, multinomiale, gamma, etc, et nous en introduirons d'autresdans la partie "statistiques" de ce cours.

    1- Loi de Bernoulli (p)

    Soit A un vnement de probabilit p. Introduisons la variable alatoire X telle que :X() = 1 si A,

    = 0 sinon .On dit que X suit la loi de Bernoulli de paramtre p.

    Plus gnralement, soit p dans [0, 1]. X suit la loi de Bernoulli (p) si :P( X=1) = p et P( X=0) = 1 - p .

    E(X) = (X) =

    2- Loi binomiale (n, p)

    Exercice 5-1 : On lance 4 fois un d. On note X le nombre de fois o on obtient 6.a) Pour k = 0, 1, 2, 3, 4, calculer P(X = k).b) On note Xi la variable de Bernoulli qui vaut 1 si on tire un 6 au i-ime lancer, 0 si onne tire pas 6 ce lancer. Ecrire X en fonction des Xi , et en dduire la valeur de E(X) etde (X).

    Plus gnralement, la loi binomiale (n, p) est la loi d'une somme X de n variablesalatoires indpendantes suivant chacune la mme loi de Bernoulli (p). C'est aussi lenombre de ralisations d'un vnement A lors de l'excution de n expriences alatoiresindpendantes, le rsultat de chacune ralisant A avec la probabilit p. On a :

    P (X = k) = ( k = 0, 1, , n )E(X) = (X) =

    3- Loi uniforme

    La loi uniforme sur intervalle [a, b] de est la loi de densit f : f(x) = 1b-a si a x b

    = 0 sinon .

  • 27

    E(X) = a+b2 (X) = (b-a)2

    12

    Exercice 5-2 : Soit X une variable alatoire de loi uniforme sur [0, 1].a) Calculer directement E(X) et (X).b) On pose Y = a + (b-a) X . Que valent E(Y) et (Y) ? Quelle est la loi de Y ? Qu'enconclut-on ?

    4- Loi exponentielle

    Soit un paramtre strictement positif. La loi exponentielle de paramtre est la loi dedensit f dfinie par : f(x) = e-x si x 0

    = 0 sinon .Si X suit cette loi :

    E(X) = 1

    (X) = 12

    On peut remarquer aussi que pour tout t positif ou nul :P( X t+x | X t ) = P( X x | X 0 )

    Cette galit permet d'interprter X comme la dure de vie d'un appareil "sansvieillissement" ; en effet, tant donn un instant t, si l'appareil n'est pas tomb en panneauparavant (si X t ), la probabilit pour qu'il marche encore sans problme durant lapriode de temps x ( X t+x ) ne dpend pas d'instant t. (Nous avons tudi dansl'exercice 2-3 une situation analogue mais dans le cas discret).Nous ne dtaillerons pas davantage les conditions d'utilisation de cette loi, ni de la loi dePoisson dfinie dans le paragraphe suivant : ce serait plutt du ressort d'un cours sur lesprocessus stochastiques.

    5- Loi de Poisson ()

    Soit un paramtre strictement positif. On dit que X suit la loi de Poisson () si Xprend ses valeurs dans et :

    P(X = k) = e - k

    k! ( k = 0, 1, 2, )Cette loi dcrit le nombre d'vnements intervenant dans un intervalle de temps delongueur 1, lorsque les laps de temps sparant deux vnements sont indpendants et demme loi exponentielle de paramtre .On a :

    E(X) = (X) =

  • 28

    6- Loi normale (, )

    La loi normale centre rduite (0,1) est la loi de densit f dfinie par :f(x) = 12pi e

    -

    x22

    .

    Si X suit (0,1) :E(X) = 0 (X) = 1

    Exercice 5-3 : On dit qu'une variable alatoire X suit la loi normale (, ) si X-

    suit

    la loi normale centre rduite. Si X suit la loi (, ), quelles sont les esprance,variance, densit de la loi de X ?

    On peut montrer que la primitive de la fonction e - x22

    ne peut pas s'exprimer l'aide de

    fonctions usuelles. La fonction de rpartition d'une variable normale se calcule donc pointpar point et numriquement (voir la table en fin de polycopi) :

    Exercice 5-4 : a) Soit X une variable alatoire de loi (0,1). Que valent :P( X -1 ) P( -1 < X < 2 ) ?

    b) Soit X une variable alatoire de loi (1,4). Que vaut P( X > 5) ?

    On montre le rsultat important suivant :

    Proposition 5-1 : Soient X et Y deux variables alatoires indpendantes et de loisnormales. Alors X+Y suit une loi normale. Plus prcisment, si X suit la loi (1, 1) etY suit (2, 2), alors X+Y suit la loi ( , ).

    7- Exercices

    Exercice 5-5 : On a constat que les disquettes produites dans une usine sont dfectueusesavec une probablit 0,01 indpendamment les unes des autres. L'usine conditionne sesdisquettes par botes de 10, et offre l'acheteur le remboursement d'une bote ds qu'aumoins deux des 10 disquettes sont dfectueuses. Dans quelle proportion les botes sont-elles renvoyes ? Si quelqu'un achte 3 botes, avec quelle probabilit renvoit-ilexactement une bote ? au moins une bote ?

    Exercice 5-6 : On a constat que le nombre N de clients visitant par jour le magasin d'untapissier suit une loi de Poisson de paramtre 4, et que chaque client passe une commande

  • 29

    avec la probabilit 0,1 . On note C le nombre de commandes passes par jour. Quelle estla loi de C ? Enoncer un rsultat plus gnral.

    Exercice 5-7 : Le diamtre (exprim en cm.) des tomates livres une usine d'emballageamricaine suit une loi normale (7, ), o est inconnu. Un tri automatique rejettetoutes les tomates dont le diamtre n'est pas compris entre 6cm et 8 cm.a) On constate que 10% des tomates livres sont rejetes par ce procd de tri. Calculerl'cart type .b) Le directeur veut rduire 5% le pourcentage de tomates rejetes lors du tri. Nepouvant agir sur les livraisons, il installe un systme de tri qui rejette les tomates dediamtre infrieur (7-s) ou suprieures (7+s). Calculer s.

    Exercice 5-8 : On a constat qu'en absence d'pidmie, la variable alatoire qui reprsentele poids d'un poulet de 81 jours pris au hasard dans un levage des Landes suit une loinormale ( 1,8 , 0,2 ), et que les poulets se dveloppent indpendamment. On note Xla moyenne arithmtique des poids de 100 poulets pris au hasard. Avec quelle probabilita-t-on ( 1,79 < X < 1,81 ) ? Mme question en remplaant 100 par 1000 poulets.

  • 30

    VI- Somme d'un grand nombre de variablesalatoires indpendantes

    1- L'ingalit de Tchebychev

    Soit X une variable alatoire d'esprance E(X) et de variance (X), et soit a un relpositif.Notons Y la variable alatoire dfinie par :

    Y() = a2 si | X() - E(X) | a = 0 sinon .On a bien sr :

    Y [ X - E(X) ]2 ,et donc :

    E(Y) E[ ( X - E(X) )2 ] .De plus :

    E(Y) = a2 P{ | X- E(X) | a }

    On a ainsi obtenu l'ingalit de Tchebychev :

    P{ | X- E(X) | a } (X)a2

    .

    Cette ingalit n'a bien sr pas d'intrt lorsque les probabilits P( | X - E(X) | a )peuvent tre calcules explicitement et exprimes simplement. Elle est par contre utiledans le cas contraire, condition bien sr de connatre l'esprance et la variance de X.Comme la dfinition mme de (X), l'ingalit de Tchebychev met en vidence l'intrtde la variance comme mesure de l'talement des valeurs prises par X autour de la valeurmoyenne E(X).

    Exercice 6-1 : On lance n fois un d, et on note M la moyenne arithmtique des pointsobtenus.a) Calculer E(M) et (M).b) Combien de fois suffit-il de lancer un d pour que, avec une probabilit suprieure 0,9 , la moyenne arithmtique des points obtenus soit comprise entre 3,4 et 3,6 ?

    2- Loi des grands nombres

  • 31

    Considrons n variables alatoires X1,, Xn, toutes suivant la mme loi d'esprance etd'cart-type , et intressons-nous la moyenne arithmtique M de ces variablesalatoires :

    M = X1+ + Xn

    n .

    Un calcul simple donne l'esprance et la variance de M :

    E(M) = (M) = 2

    n

    Si a est strictement positif, on a, en vertu de l'ingalit de Tchebychev :

    P{ | M - | a } 2na2

    .

    On en dduit le thorme connu sous le nom de loi faible des grands nombres :

    Thorme 6-1 : Soit (Xn)n une suite de variables alatoires indpendantes et de mmeloi, d'esprance et d'cart-type . Alors, pour tout a strictement positif :

    limn +

    P { | X1+ + Xnn

    - | > a } = 0.On dit que la suite ( X1+ + Xn

    n )n converge en probabilit vers .

    Exemple 6-1 : Excutons une suite d'expriences alatoires indpendantes, le rsultat dechacune ralisant un vnement A avec la probabilit p. Pour dcrire cette exprience,introduisons les variables alatoires X1,, Xn, dfinies par :

    Xi = 1 si le rsultat de la i-ime exprience est dans A,= 0 si le rsultat de la i-ime exprience n'est pas dans A.

    Ces variables alatoires sont indpendantes, et suivent toutes la mme loi de Bernoulli(p), dont l'esprance est p. La variable alatoire X1+ + Xn

    n reprsente la

    frquence de ralisation de A au cours des n premires expriences. On conclut de la loides grands nombres que, lorsque n est grand, cette frquence est, dans le sens prcis parl'nonc, proche de p. Or, p n'est autre que la probabilit de ralisation de A lors d'uneexprience. Ainsi, on a construit la thorie mathmatique des probabilits en partant de ladfinition intuitive de la probabilit d'un vnement A comme frquence de ralisation deA sur un grand nombre d'expriences, et, par une dduction interne au cadre formelmathmatique, on dmontre cette mme proprit.

    3- Thorme central-limite

    Soit (Xn)n une suite de variables alatoires indpendantes et de mme loi, d'esprance et d'cart-type . On a alors :

    E(X1+ + Xn) = n , (X1+ + Xn) = n 2 ,

  • 32

    et la variable alatoire centre rduite associe la somme X1+ + Xn est :

    Y n = X 1+ + Xn - n

    nRemarquons que lorsque la loi des Xn est la loi normale (, ), la loi de Yn est la loinormale centre rduite (0, 1). Le thorme central-limite affirme que dans le casgnral, la loi (0, 1) est une bonne approximation de la loi de Yn , sous rserve que nsoit assez grand. Plus prcisment :

    Thorme 6-2 : Soit (Xn)n une suite de variables alatoires indpendantes et de mmeloi, d'esprance et d'cart-type . Alors, quel que soit le rel x :

    limn +

    P { X 1+ + Xn - n n x } =

    -

    x

    12pi e

    -

    t22 dt

    .

    On dit que X1+ + Xn - n n converge en loi vers la loi normale (0, 1).

    Dans la pratique, cet nonc rigoureux est interprt assez librement : on considrerasouvent par exemple que sous les hypothses du thorme, pour des valeurs de n assezgrandes, on peut remplacer dans les calculs la loi de X1+ + Xn par un loi normale (etdonc par la loi normale (n , n) ).

    Exemple 6-2 : On repre la position d'un point matriel sur une droite par son abscisse.On se donne aussi un rel positif h "petit". Partons de l'abscisse 0. Lanons une pice. Sion obtient pile, avanons le point d'une distance h, si on obtient face, reculons le pointd'une distance h. Et recommenons C'est un exemple de marche alatoire .Notons Xn la variable alatoire dfinie par : Xn = 1 si on obtient pile au n-ime lancer de la pice

    = -1 si on obtient face au n-ime lancer de la pice.Remarquons que :

    E(Xn) = 0 (Xn) = 1A l'issu du n-ime lancer, le point est situ l'abscisse Un = h (X1 ++ Xn ) . On a :

    E(Un) = 0 (Un) = nh2Du thorme central-limite, on dduit que, pour des valeurs de n assez grandes, la loi deUn est approche par la loi normale ( 0, nh2 ). On peut reprsenter graphiquementl'volution de la densit de probabilit de prsence du point :

  • 33

    4- Exercices

    Exercice 6-2 : Rsoudre l'exercice 6-1 en utilisant le thorme central-limite, et comparerles rsultats obtenus.

    Exercice 6-3 : 60 personnes veulent retirer de l'argent au guichet d'une poste. La sommemoyenne demande par chaque personne est de 400F, avec un cart type de 200F. Lessommes demandes par chaque personne sont indpendantes (et de mme loi).Combien d'argent doit avoir le guichet sa disposition pour que, avec une probabilitsuprieure 0.95, les 60 personnes retirent la somme qu'elles souhaitent ?

    Exercice 6-4 : Une caftria d'entreprise fournit chaque jour n repas, et propose chaquejour 2 plats du jour. Le cuisinier a remarqu que lorsqu'il propose saucisse-lentilles etpoisson pan-riz, chaque client souhaite le plat de saucisses avec la probabilit p = 0,6 etle plat de poisson avec la probabilit 1-p , et que les choix des clients sont indpendants.Pour tenter de satisfaire sa clientle, il prpare np+ s plats de saucisses, et n(1-p)+ splats de riz.On supposera successivement n = 100 et n = 1000.Quelle est la valeur minimale de s telle que, avec une probabilit suprieure 0,95 , tousles clients aient le plat qu'ils souhaitent ?Pour cette valeur, quelle est le pourcentage de plats non consomms compar aux platsprpars ?

    Exercice 6-5 : Le nombre de visiteurs potentiels de la Foire de Bordeaux est v=100000.Les visiteurs viennent indpendamment les uns des autres et avec la probabilit p( 0 < p < 1). On note Y le nombre de personnes qui visitent la foire.a) Trouver la loi de Y. Quelle sont l'esprance, la variance de Y ?

  • 34

    b) Soit x le prix d'entre ( x 0 ) et R la recette correspondante. Quelle est l'esprance deR ? En supposant p et x relis par la relation p = e -cx , o c est une constante positive,trouver le prix d'entre qui maximise E(R). Quelle est alors la valeur de E(R) ?c) Dterminer le nombre maximal n tel que, avec une probabilit suprieure ou gale 0.8, il y aura au moins n visiteurs.

  • 35

    VII- Echantillonnage

    1- Description des donnes statistiques sur un caractre

    On considre ici une population , c'est--dire un ensemble d'individus. On s'intresse un caractre particulier des individus de cette population, qu'on suppose, pour chaqueindividu, quantifiable par un nombre rel. On suppose qu'on a mesur exprimentalementla valeur du caractre de n individus et qu'on a trouv les nombres x1, , xn .

    Exemple 7-1 : La population est l'ensemble des cbles fabriqus dans une usine donne,le caractre est la charge de rupture d'un cble. On a mesur la charge de rupture de 12 deces cbles et obtenu la liste :1440 1410 1520 1470 1430 1490 1455 1445 1472 1455 1470 1430

    Exemple 7-2 : La population est l'ensemble des jeux de pile ou face effectus avec unepice de monnaie donne, le caractre est gal 1 si on obtient face et 0 si on obtient pile.On a lanc la pice 10 fois et obtenu la liste :

    0 0 1 0 0 1 0 1 1 0

    Nous rappelons dans ce paragraphe les outils les plus courants de description desproprits des listes de rsultats x1, , xn obtenues dans ce contexte exprimental.

    On peut reprsenter l'ensemble de ces nombres graphiquement par :- la fonction de rpartition empirique : l'ordonne du point d'abscisse a est gale

    card{j / x j a }n

    .

    - le diagramme en btons des frquences : la hauteur du bton d'abscisse a estgale card{j / xj = a}). Cette reprsentation n'a d'intrt que s'il y a des rptitions dansla liste x1, , xn.

    - un histogramme des frquences : la surface du rectangle de base l'intervalleborn I est gale card{j / xj I }

    n . Un tel histogramme dpend de la faon dont on

    dcoupe en intervalles l'ensemble des valeurs du caractre.

    On peut aussi en calculer des tendances centrales :

    - la moyenne arithmtique x_

    :

    x_

    =

    i=1

    n x i

    n ,

  • 36

    - la mdiane m : si les xj sont rnumrots de telle sorte que x(1) x(n) , m = x(k) si n = 2k-1

    = 12 ( x(k) + x(k+1) ) si n = 2k

    (les quartiles , les dciles , et plus gnralement les s-quantiles sont dfinis de faonanalogue en rpartissant les x(i) en 4, 10 ou s groupes, au lieu de 2 pour la mdiane).

    - le mode : la valeur a (ou l'une des valeurs) qui maximise card{j / xj = a}.

    On peut en dcrire la dispersion par :- le rang : diffrence entre la plus grande et la plus petite valeur des xi,- l'cart entre certains quantiles : par exemple, diffrence entre le troisime et

    premier quartile,

    - l'cart moyen : i=1

    n | x i - x

    _

    |n

    ,

    - la variance empirique :

    s2 = i=1

    n ( x i - x

    _

    )2

    n - 1etc

    Exercice 7-1: Pour l'exemple 7-1, reprsenter un histogramme de frquences. Calculer la

    moyenne x_

    , la mdiane, la variance empirique s2.

    Exercice 7-2 : Pour l'exemple 7-2, calculer la moyenne x_

    , la variance empirique s2.

    Exercice 7-3 : Proposer une formule rcursive pour le calcul conjoint des moyenne etvariance empiriques.

    On remarque que pour faire ces descriptions, on a au plus besoin d'outils informatiquessimples, dans le cas o la liste de donnes est trop longue pour tre traite " la main". Lasituation est diffrente si on s'intresse plusieurs caractres simultanment car lesreprsentations graphiques brutes des donnes exprimentales sont en gnralesinexploitables car illisibles (on n'y repre aucun ordre, aucune structure). L'objet del'analyse des donnes est de proposer des mthodes pour reprsenter et exploiter de tellesdonnes statistiques multivaries.

    2- Echantillons alatoires, statistiques, estimateurs

  • 37

    Reprenons l'exemple 7-1. S'il ne veut pas faire faillite, le fabricant des cbles ne peut pasmesurer la charge de rupture de tous les cbles qu'il fabrique, puisque cette mesure lesdtruit. La valeur moyenne de la charge de rupture qu'il a calcule en testant 12 cblesreflte-t-elle bien la valeur moyenne de la charge de rupture de l'ensemble des cbles ? Lafonction de rpartition empirique obtenue est-elle une bonne approximation de celle qu'onobtiendrait aprs le test de tous les cbles ou de 1200 de ces cbles ? L'objet de la thoriedes statistiques est de rpondre des questions de ce type, c'est--dire d'estimer lapertinence de la gnralisation des caractristiques de l'chantillon exprimental lapopulation toute entire.La dmarche choisie est celle de la modlisation probabiliste.On assimile le caractre numrique, dont x1, , xn est un chantillon observ, unevariable alatoire X dont la loi est inconnue, ou dont le type est connu mais certains desparamtres sont inconnus. Par exemple, il se peut qu'on sache, pour des raisonsthoriques ou en consquence d'expriences antrieures, que la charge de rupture d'uncble suit une loi normale (, ) de paramtres et inconnus ; mais on peut aussin'avoir aucune ide a priori sur le type de sa loi.On reprsente l'exprience de l'chantillonage par n variables alatoires X1, , Xn,indpendantes et de mme loi que X, et on considre que la liste (x1, , xn) est unrsultat possible de cet exprience, c'est--dire une valeur particulire prise par le vecteuralatoire (X1, , Xn).Nous allons dans ce cours voir comment l'chantillon exprimental peut tre utilis pourestimer la loi de X ou certaines de ses caractristiques, et donner des moyens de mesurerla validit de ces estimations.

    Prcisons le cadre de modlisation :

    Dfinition 7-1 : Si X1, , Xn sont des variables alatoires indpendantes qui suiventtoutes la mme loi , on dit qu'elles constituent un chantillon alatoire .

    Dfinition 7-2 : Soit X1, , Xn un chantillon alatoire. Une statistique est une variablealatoire de la forme (X1, , Xn), o est une fonction dterministe de n dans . Savaleur ne dpend que des valeurs prises par (X1, , Xn) et non de paramtres de la loides Xi.

    Exemple 7-3 : Un mois avant un rfrendum, on sonde 1000 personnes inscrites sur leslistes lectorales sur leur intention d'aller voter. Les 1000 personnes ont t tires auhasard (avec remise) dans la population des inscrits. On obtient 650 intentions favorables.Si on tire une personne au hasard et l'interroge, on peut reprsenter sa rponse par unevariable alatoire X qui vaut 1 si elle a l'intention d'aller voter, et 0 sinon. La loi de X est

  • 38

    une loi de Bernoulli de paramtre p, inconnu, gal la proportion dans la population desinscrits des personnes ayant l'intention d'aller voter.On peut reprsenter l'exprience du sondage en introduisant 1000 variables alatoires X1,, X1000 , indpendantes car les 1000 personnes ont t tires au hasard (avec remise),et qui suivent la loi (p). X1, , X1000 est un chantillon alatoire de loi (p). Lesondage a donn des valeurs exprimentales de cet chantillon, x1, , x1000 , telles que

    x1+ + x1000 = 650 . Une statistique usuelle est X1+ + X1000

    1000 . Elle est bien

    indpendante de l'inconnue p. Sa valeur exprimentale est 0,65 : c'est la proportion parmiles inscrits sonds de personnes ayant l'intention d'aller voter. On tudiera dans la suitedu cours dans quelle mesure cette valeur 0,65 peut tre considre comme uneapproximation de p.

    Dans l'exemple prcdent, la statistique X1+ + X10001000 est utilise pour estimer le

    paramtre p de la loi (p) de l'chantillon X1, , X1000 . On dira que c'est unestimateur de ce paramtre p.

    Plus gnralement, considrons un chantillon alatoire X1, , Xn dont la loi dpendd'un paramtre rel (ou vectoriel) inconnu et qu'on veut estimer.

    Un estimateur du paramtre est tout simplement une statistique dont la valeurexprimentale est utilise comme estimation de . Un estimateur peut tre de plus oumoins bonne qualit, suivant la fiabilit de l'estimation de qu'il fournit. Les propritsqu'on va dfinir maintenant permettent de cerner la qualit d'un estimateur.

    Considrons un estimateur n = n (X1, , Xn) de , o n est une fonctiondterministe de n dans (ou dans l'espace vectoriel o se trouve ).

    - On dira qu'il est convergent si n converge en probabilit vers .Une traduction de cette condition est qu'il suffit de choisir n assez grand pour que la loide n soit aussi resserre que l'on veut autour de la valeur .

    - On peut dfinir l'efficacit de l'estimateur par une mesure du resserrement de la loi den autour de , qu'on appelle l'erreur totale :

    E( ( n - )2 ).Plus cette erreur est petite, - ou converge vite vers 0 - , plus l'efficacit de l'estimateur estgrande.

    - Par un calcul simple, on montre :

  • 39

    E( ( n - )2 ) = (n) + [E(n) - ]2On appelle (E(n) - ) le biais de l'estimateur. Un estimateur est dit sans biais si sonbiais est nul. L'efficacit d'un estimateur sans biais est d'autant plus grande que savariance est petite, - ou converge vite vers 0 -.

    - Par une dmonstration semblable celle de l'ingalit de Tchebychev, on montre aussique si E(n) tend vers et (n) tend vers 0 quand n tend vers l'infini, n est unestimateur convergent de .

    3- Estimateurs les plus usuels

    Dans ce paragraphe, X1, , Xn dsigne un chantillon alatoire dont la loi a pourfonction de rpartition F, dsigne l'esprance des Xi et 2 leur variance.

    a) Moyenne de l' chantillon

    Dfinition 7-3 : La moyenne de l'chantillon X1, , Xn est la variable alatoire X_

    :

    X_

    =

    X1+ + Xnn

    Nous avons dj vu (ingalit de Tchebychev et loi des grands nombres) que :E(X

    _

    ) = (X_

    ) = 2

    n

    La statistique X_

    est donc un estimateur sans biais et convergent de l'esprance de la loide X.

    b) Variance de l'chantillon

    Dfinition 7-4 : La variance de l'chantillon X1, , Xn est la variable alatoire S2 dfiniepar :

    S2 = i=1

    n ( X i - X

    _

    )2

    n - 1L'cart-type de l'chantillon est la variable alatoire S = S2 .

    Exercice 7-4 : a) Montrer que :(n-1) S2 =

    i=1

    n (Xi - )2 - n ( X

    _

    - )2

  • 40

    (On a aussi : (n-1) S2 = i=1

    n Xi2 - n X

    _

    2

    Cette formule peut tre utile pour les calculs " la main", mais est numriquement peufiable. Utiliser l'algorithme de l'exercice 7-3 est prfrable pour les calculs sur machine).b) En dduire que S2 est un estimateur sans biais de la variance 2 de l'chantillon, puis,en utilisant la loi des grands nombres, que cet estimateur est convergent.

    Exercice 7-5 : Si l'esprance des Xi est connue, montrer que i=1

    n ( X i - )2

    n est un

    estimateur sans biais et convergent de la variance 2 des Xi .

    c) Fonction de rpartition de l'chantillon

    Dfinition 7-5 : La fonction de rpartition Fn de l'chantillon X1, , Xn est dfinie,pour tout x dans , par :

    Fn(x) = card { i / X i x }

    n

    Remarquons que pour x fix, Fn(x) est une variable alatoire relle. Fn est donc unefonction alatoire de dans .

    Exercice 7-6 : Soit x un rel. Quelle est la loi de nFn(x) ? Que vaut E(Fn(x)) ? Montrerque Fn(x) est un estimateur sans biais et convergent de F(x), o F est la fonction derpartition des Xi . (indication : introduire les variables alatoires Ii dfinies par :

    Ii () = 1 si Xi () x= 0 sinon. )

    On pourrait de mme dfinir un histogramme de l'chantillon, etc

    4- Un exemple de comparaison de l'efficacit de deux estimateurs

    Supposons ici que la loi de l'chantillon X1, , Xn est la loi uniforme sur [0, 2], o est le paramtre estimer.

    - Premier estimateur :

    Rappelons que si X suit la loi uniforme sur [0, 2], E(X) = . Ainsi, X_

    est un estimateursans biais et convergent de . Sa variance est :

    (X_

    ) = (X)n

    =

    23n .

  • 41

    - Deuxime estimateur :Considrons l'estimateur :

    n = max (X1, , Xn)

    2 .

    La densit d de sa loi (voir l'exercice 3-12) est donne par : d(x) = n xn-1

    nsi 0 x ,

    = 0 sinon ,et donc :

    E(n) = nn+1 (n) = n

    (n+2)(n+1)2 2

    n est donc un estimateur convergent de .En posant n =

    n+1n

    n, on obtient un estimateur sans biais et convergent de , et qui

    vrifie :(n) = 1n(n+2) 2

    On constate que, quel que soit n, il est plus efficace que l'estimateur X_

    .

    Ainsi, dans le cas des lois uniformes sur [0, 2], il est plus efficace, pour estimerl'esprance de la loi, d'utiliser un autre estimateur que l'estimateur usuel X

    _

    . Mais pourdes lois d'un autre type, ce n'est pas forcment le cas. De fait, une mthode deconstruction d'estimateurs, connue sous le nom de mthode du maximum devraisemblance , produit, pour chaque type de loi et de dpendance par rapport auparamtre, un estimateur de ce paramtre qui est (presque) toujours le plus efficace desestimateurs. On pourra trouver un expos de cette mthode dans la plupart des manuels destatistiques.

    5- Statistiques issues d'une loi normale

    a) Lois issues de la loi normale

    Dfinition 7-6 : Soient Z1, , Zn n variables alatoires indpendantes, qui suivent toutesla loi normale (0, 1). La loi du khi-2 n degrs de libert, note n2, est par dfinitionla loi de Z12+ + Zn2.

    Exercice 7-7 : Soit X une variable alatoire qui suit la loi n2. Calculer son esprance.

    Exercice 7-8 : a) Soit X une variable alatoire qui suit la loi 62. Que vaut P( 3 X 9) ?b) Soient X et Y deux variables alatoires indpendantes, X suivant la loi 32, Y suivant laloi 62. Que vaut P( X+Y 10 ) ?

  • 42

    Dfinition 7-7 : Soient Z et X deux variables alatoires indpendantes, Z suivant la loinormale (0, 1), et X suivant la loi n2. La loi de Student n degrs de libert, note tn,est par dfinition la loi de ZX/n .

    On montre qu'une variable alatoire de Student a une densit symtrique par rapport 0.Son esprance est donc nulle.

    Exercice 7-9 : a) Soit X une variable alatoire qui suit la loi de Student t12. Que vautP( X 1,4) ?b) Expliquer pourquoi, pour n 30 , les valeurs donnes dans la table de la loi de Studentsont celles que donnerait l'usage de la table de la loi normale (0, 1) ?

    Dfinition 7-8 : Soient X et Y deux variables alatoires indpendantes, X suivant la loi

    n2, Y suivant la loi m2 . La loi de Fischer n et m degrs de libert, note Fn m, est par

    dfinition la loi de ( X

    n )

    ( Ym

    ) .

    b) Moyenne et variance d'un chantillon de loi normale

    Proposition 7-1 : Soit X1, , Xn un chantillon alatoire de loi (, ), X_

    et S2

    dsignent les moyenne et variance de cet chantillon. Alors :

    a) X_

    et S2 sont indpendantes

    b) n (X_

    - )

    suit la loi (0 ; 1)

    c) (n-1) S22

    suit la loi n-12

    d) n (X_

    - )S suit la loi de Student tn-1

    Exercice 7-10 : On admet les parties a) et c) de l'nonc. Montrer les autres assertions.

  • 43

    VIII- Tests d'hypothses sur les valeurs desparamtres d'une variable alatoire

    Dans ce chapitre, X1, , Xn dsigne un chantillon alatoire d'une loi qui dpend d'unparamtre rel inconnu .Considrons l'hypothse sur le paramtre :

    (H) : = 0o 0 est un valeur explicite.On veut construire un test qui utilise un chantillon exprimental (x1, , xn) pourprouver cette hypothse. On procde de la faon suivante.On choisit un estimateur du paramtre . On note e sa valeur exprimentale.On se donne une variable alatoire discriminante de la forme D = (X1, , Xn, 0), o est une fonction dterministe valeurs relles. On fait en sorte que sa valeurexprimentale de = (x1, , xn, 0) permette de comparer les valeurs 0 et e, en enrefltant par exemple la distance. On se donne aussi une zone de rejet R ( R ), et ondcide :

    - de rejeter l'hypothse (H) si de R- de considrer que l'exprience ne contredit pas (H) sinon

    En prenant cette dcision, on court un risque de se tromper.Si on est dans la deuxime situation, la formulation de la conclusion est tellement mollequ'on ne court pas grand risque de se tromper. (Ce qui ne veut pas dire pour autant queconsidrer qu'une exprience ne contredit pas (H) est toujours anodin. Supposons parexemple que (H) signifie "Le fonctionnement de la centrale nuclaire de Blaye estnormal"...)Si on est dans la premire des situations, il se peut que le paramtre soit vraiment gal 0, et que le fait que de soit dans la zone de rejet R soit un fait de hasard. Si c'est le cas,le test nous fait rejeter (H) tort, et plus prcisment, si 0 est la vraie valeur de , enutilisant ce test, on se trompera dans la dcision (environ) 100 fois sur 100, o :

    = P{ D R }.Ce nombre , ou le pourcentage (100 )%, s'appelle le niveau de risque du test . Pourpouvoir calculer ce risque, il faut donc choisir la fonction discriminante D de telle sorteque sa loi soit connue lorsque (H) est vraie.Par la suite, pour construire un test de (H), on fixera en gnral ds le dpart le niveau derisque , et on dfinira la zone de rejet R de sorte que P{ D R } = .

    1- Valeur de l'esprance d'une variable normale de variance connue

  • 44

    Soit X1, , Xn un chantillon alatoire de loi (, ), o est connu et inconnu. Onsuppose qu'on dispose d'une valeur exprimentale (x1, , xn) de cet chantillon.

    Fixons 0 , et soit tester l'hypothse :(H) : = 0

    Construisons le test.

    On utilise l'estimateur X_

    du paramtre . On note x_

    sa valeur exprimentale.Fixons (0 < < 1) le niveau de risque du test. (Comme mesure un risque de setromper, on choisit "petit", par exemple = 0,05 ou 0,1).

    Si l'hypothse (H) est vraie, la variable alatoire D = n (X_

    - 0)

    suit la loi (0 ; 1).

    Nous choisirons cette variable alatoire comme variable discriminante. Remarquons que

    sa valeur exprimentale de = n (x_ - 0)

    reflte bien la distance entre x

    _

    , la valeur

    exprimentale du paramtre , et 0, la valeur tester.

    Dfinissons t/2 par :P( Y < - t/2 ) = P( Y > t/2 ) = /2 , Y suivant la loi (0 , 1).

    et la zone de rejet :R = { d / |d| > t/2 }

    La construction du test est acheve.

    La mise en uvre de ce test au niveau de risque consiste dcider de :

    - rejeter l'hypothse (H) si | n (x_

    - 0)

    | > t/2 ,- considrer que l'exprience ne contredit pas (H) sinon .

    Exercice 8-1 : On suppose que lorsqu'un signal de valeur est mis d'un point A, lavaleur du signal reu au point B est bruite et suit une loi normale ( , 2). Unepersonne au point B s'attend ce que le signal mis ait la valeur 8. Or, le mme signal estmis 5 fois du point A, et la valeur moyenne reue au point B est 9,5. Cette personnedoit-elle remettre en cause son hypothse ?

    L'hypothse ( = 0) dont nous venons de dcrire le test est ce qu'on appelle unehypothse simple, car, sous cette hypothse, la loi de l'chantillon est compltementdtermine.Soit maintenant tester l'hypothse composite :

  • 45

    (H) : 0o 0 est une valeur explicite du paramtre.Construisons-en un test de niveau (0 < < 1).On utilise l'estimateur X

    _

    du paramtre .

    On dcidera de rejeter (H) lorsque la valeur de x_ est trop grande par rapport 0, ou, ce

    qui revient au mme, lorsque de = n (x_ - 0)

    > c pour un certain c.

    Pour construire c en fonction du niveau , supposons que l'hypothse (H) est vraie, etplus prcisment, supposons que ( 0 ) est la vraie valeur du paramtre. Le risque

    de rejeter tort (H) est alors quantifi par P{ n ( X_

    - 0)

    > c}. Or, n ( X_

    - )

    suit la loi (0, 1) et ce risque est donc :

    P{ n ( X_

    - 0)

    > c} = P{ Y > c + n ( 0 - )

    }

    o Y suit la loi (0 , 1). Il est le plus grand lorsque = 0 , et il vaut alors P{ Y > c }.On va donc choisir c tel que cette probabilit soit gale . Ainsi, on saura que sil'hypothse (H) est vrifie, le test rejettera a tort (H) au plus (environ) 100 fois sur100.

    En rsum, la mise en uvre de ce test au niveau de risque consiste dcider de :

    - rejeter l'hypothse (H) si n (x_

    - 0)

    > t ,

    - considrer que l'exprience ne contredit pas (H) sinon ,o t est dfini par :

    P( Y > t ) = , Y suivant la loi (0 , 1).

    2- Valeur de l'esprance d'une variable normale de variance inconnue

    Soit X1, , Xn un chantillon alatoire de loi (, ), o et sont inconnus. Onsuppose qu'on dispose d'une valeur exprimentale (x1, , xn) de cet chantillon.

    Fixons 0 , et soit tester l'hypothse :(H) : = 0

    Construisons-en un test au niveau de risque (0 < < 1).

  • 46

    On utilise les estimateurs X_

    et S de paramtre et . On note x_

    et s leurs valeursexprimentales.

    Si l'hypothse (H) est vraie, la variable alatoire D = n (X_

    - 0)S suit la loi de Student

    n-1 degrs de libert. Remarquons qu'il est moins clair que dans le cas o est connu

    que sa valeur exprimentale n (x_

    - 0)s

    reflte la distance entre x_

    et 0, puisque le

    dnominateur s dpend de la valeur exprimentale (x1, , xn). Il est pourtant d'usage dechoisir cette variable alatoire D comme variable discriminante.Nous dfinirons alors t/2 par :

    P( Y < - t/2 ) = P( Y > t/2 ) = /2 , Y suivant la loi de Student tn-1 .et la zone de rejet :

    R = { d / |d| > t/2 }

    La mise en uvre du test au niveau de risque consiste donc dcider de :

    - rejeter l'hypothse (H) si | n (x_

    - 0)s

    | > t/2 ,- considrer que l'exprience ne contredit pas (H) sinon .

    On pourrait, de mme que dans le cas de la variance connue, construire un test au niveaude risque a de l'hypothse composite ( 0).

    Exercice 8-2 : L'utilisateur d'un certain cble exige que sa charge moyenne de rupture soitau moins de 200 tonnes. Il a test 8 de ces cbles et trouv les charges de rupture :

    210 195 197,4 199 198 202 196 195,5On suppose que la charge de rupture d'un cble suit une loi normale.Que conclure, au niveau de risque de 5% ? Au niveau de risque de 10% ?

    3- Valeur de la variance d'une variable normale

    Soit X1, , Xn un chantillon alatoire de loi (, ), o et sont inconnus. Onsuppose qu'on dispose d'une valeur exprimentale (x1, , xn) de cet chantillon.

    Fixons 0 , et soit tester l'hypothse :(H) : = 0

    Construisons-en un test au niveau de risque (0 < < 1).

  • 47

    On utilise les estimateurs X_

    et S de paramtre et . On note x_

    et s leurs valeursexprimentales.

    Si l'hypothse (H) est vraie, la variable alatoire, (n-1)S202

    suit la loi du khi-deux n-1

    degrs de libert. Nous la choisissons comme variable discriminante. Sa valeur

    exprimentale (n-1)s202

    est fonction de s et permet donc la comparaison de s et 0.

    On dfinit la zone de rejet :R = { d / d > t /2 ou d < t 1- /2 }

    avec :

    P( Y > t ) = , Y suivant la loi n-12La construction du test est acheve.

    La mise en uvre de ce test au niveau de risque consiste dcider de :

    - considrer que l'exprience ne contredit pas (H) si t 1- /2 < (n-1)s2

    02 < t /2 ,

    - rejeter l'hypothse (H) sinon.

    En suivant une dmarche analogue celle dcrite dans le paragraphe 1, on peut justifierl'utilisation, pour tester l'hypothse composite ( 0) au risque , du test qui consiste

    - rejeter l'hypothse (H) si (n-1)s202

    > t ,

    - considrer que l'exprience ne contredit pas (H) sinon.

    Si l'esprance est connue, on construit les tests de manire analogue, en utilisant

    l'estimateur de la variance S'2 = i=1

    n ( X i - )2

    n et en remarquant que si (H) est

    vraie, D = nS'2

    02 suit la loi du khi-deux n degrs de libert.

    Exercice 8-3 : Le systme de mesure d'une pompe essence est tel que le nombre de litresaffichs suit une loi normale d'esprance gale au nombre de litres distribus et d'cart-type inconnu . Ce systme est considr comme efficace si est infrieur 0,075 litres.Par 20 mesures indpendantes, on a test un systme nouvellement install et obtenul'estimation s2 = 0,00625. Le systme de mesure est-il efficace ?

    4- Valeur de la probabilit d'un vnement

  • 48

    Supposons que X1, , Xn est un chantillon alatoire de loi de Bernoulli (p), o p estinconnu.On suppose qu'on dispose d'une valeur exprimentale (x1, , xn) de cet chantillon.

    Fixons p0 , et soit tester l'hypothse :(H) : p = p0

    Construisons-en un test au niveau de risque (0 < < 1).On utilise comme estimateur de p la moyenne de l'chantillon, X

    _

    . On note pe la valeurexprimentale correspondante.

    Si l'hypothse (H) est vraie, la variable alatoire nX_

    suit la loi du binme (n, p0). Nousla choisissons comme variable discriminante. Par un calcul itratif, - ou en utilisant destables ou abaques -, on peut dterminer k/2- et k/2+ tels que :

    k/2- = max { k / i=0

    k C

    ni p0i ( 1 - p0 )n-i /2 }

    k/2+ = min { k / i=k

    n C

    ni p0i ( 1 - p0 )n-i /2 }

    La mise en uvre de ce test au niveau de risque consiste alors dcider de :- considrer que l'exprience ne contredit pas (H) si k/2- < npe < k/2+

    ,

    - rejeter l'hypothse (H) sinon.

    Supposons maintenant que la taille n de l'chantillon est assez grande pour qu'on puisse,

    sous l'hypothse (H), donner une bonne approximation de la loi de n (X_

    - p0 )p0(1-p0) par

    la loi (0 ; 1). (Il est d'usage de considrer que cette approximation est trs bonnelorsque np0( 1 - p0 ) 10 ). On peut alors proposer un test au niveau de risque de miseen uvre beaucoup plus simple.

    On choisit n (X_

    - p0 )p0(1-p0) comme variable discriminante. Dfinissant t/2 par :

    P( Y < - t/2 ) = P( Y > t/2 ) = /2 , Y suivant la loi (0 , 1),on a :

    P{ | n (X_

    - p0 )p0(1-p0) | > t/2 } .

    La mise en uvre de ce test au niveau de risque consiste donc dcider de :

    - rejeter l'hypothse (H) si | n (pe - p0)p0(1-p0) | > t/2 ,- considrer que l'exprience ne contredit pas (H) sinon .

  • 49

    Exercice 8-4 : La chane de fabrication de montres est conue pour qu'au plus 2% desmontres soient dfectueuses. Sur 500 montres testes, on en a trouv 16 dfectueuses.Doit-on conclure un dysfonctionnement de la chane de fabrication ? (Proposer et utiliserun test unilatral).

    5- Valeur de l'esprance d'une variable alatoire de loi quelconque

    Supposons que X1, , Xn est un chantillon alatoire de loi quelconque et qu'on veuilletester une hypothse sur l'esprance de sa loi.

    Si le type de la loi de l'chantillon est connue, il faut en principe faire une analyse

    analogue celle que nous avons faite pour la loi normale : choisir un estimateur ( X_

    n'est

    pas forcment le meilleur : voir le chapitre VII 4 ...), choisir une fonction discriminante(de loi connue ou calculable, c'est l le plus gros problme...), etc

    Cependant, pour des valeurs de n assez grandes, et si l'cart-type des Xi est connu, on

    sait, d'aprs le thorme central-limite, que sous l'hypothse (H), n (X_

    - 0)

    suit

    approximativement la loi (0 ; 1). On pourra alors construire un test comme on l'a faitdans le paragraphe 4 sur la loi de Bernoulli. Si l'cart-type des Xi est inconnu, on

    utilise gnralement la variable discriminante n (X_

    - 0)S , en considrant qu'elle suit

    approximativement la loi (0 ; 1), mais on ne peut pas le justifier dans un cadre gnral.Dans tous les cas, il faut remarquer que si le type de loi des Xi est inconnu, on ne sait paspour quelles valeurs de n ces approximations sont valides. On ne se risquera pas utiliserde tels tests si n est plus petit que 30.

    6- Intervalle de confiance pour l'estimation d'un paramtre

    Soit X1, , Xn un chantillon alatoire d'une loi qui dpend d'un paramtre relinconnu , et soit un estimateur du paramtre . On suppose disposer d'un chantillonexprimental (x1, , xn ), et on note e sa valeur exprimentale. On suppose enfin qu'ondispose d'un test de niveau de risque donn (0 < < 1) pour tester les hypothses( = 0).On dfinit alors l'intervalle de confiance au niveau de confiance (1- ) de l'estimation duparamtre comme l'ensemble I1- des valeurs 0 qui ne sont pas rejetes par ce test.

  • 50

    En utilisant les tests proposs dans les paragraphes prcdents, on obtient les intervallesde confiance au niveau (1- ) suivants :

    - Intervalle de confiance de l'esprance d'une variable normale d'cart-type connu :

    I1- = [ x_

    - t/2

    n , x_

    + t/2

    n ]avec t/2 dfini par :

    P( Y < - t/2 ) = P( Y > t/2 ) = /2 o Y suit la loi (0 , 1).

    - Intervalle de confiance de l'esprance d'une variable normale de variance inconnue :

    I1- = [ x_

    - t/2 s

    n , x_

    + t/2 s

    n ]avec t/2 dfini par :

    P( Y < - t/2 ) = P( Y > t/2 ) = /2 o Y suit la loi de Student tn-1.

    - Intervalle de confiance de la variance d'une variable normale d'esprance inconnue :

    I1- = [ (n-1)s2

    t/2 ,

    (n-1)s2t1-/2

    ]

    avec :

    P( Y > t ) = o Y suit la loi n-12 .

    - Intervalle de confiance de la variance d'une variable normale d'esprance connue :

    I1- = [ ns'2t/2

    , ns'2t1-/2

    ]

    avec :

    P( Y > t ) = o Y suit la loi n2 .

    - Intervalle de confiance du paramtre d'une variable de Bernoulli pour les grandesvaleurs de n :

    I1- [ pe - t/2pe(1-pe)n , pe + t/2pe(1-pe)n ]avec t/2 dfini par :

    P( Y < - t/2 ) = P( Y > t/2 ) = /2 o Y suit la loi (0 , 1).

    Exercice 8-5 : On suppose que lorsqu'un signal de valeur est mis d'un point A, lavaleur du signal reu au point B est bruite et suit une loi normale ( , 2).

  • 51

    a) Pour rduire l'erreur de transmission, on envoie le mme signal 9 fois. Les valeursreues sont :

    5 8,5 12 15 7 9 7,5 6,5 10,5 .Quel est l'intervalle de confiance bilatral de la valeur mise , au niveau de confiance0,95 ?b) Combien de fois le mme signal doit-il tre envoy pour que l'intervalle de confiancede au niveau 0,95 soit de demi-longueur infrieure 0,1 ?

    Si on dispose d'un test unilatral de niveau de risque donn (0 < < 1) pour tester leshypothses ( 0), on dfinit l'intervalle de confiance [, +[ au niveau de confiance(1- ) de l'estimation du paramtre comme l'ensemble I1- des valeurs 0 qui ne sontpas rejetes par ce test.

    7- Exercices

    Exercice 8-6 : Un procd de fabrication exige d'une certaine solution chimique d'avoirun pH exactement gal 8,20. La mthode de mesure de pH utilise donne un rsultat quisuit la loi normale d'cart-type 0,02 et d'esprance gale la vraie valeur du pH. On amesur 10 fois le pH de la solution et trouv :

    8,18 8,16 8,17 8,22 8,19 8,17 8,15 8,21 8,16 8,18a) Que conclure au niveau de risque de 5% ?b) Que conclure au niveau de risque de 5 ?

    Exercice 8-7 : On a constat que sur n = 100 naissances, g = 49 ont t des naissances degarons. Est-il raisonnable d'admettre que les naissances sont galements rparties entregarons et filles ? Mme question pour 490 naissances de garons sur un total de 1 000,de 4 900 sur un total de 10 000.

    Exercice 8-8 : Reprendre les donnes et les questions de l'exercice 8-5, mais ensupposant que lorsqu'un signal de valeur est mis d'un point A, la valeur du signal reuau point B suit une loi normale ( , ), avec et inconnus.

    Exercice 8-9 : Un procd de vrification de l'paisseur de rondelles mtalliques fournitune mesure qui suit une loi normale d'esprance gale la vraie valeur de l'paisseur etd'cart-type inconnu. On a mesur 10 fois l'paisseur d'une rondelle et trouv :

    1,23 1,24 1,26 1,20 1,30 1,33 1,25 1,28 1,24 1,26 mm.Quel est l'intervalle de confiance au niveau 0,8 de l'cart-type de l'paisseur d'unerondelle ?

  • 52

    Exercice 8-10 : Dans une population africaine isole, on a test 72 personnes choisies auhasard, et observ que 9 d'entre elles portent une anomalie gntique particulire. Quelleest l'intervalle de confiance au niveau 0,95 de la frquence de cette anomalie dans lapopulation ?

    Exercice 8-11 : Entre le premier et second tour des lections prsidentielles, un candidat Ccommande un institut de sondage une valuation de ses chances de gagner. Sur 1000personnes interroges et ayant l'intention d'exprimer leur suffrage, 515 dclarent avoirl'intention de voter pour C.a) Si les lections avaient lieu le jour du sondage, C gagnerait-il les lections ? (Proposerun test au niveau de risque de 5% ).b) Le candidat est du. Il esprait plus de prcision de ce sondage. Combien depersonnes ayant l'intention d'exprimer leur suffrage aurait-il fallu interroger pourconclure, au niveau de risque de 5%, que C gagnerait les lections si les lections avaientlieu le jour du sondage ?

    Exercice 8-12 : Le diamtre de la prune d'une certaine varit est une variable alatoire Xqu'on suppose normale. Les mesures faites sur un chantillon de 375 prunes de cettevarit ont donn les rsultats suivants :diamtre en cm 24 26 28 30 32 34 36 38 40effectif 7 20 38 79 84 75 53 15 4

    a) Estimer, en cm, l'esprance et l'cart-type de X.b) Quel est l'intervalle de confiance au niveau 0,95 de l'estimation de E(X)