Tutorat Associatif Toulousain de... · Si f '(x) < 0, pour tout x de J, alors f est strictement...

114
Tutorat Associatif Toulousain 133, Route de Narbonne 31062 TOULOUSE CEDEX Année universitaire 2016 - 2017 P.A.C.E.S UE4 : Évaluation des méthodes d'analyse appliquées aux sciences de la vie et de la santé BIOSTATISTIQUES © Tous droits réservés au T utorat Associatif T oulousain. Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites. 1

Transcript of Tutorat Associatif Toulousain de... · Si f '(x) < 0, pour tout x de J, alors f est strictement...

Tutorat Associatif Toulousain 133, Route de Narbonne

31062 TOULOUSE CEDEX

Année universitaire 2016 - 2017

P.A.C.E.S

UE4 : Évaluation des méthodes d'analyse appliquées aux sciences de la vie et de la

santéBIOSTATISTIQUES

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

1

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

2

Préface

Ce polycopié est destiné aux étudiants en Première Année Commune aux Études de Santé (P.A.C.E.S.) en complément des enseignements dispensés à la faculté.

En aucun cas les informations contenues dans ce polycopié ne pourront engager la responsabilité des facultés de médecine et de pharmacie ou de mesdames et messieurs les professeurs.

L'année 2010-2011 a été marquée par la réforme de la PACES, et nous avons fait tout notre possible pour réadapter ce polycopié aux nouveaux cours. Nous avons tâché autant que possible d'éliminer les items traitant de parties de cours obsolètes.

Nous nous excusons d'avance si toutefois des QCMs inadaptés nous auraient échappés. Nous vous invitons à signaler toute erreur ou toute remarque sur le forum

de Tutoweb ou bien lors des permanences.

Ce polycopié a été réalisé, revu, corrigé et complété par les équipes successives de tuteurs.

Remerciements aux tuteurs de l'année 2016/2017 : Stuart Cannell, Alice Legrand, Giuliana Torsiello, et Emmanuelle Vrignaud pour leur implication et leur excellent travail

Compilé par Andréa Villeneuve

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

3

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

4

SOMMAIRE

– Notions Élémentaires – Fonctions.....................p 7

– Biostatistiques..................................................p 41

– Lois de Probabilités.........................................p 67

– Tests Statistiques .............................................p 81

– Épidémiologie................................................p 105

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

5

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

6

I - Notions Élémentaires - Fonctions – Synthèse

Plan

Rappels – Définitions

Fonctions usuelles :– inverse– polynomiale– racine carrée– exponentielle– logarithme– trigonométriques

Analyse des fonctions :– domaine de définition– variations– extrema– limites et asymptotes– tableau de variation

Fonctions de plusieurs variables :– application partielle– dérivée partielle– différentielle– extrema

Incertitude :– incertitude absolue– incertitude relative

I. RAPPELS - DEFINITIONS

• Domaine de définition Df : C'est l'ensemble des éléments x pour lesquels f(x) existe.

• Symétrie :◦ Par rapport à un point:

▪ La symétrie de centre O est la transformation qui pour tout point M, associe le point M' tel que O soit le milieu de MM'.

▪ La symétrie par rapport à l'origine f (-x)= -f(x) (fonction "impaire")

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

7

◦ Par rapport à une droite:▪ Le point B est le symétrique du point A par rapport à la droite d si la droite d est la

médiatrice du segment [AB] .▪ Symétrie par rapport à l'axe des ordonnées f (-x) = f (x) (fonction "paire").

• Périodicité : f est dite périodique de période P si f ( x+P ) = f(x) ; ou le graphe de f est

invariant par translation d'un vecteur ( P,0).

• Variations: ◦ f étant dérivable sur I, pour tout intervalle J inclus dans I :

▪ Si f '(x) > 0, pour tout x de J, alors f est strictement croissante sur J.▪ Si f '(x) < 0, pour tout x de J, alors f est strictement décroissante sur J.▪ Si f '(x) = 0, pour tout x de J, alors f est constante sur J.

◦ Exemple:

◦ Astuce : vérifiez toujours l'intervalle de définition avant de dériver car si la fonction n'existe pas pour une partie de l'intervalle demandé, vous n'avez pas à aller plus loin puisque cela signifie qu'il n'y a pas de derivé.

• Continuité :une fonction f est continue sur son domaine de définition lorsqu'elle est continue en tout point de son domaine de définition (tracer de courbe sans lever la main).

• Asymptotes : ◦ Une droite d'équation x = x0 est asymptote à la courbe de la fonction f lorsque limx-->x0

f(x) = ± 8

◦ Une droite d'équation y = y0 est asymptote à la courbe de la fonction f lorsque limx-->±∞

f(x)= y0

◦ Il existe également des asymptotes obliques : la droite d'équation y = ax + b est asymptote à la courbe représentative de la fonction f (x) lorsque limx-- >±∞ f(x)-(ax+b)=0. Les asymptotes obliques ne peuvent seulement exister lorsque limx-->±∞

f(x)=±∞

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

8

II. FONCTIONS USUELLES

1. Fonction inverse f(x) = 1/x

• Df = IR* (continue sur son intervalle de définition).

• Variations : Strictement décroissante sur ]- 8 ;0 [ puis sur ]0; + 8 ] attention ! pas strictement décroissante sur IR* car pour -x<x on a f(-x)<f(x)

• Limites : limx→+∞

1x=0 +

limx→−∞

1x=0 -

limx→0-

1x=−∞

limx→0+

1x=+∞

asymptote verticale en 0, d'équation x = 0 asymptote horizontale en +/- 8 d'équation y = 0.

• Symétrie : La fonction inverse est impaire.

2. Fonctions polynômes f(x) = anxn + an-1xn-1 + ... + a1x + a0

• D(f) = IR• continues sur IR

• Limites d'un polynômeUn polynôme en ± 8 est équivalente à son monôme de plus haut degré

• Symétrie des monômesUn monôme admet une symétrie axiale si n pair, une symétrie par rapport à l'origine si n impair.

• Voir les variations et limites des monômes grâce à leur représentation graphique selon le degré n pair/impair et le coefficient positif/négatif dans le polycopié de la fac.

• Les polynômes n'ont pas de propriétés remarquables par rapport aux symétries et variations

3. Fonction racine f(x)=√ x

• Df =IR+ ou [0 ;+ 8 [.

• Variations : Strictement croissante et continue ; pas de propriétés de symétrie

• Limites : Limx-->+∞=+ 8

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

9

• Propriétés fonction racine est négligeable en + 8 devant toute fonction polynôme de degré ≥1 puisque √ x = x1/2

4. Exponentielle f(x) = exp (x)

• Df=R.

• Variations : Strictement croissante

• Limites : limx→+ 8 exp x = + 8

limx→- 8 exp x = 0 ( asymptote horizontale y=0 en - 8 )

• Propriétés : exp(x+y) = exp(x) * exp(y) et exp(-x) = 1/exp(x). exp ( 0 ) =1 Les fonctions polynômes et racine carré sont négligeables devant l'exponentielle en + 8

5. Logarithme f(x) = ln (x)

• Df = R+*

• Variations :Strictement croissante sur Df

• Limites : Limx→+ 8 (ln x)= + 8

• limx→0+ (ln x) = - 8 ( asymptote verticale en 0+ )

• Propriétés : • ln est la fonction réciproque de l'exp, ainsi pour x dans R ln(exp(x)) = x et exp(ln(x)) = x

pour x dans R+* • Pour x > 0 et y > 0

ln ( x.y ) = ln (x) + ln (y) ln( x/y) = ln ( x) - ln (y) ln (x)p= p*ln(x)

• ln est négligeable en + 8 devant les fonctions racine carré, polynômes, et exponentielle.• logA(x)= ln(x)/ln(A) • ln ( 1) = 0 • log(x)=log10(x) par convention = ln(x)/ln(10)

Hiérarchie des fonctions à l'infini :ln(x)<√ x<x<xn<ex

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

10

6. Fonctions Trigonométriques

• Définition : le couple (cos α ; sin α ) représente les coordonnées d'un point M du cercle trigonométrique, repéré par un angle α à partir de la demi-droite [Ox).

• Fonction cos est sin : f(x) = cos (x) et f(x) = sin (x)

◦ Df = IR

◦ Variations :La fonction cos est décroissante sur [0;π ]et croissante sur [π; 2π].La fonction sin est croissante sur [-π/2; π/2] et décroissante sur[π/2; 3π/2]

◦ Périodicité :cos et sin sont périodiques de période 2π ( ou : les courbes sont invariantes par translation de vecteur ( 2 π ; 0)).

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

11

Cependant la période peut varier ; en effet lorsqu'on a cos(ax+b) ou sin(ax+b), la période est égale à 2π/|a|

◦ Symétrie : La fonction cos est paire et la fonction sin est impaire.

• Fonction tan f( x) = tan (x)

◦ tan x = (sin x) /(cos x) ◦ Df = IR privé de π/2 +k. π (k ⋲ Z)

◦ Symétrie, continuité, périodicité : tan est impaire ;périodique de période π ; Avec f(x)= tan(ax+b) on a une période égale à π/|a|continue sur tout intervalle ]- π/2 + k. π ; π/2 + k. π[ (k ⋲ Z) mais non continue sur Df

◦ Variations :tan est croissante sur tout intervalle ]- π/2 + k. π ; π/2 + k. π[ (k ⋲ Z) mais non croissante sur Df

◦ Limites :limα→π/2- =+ 8 et limα→π/2+ = - 8 donc tan admet une infinité d' asymptotes verticales d'équation x = π/2 + k. π (k ⋲ Z)

III.ANALYSE DES FONCTIONS

1. Domaine de définition

• opérations +,-,x :

◦ Le domaine de définition de la fonction entière est l'intersection des domaine de définition des fonctions qui la composent, ou dit autrement :

◦ Donnent une fonction dont Df est l'intersection des domaines f et g. Df Dg .

◦ D'où le Df n'existe seulement si les Df des 2 fonctions f et g ne sont pas disjoints.

◦ Rmq : /!\ Vérifiez toujours si les intervalles sont compatibles lorsqu'on vous demande un calcul, ça peut vous faire gagner du temps si ce n'est pas le cas!

◦ Exemple : 7x + 2/xDf 7x => IRDf 2/x => IR*Df 7x + 2/x => IR*

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

12

• Opération ÷ :

◦ Le domaine de définition d'un quotient est l'intersection des domaines de définition du numérateur et du dénominateur privé des valeurs qui annulent le dénominateur :

◦ Le quotient de deux fonctions f par g est la fonction qui, à tout réel x de Df Dg tel que

g(x) ≠ 0, associe le réel f(x)/g(x), que l'on note f/g.

◦ Exemple : (x^ 3)/(√ x)Df x^3 => IRDf √ x => IR+ et √ x =0 <=> x =0 Df (x^ 3)/(√ x) => IR+*

• Composée de deux fonctions f suivie de g notée : f o g

◦ Le domaine de définition de la fonction composée f o g sont les valeurs x telles que g( x) appartient à Df

◦ Exemple : ◦ Soit g (x) = x2 - 1 définie sur IR ; g(x) est positif entre ]-∞; -1] [1 ; +∞[ et négatif sur

]-1;1[◦ f(x) √x définie sur IR+

◦ f o g = f(g(x)) = √x²−1 est définie sur ]-∞; -1] [1 ; +∞[ car ce sont les valeurs x qui donnent des g(x) positifs (appartenant à IR+)

2. Variations

• Propriétés à connaître sur les sens de variations

◦ Influence d'un coefficient▪ Si k > 0 les fonctions f et kf ont le même sens de variations.▪ Si k < 0 les fonctions f et kf ont des sens de variations contraires

◦ Somme de fonctions :- la somme de 2 fonctions croissante donne une fonction croissante- la somme de 2 fonctions décroissante donne une fonction décroissante.- on ne peut pas savoir les variations de la somme d'une fonction croissante avec une fonction décroissante sans avoir d'indices supplémentaires (comme la dérivée)

◦ Produit et quotient : Prenons l'exemple de f*g :Si f et g sont croissantes et strictement supérieures à 0 alors la fonction f*g est croissanteSi f et g sont décroissantes et strictement supérieures à 0 alors la fonction f*g est décroissanteSi f est croissante et g décroissante, il faut alors calculer la dérivée

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

13

◦ Variations des fonctions composées : elle suit la règle des signes ++ => + - - => + - + => -

Astuce: Si les deux fonctions varient dans le même sens, alors la fonction composée est croissante, sinon elle est décroissante.

• Détermination générale des variations : dérivées

Définition

Soit f une fonction définie sur un intervalle ouvert contenant x0. On dit que f est dérivable en x0 si la quantité f( x 0+h)-f( x 0) admet une limite finie quand h tend vers 0. hSinon, il existe une méthode raccourcie : f est dérivable en x0 ssi lim x-> x0 f'(x) n'est pas égal à ∞

Cette limite est appelée nombre dérivé de f en x0 et notée f '(x0).

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

14

Dérivées des fonctions usuelles

f f '

k 0

k.x k

xn nxn-1

1/x -1/x2

√x 1/2√x

ex ex

ln(x) 1/x

sin(x) cos(x)

cos(x) -sin(x)

tan(u) u'(1+tan²(u))u'/(cos²u)

ln|u| u'/u

fog g'*f'og

• Astuce : Pour éviter de confondre les dérivés de cos et sin (au niveau de la négation) pensez que « le Cos est Chiant donc sa dérivé est négative » (triste si vous préférez) . Sinon visualisez le cercle trigonométrique et si vous écrivez « sin » en haut de l'axe des ordonnées et « cos » à droite de l'axe des abscisses, pour aller de sin vers cos il faut aller en avant donc pas de changement de signe sur la dérivée, alors que pour aller de cos à sin, il faut aller en arrière et donc la dérivée prend un signe (-)

Dérivées des fonctions et opérations

Soit u et v deux fonctions dérivables sur le même ensemble D.

f f '

k.u k.u'

u+v u'+v'

u.v u'v+uv'

1/u -u'/u²

u/v (u'v-uv')/v²

un n.u'.un-1

ln(u) u'/u

√u u'/2√u

v o u v '(u(x)) *u '

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

15

tan(u) u'(1+tan²(u))u'/(cos²u)

ln|u| u'/u

• Sens de variation : f est strictement : ◦ Croissante sur I si pour tout x ⋲ I, f '(x) > 0.◦ Décroissante sur I si pour tout x ⋲ I, f '(x) < 0.◦ Constante sur I si pour tout x ⋲ I, f '(x) = 0.

3. Extrema

• Extrema : Dans le cas de fonctions d'1 variable : si la dérivée s'annule en changeant de signe en xo, alors f admet un extremum local en xo

• attention : Pour que f admette un extremum, il faut que sa dérivée s'annule en changeant de signe.Par contre, si on affirme que f possède un extremum en a, alors sa dérivée s'annule en changeant de signe en a . Si f possède un extremum en a, alors sa dérivée s'annule, c'est vrai aussi mais la réciproque est fausse.Exemple : une fonction croissante avec un plateau possède une dérivée nulle à ce niveau, mais elle ne possède pas d'extremum car la dérivée ne change pas de signe, comme la fonction f(x)=x3 au niveau du point x=0

4. Calcul de limites

• Somme

+ b + 8 - 8 a a+b + 8 - 8

+ 8 + 8 + 8 ?

- 8 - 8 ? - 8

• Différence

- b + 8 - 8

a a-b - 8 + 8

+ 8 + 8 ? + 8

- 8 - 8 - 8 ?

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

16

• Produit

x 0 b≠0 + 8 - 8

0 0 0 ? ?

a≠0 0 ab ± 8 ± 8

+ 8 ? ± 8 + 8 - 8

- 8 ? ± 8 - 8 + 8

• Quotient

x 0 b≠0 + 8 - 8

0 ? 0 0 0

a≠0 ± 8 a/b 0 0

+ 8 ± 8 ± 8 ? ?

- 8 ± 8 ± 8 ? ?

• Rappels :

• Tout polynome au voisinage de +/- ∞ est équivalent à son terme de plus haut degré• Tout polynome au voisinage de 0 est équivalent à son terme de plus bas degré• a/∞ => 0• a/0 => ∞• 0/∞ => 0

• Formes indéterminées

∞/∞ 0/0 0*∞ ∞-∞

◦ ∞/∞ ou 0/ 0 peuvent se résoudre :par le théorème de l'hopital : lim x→a f/g = lim x→a f'/g'par les croissances comparées si on cherche la limite en + ∞

◦ ∞ - ∞ peut se résoudre :par l'utilisation d'une quantité conjuguéecroissances comparées en + ∞

◦ 0*∞ peut se résoudre :par les croissances comparées quand on cherche la limite en + ∞.

◦ Les FI peuvent parfois être traitées par des équivalents, notamment grâce au DL1

• Equivalents : Si f ~ g en A (réel ou ±∞) et si limA f = L, alors limA g = Lconditions d'utilisation :• Un produit ou un quotient de deux fonctions peut être remplacé par le produit ou le

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

17

quotient de deux fonctions équivalentes.• Une somme de deux fonctions ne peut pas en général être remplacée par la somme de

deux fonctions équivalentes.• Si g = o(f ) alors (f + g) ~ f (rappel « g= o(f) » signifie que g est négligeable devant f).• théorème de l'hopital :• dans les cas exposés ci dessus, il s'agit de remplacer f(x)/g(x) par f'(x)/g'(x) puis

f'(x)/g'(x) par f''(x)/g''(x) etc jusqu'à lever la forme indéterminée• croissances comparées :

dans les cas exposés ci-dessus, il s'agit de comparer les comportements des fonctions en + ∞ afin d'en déduire laquelle est négligeable devant l'autre et de restreindre la limite à trouver à la fonction dominante.Rappel : en + ∞ ; ln (x) < √ x < x < a^x < e ^xEx : Lim de 5x - √ x en + ∞Il s'agit d'une FI de la forme ∞ - ∞ que l'on peut résoudre par les croissances comparées.En + ∞, la fonction racine carrée est négligeable devant la fonction affine, on dit que la fonction est équivalente à 5x en + ∞, la limite est donc + ∞.quantité conjuguée :Dans les cas exposés ci-dessus, il s'agit de multiplier et diviser par la quantité conjuguée afin de lever l'indétermination, marche à suivrea-b = a- b * (a+b)/(a+b) = (( a-b)*(a+b))/a+b = (a^2-b^2) / (a+b)

• En résumé :Trouver les limites de fonctions nécessite de connaître les calculs des limites, la résolution des FI et les limites des fonctions usuelles

5. Tableau de variation

• Exemple : soit f(x)=x²-6x+1 donc f '(x)=2x-6

or pour Xo =3 f '(Xo)=0 f '(X)<0 pour X<3 ► f(x) est décroissante pour X<3 f '(X)>0 X>3 ► f(x) est croissante pour X>3

Le tableau de variation permet de faire la synthèse de l'analyse de la fonction, il regroupe le domaine de définition, les limites, les variations, et permet de connaître les extrema locaux, de vérifier que l'on ne s'est pas trompé.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

18

IV. FONCTIONS DE PLUSIEURS VARIABLES

1. Développement limité d'ordre 1

• Le développement limité (DL) d'une fonction f au voisinage d'un point x0 est une approximation polynomiale de f en x0 .son expression générale s'écrit : f (x0+h)=a0+a1.h+...+(an) .h

n+h.ϵ(h) avec Limh→0

ϵ(h)=0

Le polynôme a0+a1.h+...+(an). hn est la partie régulière du DLh.ϵ(h) est le reste, qui est négligeable si la variable est suffisamment proche de x0 .

• Le DL d'ordre 1 est un cas particulier des DL où la partie régulière est une fonction affine ( on parle alors d'approximation affine ou linéaire de la fonction en x0 ) ; et h.ϵ(h) est « infiniment petit d'ordre 1 », il est négligeable devant h donc on note h.ϵ(h)=o(h) .

• Définition DL1 : D ϵ ℝ admet un développement limité d'ordre 1 en x0 ϵ D lorsqu'il existe a ϵ ℝ et qu'il existe une fonction ϵ dont la limite en 0 est 0 , tel que pour tout h

vérifiant ( x0 + h) ϵ D, on ait :f (x0+h)= f (x0)+a.h+h.ϵ(h) ; a= f ' (x0) = coefficient directeur de la tangente en x0 .

• Principe :Il s'agit d'approcher f(x) par une fonction affine au « voisinage » de x0 , Formule à retenir :

f (x0+h)= f (x0)+ f ' (x0)h+o (h)

• Objectif: le développement limité est un outil mathématique facilitant le calculdes limites d'une fonction ( traiter les formes indéterminées) et de sa dérivéeà partir de ces informations, il est alors possible de détermine les extrema d'une fonction et de dresser son tableau de variations.(En effet, le principe est de faciliter l'étude d'une fonction f(x) en la décomposant en une somme de fonctions affines ( les DL1, de type y = ax + b) définies par leurs dérivées ( la dérivée définissant la pente de la droite et étant égale à a). En étudiant chaque dérivée, on est ainsi capable de connaître les variations de la fonction f(x))

• exemple : Trouver le DL1 de g( x) = x^2 – ln( x-1) au voisinage de x0 = 2g(2) = 2^2 – ln ( 2-1) = 4g'(x) = 2x - ( (1)/( x-1)) ; g'(2) = 3d'où g ( 2 + h) = 4 + 3h + h.ϵ(h)

• Notation

◦ Δ indique une différence , sur la fonction ou les valeurs de x

( sur la fonction par exemple : Δ f x0= f (x0+Δ x)− f ( x0) )

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

19

◦ d indique une variation infinitésimale d'ordre 1, sur les valeurs de x ou sur les valeurs de f(x) (provoquées par une variation infinitésimale dx autour de x0 )

f (x0+h)= f (x0)+ah+ο(h)<=> f (x0+h)− f (x0)=ah+ο(h)<=> df x0=ah+ο(h)

• Remarque : a=dfdx= f ' ( x0)

= pente de la tangente en x0

= nombre dérivé en x0

• Dans le cas d'une différence, si on néglige le terme d'erreur ο(Δ x ) , Δ f ≈aΔ x (pas d'égalité).

• Dans le cas d'une différence infinitésimale, ο(h) n'est pas négligé et on ne fait donc pas d'approximation : df =a.dx (égalité)

VII. FONCTION DE PLUSIEURS VARIABLES

Def : elles sont de type f ( x ; y ; z)Objectif : en Biostatistiques, les FPV sont fréquemment utilisée pour modéliser des phénomènes faisant intervenir plusieurs paramètres.

• Objectif :

◦ h y est une variation par rapport à x y . On cherche à découvrir la nouvelle fonction f (x y+hy ) après sa variation par rapport à f (x y ) pour connaître l'allure de f(x)

autour de xy.◦ Les applications permettent de savoir les marges d'erreur à cause d'une mesure ou les

effets de la modifications d'une variable (ajustement de l'erreur) sur l'ensemble de la fonction.

• Fonction à une variable :

◦ f (x0+h0)= f ( x0)+ah0+ο(h0) où ah0+ο(h0) représente la variation de la fonction.

◦ a correspond à f ' ( x0) = dérivée de f en x0 .

• Fonction à n variables :

◦ f (x1+h1, x2+h2 ...+x n+hn)= f (x1, x2 ... , xn)+L(h1, h2... , hn)+ο(h1, h2 ... , hn) où L(h1 ...hn)+ο(h1...hn) représente la variation de la fonction.

◦ L correspond à df ( x1 ... xn(h1 ...hn)) = différentielle de f en x1 ... xn .◦ Comme ο(h0) et ο(h1 ...hn) tendent vers 0 et sont négligeables, les variations de la

fonction dépendent de ah ou L(h1 ... hn) .

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

20

• Synthèse des représentations graphiques

◦ La représentation graphique d'une fonction à n variables (avec n>2) est une hypersurface (surface à plus de 3 dimensions) ; la représentation graphique d'une fonction à 2 variables est une surface.

◦ La représentation graphique d'une application partielle de cette fonction est une section de cette hypersurface par un plan vertical car toutes les variables sont fixées sauf une.

◦ La représentation graphique d'une dérivée partielle de cette fonction est une section de l'hyperplan de la différentielle par un plan vertical.

◦ La représentation graphique de la différentielle est un hyperplan tangent en un point de l'hypersurface de cette fonction.

◦ Un extremum local se traduit graphiquement par un plan horizontal tangent à l'hypersurface

1. Application partielle

• Objectif : Pour étudier une FPV « complexe » ; on la décompose en plusieurs fonctions à 1 variables, plus simple à étudier : les « applications partielles » ; c'est l'outil de base qui va permettre de déterminer les dérivées partielles puis de construire la différentielle.

• Une application partielle s'obtient en fixant toutes les variables sauf une. Ainsi, une FPV à n variables possède n applications partielles qui donnent n dérivées partielles

• Exemple : f(x, y, z) = 3x + 2y – z la première application partielle est f( x) = 3x + 2y – z où y et z sont considérés comme des constantes, seul x varie.

2. Dérivée partielle

Def : La dérivée partielle est la dérivée de l'application partielle correspondante.

Elle se note (∂ f )(∂ xn)

( pente de la tangente dans un plan vertical)

• Exemple :Soit f(x, y, z) = 3x + 2y – z ;

La dérivée partielle selon x se note: (∂ f )(∂ x )

= 3 qui est la dérivée de l'application partielle

f( x) = 3x + 2y – z.

3. Différentielle

• La différentielle est la somme des dérivées partielles, sans oublier la multiplication par les h ( ou dx) ( c'est la somme des différentielles partielles)elle se note : . ; ou encore :

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

21

L(h1 ...hn)=a1 h1 ... an hn ou df ( x1 ... xn (h1 ... hn))=(∂ f )(∂ x1)

h1+...+(∂ f )(∂ xn)

hn

◦ Exemple numérique :

f (x1, x2)=( x1

2)

( x2)

▪ 1ere application partielle : je fixe toutes les variables sauf une, d'où x2 = a, ainsi f

varie seulement en fonction de x1. On a donc : f (x1)=(x1

2)

a

▪ 2eme application partielle : f (x2)=(b2)

x2

où x1=b

▪ 1ere dérivée partielle : f ' ( x1)=2.x1

a=(∂ f )(∂ x1)

▪ 2eme dérivée partielle : f ' ( x2)=−(b2

)

(x 22)=(∂ f )(∂ x2)

▪ Différentielle pour un point donné : x1=b et x2=a

df (b , a )(h1, h2)=h1.(∂ f )(∂ x1)

+h2.(∂ f )(∂ x2)

=2a

x.h1−b2

x2 .h2

(on additionne les dérivées partielles sans oublier les multiplications par h)

▪ Fonction :

f (x1+h1, x2+h2)=[ f (x1, x2)]+[L(h1, h2)]+[ο(h1, h2)]=[x1

2

x2

]+[2a

x1 .h1−b2

x22 .h2]+[ο(h1, h2)]

▪ Ainsi, on peut dire que la variation de h1 autour de x1 et de h2 autour de

x2 induit une variation de la fonction de Δ f ( x)=2a

x1. h1−b2

x2 . h2 .

▪ L'intérêt de cette méthode est de constater l'importance de la variation en fonction de la variable ( x1 ou x2 ou... xn ) et de déterminer le sens de cette variation.

Application : Extrema

Théorème :

◦ Si une fonction à plusieurs variables f est différentiable sur son domaine de définition Ω et si elle admet un extremum au voisinage d'un point ( x1, x2, ... , xn ) n'étant pas

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

22

sur la « frontière » de Ω , alors la différentielle de f en ( x1, x2, ... , xn ) est nulle :df (x1, x2, ... , x n)=0

• A retenir :Si la différentielle s'annule en un point, c'est à dire que toutes les dérivées partielles qui la composent s'annulent, la fonction admet un point critique ; tous les points critiques ne sont pas des extrema Si la fonction admet un extremum en un point, alors la différentielle s'annule; ( car un extremum est un cas particulier des points critiques)

• En particulier, pour un point critique d'une fonction à deux variables, si une application partielle atteint un maximum et l'autre un minimum alors on a un point selle (et non un extremum).

◦ Exemple : f(x,y)= x2 – y2 on obtient f'(x1)= 2x et f'(y1)= -2y◦ Les 2 dérivées partielles s'annulent en 0, donc on a un point critique en (0;0).◦ MAIS 0 est un minimum pour f(x1) et un maximum pour f(y1) ► ce ne peut pas être un

extremum.

V. INCERTITUDES

• La mesure

Lorsque nous prenons une mesure, nous ne pouvons pas prétendre que celle-ci correspond à la valeur exacte de la grandeur mesurée. Que la mesure soit celle d'une longueur, d'une masse, d'un volume ou d'un intervalle de temps, nous devons inévitablement nous rendre à l'évidence que notre mesure est plus ou moins proche de la réalité.

• L'erreur

L'erreur, c'est l'écart entre la mesure et la valeur exacte. Puisque la valeur exacte est souvent inaccessible, l'erreur est inconnue, d'où la notion d'incertitude

1. Incertitude déterministe

• L'incertitude ou la variation sur la fonction y ( Δ y ) est due à celle de sa variable x (Δ x ) : Δ y= f ( x0−Δ x)− f ( x0) .

Il existe 2 cas à retenir : ◦ f est monotone (toujours croissante ou toujours décroissante sur son ensemble de

définition) : L'incertitude ou la variation maximale Δ y(max ) correspond à f (x 0+Δ x) ou f (x 0−Δ x) .

◦ f n'est pas monotone (f est croissante et décroissante sur son ensemble de définition) : L'incertitude ou la variation maximale Δ y(max ) ne correspond pas forcément à

f (x0+Δ x) ou à f (x 0−Δ x) .

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

23

• Nous utiliserons dans ce cas un modèle linéaire ( donc monotone ) sur une fonction à une variable.

• La variation de la fonction représente une fraction des variations de la variable. • Soit Δ y=aΔ x . On peut dire que Δy représente α% de Δx, ou encore que les variations

de y autour de f(x0) représentent α% des variations de x autour de x0. (Rq : α=a

100) .

• On ne distingue pas les cas Δ x>0 et Δ x<0 car la variation de Δ y est de même amplitude quel que soit le signe de Δ x .

• Souvent, on fait une approximation pour arriver à ce modèle linéaire facile à utiliser (à l'aide d'un développement limité)

• Exemple :

• Développement limité de v (x)=K √x au voisinage de x0 .

v (x0+Δ x)=v( x0)+dvdxΔ x+ο(Δ x)=v( x0)+

K(2√x0)

.Δ x+ο(Δ x) <=>

v (x0+Δ x)−v( x0)=K

(2√x0).Δ x+ο(Δ x) <=> Δ y=

K(2√x 0)

.Δ x+ο(Δ x) .

• Donc si l'on néglige ο(Δ x) (approximation), Δ v≈K

(2√x0).Δ x .

• Un problème de notation se pose:◦ On utilise d'abord la différence infinitésimale:

df = f ( x+dx)− f (x)=df.dx

dx= f ' ( x). dx <=> df =

df.dxdx

. Remarque : on peut

dire que les deux dx sont « différents »: en haut c'est la variation autour de x, en bas de la convention pour définir une dérivée (df/dx= f'(x)).

◦ On en déduit Δ f ≈dfdx.Δ x quand Δx est petit .

◦ De même, pour une fonction à plusieurs variables, Δ f ≈a1Δ x1+a2Δ x2+...+anΔ xn se déduit de la différentielle : df =a1 dx1+...+an dn .

• Exemple : f(x;y) = ln (1+xy) :

◦ Je cherche la différentielle : df =y0

(1+x0 y0)dx+

x0

(1+x0 y 0)dy .

◦ Application numérique : pour (x0 ; y0) = (0; 0,5).◦ df = 0,5 dx autrement dit, lorsque x et y varient faiblement autour de 0 et 0,5, les

variations de f représentent environ 50% des variations de x.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

24

2. Incertitude absolue

L'incertitude absolue est une estimation de l'erreur que fait l'expérimentateur. L'incertitude absolue est l'écart maximum possible entre la mesure et la valeur exacte. La mesure et son incertitude absolue constituent un domaine de valeurs possibles à l'intérieur duquel se trouve la valeur exacte.

L'incertitude absolue s'exprime généralement avec un seul chiffre en utilisant les mêmes unités que celles associées à la mesure.Exemple : 23,4 ± 0,5 cm

Formule :

Δ f max≈(∂ f )(∂ x1)

.Δ x1+...+(∂ f )(∂ xn)

.Δ xn

• Les variations des variables peuvent se compenser. On calcule alors l'incertitude en maximisant f :

Δ f max≈∣(∂ f )(∂ x1)

.Δ x1∣+...+∣ (∂ f )(∂ x n)

.Δ xn∣Et non : Δ f max≈∣(∂ f )

(∂ x1).Δ x1+...+

(∂ f )(∂ x n)

.Δ x n∣ Attention ! (piège classique et erreur facile).

• NB : Pensez que pour les incertitudes il vaut mieux trop que pas assez (question de sécurité).

3. Incertitude relative

L'incertitude relative est le rapport entre l'incertitude absolue et la mesure. Ce rapport est habituellement exprimé en pourcentage.Exemple : 23,4 ± 0,5 cm pourrait aussi s'écrire 23,4 ± 2%L'incertitude relative permet de comparer la précision de différentes mesures. La mesure la plus précise est celle dont l'incertitude relative est la plus faible.

• Il s'agit de dff .

• Pour faciliter le calcul, on utilise aussi la dérivée logarithmique de f : d ( ln f )

• [dln( f ( x))]

dx=

1f(x) . df

dx <=> d ( ln ( f ))=

dff

• Pour calculer la dérivée logarithmique d'une fonction de plusieurs variables, suffit de prendre les variables les unes après les autres et appliquer cette dérivée à chacune d'elles

• Exemple : f(x;y) = 3xy-²ln(f) = ln(3xy²) = ln(3) + ln(x) + ln(y-²) = ln(3) + ln(x) – 2ln(y) puisque ln(xy/z) = ln(x) + ln(y) -ln(z) Cette décomposition du logarithme permet de simplifier les calculs des dérivés partiels, ce

qui nous donne:ln(f)'= dx/x – 2y-3dy/y-2

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

25

dff=d ln ( f )=

d ln ( f )dx

dx+d ln ( f )

dydy= 1

xdx− 2

ydy

• Voici quelques phrases qu'on peut déduire (les plus demandées en qcm) :

◦ Pour (x;y)=(2,1) càd pour une variation dx autour de 2 et dy autour de 1, la variation

relative de f (càd df/f) est d'environ 12

dx−2dy .

◦ Si y est fixé (dy=0), un variation dx autour d'une valeur de x élevée provoque une variation relative environ nulle. En effet : df/f = dx/x, donc si x est très grand dx/x tend vers 0 et donc df/f aussi.

◦ Une petite augmentation de x autour de x0 positif, et une petite diminution de y autour de y0 positif, provoque une petite augmentation relative de f. En effet : dx/x0 > 0 et −2dy

y0

>0 sachant que y0 est positif et que dy est négatif.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

26

Notions élémentaires – fonctions QCMs

QCM 1 : Concernant les propriétés sur les fonctions :A. La fonction inverse est continue sur R-* et sur R+*. Il s'agit d'une fonction paire.B. La fonction inverse a pour limite -∞ en 0-.C. Une fonction polynôme est toujours impaire.D. Un polynôme se comporte à l'infini de la même façon que le monôme de plus bas degré qui lui est équivalent.E. La fonction racine n'a pas de propriété de symétrie.

QCM 2 : Trouver les propositions exactes :A. La fonction ln est définie sur R+ comme la fonction réciproque de exp.B. La fonction cos est décroissante sur (0 ; π).

C. La fonction tan est définie par tan x=cos xsinx

.

D. Pour la fonction tan, limite en π2

par valeur inférieure = +∞.

E. Le nombre dérivé a en xo est noté f'(xo) ou dfdx

ǀ xo.

QCM 3 : Indiquer pour les propositions suivantes si elles sont vraies ou fausses :

A. (tan x )'=  1+tan ² x

B. tan x '=  1

cos ² xC. lim

x∞[10,8 x ]=1

D. limx∞

[ 41,1x ]=4

E. limx∞

[ 41,1x ]=∞

QCM 4 : Une fonction peut être dite :A. Impaire si f(x) = f(-x) uniquement.B. Paire si elle est centrée en 0 et que f(x) = f(-x) uniquement.C. Impaire si elle est symétrique par rapport à l'origine et que f(-x) = -f(x) uniquement.D. Impaire si son ensemble de définition est symétrique par rapport à l'origine du repère, f(-x) = -f(x) et sa courbe est symétrique par rapport à l'origine du repère uniquement.E. Paire si elle est symétrique par rapport à l'axe des abscisses uniquement.

QCM 5 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :A. La fonction f(x) = x² est paire.B. Ln (exp (x)) = x pour tout x Є ]-∞ ; +∞[.C. La fonction tangente est défini par tanθ = cosθ/sinθ.D. La fonction tangente est croissante sur la totalité de son ensemble de définition.E. Si une fonction f admet un DL1 en xo alors f est dérivable en x0.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

27

QCM 6 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :A. Ln(ab) = ln(a) + ln(b).B. Ln (a3)= 3ln(a).C. ln a=ln a .D. La fonction tangente est paire.E. La fonction cosinus est paire. QCM 7 : Soient f x = x ; g(x) = 3x + 2 ; h(x) = f°g :A. h x =3 x2 .B. h(x)= 3 x + 2.C. La fonction h(x) est définie sur .ℝD. La fonction h(x) est définie dur +.ℝE. La fonction h(x) est définie sur [-2/3; +∞[. QCM 8 : Soit f(x)= (x4 + 5x3 -10x +3)²A. f'(x)= 2x (4x6 + 15x4 -10x²).B. f'(x)= 2x (4x3 + 15x² -10).C. f'(x)= 2 (4x3 +15x² -10)(x4 +5x3 -10x +3).D. L’ensemble de définition de la fonction est ]-∞ ; +∞[. E. L’ensemble de définition de la fonction est : +.ℝ QCM 9 : Calcul de limites : Quelle(s) est(sont) la(ou les) proposition(s) inexacte(s) :

A. limx→0+

x3+5x2

3x4+2x

=+∞ .

B. limx∞

xe – x=∞ .

C. limx 5+

cosxln x2 – 25=–∞ .

D. limx1

1x1

=∞ .

E. limx→+∞

ln(x )x

est une FI.

QCM 10 : Soit g(x) = 1/( ln x – 1) :A. g(x) admet une asymptote verticale : y = e.B. g(x) admet une asymptote horizontale x = 0.C. g(x) n’admet aucune asymptote.D. L’ensemble de définition de g est +.ℝE. L’ensemble de définition de g est : [+1 ; e[ ]e ; +∞[.∪

QCM 11 : Soit g(x)= 1/( ln x -1) :

A. limx e–

g x=–∞ .

B. limx e–

g x=∞ .

C. limx e+

g x=∞ .

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

28

D. limx e+

g x=–∞ .

E. g(x) est une fonction impaire.

QCM 12 : Soit f(x,y,t) = e3t (x2 + y)/t :A. ∂f/∂x = 2xe3t/t.B. ∂f/∂y = e3tx2/t.C. ∂f/∂t = (e3t (x2+ y) (3t – 1))/t2.D. Différentielle de f : df= (2xe3t/t )dx + (e3tx2/t)dy + (e3t (x2+ y) (3t – 1))/t2dt.E. Différentielle de f : df= (2xe3t/t )dx + (e3t/t)dy + (e3t (x2+ y) (3t – 1))/t2dt. QCM 13 : Soit f(x)= x exp(-x2/2) :A. f ’(x)= exp (-x2/2) (1+x2)B. Le tableau de variation de f est :

x -∞ -1 -1 1 1 +∞

f ‘(x) + - +

F (x) Croissante Décroissante Croissante

C. f admet deux extremums sur son ensemble de définition.D. f admet un minimum local nul. E. f admet un maximum local.

QCM 14 : Soit la fonction f x =2cosx2sinx

:

A. f ' x=−2 sinxsin²x2 cosxcos²x

2sinx ²

B. f ' x=−2 sinx2cosx1

2sinx ²

C. f ' x=2 sinx2cosx12sinx ²

D. L'ensemble de définition de la fonction est R.E. L'ensemble de définition de la fonction est ]-8 ; 1[ U ]1 ; +8[.

QCM 15: Soit l'équation d'une mole de gaz parfait PV=nRT où P, V, n et T représentent respectivement la pression, le volume, le nombre de mole, la température. R est une constante.A. V/ T = n/PB. P/ V = (nRT)/VC. T/ P = V/nD. n/ T = -(PV)/(RT2)E. n/ T = (PV)/(RT2)

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

29

QCM 16 : Soient f(x) une fonction monotone sur R strictement croissante.g(x) une fonction monotone sur R strictement décroissante.h(x) une fonction monotone sur R strictement décroissante.A. h>0, h(x).f(x) est croissant sur R. B. h<0, h(x).f(x) est décroissant sur R.C. fog est croissant sur R.D. fog est décroissant sur R.E. goh est décroissant sur R.

QCM 17 : Soit T=2 Lg

:

A. ∂ T∂ L=

Lg

B. ∂ T∂ L=2

Lg

C. ∂ T∂ g= Lg

D. ∂ g∂ L=4

2

T

E. ∂ g∂ L=−162 L

QCM 18 : Soient f x =3 x4 et g x= x26 x5 :

A. f o g x =3 x4 ²63 x45

B. f o g x =3 x²6x54

C. f o g x =9 x542 x

D. L'ensemble de définition de la fonction f°g est ℝ+.E. L'ensemble de définition de la fonction f°g est ]–∞ ; -5[ U ]-1 ; +∞[.

QCM 19 : Soit la fonction h x =sin x cos– x :

A. h ' x=cos x cos– x sin x sin– x

B. h ' x=cos² xsin2x

C. Dh = .ℝD. Dh = [-1;1].

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

30

E. Si f x ; y=sin xcos – y alors ∂ f∂ x=cos xcos – y

QCM 20 : Soit la fonction f définie par f x =3 x2

2k

3 x2 :

A. Df = ]–∞ ; 0[ U ]0 ; +∞[.

B. Df = ]–∞ ; 0] U ]0 ; +∞[.

C. ∂ f∂ k=

2

3x3

D. f ' x=6 x– 3 k

x4

E. Df = .ℝ

QCM 21 : L = a tan b où a et b sont des variables indépendantes. Sachant que a=4 et b=45° et que ces valeurs sont connues à 2% près, quelle est l'incertitude de L ?A. 6 %.B. 8 %.C. 10 %.D. 16 %.E. 18 %.

QCM 22 : Soit f(x)=(2x²+mx+1)/(x+1) : déterminer m pour que la fonction définie par f(x) ait une asymptote oblique passant par l'origine. On nommera cette AO : E(x).A. E(x)= ax.B. m=0.C. m=1.

D. limx∞

f x =∞ .

E. E(0)=1.

QCM 23 : Soit f(x)=x/ln(x) :A. Df =]–∞ ;1[∪]1;∞[ .

B. limx0

f x=FI .

C. f(x) admet une asymptote verticale : V=> x=1.

D. f x '= 1ln x– 1

ln x 2 .E. lim

x –1f x= lim

x1f x .

QCM 24 : Quelle(s) est(sont) la(les) proposition(s) exacte(s) :

A. Si f x =x410 x2 –5 x33 alors f ’ x =34 x3

20 x – 5x 410 x2 –5 x32 .

B. Si g x=10 x –5 x2 – 10x232

alors g ' x =10 x x2

3– 5 x2 – 104 x x233

.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

31

C. Si g x=10 x –5 x2 – 10x232

alors g ' x =10 x x2

3– 5 x2 – 104 xx234

.

D. Si g x=10 x –5 x2 – 10x232

alors g ' x =10x2

33 –10x x23−5 x2 – 104 x

x233

.

E. Si g x=10 x –5 x2 – 10x232

alors g ' x =10x2

33 – 10x x235 x2 – 104 x

x233

.

QCM 25 : Soit f la fonction définie par f(x)=cos²(x) :

A. f est une fonction périodique de période

2.

B. f est une fonction périodique de période .

C. L'axe de symétrie de la fonction f est x=

2.

D. L'axe de symétrie de la fonction f est x= .E. La fonction f ne présente pas d'axe de symétrie.

QCM 26 : Soient f x =6 x212 x4 et g x=

1

x32 :

A. f °g x =6

x34

12

x324 .

B. g ° f x =6

x34

12

x324 .

C. f °g x =236x322 x34

x34

D. L'ensemble de définition de la fonction f est \{-3}.ℝE. L'ensemble de définition de la fonction g est \{-3}.ℝ

QCM 27 : Soit la fonction f x , y , z=x – y

z y 2 :

A. ∂ f∂ xx , y , z =

1

z y 2.

B.∂ f∂ yx , y , z =

− z y2−2x− y z y z y 4

.

C. ∂ f∂ xx , y , z =

−1

z y 2.

D. ∂ f∂ yx , y , z =

− z y−2x− y

z y 3.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

32

E. ∂ f∂ yx , y , z =

−2x y−z

z y 3

.

QCM 28 : Quelle(s) est(sont) la(les) proposition(s) exacte(s) :

A. Si f x , y , z=5 x4 yx

z y alors

∂ f∂ xx , y , z =

54yz y

.

B. Si f x , y , z=5 x4 yx

z y alors

∂ f∂ yx , y , z =

−5x4xy

z y 2.

C. Si g x , y , z =x25y4zy alors

∂ g∂ xx , y , z =5y4zy .

D. Si g x , y , z =x25y4zy alors

∂ g∂ zx , y , z =9yx2

.

E. Si h x , y , z =3 z

2 x y alors

∂ h∂ yx , y , z =

−1

2x y2.

QCM 29 : Soit la fonction : f(x,y,z) = 2x²+(1/y)z … :A- La première application partielle de f considère x comme une variable et y et z nulles.B- Dans la seconde application partielle, y et x sont constantes.C- La dérivée de la troisième application partielle de f est : (-1/y²).D- Pour dériver cette fonction il faut additionner ses dérivées partielles.E- f'(x,y,z) = 4x+(1/y)+(z/y²).

QCM 30 : Soit f la fonction définie par f(x)= −5x3+2x+4

3x+2. Indiquer si les propositions sont

vraies ou fausses :A. f est définie sur ]-∞ ; -3/2[ U ]-3/2 ; +∞[.B. f est définie sur ]-∞ ; 0[ U ]0; +∞[.

C. f '(x) = −15x2+2

3.

D. f '(x) = (−15x²+2)(3x+2)+3(5x3

−2x−4)(3x+2) ²

.

E. f est équivalente en ±∞ à un polynôme de degré impair.

QCM 31 : Soit f la fonction définie par f(x) = −cos (x )sin (x )

. Indiquer si les propositions sont

vraies ou fausses :A. f(x) = −tan( x) .B. f est périodique de période π.

C. f '(x) = 1

tan² ( x)cos² ( x).

D. f '(x) = 1

sin² ( x).

E. La limite de f quand x tend vers π+ (c'est-à-dire à droite de π) est -∞.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

33

QCM 32 : Soit la fonction f définie par f(x,y,z) = 3zy+x²+5y3

2. Indiquer si les propositions

sont vraies ou fausses :A. f et ses dérivées partielles sont définies sur IR3.

B. ∂ f∂ x=x .

C. ∂ f∂ y=

15y²2

.

D. Une application partielle est une fonction avec plusieurs variables.E. Chaque application partielle est équivalente à un plan 3D.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

34

Notions Élémentaires - Fonctions, ce qu’il fallait répondre :

1 : BE 2 : BDE 3 : ABCE 4 : D 5 : ABE6 : ABE 7 : AE 8 : CD 9 : ABDE 10 : E11 : AC 12 : ACE 13 : CE 14 : ABD 15 : D16 : D 17 : A 18 : B 19 : ACE 20 : A21 : E 22 : AD 23 : CD 24 : AE 25 : B26 : ACE 27: ABDE 28 : A 29 : D 30 : D31 : BCDE 32 : AB

Pourquoi certaines réponses sont fausses :

QCM 1 : A. Cette fonction est impaire. C. Les fonctions polynômes peuvent êtres paires aussi, comme par exemple la fonction f(x)=x²

D. De la même façon que le monôme de plus haut degré.

QCM 2 : A. sur R+*.C. tan(x) = sin(x)/cos(x).

QCM 3 : A. (VRAI) car tan(x) = sin(x)/cos(x), on dérive sur le mode de (u/v)'= (u'*v- u*v')/(v2).On obtient (cos2x + sin2x)/cos2x qui par simplification peut donner les 2 résultats. B. (VRAI) cos2x + sin2x = 1.D et E. Pour Ax si A>1 alors Ax tend vers l'infini si x tend vers l'infini. Si 0<A<1

alors Ax tend vers 0 quand x tend vers l'infini

QCM 4 : A. Pair => f(x) = f(-x) et Impair => f(-x)= -f(x).B. Si D(f) (ensemble de définition) est symétrique par rapport à l'origine. f(x)=x2 +1 est une fonction paire même si f(x) n'est jamais égal à 0 ; mais D(f)=IR qui est symétrique par rapport à 0.C. et E. Voir B et 3 conditions nécessaires ( f(x)= f(-x), symétrie de D, symétrie par rapport à l'axe ou l'origine respectivement pour les fonctions paires et

impaires.

QCM 5 : C. tanθ=sinθ/cosθ.D. La fonction tangente n'est croissante que sur les parties connexes de l’ensemble de définition (dire qu'elle est croissante sur la totalité de son ensemble de définition voudrait dire que pour tout x1<x2 alors tan(x1)<tan(x2) ce qui est faux si on regarde par exemple -π/3 et 0) car la fonction n'est pas

continue.

QCM 6 : C. ln( a ) = ln(a1/2)=½ ln(a).D. tan(-x)=sin(-x)/cos(-x)= -sin(x)/cos(x)= -tan(x). La fonction tangente est donc impaire (symétrie par rapport à un point et non axiale).

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

35

QCM 7 : B. fog=√(3x+2). C. et D. : Conditions pour la Df : 3x+2> ou =0 <=> x>ou= -2/3Df = (-2/3 ; +∞). Attention, même si effectivement + est inclus dans Df, ℝ

on demande toujours la TOTALITE de l'ensemble.

QCM 8 : A. et B. Cf C. : Décomposons la fonction f en 2 fonctions : g(x)=x² eth(x)= x4+5x3-10x+3.f(x)= goh. f'(x)=(goh)'=h'*g'oh. h'(x)= 4x3+15x²-10 et g'(x)=2xf'(x)=2(4x3+15x²-10)(x4+5x3-10x+3)

D. Vrai, car c'est une fonction polynôme.E. Cf D.

QCM 9 : Attention : « Réponses INEXACTES » ce piège est seulement tombé aux concours d'UE6 du 2e semestre pour l'instant, mais pourrait tomber dans les autres matières aussi, vous forçant de lire attentivement chaque énoncé. A. Pour une limite vers 0, la limite d'une fonction rationnelle polynôme est égale à celle de ces termes de plus bas degrés. Ici, la fonction équivalente en 0 est 5x²/2x=5x qui tend vers 0.

B. Elle est égale à 0 car en l'∞, la fonction équivalente de xe-x est e-x et lim e-x en +∞ = 0

D. Elle est égale à ½.E. Elle est égale à 0 (x est prioritaire devant ln(x)).

QCM 10 : A et B. lim x→+∞ =0 et il n'existe pas de limite en -∞ puisque la fonction n'existe pas sur ce domaine. Donc asymptote verticale en x = e et asymptote horizontale en y = 0.

C. Il y a 2 asymptotes (cf A et B). D.puisque le dénominateur doit être différent de 0 et dans ln(x), x doit être strictement supérieur à 0

QCM 11 : B. limx→e- g(x)=1/((√(ln(e-)) -1)=1/(1- -1)=1/0- = -∞D. limx→e+ g(x)=1/((√(ln(e+)) -1)=1/(1+ -1)=1/0+ = +∞E. g(-x) est différent de –g(x), de plus le domaine de définition n'est pas symétrique par rapport à O.

QCM 12 : A. f(x,y,z)= e3tx²/t + e3ty/t. df/dx=2e3t/t

B. df/dy=e3t/t C. (u/v)'=(u'v-v'u)/v² df/dt= (3e3t(x²+y)t-e3t(x²+y))/t²= (e3t(x²+y)(3t-1))/t²

D. voir A,B et C

QCM 13 : A. (uv)'= u'v+v'u :f’(x)=e-x²/2-xe-x²/2x = exp (–x²/2) (1-x²).B. Etudions le signe de la dérivée :e-x²/2 est toujours supérieur ou égal à 0.

1-x²≥ 0 → 1≥ x² → 1≥x²≥ -1 donc f'(x)≥ 0pour x compris entre -1 et 1 Le tableau correct est donc décroissante puis croissante puis décroissante sur

les mêmes intervalles.D. Il n'est pas nul. Il se trouve au niveau de x=1 puisque la fonction est

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

36

décroissante et ensuite croissante, il y a donc un minimum local. F(1)= e-1/2 et non 0

QCM 14 : A. B. et C. On prend u x =2cosx et v x=2sinxAlors, on a u ’ x =−sinx et v ’ x =cosx

f ' x=u ' .v−u.v '

v²=−sinx.2sinx−2cosx .cosx

2sinx

=−2 sinx−sin²x−2cosx−cos²x

2sinx ²=−2sinxsin²x2cosxcos²x

2sinx ²

Comme sin²xcos²x=1 , f ’ x =−2 sinx2 cosx1

2sinx ²

D. et E. L’ensemble de définition : 2sinx≠0Or, on sait que : −1sinx1En ajoutant 2, on obtient −122sinx12 → 12sinx3Donc 2sinx 0 (jamais nul) donc l’ensemble de définition est R.

QCM 15 : A. Ecrivez d'abord l'équation demandé, ici V =nRT/P avant de la dériver. On obtient dV/dT=(nR)/P.B. P=nRT/V On obtient dP/dV= –(nRT)/V2.

C. T=PV/nR On obtient dT/dP= V/(nR).D. n=PV/RT, dn/dT= -RPV/(RT)²= -PV/(RT²)E. n/ T = -(PV)/(RT2).

QCM 16 : A ex : h=e-x et f(x)=4x B. ex : h= -ex, et f(x)= 4x

C. fog décroissante.E. goh croissante.

QCM 17 : A et B. dt/dL=(1/g)/(2√(L/g))*2π = π/(g√L/g)= π/(√(g²L/g))

C. dT/dg= =

D. et E. T= 2π √(L/g) → T/(2π)=√(L/g)→ (2π/T)²=g/L → g=(2π/T)²L . ∂ g∂ L=

4π²

T 2 .

QCM 18 : A. Il s'agit de g°f(x) et non de f°g(x). fog=3√(x²+6x+5)C. Il s'agit de g°f(x) et non de f°g(x).D. Pour trouver l'ensemble de définition, il faut x2

6 x50 , on obtient :x1= -5 et x2= -1.

x –∞ -5 -1 +∞x² + 6x + 4 + 0 - 0 +

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

37

E. cf D.

QCM 19 : B. Cf A. cos(-x)=-cos(x), -sin(x)=sin(-x) (uv)'=u'v+v'u : h'(x)=cos(x)cos(-x)- sin(x)sin(x)=cos(x)cos(-x)+sin(-x)sin(x)

D. Cf C. Aucune restriction sur le domaine de définition

QCM 20 : ATTENTION ici on a f(x) et non f(x ;k) donc k est une constante !B. cf A. puisque le dénominateur doit être différent de 0C. Le dérivé d'une constante est égal à 0

D. f '(x) =6x-(2k*3x*2)/(3x²)² 6x+−4k

3x3 .

E. cf A... .

QCM21 : A,B,C,D. dL/da=tan(b)=sin(45°)/cos(45°) (pour b=45°) = =1 dL/db= a/cos²(b)=4/(2√2)²=8 Vu que les valeurs sont connues à 2% près, on a L'incertitude= 1*2%+8*2%=18% puisque incertitude L=incertitude de L sur a+ incertitude de L sur b

QCM 22 : A. Vrai : b=0 car AO passe par l'origine.B. m=2. Une asymptote oblique implique que lim f(x)-(ax+b)=o quand x→+∞. On pose donc lim(2x2+mx+1)/(x+1)-(ax+b)=0 => lim((2-a)x2+(m-a-b)x+(1-b))/(x+1)=0 avec b=0D'où lim 2-a=0 => a=2 ; lim m-a=0 => m=a et lim1/(x+1)=0 pour tout x.C. m=2.E. E(0)=0, A0 passe par origine.

QCM 23 : A. ]0;1[ ]1;+∞[.∪B. lim

x0f x=0 .

C.Pour x=1, ln(x)=0 → AV : x=1

E. limx –1

f x=–∞ .

limx1

f x =∞ .

QCM 24 : A. (un)'=nu'un-1

B. C. et D. Cf E. On dérive, puis on met tout sur le même dénominateur. (u/v)'=(u'v-v'u)/v²

QCM 25 : A. Cf B. cos2(x+)= -cos(x) * -cos(x)= cos2(x) Voir cercle trigonométrique

D. E. La fonction ne présente pas un seul axe de symétrie mais plusieurs dont x=

,

2, … .

QCM 26 : B. g ° f x =1

6x212x432

=1

6x212x72

.

D. Définie sur IR.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

38

QCM 27 : C. Cf A.

QCM 28 : B. Car de la forme u/v avec u=5 x4 xy , u ’=4 x , v=z y , v '=1 .

D'où : ∂ f∂ yx , y , z =

4x z y−5x4xy.1

z y 2=

4xz4xy−5x−4xy z y 2

=4xz−5x z y 2

.

C. Car g x , y , z =x25y4zy =5yx2

4zyx2 .

D'où ∂ g∂ xx , y , z =10xy8xyz=xy 108z .

D. ∂ g∂ zx , y , z =04yx2

=4yx2

.

E. Si on prend : u=3 z , u ’=0 , v=2 x y et v '=1 .

∂ h∂ yx , y , z =

O×2x y −3z×1

2x y 2=

−3z2x y2

QCM 29 : A.Constantes ! Pas nulles, attention important pour les dérivées.B. x et z !C. 1/y.E. 4x dx+(1/y) dz -(z/y²) dy.

QCM 30 : A. et B. f est définie sur ]-∞ ; -2/3[ U ]-2/3 ; +∞[. Attention à ne pas confondre 2/3 et 3/2 dans la précipitation, il faut toujours bien vérifier.C. Voir D.E. Elle est équivalente à un polynôme de degré pair: -5x3/3x=-5x²/3

QCM 31 : A. f(x) = −1

tan( x)C et D. f'(x)=(sin(x)sin(x)-cos(x)*(-cos(x)))/sin²(x) =(cos²(x)+sin²(x))/sin²(x)=1/sin²(x)= =1/(tan²(x)cos²(x))

QCM 32 : C. ∂ f∂ y=3z+

15y²2

.

D. C'est une fonction d'une seule variable.E. C'est équivalent à un plan 2D.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

39

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

40

II - Biostatistiques - Synthèse

MESURE DES PHENOMENES BIOLOGIQUES, NOTION DE VARIABILITÉ ET DE LEUR SOURCE

Les modèles mathématiques sont des représentations de la réalité.Ils sont :

• Simplifiés.• Multiples.• Jamais parfait.• Un cadre mathématique.• Prédictifs (théorie → réalité) ou descriptifs (réalité → théorie).

Dans les métiers de la santé, les décisions sont sous incertitude.

1. Sources de variabilité

Ainsi, une mesure comporte toujours une erreur (le but étant de la limiter) par rapport à la réalité. Il convient alors de tenir compte de plusieurs sources de variabilités pour pouvoir conclure sur un résultat :

Équation x i , j ,k ,l = μ + a i + bi , j + c i , j ,k + d i , j ,k ,l

X = μ + A + B + C + D

Valeur Mesure in fine

Valeur moyenne de la population

Valeur spécifique de Dupont

Valeur de Dupont à

l'instant de la mesure

Variation due aux

conditions de mesure

Variation due à l'erreur

de mesure

Variabilité Valeur individuelle

Inter-individuelle

Intra-individuelle

Analytique (pré-

instrumentale)

Analytique (instrumenta

le)

Valeur Hypothétique, vraie « Bruit »

(Cette addition est à comprendre comme la somme des facteurs influençant la mesure et non au sens algébrique, les QCMs là-dessus sont répétitifs et permettent d'intégrer cette notion)

• La variabilité inter-individuelle met en avant la différence entre les individus : on mesure notre variable au sein de la population.

• La variabilité intra-individuelle est la variabilité biologique d'un moment à un autre chez un même individu.

• Exemple : Un individu ne présentera pas toujours le même taux de glycémie et ce même si les conditions de mesures sont considérées comme identiques.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

41

• La variabilité analytique pré instrumentale est liée aux conditions d'examen. • Exemple : La fréquence cardiaque pour un même individu sera différente selon

si elle est mesurée au repos ou après un effort. • Tandis que la variabilité analytique instrumentale est liée à l'incertitude des instruments

diagnostiques.• En pratique la variabilité analytique (pré-instrumentale + instrumentale) est toujours

présente quelque soit la mesure

Les erreurs possibles sur une mesure sont de deux types :• Erreur aléatoire => Manque de précision.• Biais => Manque d'exactitude.

Une même mesure peut cumuler un manque d'exactitude et un manque de précision.Une mesure précise peut être avec ou sans biais et donc inexacte ou exacte.

L'exemple de la balistique (ou du tir à l'arc) est particulièrement intéressant : si on manque d'exactitude mais qu'on est précis les balles iront toujours au même endroit mais à côté de la cible, tandis que si l'on manque de précision, on visera la bonne cible mais on visera mal et les balles iront quand même à côté tout en se répartissant autour de la cible de manière aléatoire (si on tire un nombre assez important de balles, elles décriront un halo autour de la cible sans, en théorie, jamais l'atteindre!)... Le but est donc de bien viser tout en visant la bonne cible et d'allier précision et exactitude : éviter les biais (=décalages) et réduire l'aléa (qui parasite la mesure).

• On passe du « monde hypothétique, vrai » (μ + A) au « monde expérimental, observé » (X = μ + A + B + C + D) par DEDUCTION c'est à dire prédire à partir d'une MODELISATION théorique (par exemple la météo)

• On passe du « monde expérimental, observé » (X = μ + A + B + C + D) au « monde hypothétique, vrai » (μ + A) par INDUCTION (par exemple trouver une théorie à partir d'un fait observé).

2. Décomposition de la variabilité d'une mesure

Si variabilité de X :

Plus cette variabilité est celle de A par rapport à celle de B, C, D, plus la distinction entre les individus augmente.

¡ ATTENTION !Il existe d'autres incertitudes sur : les causes des maladies, le pronostic, l'efficacité des traitements... En fait il en existe pour chaque facteur qui s'ajoute et qu'il faut prendre en compte.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

42

STATISTIQUES DESCRIPTIVES

I. MESURE DE LA TENDANCE CENTRALE

Il s’agit de trouver un indicateur de position centrale et donc de résumer des variations dans la répartition des différentes valeurs, celui-ci nous servira ensuite de référence à partir duquel on déterminera l’éloignement des autres valeurs et donc la puissance du test statistique :

• La moyenne : Pour les variables QUANTITATIVES, c’est la plus fréquemment utilisée.

Si on a n fois x, on calcule la moyenne pondérée : E ( X )= x=  1n

   ∑i=1

n  ni x i

{E(X) correspond à l'espérance mathématique de la série statistique, càd la moyenne théorique et peut être différente de celle observée, mais les deux sont souvent confondues}

• La médiane : Pour les variables QUANTITATIVES ET QUALITATIVES ORDINALE.C’est la valeur du caractère correspondant à un effectif cumulé égal à la moitié de l’effectif total (valeur pour laquelle il y a 50% de l'effectif au delà et 50% en deça).ATTENTION :

• si le nombre N de valeur est impair, il ne faut pas prendre la valeur correspondant à N/2 mais bien celle de (N+1)/2 !!!!!

• si le nombre N de valeur est pair la valeur médiane peut être TOUTE valeur de l'intervalle [x(N/2) ; x (N/2 +1)], on parle d'intervalle médian : ◦ ex : pour la série {3;8;10;15;21;27;31;39} l'intervalle médian est {15;22}

• si détermination par le calcul : TOUJOURS classer les valeurs par ordre croissant

ASTUCE : Pour le calcul de la médiane, plutôt que d’essayer de déchiffrer la formule du cours qui ressemble à rien, reportez vous à l’exemple ci-dessous qui risque de vous inspirer un peu plus…

• Le mode : Pour les variables QUANTITATIVES DISCRETES ET QUALITATIVES, c'est aussi le seul paramètre utilisable pour les variables qualitatives nominales ! C’est la valeur de la série qui a le plus grand effectif (fastoche), pour les variables continues on parle de classe modale (la pointe, le sommet, l'apex de la courbe! Ce qui est « à la

mode » est ce que fait le plus grand nombre de personne en général).ATTENTION : une distribution peut présenter plusieurs modes (→ unimodale, bimodale, plurimodales...)REMARQUES : lorsque la distribution est symétrique, la moyenne, la médiane et le mode sont confondues. En revanche, si la distribution est biaisée on aura :◦ A droite (plus étalée à droite) : Mode<Médiane<Moyenne (à droite du mode et de la

médiane) .◦ A gauche (plus étalée à gauche) : Mode>Médiane>Moyenne (à gauche du mode et de la

médiane).

• Quartiles : Quartiles partagent la série en 4 intervalles de même taille =>25%.Déciles partagent la série en 10 intervalles de même taille =>10%.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

43

Percentiles partagent la série en 100 intervalles de même taille=>1%Remarques:

• Le mode est le seul paramètre utilisable pour les variables qualitatives nominales .

• Q2 = médiane • Attention à ordonner les données par ordre croissant.

II. MESURE DE LA DISPERSION

Après avoir déterminé la valeur centrale, pour bien connaître notre série statistique il nous reste à évaluer comment les autres valeurs de la série se disposent autour de celle-ci…Ces indicateurs de dispersions sont pour les variables QUANTITATIVES

• Etendue : xmax-xmin càd la différence entre la plus grande et la plus petite des valeurs observées de la variable (sert à évaluer « l’étalement » de la série et déterminer des valeurs aberrantes = trop écartées, qui sortent du cadre logique de la mesure) => Peu stable car n'utilise que 2 données. ◦ Attention à ne pas confondre étendue et amplitude

• Espace interquartile : Le plus souvent entre le 1er et le 3ème quartile : QR=Q3-Q1=P75-P25REMARQUE : Les quartiles et les intervalles interquartiles sont représentés en boxplot

• Ecart moyen :  ∑i=1

n

(x i− x )

n

Rq : la somme est toujours nulle, donc on utilise plutôt :

• Variance et écart-type :

o Variance : c’est la moyenne des carrés des écarts à la valeur moyenne.

σ ²=  ∑i=1

n

(x i− x) ²

n=> La variance augmente avec la dispersion des valeurs.

o Ecart-type : C’est la racine carré de la variance. Il est mesuré dans la même unité que la variable.

σ=√(∑i=1

n( x i− x ) ²

n)

Attention : Un changement d’origine ne modifie pas la variance : σ ( x+b)=σ ( x ) .

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

44

Donc si y=a x+b   alors σ 2 ( y)=σ ²( x ) et σ (y)= a   σ ( x )

o Variance et écart-type estimé : Si on ne connaît pas l’écart-type de la population, on ne l’estime pas par celui de l’échantillon mais par la formule :

s=nσ

n−1

Attention : On utilise σ lorsqu’il s’agit de l’échantillon et « s » lorsqu’il s’agit d’une estimation à

l’échelle de la population.

• Coefficient de variation : Il est super utile car il permet de comparer différents phénomènes quelques soient leurs unités (par exemple de faire une association entre une série statistique sur le poids des PACES par rapport à leur nombre d’heures de travail), on dit qu'il est

indépendant de l'unité de mesure, en pratique il est souvent exprimé en % : CV= σ x

Remarque, on utilisera de préférence pour :

▪ Une distribution symétrique : médiane, espace inter quartile, quantiles.▪ Une distribution asymétrique : moyenne et écart-type.

Astuce : Apprenez par cœur la synthèse sur les indicateurs de tendance centrale, ça risque de vous servir pour les QCM !

Démarche statistique : Description des données de l'échantillon → Tests statistiques → Généralisation → Conclusion sur la population

III. EXEMPLE

Un échantillon de PACES a été interrogé, voici le résultat des différents poids recensés en milieu d’année, la moyenne de cette série est 70 et l’écart-type est 14.

Poids [50;60[ [60;70[ [70;80[ [80;90[ [90;100[

Effectif 20 40 20 15 5

A. La moyenne de cette série est sous la forme    ∑i=1

n  ni x i

n avec les xi représentés par les centres

de classe.B. La médiane de cette série est 65.C. Le mode est 65.D. Le coefficient de variation de cette série est égal à 0.2.E. Le moment d’ordre 1 est égal à 70.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

45

Réponse : AE

B. On sait que la médiane se situe dans la classe [60 ;70[ puisque c’est dans celle-ci que se situe l’effectif cumulé croissant 50. Mais elle ne se situe pas au centre de la classe puisque les effectifs dans chaque classes ne sont pas les mêmes, voici la méthode pour la calculer (méthode du cours) :

x Ecc60 20

Mediane 5070 60

Ecc = Effectif cumulé croissant.

M e−6070−60

= 50−2060−20

=34⇔ (M e−60 )=¿ 30

4 ⇔ Me= 67,5

Autrement formulé : Mediane → 50% des Ecc Amplitude de l'intervalle [60;70] = 10 1 effectif inclus dans [60;70] correspond donc à 10/40 = ¼ de l'intervalle [60 ; 70]Or, on sait que l'effectif cumulé croissant 50 correspond à 20 de l'intervalle [50;60] + 30 de l'intervalle [60;70]). Donc Me = 60 + 30 x ¼ = 67,5C. Le mode n’est là non plus le centre de classe (malgré qu’il appartienne à la classe

[60;70[ qui a le plus grand effectif) car les effectifs correspondant aux classes qui l’entourent ne sont pas les mêmes. Autrement dit, sur une représentation graphique les pentes qui entourent le mode (représenté par le sommet) ne sont pas les mêmes.

D. Le coefficient de variation est C V=s

x , il ne faut donc pas utiliser l’écart-type mais

son estimation s=nσ

n−1>σ donc C V>0,2 .

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

46

PROBABILITÉS CONDITIONNELLES

I. GÉNÉRALITÉS :

• On note (E) l'ensemble des événements élémentaires possibles. P(E) =1• Soient A et B deux événements élémentaires possibles.

◦ A∈(E) 0⩽P (A)⩽1

◦ B∈(E) 0⩽P (B)⩽1

• On note ◦ A événement contraire de A. P (A)=1−P(A)

◦ A∪B ensemble des événement qui réalisent soit A soit B, soit les deux. ◦ A∩B ensemble des événements qui réalisent à la fois A et B.

On distingue deux cas :

A et B sont incompatibles (exclusifs) A et B ne sont pas incompatibles

P (A∩B)=0

P (A∪B)=P (A)+P (B)

P (A∩B)≠0

P (A∪B)=P (A)+P (B)−P (A∩B)

Il existe 3 types d'ensemble (E) : • Fini • Infini dénombrable → Ensemble des entiers • Infini indénombrable → Ensemble des réels

II. PROBABILITÉS CONDITIONNELLE OU A POSTERIORI :

• On note P (A/B) la probabilité de réaliser l’événement A sachant que l’événement B est réalisé.

P (A/B)=P (A∩B)

P (B)

On parle de :• Probabilité a priori → P(A) • Probabilité à posteriori (conditionnelle) → P(A/B)

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

47

• Notion d'indépendance:

Deux évènements sont dits indépendants si le fait de savoir si A s'est produit ne donne aucune information sur la probabilité de B. Soit P(A/B)=P(A).Et donc : P(A∩B)=P(A)*P(B)ASTUCE : La formule si dessus permet de vérifier rapidement si deux évènements sont indépendants. ATTENTION : Si A et B sont exclusifs, ils ne peuvent pas être indépendants : P(A∩B) = 0 ≠ P(A)*P(B). De même, si ils sont indépendants, ils ne peuvent pas être incompatibles.

III.THÉORÈME DE BAYES

• Calcul des probabilités a posteriori d’un événement ( P (A/B) ) en fonction des probabilités a priori ( P (A) ).

IV. APPLICATION AUX TESTS DIAGNOSTICS

Cette partie est très importante, en effet de nombreux qcms de concours portent sur cette partie pas si compliquée si on connaît ses formules.

Soit :

M+ : Sujet malade . M- : Sujet non malade. VP : Vrai positif (sujet malade et positif au test).FP : Faux positif (sujet non malade et positif au test).

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

48

P (A+/B+ )=P (A+∩B+)

P (B+)=

P (B+ /A+)×P (A+)P (A+∩B+)+P (A-∩B+)

=P (B+/A+)×P (A+ )

P (B+ /A+ )×P (A+)+P (B+ /A-)×P (A-)

T+ : Sujet positif au test.VN : Vrai négatif (sujet non malade et négatif au test).T- : Sujet négatif au test.FN : Faux négatif (sujet malade et négatif au test).

Un test diagnostic se caractérise par la sensibilité, la spécificité, la valeur prédictive positive, la valeur prédictive négative.

• Sensibilité Se ➔ Probabilité d'être positif au test chez les sujets malades.

La sensibilité est une probabilité conditionnelle calculée chez les malades.

• Spécificité Spe ➔ Probabilité d'être négatif au test chez les sujets sains.

La spécificité est une probabilité conditionnelle calculée chez les non malades.

• Valeur prédictive positive VPP ➔ Probabilité d'être malade chez les sujets positifs au test.

• Valeur prédictive négative VPN ➔ Probabilité d'être sain chez les sujets négatifs au test.

Remarque : La sensibilité et la spécificité sont des caractéristiques intrinsèques du test, elles ne dépendent pas de la prévalence de la maladie et varient en sens inverse. Par contre, les valeurs prédictives sont directement influencées par la prévalence de la maladie :

◦ Si la prévalence augmente, la valeur prédictive positive augmentera( et la valeur prédictive négative diminuera).

◦ Si la prévalence diminue, la valeur prédictive négative augmentera ( et la valeur prédictive positive diminuera).

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

49

Se=P (T+ /M+)=VP

VP+FN

Spe=P (T- /M-)=VN

VN+FP

VPP=P (M+ /T+)=VP

VP+FP

VPN=P (M- /T-)=VN

VN+FN

En utilisant le théorème de Bayes, on peut exprimer les différentes grandeurs :On note p la prévalence de la maladie. P(M+) = p

V. CAS PARTICULIER D'UNE VARIABLE QUANTITATIVE AVEC UN SEUIL :

Pour tous les QCMs de ce type, il est fortement conseillé de refaire le schéma ainsi que le tableau suivant avant de répondre :

M+ M-

T+ VP FP

T- FN VN

Sur le schéma avec les courbes on peut visualiser :

• Si on augmente le seuil (« on déplace la barre vers la droite »), on diminue le nombre de FP et de VP (donc Se diminue) , et on augmente le nombre de VN et FN (donc Sp augmente). Il est plus dur d'être positif si le seuil est plus haut (donc plus dur à atteindre)

• Si on diminue le seuil(« on déplace la barre verticale vers la gauche »), on augmente le

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

50

VPP=P(M+/T+)=P (M+∩T+)

P (T + )=

P (M+)×P (T+/M+)P (M+∩T+)+P (M-∩T+)

=P (M + )×P (T + /M +)

P (M + )×P (T + /M +)+P (M -)×P (T +/M -)

VPP=p×Se

p×Se+(1− p)×(1−Spe)

VPN=P (M-/T-)=P(M-∩T-)

P(T -)=

P (M-)×P (T- /M-)P (M-∩T-)+P(M+∩T-)

=P (M -)×P(T - /M -)

P (M -)×P (T - /M -)+P (M +)×P (T - /M +)

VPN=(1− p)×Spe

(1− p)×Spe+ p×(1−Se )

nombre de VP et FP (donc Se augmente) et on diminue le nombre de VN et FN (donc Sp diminue).

On détermine ensuite si la sensibilité (ou la spécificité) augmente ou diminue en l'exprimant en fonction de VP,FP,VN,FN. (voir page précédente).

Par exemple, si le seuil est plus élevé, le nombre de VP diminue et le nombre de FN augmente. Or il y a toujours autant de malades (M+ = VP+FN) donc la sensibilité diminue.

Remarque : Les valeurs de Sensibilité et Spécificité varient toujours en sens inverse, ainsi si vous connaissez l'évolution d'une des deux valeurs, vous pouvez en déduire l'autre (utile pour les QCMs)

VI. COURBE ROC

Elle permet de déterminer la qualité d'un test diagnostic en exprimant la sensibilité en fonction de (1-spécificité), chaque point de la courbe correspondant à la valeur d'un seuil. Plus un test possède des valeurs de sensibilité et de spécificité élevées (proche de 1), plus il a un intérêt diagnostic.

Ainsi plus la courbe représentative du test est proche du point de coordonnées (0,1) qui correspond a une Spécificité maximale (1-Spé =0 donc Spé =1) et une sensibilité maximale (Se=1 ), plus le test comporte un intérêt diagnostic.Lorsque la courbe se rapproche de la diagonale cela revient à classer les malades et les non malades au hasard.

Dans l'exemple du cours :

• Le test A est le plus informatif car sa courbe représentative est la plus proche du point (0,1).

• Le test B est moins informatif que le test A mais plus informatif que le test C.

• Le test C ne comporte aucun intérêt diagnostic (équivalent a classer les sujets sains et malades au hasard).

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

51

Se=VP

VP+FN

VII. QCM D'APPLICATION :

QCM 1 : Un test de dépistage d'une nouvelle maladie auto-immune est réalisé dans une population de 100 sujets dont 28 malades et 72 non malades. On dénombre 21 sujets positifs au test parmi les malades et 9 sujets positifs au test parmi les non malades. On veut évaluer la qualité de ce test diagnostic :

A. Le nombre de faux négatifs est de 9.B. La valeur prédictive négative est égale à 90%.C. La sensibilité du test diagnostic est égale à 75%.D. La spécificité du test diagnostic est égale à 70%.E. Si la prévalence de cette maladie augmente, la sensibilité du test sera plus élevée.

QCM 2 : Ce test de dépistage repose sur le dosage d'anticorps spécifiques. Un sujet est considéré comme positif au test si son taux sanguin est supérieur à une valeur précise.

A. Si on augmente la valeur du seuil de positivité du test, cela diminuera la spécificité.B. Si on diminue la valeur du seuil de positivité du test, cela augmentera le nombre de faux positifs.C. Si la modification de la valeur du seuil de positivité du test s'accompagne d'une hausse du nombre de faux négatifs, la sensibilité diminuera.D. Si la modification de la valeur du seuil de positivité du test s'accompagne d'une hausse de la sensibilité, la spécificité diminuera.E.. Si la prévalence de la maladie diminue, la valeur prédictive négative augmentera.

QCM d'Application, ce qu’il fallait répondre :

1 : BC 2 : BCDE

Pourquoi certaines réponses sont fausses : QCM 1 : Pour répondre à ce type de QCM, il faut toujours réaliser un tableau (si il ne

vous est pas déjà donné dans l'énoncé).

Malades (M+) Non malades (M-)

Test positif (T+) VP = 21 FP = 9 30

Test négatif (T-) FN = 28-21= 7 VN = 72-9= 63 70

28 72 100

A. Faux : Le nombre de faux négatifs est égal à 7 (cf tableau)

B. Vrai :

C. Vrai :

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

52

VPN= VNVN+FN

=6370=

90100

Se= VPVP+FN

=2128=

75100

D. Faux :

E. Faux : Les valeurs de sensibilité et de spécificité ne dépendent jamais de la prévalence de la maladie.

QCM 2 : Pour répondre à ce QCM, il est conseillé de refaire rapidement le schéma « cas particulier d'une variable quantitative avec un seuil » page 4

A. Faux. Si on augmente la valeur du seuil, le nombre de VN augmentera tandis que la somme VN+FP restera constante, donc la spécificité augmentera.

B. Vrai. Voir schéma.

C. Vrai. Si on augmente le nombre de FN, on diminue le nombre de VP, donc la sensibilité diminuera.

D. Vrai. Les valeurs de sensibilité et de spécificité varient toujours en sens inverse.

E. Vrai. Si la prévalence diminue, la probabilité d'être sain augmente, donc la valeur prédictive négative augmente. Par contre, la valeur prédictive positive diminue mais dans les deux cas, cela illustre le fait qu'on a moins de chance d'être malade, quel que soit le résultat du test, ce qui est normal puisque la prévalence de cette maladie diminue.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

53

Spe= VNVN+FP

=6372=

87,5100

Spe= VNVN+FP

Se=VP

VP+FN

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

54

Biostatistiques QCMs

QCM 1 : On mesure le cholestérol chez 100 patients, chaque patients étant prélevé 2 fois. On obtient au total 200 mesures. Quelles variabilités participent à la dispersion de ces 200 mesures ?A. La variabilité intra-individuelleB. La variabilité inter-individuelleC. La variabilité instrumentale.D. La variabilité inter-individuelle et les variabilités analytiques mais pas la variabilité intra-individuelle puisqu'il y a 100 patients.E. La variabilité intra-individuelle et inter-individuelle mais pas les variabilités analytiques puisque chaque patient a été prélevé 2 fois.

QCM 2 : On mesure la protéine K 30 fois dans le même tube, issu d'un seul prélèvement sanguin.A. On s'attend à trouver 30 fois le même résultat.B. Il y a de la variabilité inter-individuelle.C. Il y a de la variabilité intra-individuelle.D. Il y a de la variabilité instrumentale et pré-instrumentaleE. On s'attend à trouver de légères différences dans les résultats du fait de la variabilité inter et intra individuelle.

QCM 3 : Définitions A. On peut transformer une variable ordinale en variable nominale. B. Le degré de douleur est une variable qualitative ordinale. C. Le nombre de télévision par foyer est une variable qualitative discrète.D. La couleur des yeux est une variable qualitative nominale.E. On étudie 150 familles. Pour chacune d'entre elles on connait le nombre d'enfants et le budget pour les vacances : Une famille est une unité statistique.

QCM 4 et 5 : On teste sur une population de 80 souris un médicament stimulant pour la mémoire, contre la pathologie d'Alzheimer. Pendant un mois de traitement elles ont parcouru quotidiennement un labyrinthe technique afin de mémoriser la sortie. Le jour J du test, on chronomètre le temps (exprimé en secondes) que met la souris pour sortir. On a regroupé les résultats dans des intervalles d'étendues régulières :

Valeurs centrales

Intervalles Nombre de souris Effectif cumulé

[77,50 ; 82,50[ 8 8

[82,50 ; 87,50[ 23 31

[87,50 ; 92,50[ 31 62

[92,50 ; 97,50[ 14 76

[97,50 ; 102,50[ 4 80

Ces résultats pour être interprétés sont comparés au Quartile 3 (75 %) du test placebo de référence qui est Q3' = 93,02

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

55

Ici on a admis qu'un résultat est défavorable pour un médicament testé si le Q3 du test est supérieur au Q3' du placebo. Si au contraire c'est inférieur, le médicament est dit « candidat potentiel » pour avoir agit positivement sur au moins 75 % des souris.

QCM 4: Concernant ce test, quelles sont les affirmations vraies (valeurs arrondies) :A. Q3 = 93,21.B. Q3 = 92,18.C. Q3 = 97,14.D. Le médicament est défavorable.E. Le médicament est « candidat potentiel ».

QCM 5 : Concernant ce test, quelles sont les affirmations vraies, sachant que la somme des

écarts des carrés de ce test est ∑i=1

n

X− X ² = 2 034,69 (Toutes les valeurs sont arrondies) :

A. La moyenne est égale à 88,94.B. L'écart type estimé s est s = 25,76.C. L'écart type estimé s est s = 25,43.D. Le Coefficient de Variation est CV = 0,2 896.E. Le Coefficient de Variation est CV = 0,0 571.

QCM 6 : Le cholestérol est véhiculé dans le sang par des systèmes de transport aux rôles très différents : les lipoprotéines LDL (lipoprotéines de petite densité) et HDL (lipoprotéines de haute densité).Lorsqu'on mesure le cholestérol dans le sang, on mesure séparément cholestérol-HDL et cholestérol-LDL, l'ensemble formant le cholestérol total :

Individu 1 2 3 4 5

HDL (g/L) 0,70 1,25 2,00 0,35 1,15

LDL (g/L) 0,95 1,55 2,02 0,70 1,20

A. HDL est une variable quantitative discrète. B. LDL est une variable quantitative continue.C. La moyenne arithmétique du HDL dans cette expérience est 1,284.D. La moyenne arithmétique du HDL dans cette expérience est 1,09.E. La moyenne arithmétique du LDL dans cette expérience est 1,09.

QCM 7 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :A. Le mode est une caractéristique intéressante si la distribution est symétrique.B. La moyenne est sensible aux valeurs anormalement petites ou grandes.C. Il existe 2 types de variables : quantitative et qualitative.D. Les variables quantitatives peuvent être discrètes ou continues.E. Les variables qualitatives ordinales sont dichotomiques.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

56

QCM 8 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :A. L'étude du tabagisme représente une variable qualitative ordinale.

B. La formule de la variance est :

2=

∑i=1

n

x i – x 2

nC. La médiane partage une suite croissante en 2 parties contenant chacune au plus 50% des valeurs.D. Pour une distribution symétrique le mode, la médiane et la moyenne correspondent au même point.E. La médiane est un quartile.

QCM 9 : La température est relevée chaque heure pendant 4 jours dans une forêt. Les 97 résultats obtenus ont été triés et sont rassemblés dans le tableau suivant :

Température 14,5 15 15,5 16 16,5 17 17,5 18 18,5 19 19,5Nombre de fois où cette température a

été relevée

5 7 10 12 15 10 11 9 7 7 4

A. La médiane correspond à 15,5°.B. la médiane correspond à 16,5°C. la moyenne est égale à 17,8D. La moyenne est égale à 16,8°.E. Le coefficient de variation est le rapport de la moyenne à l’écart type.

QCM 10 : Après la première colle de mathématiques les notes des étudiants en PACES à Purpan ont été reportées dans le tableau suivant :

Notes Nombre d'étudiants

0-4 200

5-9 185

10 - 15 305

16-20 110

A. Q1 = 4.B. Q2 ≈ 10,41.C. Q2 ≈ 10,25.D. 75% des étudiants ont obtenu une note ≤ 13,52.E. 75% des étudiants ont obtenu une note ≤ 13, 85.

QCM 11 : On recense le nombre d'ordinateurs par foyer. L'enquête porte sur un échantillon de 10 foyers.Voici le tableau observé :

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

57

Nombre d'ordinateurs Nombre de foyers

0 2

1 3

2 2

3 2

4 1

On s'intéresse à la distribution du nombre d'ordinateurs par foyer.

A. L'étendue est de 4B. Le mode est égale à 4C. La médiane est égale a 1,5D. La moyenne est égale à 0,17E. On ne peut pas calculer la moyenne car il s'agit d'un variable quantitative discrète.

QCM 12 : Soient A et B deux évènements :A. Si A et B sont exclusifs alors P(AUB) = Ø.B. P(A/B) = P(A et B)/P(A). C. Si P(A et B) = P(A) x P(B) alors A et B sont indépendants. D. La sensibilité d'un test diagnostic représente la probabilité qu'un individu malade ait un test positif. E. La spécificité d'un test diagnostic représente la probabilité qu'un individu malade ait un test négatif.

QCM 13 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :A. La loi de probabilité d'une variable aléatoire continue est : P(x< X < x+dx)= f(x).dx.

B. La fonction f(x) densité de probabilité de X est telle que : ∫–∞

f xd x=1

C. La fonction de répartition f(x) telle que f'(x)= f(x) a une limite en +∞ qui tend vers +∞.D. Si f(x)= 0,5 alors x représente la médiane. E. P(a<X<b) = f(a) – f(b).

QCM 14 : Soit un ensemble composé uniquement de deux évènements possibles : l’événement A et l’événement B. Indiquer quelle(s) est(sont) la(les) proposition(s) vraie(s) si A et B sont deux évènements indépendants.A. P(B/A) = P(B)B. P(A/B) = P(B)C. P(A ∩B) = 0 D. P(A∩B) = P(A).P(B) E. P(A∩B) = P(A) +P(B)

QCM 15 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) : A. Pour que deux séries statistiques aient la même moyenne, il faut qu'elles aient la même médiane.B. Quelle que soit la série statistique, la moyenne et la médiane sont égales.C. Il existe une série statistique de moyenne et de médiane égales.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

58

D. Quelle que soit la série statistique, la moyenne appartient à l'intervalle (Q1;Q3). E. Il n’existe aucune série statistique de moyenne et de médiane égales.

QCM 16 : Soient deux boules blanches et trois noires dans une urne (tirage avec remise) :A. La probabilité de piocher une boule blanche est 3/4.B. La probabilité de piocher une boule blanche est 3/1.C. La probabilité de piocher une boule noire est 3/4.D. La probabilité de piocher deux boules noires est 9/25.E. La probabilité de piocher une boule blanche et une boule noire est 6/25.

QCM 17 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :

Voici les résultats du test d'alcoolémie de 11 élèves reçus en P2 :

0 / 0 / 0,25 / 0,3 / 0,45 / 0,5 / 0,85 / 1 / 1,3 / 1,5 / 5.

A. Moyenne = 0,5.

B. Médiane = 0,5.

C. Amplitude intervalle = 11,15.

D. Etendue de la distribution = 5.

E. Q2 représente la médiane.

QCM 18 : Une personne à 1 chance sur 50 d'être atteinte de la maladie de l'open bar (M). Une personne malade aura 95% de chance que sont test soit positif (TP) pour cette maladie alors qu'une personne non-malade 5%.A. P(Personne malade avec test négatif)=0,001.B. P(Test positif)=0,5.C. P(M/TP)=P(M TP)/P(TP).∪D. P(M/TP) peut être traduite par la phrase : on choisit une personne au hasard, le résultat du test est positif. Quelle est la probabilité que cette personne soit atteinte de cette maladie ?

E. La probabilité d'être malade sachant que le test est positif est de : 0;019 / 0,068

QCM 19 : Voici les résultats de l'étude d'un groupe allergique au lactose :

Degré d'allergie 11 à 21 21 à 31 31 à 41 41 à 51

Effectifs 16 80 64 32

A. Calcul de la moyenne = 41,83. B. La valeur centrale est un multiple de 15.C. Changement de variable x'=x-26, la moyenne de x'=5,83.D. Changement de variable x'=x-26, la moyenne de x=15+5,83.E. Changement de variable x'=x-26, la moyenne de x=26+5,83.

QCM 20 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :

A. L'écart type estimé s=nσ n – 1

.

B. Ecart type de la distribution des moyennes sem=σ /n

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

59

C. L'étendu est utilisée pour déterminer les valeurs aberrantes.D. Coefficient de variation = Rapport de l'écart type à la moyenne.E. CV=s/moyenne de x.

QCM 21 : Une machine à écrire comporte 42 touches dont 26 lettres et 8 chiffres. Une personne tape au hasard sur les touches. On admet que la probabilité pour qu’elle frappe une touche donnée est la même quelle que soit la touche.

A. La probabilité pour qu’elle frappe une lettre est 13/21.

B. La probabilité pour qu’elle frappe un chiffre est (26+8)/42.

C. La probabilité pour qu’en tapant sur 5 touches, elle frappe une suite de 5 lettres est 26 /425 .

D. La probabilité qu’en tapant sur 3 touches elle frappe le mot « oui » ou le mot « non » est (1/42)².

E. On considère qu’il s’agit d’un « tirage avec remise ».

QCM 22 : Une première urne contient huit boules vertes. Une de ces boules porte le chiffre 1, trois portent le chiffre 2 et quatre le chiffre 4. Une deuxième urne contient six boules rouges : une de ces boules porte le chiffre 3, deux le chiffre 5 et trois le chiffre 6. On extrait au hasard une boule de chaque urne. On désigne par X le chiffre porté par la boule verte et par Y le chiffre porté par la boule rouge.

A. L’ensemble des éventualités est composé de 48 couples équiprobables.

B. P X=2et Y=6 =1/3.

C. P XY ≥ 8 =29/48.

D. P XY ≥ 8 =29/96.

On effectue 10 fois de suite le tirage précédent, en replaçant à chaque fois les boules extraites dans leur urne respective avant chaque nouveau tirage.

E. Si Z désigne le nombre de réalisations de l’événement XY ≥ 8 à l’issu des dix tirages, alors

P Z=5=10!

5 !5 !× 29

485

×1–2948

5

.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

60

QCM 23 : On a réalisé une étude sur un échantillon de 10 personnes. Voici les résultats obtenus :

Nombre de médicaments

Nombre de personnes

0 21 42 03 34 1

A. La médiane est égale à 1.

B. La moyenne est égale à 0×21×42×03×34×1

10.

C. La moyenne est égale à 0×21×42×03×34×1

11.

D. La moyenne et la médiane sont égales.

E. La moyenne est supérieure à la médiane.

QCM 24 : Après la dernière colle de mathématiques les notes des étudiants en PACES à Purpan ont été reporté dans le tableau suivant :

Notes Nombres d'étudiants

0-4 200

5-9 258

10-14 322

15-20 20

A. Q1 = 4.B. Q2 ≈ 8,1.C. Q2 ≈ 9,65.D. 75% des étudiants ont obtenu une note ≤ 11,76E. 75% des étudiants ont obtenu une note ≤ 13,25.

QCM 25 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :A. Le mode est une caractéristique intéressante si la distribution est asymétrique.B. Les variables qualitatives nominales peuvent être dichotomiques.C. La sensibilité d'un test diagnostic représente la probabilité qu'un individu malade est un test négatif.D. L'intervalle de pari est la valeur théorique vers une observation expérimentale.E. L'erreur de première espèce est lorsque l'on rejette Ho alors que Ho est vrai.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

61

QCM 26 : A propos de la mesure des phénomènes biologiques …Une étude (mesure d'une variable biologique) est réalisée au sein d'un échantillon de 200 personnes représentatif de la population générale, le protocole est unique et correctement appliqué, On obtient 200 valeurs différentes. Quelles sont les propositions inexactes ?A. Le nombre important de valeurs différentes peut être du à la variabilité inter-individuelle.B. Il est le fait d'une variabilité intégralement intra-individuelle.C. Il est impossible qu'il soit du à une erreur analytique.D. Une série de valeurs biaisée présente un manque de précision.E. L'exactitude permet d'éviter les erreurs dues à l'aléa.

QCM 27 : Au sujet des statistiques descriptives …Une série statistique est représentée par une courbe de Gauss moins étendue à droite qu'à gauche.A. Il s'agit d'une représentation particulièrement adaptée pour une variable qualitative continue.B. La série présente un biais à droite.C. La médiane est influencée par les valeurs extrêmes.D. La moyenne, la médiane et le mode sont confondus.E. On peut affirmer que : Moyenne<Médiane<Mode.

QCM 28 : En ce qui concerne les probabilités conditionnelles …Lancer d'un dé à six faces (équilibré) : On relève le nombre de sorties pour chaque face.A. P(A) = P(A/B)*P(AUB).B. P(AUB) = P(A)+P(B).C. La probabilité de sortie du six est de 1/3.D. Chaque face a une probabilité de sortie de 1/6.E. P(six/six) = 0.

QCM 29 : A propos des statistiques descriptives, indiquer si les propositions suivantes sont vraies

ou fausses :

A. Pour caractériser les personnes âgées, l'existence d'un AVC dans l'année précédente est

représentée par une variable booléenne

B. Le dosage de la protéinurie sur la bandelette urinaire en 3 classes : + (codé 1), ++ (codé 2) ou ++

+ (codé 3) est une variable qualitative ordinale

C. La moyenne d'une variable qualitative nominale codée numériquement n'est pas interprétable

D. Le nombre d'opérations au cours de la vie est une variable quantitative continue

E. La transformation d'une variable quantitative en variable qualitative ordinale constitue une perte

d'information

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

62

Biostatistiques, ce qu’il fallait répondre :

1 : ABC 2 : CD 3 : ABDE 4 : BE 5 : AE6 : BD 7 : BCD 8 : BCDE 9 : BD 10 : ACD11 : AC 12 : CD 13 : ABD 14 : AD 15 : C16 : DE 17 : BDE 18 : ADE 19 : CE 20 : ABCDE21 : ACE 22 : ACE 23 : ABE 24 : ABD 25 : ABDE26 : BDE 27 : E 28 : D 29 : ABCE

Pourquoi certaines réponses sont fausses :

QCM 1 : D. Chaque patient subit 2 prélèvements, il y a donc de la variabilité intra-individuelle.E. Il y a toujours de la variabilité instrumentale et pré-instrumentale.

QCM 2 : A. On n'aura jamais le même résultat à chaque mesures effectuées. Ceci étant du aux différentes variabilités.B. Il n'y a qu'un seul prélèvement sanguin, donc il n'y a pas de variabilité inter-individuelle.C. Vrai même si il n'y a eu qu'un seul prélèvement sanguin car il a été réalisé à un instant t. E. Il n'y a pas de variabilité inter-individuelle.

QCM 3 : A. Vrai, mais il y aura une perte d'information. C. Faux, c'est une variable quantitative discrète.E. Vrai, la famille est l'unité statistique à laquelle on s'intéresse et qui est décrite par des variables aléatoires.

QCM 4 : On veut quoi? Le Quartile 3, 75 % de l'effectif.Qui? C'est le 75 % de l'effectif total est 75x80/100 = 60ème souris.Où? Dans l'intervalle [87,50 ; 92,50[.Calcul de Q3 :

1. Etendue 92,50 – 87,50 = 5.2. Partage par l'effectif concerné 5/31 = 0,163.3. On multiplie par le nombre de souris manquant, on avait comme

précédent effectif cumulé : 31 pour l'intervalle [77,50 ; 87,50[, il nous manque 62 – 31 = 31 souris pour atteindre la 60ème. Donc 0,163 x 31 = 4,68.

4. On ajoute le résultat obtenue à la borne inférieur de l'intervalle étudié, soit 87,50 + 4,68 = Q3 = 92,18

On remarque que Q3 = 92,18 est inférieur à Q3' = 93,02 , donc le médicament est dit candidat potentiel.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

63

QCM 5 : A. Calcul de la moyenne : X = (80x8 + 85x23 + 90x31 + 95x14 + 100x4)/80 = 88,94.B. Faux c'est s² = 2039,64/(n-1) = 2039,64/79 = 25,76 . Donc l'écart type estimé est la racine carré, s = 5,075.C. Faux c'est la Variance σ² = 2039,64/n = 2039,64/80 = 25,43.D. Faux voir E.E. Annulé. (besoin de la calculatrice) . CV = s / X = 5,075/88,94 = 0,0571.

QCM 6 : A. Faux, c'est une variable quantitative continue puisque l'échelle est un sous ensemble des nombres réels. C. La moyenne HDL = 1,09.E. La moyenne LDL = 1,284.

QCM 7 : A. Elle est intéressante lorsque la distribution est asymétrique.E. Les valeurs sont une échelle de chiffres qui a pour seule propriété des nombres réels leur relation d'ordre. Les variables qualitatives nominales sont elles dichotomiques.

QCM 8 : A. C’est une variable qualitative nominale (variable dichotomique).C. VRAI : cf définition de la médiane, faire attention à la notion de

CROISSANCE en effet, lors du concours blanc 2015 il manquait cette notion et l'item devenait faux !

QCM 9 : A. Le nombre d’observations est impair ( 97=2×481 ), la médiane est égale à la 49ème mesure c’est-à-dire 16,5°.C. La moyenne est égale a 16,8°.E. C’est l’inverse.

QCM 10 : A. VRAI : 25% des étudiants représentent 200 élèves. B. Q2= 5/305 x15 +10 ≈ 10,25.E. Q3= 5/305 x 215 + 10 ≈ 13,52.

QCM 11 : B. Le mode est la valeur qui a le plus grand effectif. Ici il est égale à 1.C. Ici pour calculer la médiane il faut par avance calculer les effectifs cumulés croissants ; ce qui nous donne :

Nombre d'ordinateurs Nombre de foyers Effectifs cumulés croissants

0 2 2

1 3 5 (2+3)

2 2 7 (2+3+2)

3 2 9 (2+3+2+2)

4 1 10 (2+3+2+2+1)

Ainsi, on voit bien que la médiane est égale a 1,5.D. (0x2 + 1x3 + 2x2 + 3x2 + 4x1)/10= 1,7

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

64

QCM 12 : A. Si A et B exclusifs alors P(A et B) = Ø.B. P(A/B) = P( A et B) / P(B) et P(B/A)= P(A et B)/ P(A)E. Cela représente la probabilité qu'un individu sain ait un test négatif.

QCM 13 : C. limx∞

f x =1

E. donc p aXb= f b − f a

QCM 14 : A. Propriété par définition de deux évènements indépendants.B. cf A.C. P(A ∩ B) = P(A).P(B).E. cf C.

QCM 15 : A. Faux, car peu importe le nombre de série statistique la médiane ne sera pas toujours égale à la moyenne c’est même très rare.Ex : voici 2 séries de notes : 1 8 8 9 10 11 12 13 17 -> moyenne = 89/9 = 9.89 et médiane= 101 2 2 5 8 15 18 19 19 -> moyenne = 89/9 = 9.89 et médiane= 8Les moyennes sont égales, mais les médianes ne le sont pas.B. Faux, car par exemple pour cette série : 35 38 38 39 39 42 42 43 43 44 44 44 Total : 12Ici, la médiane se trouve entre la 6ème et 7ème valeur car 12/2=6Or la 6ème valeur = 42 et la 7ème également donc la médiane est 42.Maintenant la moyenne : 35+38*2+39*2+42*2+43*2+44*3 = 40.9 ≠ 42.

12C. Vrai, par exemple pour cette série : 10 10 10 10 10 → moyenne = 10 et médiane = 10.D. Contre-exemple : 2 8 10 10 11 15 15 15 20 20 30 700 Moyenne = 71,3.Q1 = 10 et Q3 = 20 donc la moyenne 71,3 n'appartient pas à l'intervalle [10 ; 20].

QCM 16 : A. P = 2/5.B. P= 2/5.C. P = 3/5.D. Vrai, P = 3/5 x 3/5 = 9/25E. Vrai, P = 2/5 x 3/5 = 6/25

QCM 17 : A. 11,15/11.C. 5.

QCM 18 : B.P= P(M+∩T+) + P(M- ∩T+) = 0,068.C. Ptp(M)=P(M∩TP)/P(TP).

QCM 19 : A. Moyenne = 31,83.C. Moyenne de x' = moyenne de x – 26 = 31,83 – 26 = 5,83

QCM 21 : B. P=8/42.D. P=2(1/42)3 car P(oui) = P(non) = (1/42)3 d'où P(oui non)=2(1/42)∪ 3.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

65

QCM 22 : A. Vrai : 8x6 = 48 couples.

B. P(X=2)= 3/8.

P(Y=6)= 3/6.

D’où P(X=2 et Y=6)= (3/8)x(3/6)= 3/16.

D. 3 couples sont possibles pour que X + Y soit > ou = à 8 : (2;6)/(4;5) / (4;6). D'ou : P XY ≥ 8 = 3/8 x 3/6 + 4/2 x 2/6 + 4/8 x 3/6 = (9+8+12)/48 = 29/48

QCM 23 : Formulons le tableau d’une autre manière, on obtient la liste suivante : 0 0 1 1 1 1 3 3 3 4

La médiane se trouve entre la 5° et 6° valeur (entre 1 et 1) donc médiane = 1.

La moyenne = (0x2 + 1x4 + 3x3 + 4x1)/10 = 1.7.

Donc la moyenne est supérieure à la médiane.

QCM 24 : C. cf B.E. Faux

QCM 25 : C. La sensibilité d'un test diagnostic représente la probabilité qu'un individu malade ait un test positif.

QCM 26 : B. Pas seulement !C. Vrai donc faux... « protocole unique et correctement appliqué ».D. et E. C'est l'inverse.

QCM 27 : A. QUANTITATIVE !B. Gauche... .C. Moyenne... .D. Cf E.

QCM 28 : A. Formule fondamentale : P(A/B) = P(AinterB)/P(B).B. Pas toujours, il faut que les événements A et B soient exclusifs, sinon : P(AUB) = P(A)+P(B)-P(A B). C. cf D, le dé est équilibré.E. Si c'est possible, la probabilité ne sera pas nulle !

QCM 29 : A. Vrai : on peut répondre à la question par oui ou non donc cette variable est booléenne. D. Faux : quantitative discrète

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

66

III - Lois de Probabilités - Synthèse

I. VARIABLES ALÉATOIRES (VA) DISCRÈTES

• Qu'est ce qu'une VA discrète ?C'est un ensemble de valeurs fini ou infini dénombrable x1, x2, … , x

n tel que X(Ω) = {x1, x2, … ,

xn} où x1 < x2.

X suit une loi de probabilité qui est exposé par un tableau (ou un diagramme) :

xi x

1x

2... x

n

pi = P(X= x

i) =

f(xi)

p1

p2

... pn

Remarques : ◦ Σ p

i = 1 .

◦ P(X = xi) >= 0

◦ Σ pi x

i = E(X).

◦ Σ pi x

i2 = E(X2).

• Quelques formules à connaître :

◦ P(a ≤ X ≤ b) = Σ xi [a;b]

f (xi)

◦ Fonction de répartition : F(x) = Σxi ≤ x

f(xi)

◦ Espérance : E(X) = Σ pi x

i et E(X2) = Σ p

i x

i2

◦ Variance : • V(X) = E(X2) – (E(X))2 → pour une variable aléatoire X quelconque

→ pour une variable aléatoire discrète X

◦ Écart type : σ(X) = √V (X ) .

II. VA CONTINUES :

• Qu'est ce qu'une VA continue ?Pour les VA continues toutes les valeurs dans ℝ sont possibles ! Elle prend un nombre infini de valeurs dans l'intervalle sur lequel elle est définie.Sa distribution est représentée par un histogramme ou une courbe.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

67

• A connaître :X(Ω) = [a;b] = [xmin ; xmax] avec a < bPour les variables continues la probabilité en un point est nulle P[X = x

0] = 0

◦ Fonction de répartition : .

◦ Probabilité sur un intervalle : P [ x1≤ X ≤ x2]=∫x1

x2

f (x )dx = F(x2) - F(x

1)

P [ x≤ X ≤ x+dx ]∼ f ( x)dx

◦ Densité de probabilité : C'est une fonction g tel que :▪ g est définie, continue, positive sur [a,b].

▪ ∫a

b

g ( x)dx=1 → l'aire totale sous la courbe = 1

◦ Espérance : E (X )=∫a

b

x f (x )dx E (X 2)=∫

a

b

x2 f ( x)dx .

◦ Variance :

• V(X) = E(X2) – (E(X))2 → pour une variable aléatoire X quelconque

→ pour une variable aléatoire continue X de loi f

◦ Écart type : σ(X) = √V (X ) .

III.PROPRIÉTÉS DES VA :

• Espérance

◦ E(X+a) = E(X) + a.◦ E(aX) = a E(X).◦ E(aX+b) = a E(X) + b.◦ E(X+Y) = E(X) + E(Y).◦ E(aX + bY) = a E(X) + b E(Y).

▪ Avec X et Y deux VA.

• Variance

◦ V(X+a) = V(X).

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

68

◦ V(aX) = a2V(X).◦ V(aX + b) = a2V(X).◦ Si on a X et Y deux variables aléatoires INDEPENDANTES on peut écrire :

▪ V(X+Y) = V(X) + V(Y) + 2cov (X,Y) ▪ V(X-Y) = V(X) + V(Y) - 2cov (X,Y)▪ V(aX+bY) = a2V(X) + b2V(Y) + 2ab.cov(X,Y) ▪ V(aX-bY) = a2V(X) + b2V(Y) – 2ab.cov(X,Y)

→ Avec cov(X,Y) = E[(X – ux)(Y – u

y)] = σ

x .σ

y.p

• VA centrée réduite :◦ VA centrée : on pose Y la VA centrée de X. On « centre la VA grâce à l'espérance ».

Y = X – E(X) et E(Y) = 0 ; V(Y) = 0.

◦ VA réduite : on pose Y la VA réduite de X, on « réduit la VA grâce à l'écart-type »

Y=X

σ (X );V (Y )=

1

σ2(X )

∗V (X )=1 => σ2( X )=V (X ) .

◦ VA centrée réduite : on pose Y une VA centrée réduite.

Y = (X – μ)/ σ → E(Y) = 1/σ [E(X) – E(μ)] = μ -μ = 0 et V (Y )=1

σ2(X )

∗V (X )=1

IV. LOI DE PROBABILITÉ DES VA DISCRÈTES :

• 1. Loi de Bernoulli (VA discrètes)

On parle de loi de bernoulli quand X(Ω)={0,1} c'est a dire 2 possibilités soit succès, soit échec !E(X) = Σ p

i x

i = 0 * P(X=0) + 1 * P(X = 1) = P(X = 1)

On note Π = P(X = 1) → c'est le paramètre de la loi de Bernoulli.On a alors :E(X) = Π.V(X) = E(X2) – (E(X))2 = Π – Π² = Π ( 1 – Π ).E(X2) = Σ p

i x

i2 = 0² * P(X=0) + 1² * P(X = 1) = Π et E(X)2= Π²

◦ Remarques : X∼ B(Π) « X suit une loi de Bernoulli de paramètres Π ». Quand X(Ω) est un ensemble quelconque de 2 éléments on parle toujours de loi de Bernoulli.

◦ Exemple : Prévalence d'une maladie.X(ω) = 1 si l'individu est malade ; X(ω) = 0 si l'individu est sain.

◦ On a donc X∼ B(Π) avec Π = prévalence de la maladie

◦ Comment connaître Π ? ▪ On réalise n tirage d'individus au sein de la population => ECHANTILLONAGE.▪ On obtient n variables aléatoires X1, X2, … , Xn.

◦ Xi ~ B (Π) ; Hypothèse : les variables Xi sont indépendantes.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

69

◦ P(X1 = x1 et X2 = x2 et … et Xi = xi) = P(X1 = x1) * P(X2 = x2) * … * P(Xn = xn).=> Rappel : Si deux évènements A et B sont indépendants alors P(A et B) = P(A)*P(B)

◦ On utilise ensuite un estimateur de la moyenne Xn tel que Xn = (X 1+...+X n)

n.

◦ Propriété de Xn : E(Xn) = 1n∗(E (X 1)+...+E(X n)) = Π.

◦ Comme l'espérance de notre estimateur de moyenne est égal à Π on dit que notre estimateur est sans biais.

◦ Quel est l'erreur standard (SD) de notre estimateur ?SD = √Var (X n)

or

√Var (X n)=(X 1+...+X n)

n=(Var (X 1)+...+Var (X n))

n²=(Π(1−Π)+...+Π(1−Π))

n²=(Π(1−Π))

n

On a alors SD=√Var(Π(1−Π))

nn est en dénominateur donc plus n est grand plus SD est petit.

◦ Pour résumer :▪ Les individus modélisés par X1, X2, … , Xn constituent un échantillon.▪ Grâce à la valeur de X n observée dans l'échantillon, on peut estimer le paramètre

dans la population c'est-à-dire Π.

▪ X n = moyenne observée = moyenne empirique.

▪ X n est soumis aux fluctuations d’échantillonnages et son erreur standard est SD= σ

√navec var (X) = σ 2 = Π (1 - Π)

▪ + n est grand + l'estimation est précise !

• 2. Loi Binomiale : (VA discrètes)

Construction de la loi binomiale :

C'est une répétition du schéma de bernoulli n fois de manière indépendante et identiquement distribuées.Soit X la VA qui correspond au nombre de succès au cours des n épreuves.On a X(Ω) = {0;1 ;... ;n }

P(X=k) = pk = (nk)∗ pk

∗(1− p)(n−k )

On dit que X suit une loi binomiale de paramètre n, p → B(n,p) avec n le nombre d'épreuves et p la probabilité.On a une loi binomiale quand :

➔ on a une suite d'événements indépendants et identiques

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

70

➔ ordre des réponses est non imposéQuand n=1, on dit que X suit une loi de Bernoulli B(1,p)

Formules associées : P(X=n) = pn

P(X=0) = qn = (1-p)n

P(X≥1) = 1 – P(X=0)P(X<n) = 1 – P(X=n) = 1 – pn

(nk)=

(n! )(k !(n−k !))

Le point d'exclamation après le k du dénominateur a été ajouté il me semble que c'est aussi une factorielleEx : 5! = 5 * 4 * 3 * 2 * 16! = 6 * 5 * 4 * 3 * 2 * 1 = 6 * 5!0! = 1

E(X) = npV(X) = npqσ(X) = √Var (X )=√npq

• 3. Loi de Poisson : (VA discrètes)

On l'utilise pour modéliser des situations de comptage non majorées. On dit qu'une VA X tel que X(Ω) = ℕ suit une loi de Poisson de paramètre λ, noté P( λ) lorsque

P(X=k) = exp(−λ)∗(λk

k !)

X suit alors une loi binomiale de paramètres n et p → B(n,p).

◦ Propriétés

• Si X n , p∼B(n , p) et que n est grand (≥50) et p petit (np≤5) on peut démontrer que, si on

pose λ=E (X n , p)=np alors P (X n , p=k )∼exp(−λ)∗(λk

k !)

On dit que la loi binomiale converge vers la loi de Poisson lorsque n tend vers ∞.

• Si X n , p∼P (λ)alors E(X) = λ.Var (X) = λ.

Donc si on a le paramètre λ on connaît l'espérance et la variance de X.

Astuce : Dans certains exercices on ne donne pas λ mais P(X=0) = a or

P (X n , p=0)∼exp (−λ)∗(λ0

0 !)=exp(−λ)=a donc

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

71

exp(−λ)=a→ ln(exp (−λ))=ln(a )→−λ=ln (a)→ λ=−ln (a)On retrouve donc λ !

• 4. Loi normale (VA continues)

▪ Elle est définie par une somme de variables indépendantes s'approchant de la loi d'une variable continue.

▪ Soit μ∈ℝet σ∈ℝ+∗ , X suit une loi normale ( X ~ N(μ,σ)) si la fonction densité

de probabilité est f (x )=1

σ√2π∗exp

−(x−μ) ²2σ ²

.

▪ E(X) = μ.▪ V(X) = σ².▪ La fonction de densité est symétrique et centrée sur μ.

▪ Probabilité sur un intervalle P [ x1≤ X ≤ x2]=∫x1

x2

f (x )dx .

▪ Variable centrée réduite : on pose Y=X−μσ .

▪ On a x1→ y1=x1−μσ

; x2→ y2=x2−μσ

avec x qui appartient à X et y

appartenant à Y.▪ Et on a X∼N (μ ,σ) et Y∼N (0,1) .

Conséquences :• Au risque α correspond sur la table de la loi normale une valeur εα.

• Au risque α on doit avoir P(|Y|<εα) = 1 – α.• Valeur à connaître de α.

◦ α = 5 % → ε0,05 ~ 1,96 ~ 2 → P(|Y|<2) ~ 0,95 c'est à dire que 95% des valeurs ce trouvent entre -2σ et 2σ.

◦ α = 32 % → ε0,32 ~ 1→ P(|Y|<1) ~ 0,68 c'est à dire que 68% des valeurs ce trouvent entre -1σ et 1σ.

• 5. Estimations

◦ Elle permet de définir les paramètres d’une population à partir de paramètres observés sur un échantillon (le plus représentatif possible de la population).

Estimateur de la moyenne :

Lorsque l’on a n variables aléatoires Xi de loi quelconque (considérées comme une somme de variables indépendantes, pour utiliser la loi normale) et d’espérance m inconnue (ce qui est le cas fréquent dans une population puisque c’est en général ce que l’on cherche) on utilise un estimateur de m qui s’appelle moyenne « empirique » (ou « de l’échantillon » ou « observée »…) noté Mn.

M n1 n X i

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

72

On distingue ainsi les valeurs vraies, fixes et uniques issues de la population générale et les estimations des paramètres issus d'échantillons de taille n soit :

Estimateur m de μ Estimateur s2 de σ2 Estimateur p d'une proportion л

m = Σ xi / n s2= (Σ x

i – m)²/n - 1 p = Σ x

i / n

E(m) = μ E (s2) = σ2 E (p) = л

V(m) = σ2 / n V(p) = [л(1 – л)] / n

N.B. : Les lettres grecques (μ,σ et л) correspondent aux paramètres de la POPULATION.Les lettres latines (m, s et p) correspondent auc estimations des "vrais" paramètres de cette population (donc les lettres grecques) à partir d'échantillons.

• 6. Théorème de la limite centrale :

▪ C’est tout un charabia pour dire que lorsqu’on a tout plein de variables qui suit une loi quelconque, Zn obtenu par la formule magique : Z

n = (X

n – μ) / (√ σ2 / n) se

rapproche d’une loi normale centrée réduite d’autant plus que l’échantillon est grand.

▪ Echantillon de taille suffisamment grande si :

→ pour une variable suivant une loi de Bernouilli

et n > = 30 → pour une distribution quelconque de X

• 7. Loi de Student :

Elle s’utilise lorsque l’on a à faire à des variables Xi qui suivent une loi normale d’espérance m et que l’on veut tester une hypothèse sur m avec une variance estimée. Elle permet de ne pas faire d’hypothèse sur la taille de l’échantillon et s’utilise lorsque l’échantillon est petit (car dans ce cas il n’est pas judicieux d’utiliser le théorème de la limite centrale car l’erreur standard est trop importante).Dans ce cas on utilise une variance empirique :

Ainsi on utilise : Tn = (Xn – μ) / (√ S

n2 / n) qui est distribué selon une loi de Student à n-1 degré de

liberté (…pas d’inquiétude cela sera bien développé à la fin du programme).

Remarque : la moyenne µ et la variance σ2 sont les valeurs théoriques, fixes et uniques, leurs estimations, respectivement x et s2 sont des variables aléatoires.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

73

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

74

Lois de probabilités - QCMs

QCM 1 : Une urne contient 75 boules rouges et 25 noires. On effectue n tirages au hasard successifs avec remise, n désignant un entier naturel au moins égal à 10. On désigne par X la variable aléatoire prenant pour valeur le nombre de boules rouges obtenues à l'issue de ces n tirages :A. X suit une lui binomiale de paramètres B (n ; 1/4).

B. La probabilité que toutes les boules tirées soient noires est 1

22n .

C. L'espérance de X est 0,75 n.D. La probabilité qu'exactement 2 des boules tirées soient rouges est 0,752∗0,25n−2 .E. X suit une loi binomiale de paramètres B (n ; 3/4).

QCM 2 : A propos des paramètres caractéristiques des lois de probabilités :A. L'espérance mathématique de la variable X, notée E(X), est la somme de toutes les réalisations possibles de X, pondérées par leurs probabilités respectives.B. Pour une loi binomiale de paramètres n et p : E(X) = n.p.(1 – p) .C. Pour une loi binomiale de paramètres n et p : E(X) = n.p .D. L'écart-type est un indicateur de la dispersion de la variable aléatoire et il a l'avantage de s'exprimer dans la même unité que la variable aléatoire.E. V(X) = E(X²) – [E(X)]².

QCM 3 : A propos d'une variable centrée réduite :A. Son espérance est 0 et son écart-type est 1.B. Son espérance est 0 et sa variance est 1.C. Son espérance est 1 et son écart-type est 0.D. C'est une grandeur sans dimension qui permet de juger du caractère normal ou exceptionnel d'une observation.

E. La variable centrée réduite est : Y=[ X−E X ]

σ.

QCM 4 : On admet que 3 % des automobilistes contrôlés par un alcootest sont en état d'ébriété. La police contrôle n personnes. Les résultats des différents contrôles sont supposés indépendants les uns des autres. On considère la variable aléatoire X égale au nombre de personnes en état d'ébriété au cours des n contrôles :A. La loi de probabilité de X est une loi binomiale de paramètres n et 0,03.

B. Pour k appartenant aux entiers naturels, on a : P X=k =nk . 0,03 k.0,07n−k

.

C. Pour k appartenant aux entiers naturels, on a : P X=k =nk . 0,03 k.0,07n .

D. La probabilité pour qu'au cours de ce contrôle il y ait au moins une personne en état d'ébriété est (0,97)n.E. En contrôlant 500 personnes, on peut « espérer » 15 contrôles positifs.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

75

QCM 5 : A propos des probabilités et des statistiques :A. La fonction de répartition est l'intégrale de la fonction de densité de probabilité; dans le cas d'une variable continue.B. Annulé.C. Si on fait une étude pour déterminer si une personne est atteinte d'une maladie cardiaque ou non, la variable statistique correspondante sera quantitative nominale.D. La moyenne arithmétique d'une variable statistique est pondérée.E. La moyenne d'une variable quantitative divise celle ci de telle sorte qu'il y ait 50 % des données en dessous et 50 % au dessus.

QCM 6 : Sur une population de 200 personnes, 1% est malade. Soit X le nombre de personnes malades obtenues.A. La loi de probabilité de X est la loi B(200 ; 0,01).B. E(X)= 2.C. σ(X)= 1,98.D. Dans le cas où X suit une loi de Poisson, la probabilité d’avoir deux personnes malades est : P(X=2) = 2/e2.E. Lorsque n est petit et p grand, selon une loi Binomiale, X suit aussi une loi de Poisson où np= λ.

QCM 7 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :

A. Une loi binomiale 5 ,15 peut être représentée par P X=4=

155× 1

5 4

×45

.

B. E X =1 , V X =15

et Ecart type= 15

.

C. La loi de Bernouilli est utilisée lorsque il y a seulement 2 évènements possibles.D. La loi de Poisson est utilisée lorsque la variance est proche de l'écart type et est représentée par

l'expression P X=k =e−2×

2k

k !.

E. Une variable centré réduite est représentée par l'expression Y=X – E X Ecart type

.

QCM 8 : A propos de la loi de Poisson, la (les)quelles(s) de ces propositions est (sont) exacte(s) :A. Elle se note P (X=k) = exp(−λ)∗(λk

/k !) .B. On peut dire que la loi de Poisson converge vers la loi binomiale quand n tend vers l'infini.C. Si X n,p ~ P(λ) alors E(X)= σ (X) .D. Si X n,p ~ P(λ) alors E(X)= λ .E. Si X n,p ~ P(λ) alors E(X)= Var (X) .

QCM 9 : Un nouveau traitement est testé sur 500 patients, La probabilité que ce traitement réussisse est de 0,6. Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :A. Ce test suit une loi de Bernoulli.B. Ce test suit une loi binomiale.C. E(X)= 30.D. V(X)= 300.E. V(X) = 120.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

76

QCM 10 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :A. La variance est égale à √σ(X).B. Pour les variables aléatoires continues, toutes les valeurs de IR sont possibles.C. La loi normale est une loi continue.D. La loi binomiale modélise la répétition de n épreuves de Bernoulli.E. 5 ! = 5+4+3+2+1.

QCM 11 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exactes :A. Dans la loi de Poisson, l'écart type est suffisant pour représenter la loi de probabilité.B. Une distribution asymétrique peut correspondre à une loi de Poisson.C. Dans la loi binomiale, l'ordre des réponses est imposé.D. Pour les variables aléatoires continues, la probabilité en un point est nulle.E. Plus n est petit plus l'estimation est précise.

QCM 12 : Dans une population de 800 personnes, la probabilité d'avoir un accident de la route est de 0,06. Parmi les propositions suivantes la(les)quelle(s) est(sont) exactes :A. La loi de probabilité peut suivre une loi de Poisson.B. La loi utilisée peut se noter B (800, 0,06).C. P (X=0) = 0,94800 .

D. P (X=2) = (800 !)

(2 !∗798!).0,062. 0,94798

.

E. σ (X) = 800*0,06*0,94.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

77

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

78

Lois de probabilités, ce qu’il fallait répondre :

1 : BCE 2 : ACDE 3 : ABDE 4 : AE 5 : AD6 : ABD 7 : CE 8 : ADE 9 : BE 10 : BCD11 : ABD 12 : BCD

Pourquoi certaines réponses sont fausses :

QCM 1 : A. c'est la E car on compte le nombre de boules rouges et non noires.

D. P X=2 =n2 .34 2

. 14n−2

=n n−1

2∗0,752 .0,25n−2

QCM 4 : B. La formule est bonne sauf que 1-p est égal à 0,97 et non 0,07.D. P (X ≥ 1) = 1 – P(X = 0) = 1 – 0,97n

QCM 5 : B. ANNULEC. La variable sera qualitative ordinale, de toute façon une loi quantitative ne peut pas être ordinale ou nominale.E. C'est la médiane, la moyenne ne divise pas forcément un échantillon en deux parties égales.

QCM 6 : A. VRAI : C'est une loi binomiale de paramètres n= 200 et p= 0,01.B. VRAI : E X =np . C. Var X =np1− p=19,8 et σ=√var(X )=1,407... .D. VRAI : P X=2=e−2×2² /2 !=e−2×4 /2=e−2×2=2/e²E. C'est l'inverse, p est Petit et n est graNd.

QCM 7 : A. P X=4=54×154

×45

.

B. Ecart type = √ V(X) = √ n*p*(1 – p) = √ (5 * 1/5 * 4/5) = √4/5D.Lorsque la variance est proche de l'espérance.

QCM 8 : B. C'est l'inverse, la loi binomiale tend vers une loi de poisson quand n tend vers l'infini.C.Cf E.

QCM 9 : C. E(X)=np=500*0,6=300D. V(X)= np(1-p)= 500*0,6*0,4=120

QCM 10 : A. C'est l'inverse.E. 5! =5*4*3*2*1.

QCM 11: C. Non imposé.E. Plus n est grand.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

79

QCM 12 : A. np=800*0,06= 48 > 5 donc la loi de Poisson ne peut pas être appliquée.E. Il s'agit de l'expression de la variance.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

80

IV - Tests Statistiques – Synthèse

Tests Statistiques

I. INTRODUCTION

• Objectif d'un test statistique: Étendre ou non à la population les résultats obtenus sur un échantillon issu de cette même population.

• Procédure: ◦ Formuler une hypothèse pour la population.◦ En considérant l'hypothèse vraie, prédire les observations sur un échantillon de la

population.◦ Comparer la prédiction « théorique » à l'observation « pratique ».◦ Conclure : rejet ou non-rejet de l'hypothèse.

▪ Prédiction = Observation → Non-rejet : les fluctuations d'échantillonnage expliquent la différence que l'on peut observer.

▪ Prédiction ≠ Observation → Rejet : il y a une vraie différence entre l'échantillon et la population dont il est issu.

II. PRINCIPE

1. Formuler une hypothèse.

L'hypothèse nulle H0 L’hypothèse alternative H1

• Affirmation (pas interrogation!) à tester.• « Il n’existe pas de différence entre les paramètres comparés. » ou « La différence observée n’est pas significative, elle est due aux fluctuations d’échantillonnage (hasard). »• En bref: toujours un signe = (très très important, piège dans les QCM)• Rejetée ou non-rejetée mais JAMAIS acceptée!

• SI rejet de H0 • « Il y a une vraie différence » ou « H0 est fausse ».• 3 formes possibles : ≠ : bilatérale (inégalité simple) < : unilatérale (sens de l'inégalité préfiguré) > : unilatérale (sens de l'inégalité préfiguré)

Attention piège dans les QCM : Les hypothèses et test d'hypothèse s'appliquent dans la POPULATION et non dans l'échantillon testé !!!

2. Décrire la situation à observer si H0 vraie : utilisation d'une statistique de test = variable aléatoire dont on étudie la distribution (prédiction théorique).

3. Confronter l'observation à H0 : calcul de la probabilité de rencontrer dans la population la valeur observée sur l'échantillon. En pratique, calcul de la probabilité d'observer sous H0 des valeurs

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

81

plus extrêmes que la valeur observée sur l'échantillon.Plus la probabilité d'observer sous H0 des valeurs plus extrêmes que la valeur observée est faible, plus H0 semble fausse.

Exemple sur un test unilatéral:

4. Conclure après choix d'un seuil influencé par le risque:• Proba > Seuil : NON-REJET de H0 → Différence NON-SIGNIFICATIVE.• Proba < Seuil : REJET de H0 (probabilité trop petite de retrouver dans la population

la valeur observée dans l'échantillon) → Différence SIGNIFICATIVE.

III. RISQUES D'ERREUR, PUISSANCE ET DEGRÉ DE SIGNIFICATION

L'état du monde réel nous est inconnu (on ne saura jamais à 100% si H0 est vraie ou fausse!). Il faut alors accepter l'erreur éventuelle avec des risques connus et acceptés par tous.

Le risque α (de 1ère espèce) Le risque β (de 2nde espèce)

Probabilité de rejeter H0 à tort = Risque d'affirmer une différence qui n'existe

pas dans la réalité

Probabilité de ne pas rejeter H0 alors que H1

vraie (donc H0 fausse) = Risque de ne pas affirmer une différence qui

pourtant existe

α est défini à priori, en général à 5% β est défini si une hypothèse H1 est formulée

Risque (α ou β) ↓ quand Taille de échantillon ↑ Variance et erreur de mesure ↓

La puissance (1-β) : Probabilité de rejeter H0 alors que H1 vraie= Probabilité de conclure à une différence qui existe réellement (so good!)

(1-β) ↑ quand: α ↑Taille de échantillon ↑Écart entre H0 et H1 ↑ (écart + grand = différence + visible)Variance ↑

Le degré de signification p : Probabilité d'obtenir dans la population une valeur au moins aussi extrême que la valeur observée dans l'échantillon.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

82

Petit p = Grand rejet de H0 (cf. schémas précédents)• Si p < 5% : Rejet de H0 (au risque α près).• Si p > 5% : Non-rejet de H0 (au risque β près).

On rejette H0 au risque α de le faire à tort.On ne rejette pas H0 au risque ß de le faire à tort.

IV. TESTS PARAMÉTRIQUES ET NON-PARAMÉTRIQUES

• Tests paramétriques → Hypothèses, Statistiques de tests et leurs distributions.• Tests non-paramétriques → Hypothèses.• Tests non-paramétriques = Tests de rattrapage

V. CHOIX D'UN TEST STATISTIQUE

En fonction de :• La variable étudiée :

◦ Qualitative (Nominale, Ordinale).◦ Quantitative (Discrète, Continue).

• La taille de l'échantillon :◦ n ≥ 30 permet d'utiliser une statistique fondée sur une distribution normale.◦ n < 30 : normalité à vérifier, si pas de normalité recours au test non-paramétrique.

• Des échantillons :◦ Indépendants (mesures sur des individus différents).◦ Appariés (différentes mesures chez les mêmes individus).

• Des conditions d'applications.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

83

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

84

TESTS DE COMPARAISON DE MOYENNES

I. QUE COMPARER?

1 2 3

Une moyenne observée à une moyenne théorique

2 moyennes observées dans 2 échantillons indépendants

2 moyennes observées sur 2 échantillons appariés

II. AVEC QUEL TEST?

Test Z de l'écart réduit Test T de Student

Con

ditio

ns • n ≥ 30 • Égalité des variances des populations dont sont issus les échantillons• n < 30 avec normalité des distributions• n ≥ 30 (sans condition)

III.MÉTHODES

1.Z:Test de l'écart réduit pour comparer une moyenne observée à une moyenne théorique

Hypothèses Conditions d'application

Calcul Résultats

H0 : M = μ n ≥ 30

H1 bilatéral : M ≠ μ |Z| ≥ zα/2 : Rejet de H0

H1 unilatéral : M < μ Z ≥ zα : Rejet de H0

H1 unilatéral : M > μ Z ≤ (-zα): Rejet de H0

μ: moyenne connue de la population de référenceM: moyenne inconnue de la population d'où est issu l'échantillonm: moyenne observée dans l'échantillons: écart type de l'échantillonn: effectif de l'échantillonzα: valeur seuil au risque α

2.Z:Test de l'écart réduit pour comparer 2 moyennes observées dans 2 échantillons indépendants

Hypothèses Conditions d'application

Calcul Résultats

H0: µ1 = µ2 n1 ET n2 >30

H1 bilatéral : µ1 ≠ µ2 |Z| ≥ zα/2 : Rejet de H0

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

85

H1 unilatéral : µ1 > µ2 Z ≥ zα : Rejet de H0

H1 unilatéral : µ1 < µ2 Z ≤ (-zα) : Rejet de H0

µ1 et µ2: moyennes inconnues des 2 populations d'où sont issues les échantillonsm1 et m2: moyennes observées des 2 échantillonss2

1 et s22: variances des deux échantillons

n1 et n2: effectifs des 2 échantillonszα: valeur seuil au risque α

3.Z:Test de l'écart réduit pour comparer 2 moyennes observées dans 2 échantillons appariés

Il s'agit ici de comparer 2 séries d'une variable quantitative venant d'échantillons de même taille (chaque observation d'un échantillon a une observation homologue sur l'autre échantillon constituant une paire) ou de comparer 2 séries d'une variable quantitative venant d'un échantillon mesuré à des temps différents.

Hypothèses Conditions d'application

Calcul Résultats

H0: md = 0 n ≥ 30

H1 bilatéral : md ≠ 0 |Z| ≥ zα/2 : Rejet de H0

H1 unilatéral : md > 0 Z ≥ zα : Rejet de H0

H1 unilatéral : md < 0 Z ≤ zα : Rejet de H0

xi et yi: valeurs observées dans chaque sériedi = xi-yi

s²d: variance des différencesmd: moyenne des différences entre sujets appariésn: nombre de couples appariés (pairs)zα: valeur seuil au risque α

1.T:Test de Student pour comparer une moyenne observée à une moyenne théorique

Hypothèses Conditions d'application

Calcul Résultats

H0 : M = μ Distribution normale de la variable dans la

population !!!H1 bilatéral : M ≠ μ |t| > t(n-1);α/2 : Rejet de H0

H1 unilatéral : M < μ t > t(n-1);α : Rejet de H0

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

86

ddl=(n-1)H1 unilatéral : M > μ t < (- t(n-1);α) : Rejet de H0

ddl: degré de liberté (voir avec la table de la loi T de Student)t(n-1);α : valeur seuil au risque α de la loi de Student à n-1 degrés de liberté

2.T:Test de Student pour comparer 2 moyennes observées dans 2 échantillons indépendants

Hypothèses Conditions d'application

Calcul Résultats

H0: µ1 = µ2 • Si un des deux échantillons trop petit (ni < 30), distribution normale de la variable dans les deux pop.• Egalité des variances. ddl = n1 + n2 - 2

H1 bilatéral : µ1 ≠ µ2 |t| ≥ t(n-1);α/2 : Rejet de H0

H1 unilatéral : µ1 > µ2 t ≥ t(n-1);α : Rejet de H0

H1 unilatéral : µ1 < µ2 t ≤ (- t(n-1);α) : Rejet de H0

µ1 et µ2: moyennes inconnues des 2 populations d'où sont issues les échantillonsm1 et m2: moyennes observées des 2 échantillonss2

1 et s22: variances des deux échantillons

n1 et n2: effectifs des 2 échantillons

3.T:Test de Student pour comparer 2 moyennes observées dans 2 échantillons appariés

Il s'agit ici de comparer 2 séries d'une variable quantitative venant d'échantillons de même taille (chaque observation d'un échantillon a une observation homologue sur l'autre échantillon constituant une paire) ou de comparer 2 séries d'une variable quantitative venant d'un échantillon mesuré à des temps différents.

Hypothèses Conditions d'application

Calcul Résultats

H0: md = 0 Si un des deux échantillons trop petit(ni<30), les différences

di doivent être distribuées de façon

normale! ddl = (n-1)

H1 bilatéral : md ≠ 0 |t| ≥ t(n-1);α/2 : Rejet de H0

H1 unilatéral : md > 0 t ≥ t(n-1);α : Rejet de H0

H1 unilatéral : md < 0 t ≤ (- t(n-1);α) : Rejet de H0

xi et yi: valeurs observées dans chaque sériedi = xi-yi

s²d: variance des différencesmd: moyenne des différences entre sujets appariésn: nombre de couples appariés (pairs)

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

87

Remarque: L'intérêt d'un test apparié (Z ou T) est multiple: ↓ la variabilité à la seule différence entre paires, test + puissant.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

88

.=∑ (O ij−C ij)2

C ij

TEST DU CHI-2

I. INTRODUCTION

Pour étudier deux variables qualitatives, 4 utilisations du test du chi-2 : • Variables dichotomiques (2 modalités) :

◦ Comparaison de fréquences (fumeur/non fumeur).◦ Comparaison d'une fréquence à une valeur théorique.◦ Comparaison de deux fréquences.◦

• Variables à plus de deux modalités :◦ Comparaison de distributions (groupes sanguins).◦ Comparaison d'une distribution à une distribution théorique.◦ Comparaison de plusieurs distributions.

II. PRINCIPE

1. Formuler H0 et H1.2. Prédire sous H0 (considérée vraie) les effectifs attendus ou théoriques.3. Comparer les effectifs observés aux effectifs attendus.4. Conclure: rejet ou non-rejet de H0.

Utilisation de tableaux de contingence.

Tableau des effectifs observés (Oij) Tableau des effectifs attendus calculés (Eij)B1 B2 Total

Avec A et B deux

variables qualitativ

es

B1 B2 Total

A1 O11 O12 a1 A1 E11 E12 a1

A2 O21 O22 a2 A2 E21 E22 a2

Total b1 b2 N Total b1 b2 N

Pour calculer les effectifs attendus:

Sous H0 la différence entre les effectifs observés et théoriques est proche de 0. Le but du test du chi-2 est de vérifier que la somme de ces différences (statistique de test) n’excède pas une certaine valeur, auquel cas on rejetterait H0.Sous H0 la statistique de test suit une loi du X ² à (ligne-1)(colonne-1) degrés de liberté:

X ²

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

89

Eij=total de laligne×total de la colonne

effectif total=

ai×b j

N

On compare ensuite la valeur calculée X ² à la valeur correspondante sur la table du X ² au seuil choisi:

• Valeur calculée > Valeur tablée → Rejet de H0. • Valeur calculée < Valeur tablée → Non-rejet de H0.

Condition d'application:Les effectifs théoriques calculés de chaque case doivent être supérieurs ou égaux à 5.

III.COMPARAISON DE DEUX FRÉQUENCES

1. Comparaison d'une fréquence observée sur un échantillon à une fréquence théorique.

En comparant une fréquence théorique f à la fréquence observée fo d'un échantillon de N personnes issues d'une population donnée, on peut déterminer si la fréquence vraie de la population dont est issue l'échantillon est égale à la fréquence théorique.On utilise un test du chi-2:

• Si |X ²| ≥ X ²α/2 pour un test bilatéral, on rejette H0 : la fréquence vraie de la population diffèrede la fréquence théorique.

• Si X ² < X ²α ou X ² > X ²α pour un test unilatéral, on rejette H0 : la fréquence vraie de la population est (selon H1) inférieure ou supérieure à la fréquence théorique.

2. Comparaison d'une fréquence observée sur un échantillon à une autre fréquence observée

À partir des fréquences observées sur plusieurs échantillons, on peut déterminer si ces échantillons sont issus de la même population.

On calcule de la même façon la valeur du X ². Le résultat du test se détermine de la même manière que précédemment par rapport à un seuil fonction du risque.

IV. COMPARAISON DE DISTRIBUTIONS

1. Comparaison d'une distribution observée à une distribution théorique

On veut déterminer si la distribution de la variable dans l'échantillon observé est identique à la distribution de la population de référence. On utilise aussi un test du chi-2.

2. Comparaison de plusieurs distributions

On veut déterminer si les distributions des populations d'où proviennent plusieurs échantillons observés sont identiques entre elles.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

90

.=∑ (O ij−C ij)2

C ij

!

.=∑ (O ij−C ij)2

C ij

Dans les 2 cas, on utilise un test du chi-2 comme précédemment.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

91

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

92

QCM Tests statistiques

QCM 1 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :A. Erreur de 1ère espèce = on rejette H0 alors que H0 est vraie.B. Erreur de 1ère espèce = on accepte H0 alors H0 n’est pas vraie.C. Erreur de 2ème espèce = on rejette H0 alors que H0 est vraie.D. Lorsque l’on ne rejette pas H0, on en conclut l’absence de différences.E. Il est souvent écrit que le test est significatif lorsque l’on rejette H0.

QCM 2 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :A. Le seuil de 5% signifie que l’on a un risque d’erreur de 5% si on a rejeté l’hypothèse nulle.B. Le seuil de 5% signifie que l’on a un risque d’erreur de 5% si on a accepté l’hypothèse nulle. C. Dire que le test est non significatif au seuil de 5% veut dire que l’on a rejeté l’hypothèse nulle. D. Dire que le test est non significatif au seuil de 5% veut dire que l'on a accepté l’hypothèse nulle. E. Dire que le test est significatif au seuil de 5% veut dire que l’on a rejeté l’hypothèse nulle.

QCM 3 : A propos des tests d'hypothèses, indiquez si les propositions sont vraies ou fausses : A. Lors d'un test statistique, l'hypothèse nulle peut être rejetée, même si elle est vraie.B. Si l'on fait un test dans le but de comparer la rapidité de deux types d'interventions, en choisissant un risque de première espèce de 5 %, le degré de signification ne varie pas en fonction de l'échantillon choisi.C. De façon générale, lorsque un test s'avère non-significatif, cela signifie que l'on peut attribuer les différences observées aux fluctuations d’échantillonnage.D. La p-value n'est pas calculable lorsque l'hypothèse nulle est rejetée. E. Le choix de l'hypothèse alternative influe sur les seuils de décision de rejet ou non-rejet de l'hypothèse nulle

QCM 4 : A propos des tests d'hypothèses, indiquez si les propositions sont vraies ou fausses : A. Les fluctuations d’échantillonnage créent une variabilité de la moyenne observée sur les échantillons issus de la population étudiée.B. Si la probabilité d'observer sous H0 des valeurs de la statistique de test au moins aussi extrême que celle observée est faible, alors l'hypothèse nulle est fausse.C. Le risque de deuxième espèce ne dépend pas de H1.D. Le risque de première espèce permet de fixer le taux de rejet d'H0, alors qu'H0 est vraie.E. Lors d'un test statistique, la distribution de la statistique de test est connue sous H0.

QCM 5 : La répartition des groupes sanguins dans la population française est donnée comme étant la suivante : groupe A : 30%, groupe B : 25%, groupe AB 40%, groupe O : 5%. On souhaite vérifier ces données, sur la base d'un test statistique fait sur un échantillon représentatif de la population française. Sur 100 personnes interrogées, les fréquences suivantes apparaissent : Groupe A : 22 personnes, Groupe B : 33 personnes, Groupe AB : 34 personnes, Groupe O : 11 personnes. Le risque alpha de première espèce choisi est de 1%. La valeur seuil du test choisi est 5,6. A. L'hypothèse nulle est que la répartition des groupes sanguins dans l'échantillon est conforme aux fréquences donnéesB. L'hypothèse nulle est que la répartition des groupes sanguins dans la population est conforme aux fréquences données

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

93

C. Il est possible d'utiliser un test de Student pour tester H0.D. Il est possible d'utiliser un test de l'écart-réduit.E. Le test utilisé est le chi-2

QCM 6 : Cf énoncé du QCM 5A. Le nombre de degrés de liberté de la loi suivie par la statistique de test est 4.B. Le nombre de degrés de liberté de la loi suivie par la statistique de test est 3.C. Les conditions d'application pour effectuer le test approprié sont réunies car les effectifs observés sont tous supérieurs à 5.D. Si la valeur observée de la statistique de test est de 3,4, alors on peut rejeter H0.E. Si la p-value est de 8,2, alors, il est possible de ne pas rejeter H0.

QCM 7 : On souhaite savoir si l'apparition d'une bronchite est liée à l'exposition à la cigarette. On choisit ainsi deux groupes de sujets : 80 personnes ayant une bronchite (groupe A) , 110 n'en ayant pas (groupe B). On détermine également trois niveaux d'exposition à la cigarette : non fumeur, fumeur régulier et enfin, gros fumeur. Dans le groupe A, 11 personnes sont non fumeur, 25 sont fumeurs occasionnels et 44 sont gros fumeurs. Dans le groupe B, 70 sont non fumeurs, 30 sont fumeurs occasionnels, 10 sont gros fumeurs. A. L'hypothèse nulle est que la proportion de personnes ayant développé une bronchite est la même dans le groupe A et B.B. L'hypothèse nulle est que la répartition des différents « niveaux de fumeurs » est la même dans les groupes A et B. C. L'hypothèse nulle est que la répartition des différents niveaux d'exposition à la cigarette est la même chez les gens ayant une bronchite et ceux n'en ayant pas.D. Il est possible d'effectuer un test de Student pour répondre au problème, cependant il est préférable d'utiliser un test de l'écart-réduit, ce dernier étant plus précis. E. Le nombre de degrés de liberté suivi par la statistique de test est 2.

QCM 8 : A propos des tests statistiques : A. α évolue dans le sens inverse de βB. Si α augmente, alors la puissance se voit augmentée, toutes choses étant égales par ailleurs.C. Si la variance augmente, alors la puissance diminue.D. plus les échantillons sont grands, plus la puissance est grande. E. Si l'écart entre H0 et H1 augmente, alors la puissance diminue.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

94

Tests Statistiques, ce qu’il fallait répondre :

1 : AE 2 : ADE 3 : ACE 4 : ADE 5 : BE6 : B 7 : CE 8 : ABCD

Pourquoi certaines réponses sont fausses :

QCM 1 :B. Erreur de 1ère espèce = on rejette H0 alors que H0 est vraie.C. Erreur de 2èmeespèce= H1 est vraie mais on ne rejette pas H0.D. Lorsque l'on ne rejette pas H0, on n’a pas décelé de différence mais on ne peut pas affirmer une absence de différence.

QCM 2 :B. Le seuil de 5% signifie que l’on a un risque d’erreur de 5% si on a rejeté l’hypothèse nulle. De plus on n'accepte jamais H

0

C. Dire que le test est non significatif au seuil de 5% veut dire que l’on a pas refusé l’hypothèse nulle.

QCM 3 : rappel : p = p-value = degré de signification A. VRAI, c'est la définition du risque alpha.B. A chaque échantillon correspond une p-value qui lui est propre, la comparaison aux seuils permet de rejetter ou non ensuite l'hypothèse.

D. C'est la p-value qui, une fois comparée aux seuils, permet de conclure au rejet ou non de H0.

QCM 4 : B. Dans le cas décrit, le degré de signification est faible ce qui signifie que H0 est peu crédible, voire que l'on peut rejeter H0, cependant, il existe toujours le risque de rejeter H0 à tord (alpha). E. VRAI, c'est cette distribution qui nous permettra de fixer un seuil, afin de conclure au rejet ou non-rejet d'H0.

QCM 5 : A. ATTENTION, l'hypothèse nulle concerne toujours la population, et jamais l'échantillon #piège classique.C. D. Ici, il s'agit de comparaison de fréquences, les tests de student de de l'écart réduit sont donc inutiles car ne servent qu'à comparer des moyennes.

QCM 6 : A. Non, 3. ddl = (nb de lignes – 1) * (nb de colonnes – 1) = (2-1)*(4-1) = 3C.Attention, la condition concernant le test chi-2 s'applique aux effectifs théoriques et non pas aux effectifs observés.D. 3,4 < 5,6, donc, on ne peut pas rejetter H0.E. 8,2 > 5,6, donc on rejette H0, avec le risque alpha (ici 1%) de le faire à tort.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

95

QCM 7 : La clé pour tout ce genre de problèmes est de bien analyser les données, pour identifier H0, eventuellement H1,et, pour savoir quel test il est possible d'utiliser pour repondre au problème.A. Doublement faux : premierement, H0 concerne les populations dont sont issus les groupes A et B, de plus cette hypothèse n'as pas de sens car les groupes sont déja séléctionés en fonction de leur exposition à la bronchite. B. Non, dans les populations et non les groupes. D. Ces deux tests sont inutiles car il s'agit d'une étude de répartition, seul le chi-2 est adapté ici.

QCM 8 : E. Faux, la puissance augmente.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

96

QCM Tests de comparaison de moyennes

QCM 1 : A propos des tests d’hypothèses, indiquez les propositions :A. Les tests d’hypothèses permettent d’extrapoler les résultats observés sur les échantillons aux populations.B. Pour comparer deux échantillons appariés, on peut utiliser un test de Student à condition que les différences di soient normalement distribuées. C. Le choix de la valeur seuil au-delà de laquelle on rejette l’hypothèse nulle H0 dépend du risque d’erreur β et de l’hypothèse alternative.D. L’erreur de première espèce consiste à rejeter l’hypothèse nulle alors qu’elle est vraie.E. Le risque d’erreur de deuxième espèce et la puissance d’un test varient dans le même sens.

QCM 2 : Dans le cadre d’un test de comparaison de deux échantillons appariés, indiquez les propositions suivantes vraies :A. Il faut formuler l’hypothèse alternative avant d'avoir examiné les données.B. Moins la p-value est faible, plus H0 est crédible. C. On peut calculer la valeur seuil de la loi de Student avec (n1 +n2 -2) degrés de liberté.D. Lorsque p>α, on ne rejette pas H0, on peut donc affirmer qu’H0 est vraie.E. Pour utiliser un test de l’écart réduit, il faut que la variable n soit supérieure ou égale à 30.

QCM 3 : On souhaite comparer l'age moyen entre des patients ayant fait un scanner validant une fracture de l'humérus et ceux pour lesquels la fracture n'est pas confirmée : les résultats donnent le tableau suivant :

Fracture de l'humérus confirmée :

Oui : Non :

Moyenne : Écart-type : Moyenne : Ecart-type : P-value :

Age (années) : 26,2 12,5 32,4 14,6 <0,04

A. Pour comparer les moyennes d'age, il est possible d'utiliser un test de l'écart-réduit.B. Pour comparer ces moyennes, il est possible d'utiliser un test de Student, à conditions que les conditions d'application sont bien vérifiées. C. Le test du chi-2 est adapté pour faire la comparaison de ces moyennes d'âge.D. On peut conclure que l'on rejette l'hypothèse alternative (au risque alpha = 0,05).E. On peut conclure que l'on rejette l'hypothèse alternative (au risque alpha = 0,01).

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

97

Tests de comparaison de moyennes, ce qu’il fallait répondre :

1 : ABD 2 : ABE 3 : ABE

Pourquoi certaines réponses sont fausses :

QCM 1 : C. Faux, car dépend du risque d’erreur α et non β.E. Faux car Puissance = 1- β.

QCM 2 : B. Vrai: Plus le degré de signification (p value) est grand, plus H0 est crédible.C. Échantillons indépendants : (n1 +n2 -2) ddl.Échantillons appariés : (n-1) ddl.D. On ne peut pas affirmer que H0 est vraie, on conclut juste qu’on a pas mis en évidence de différence significative.

QCM 3 : C. Le test du chi-2 est inutile pour la comparaison de moyennes. D. Non. 0,04 < 0,05, ainsi, on peut rejeter H0, est donc acceptée H1 = hypothèse alternative.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

98

QCM: Tests du chi-2

QCM 1 : On souhaite « savoir » si la consommation d'alcool est identique chez les étudiants en médecine en première et en deuxième année... Pour cela, on étudie chez deux échantillons de 100 personnes, notés P1 et P2, la fréquence de consommation d'alcool.

Jamais Moins de 5 verres par semaine

Entre 5 et 10 verres par semaine

Plus de 10 verres par semaine

P1 75 20 4 1

P2 2 7 21 70

On cherche alors à déduire si la consommation d'alcool peut être considérée comme identique chez les étudiants de première et de deuxième année :

A. L'hypothèse H0 du test est : « la consommation d'alcool est identique chez les deux échantillons. » B. Il est impossible de réaliser un test du X ² car les effectifs de chaque case ne respectent pas les conditions d'application du test.C. Il faut regrouper les effectifs des classes « entre 5 et 10 verres par semaine » et« plus de 10 verres par semaine » pour que les conditions d'application du test soient respectées.D. Le test à réaliser est un test du X ² de degré de liberté égal à 4.E. Le test à réaliser est un test du X ² de degré de liberté égal à 3.

QCM 2 : On s'interroge maintenant sur une éventuelle relation entre la consommation d'alcool chez un étudiant en médecine et sa capacité à être présent aux cours dispensés en amphithéâtre. On réalise une étude sur un échantillon de 200 étudiants en deuxième année de médecine.

Consommation occasionnelle

Consommation régulière

Consommation excessive

Totaux

Toujours présent 18 27 3 48

Quelque fois présent

3 10 51 64

Rarement présent 1 7 80 88

Totaux 23 43 134 200

On calcule les effectifs théoriques puis la statistique du test du X ² La statistique du test donne le résultat : X ² = 35,95On donne X ² 5% = 16,92 pour ddl= 9 et X ² 5% = 9,49 pour ddl =4.

A. L'hypothèse nulle est : « La présence en amphithéâtre d'un étudiant en médecine est liée à sa consommation d'alcool ».B. Le test réalisé est un test du X ² de degré de liberté égal à 9.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

99

C. Le test réalisé est un test du X ² de degré de liberté égal à 4.D. Les résultats obtenus permettent de rejeter l'hypothèse nulle.E. Cette étude montre que les deux variables étudiées ne sont pas liées.

QCM 3 : Avant des élections, on demande à trois échantillons de 500 personnes issues de la population d'électeurs, de tranches d'âges différentes (18 à 30 ans, 30 à 60 ans, plus de 60 ans), leur intention de vote. Les résultats ont été répertoriés dans le tableau ci-dessous :

Candidat A

Candidat B

Ni l'un ni l'autre Total

18 – 30 ans Effectif observéEffectif théorique

175175

175225

150100

500

30 – 60 ans Effectif observéEffectif théorique

200175

200225

100100

500

Plus de 60 ans Effectif observéEffectif théorique

150175

300225

50100

500

Total 525 675 300 1500

Statistique du test X ² = 19,4444 X ² 5% = 3,841 pour ddl= 1X ² 5% = 5,991 pour ddl= 2X ² 5% = 7,815 pour ddl= 3X ² 5% = 9,448 pour ddl= 4X ² 5% = 11,070 pour ddl= 5

A. On réalise un test du chi-2 de comparaison d'une distribution à une distribution théorique. B. Les variables étudiées sont des variables quantitatives. C. L'hypothèse nulle est : « les intentions de votes dans la population sont identiques selon les trois classes d'âge étudiées ». D. On réalise un test du chi-2 à 3 ddl.E. On peut affirmer avec un risque de se tromper de 5% que les intentions de vote dans la population sont différentes selon les trois classes d'âges étudiées.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

100

QCM 4 : Une étude scientifique a été menée pour savoir si le fait porter des chaussettes par-dessus ses chaussures en hiver permettait de réduire le nombre de chute en marchant sur le verglas. On a réparti un échantillon de 10 volontaires en 2 groupes égaux, un portant des chaussettes par-dessus leur chaussures, l'autre portant seulement des chaussures. On a fait parcourir à chaque individu un trajet de 500 m très verglacé au cours duquel on a compté le nombre de chutes. On a recensé les résultats observés dans un tableau ainsi que les résultats théoriques sous l'hypothèse nulle H0 : « Le nombre de chutes n'est pas lié au fait de porter ou pas des chaussettes par-dessus ses chaussures ».

Aucune chute 1 seule chute 2 chutes ou plus

Chaussures seulement Effectif observé : 1Effectif théorique : ??

Effectif observé : 2Effectif théorique : ??

Effectif observé : 2 Effectif théorique : 1,5

Chaussures recouvertes par les chaussettes

Effectif observé : 4 Effectif théorique : 2,5

Effectif observé : 0Effectif théorique : ??

Effectif observé : 1 Effectif théorique : 1,5

A. On peut réaliser un test du Chi-2 à 2 ddl.

B. L'effectif théorique sous H0 des personnes portant seulement des chaussures et n'ayant effectué aucune chute est de 2,5.

C. L'effectif théorique sous H0 des personnes portant seulement des chaussures et n'ayant effectué aucune chute est de 0,5.

D. L'effectif théorique sous H0 des personnes portant seulement des chaussures et étant tombées une seule fois est de 0.

E. L'effectif théorique sous H0 des personnes portant seulement des chaussures et étant tombées une seule fois est de 1.

QCM 5 et 6 : Après une colle de mathématiques, les résultats de Purpan et de Rangueil sont relevés et classés. On utilise un test bilatéral pour savoir si les résultats sont identiquement répartis entre les étudiants de Rangueil et Purpan :

0 à 4 5 à 9 10 à 14 15 à 20

Rangueil 220 260 270 50

Purpan 240 230 300 30La statistique de test donne le résultat X ² = 9,285.On donne X ² 5% = 7,18 pour ddl= 3 et X ² 5% = 15,51 pour ddl= 8.

QCM 5 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :A. On réalise un test du Chi 2 à 8 degrés de liberté. B. On réalise un test du Chi 2 à 3 degrés de liberté. C. Les conditions d'applications ne sont pas réunies car on compte moins de 5 degrés de liberté. D. Les effectifs respectent les conditions d'applications du test. E. L'hypothèse H1 est la suivante : « les étudiants de Rangueil sont moins fort en mathématique que les étudiants de Purpan ».

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

101

QCM 6 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :A. La statistique de test que l'on utilise est la suivante : [(220-230)²/230]+[(240-230)²/230]+[(260-245)²/245]+[(230-245)²/245]+[(270-285)²/285]+[(300-285)²/285]+[(50-40)²/40]+[(30-40)²/40].B. On ne met pas en évidence de différence significative dans la répartition des notes entre les étudiants de Rangueil et de Purpan. C. On retient l'hypothèse H1 : « la répartition des notes est différente entre les étudiants de Rangueil et Purpan ».En utilisant les données précédentes, on calcule les effectifs théoriques puis la statistique du test.D. En ajoutant une ligne concernant les étudiants de Maraîchers, on effectuerait un test du Chi 2 à 6 degrés de liberté. E. En ajoutant une ligne concernant les étudiants de Maraîchers, on effectuerait un test du Chi 2 à 9 degrés de liberté.

QCM 7 : On souhaite étudier la répartition de l'âge selon le sexe des individus, l'enquête donne le tableau suivant :

Hommes (n = 236) Femmes (n = 232)

20-39 ans EffectifEffectif théorique

143177,5

124174,5

40-59 ans EffectifEffectif théorique

8056,2

10153,6

>60 EffectifEffectif théorique

132,3

73,9

A. On peut utiliser un test chi-2.B. On peut utiliser un test de Student.C. On peut utiliser un test chi-2 à 4 degrés de liberté.D. Les conditions de validité du chi-2 ne sont pas remplies.E. On peut utiliser un test de l'écart-réduit.

QCM 8 : Dans la population française, le pourcentage de rhésus négatif est de 15 %, on tire au sort parmi l’amphithéâtre 200 PACES, on observe que 48 personnes sont rhésus négatif. On veut savoir, (avec le risque α = 5%) si les PACES different de la population française vis-à-vis du caractère rhésus. La valeur de la statistique de test est de 8,32 et le degré de signification est de 0,007. A. Il s'agit d'un test statistique de comparaison d'une moyenne à une valeur théorique. B. L'hypothèse nulle est que la proportion de rhésus négatif observée chez les PACES est identique.C. Le nombre de degrés de liberté suivi par la statistique de test est 2.D. On rejette l'hypothèse nulle car 8,32 > 0,007.E. On rejette l'hypothèse nulle car 0,007 < 0,05 (le risque α consenti).

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

102

77×100200

=38,5

77×100200

=38,5

27×100200

=13,5

27×100200

=13,5

25×100200

=12,5

25×100200

=12,5

71×100200

=35,5

71×100200

=35,5

Test du Chi-2, ce qu’il fallait répondre :

1 : E 2 : CD 3 : CE 4 : BE 5 : BD6 : ACD 7 : D 8 : E

Pourquoi certaines réponses sont fausses :

QCM 1 : A.L'hypothèse H0 est une affirmation concernant des populations et non des échantillons.B. et C. Les conditions d'applications du test sont respectées, l'énoncé nous donne les effectifs observés qui ne doivent pas forcément être supérieurs à 5, il faut par contre que tous les effectifs théoriques de chaque case soient supérieurs ou égal à 5, ce que l'on peut vérifier avec le tableau des effectifs théoriques ci-dessous:

Jamais Moins de 5 verres par semaine

Entre 5 et 10 verres par semaine

Plus de 10 verres par semaine

Totaux

P1 100

P2 100

Totaux 77 27 25 71 200

D. Le nombre de degré de liberté se calcule ainsi : ddl= (L-1)(C-1) =(2-1)(4-1)=3 .

QCM 2 : A. L'hypothèse nulle est : les deux variables sont indépendantes, c'est à dire « la présence en amphithéâtre d'un étudiant en médecine n'est pas liée à sa consommation d'alcool. »B. Le nombre de degré de liberté est égal à : ddl= (L-1)(C-1)=(3-1)(3-1)= 4 (Attention, dans le nombre de lignes et de colonnes, on ne prend pas en compte les totaux.)

D. Vrai: ici le calcul de la statistique de test donne X ² = 35,95 avec ddl =4 , il

faut comparer cette valeur à X ² 5% = 9, 49. Comme 35,95 > 9,49 on rejette

l'hypothèse nulle.

E. On rejette l'hypothèse nulle, les deux variables sont donc liées. Dans cette étude, on a mis en évidence une relation significative entre la consommation

d'alcool et la présence en amphithéâtre d'un étudiant de médecine de deuxième année(résultat purement théorique...).

QCM 3 : A. On compare deux distributions entre elles.

B. Le test du chi 2 sert à étudier le lien entre deux variables qualitatives, ici

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

103

tranche d'âge et intention de vote.

D. 4 ddl ( (2 – 1) x (2 – 1) ).

E. Vrai : la statistique de test est supérieure à 9,448.

QCM 4 : A. Les conditions pour appliquer le test du Chi 2 ne sont pas réunies : les effectifs théoriques sont inférieurs à 5.

C. Effectif théorique = (total de la ligne x total de la colonne) / effectif total = (5x5) / 10 = 2,5.

D. (5x2) / 10 = 1.

QCM 5 : A. On calcule les degrés de libertés de la manière suivante: ddl = (Ligne-1)(Colonne-1) en ne prenant pas en compte les effectifs totaux. Ddl= (2-1)(4-1)= 3 ddl. C. Les conditions d'applications concernent les effectifs théoriques qui doivent être supérieurs à 5. E. Un test bilatéral ne se préoccupe pas du sens de la différence.

QCM 6 : B. D'après l'énoncé, on trouve que la statistique du test X ² est supérieure au

seuil X ² 5%. On conclut donc qu'il y a une différence de notes entre les étudiants de Rangueil et Purpan. E. Si on ajoute une ligne au tableau, on a alors 3 lignes et toujours 4 colonnes. Ddl = (L-1)(C-1) = (3-1)(4-1) = 6 ddl.

QCM 7 : A. Non, car les effectifs théoriques ne sont pas tous supérieurs à 5.B. Ce test est inutile car on étudie ici des distributions. C. Le test chi-2 n'est pas utilisable...E. Ce test est inutile car on étudie ici des distributions.

QCM 8 : A. Il s'agit d'un test de comparaison de fréquences.B. L'hypothèse nulle ne concerne pas des effectifs observés (ce qui est un synonyme de „échantillon“) mais au contraire la population dont ils sont issus. C. Non, un seul degré de liberté. Test du chi 2 → ddl = (colonnes-1)*(lignes-1)D. ATTENTION, attention, 8,32 correspond à une valeur seuil prise par la statistique de test, et non à une probabilité, ainsi la comparaison des deux nombres n'a aucun sens mathématique.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

104

V - Epidémiologie - Synthèse

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

105

Étude expérimentale Études d'observation (1ère partie )

Types d'étude Essai comparatif randomisé (ECR)Études descriptives

Étude de cohorte longitudinale Étude transversale

Caractéristiques principales de

l'étude

Démarche expérimentale : contrôle +++

Comparaison : 2 groupes :● un groupe témoin

● un groupe avec le traitement à étudier

Clause d'ambivalence indispensable

Comparabilité : ● Randomisation : répartition initiale au hasard des participants ( au moins 300

sujets )● insu ou aveugle : simple, double ou

ouvert.

Signification statistique : utilisation des tests d'hypothèse

Film

Suivi prospectif d'une population à partir d'une caractéristique commune pendant

une durée longue

Pas de contrôle, pas de constitution de groupe (proche de la vraie vie)

Photo

Enquête de durée courte et de faible coût

Capture d'un grand nombre d'informations sur une population à un

instant donné

Objectifs Démontrer un lien de causalité Calcul du taux d'incidence Calcul de la prévalence

Résultats Analyse en ITT (intention de traiter).

DR= R1-R0P=

nombre demaladesnombre de sujets moyens étudiés

Atouts Mise en évidence Causalité Suivi de la population sur une longue durée ( plusieurs paramètres à l'étude

simultanément)Milieu Réel

Faible coût

Base de travail au début d'une démarche de recherche

Défauts Parfois milieu trop fictif (pas la réalité)Pas de mise en évidence d'association

(nombreuses informations)Coût élevé

Biais d'information souvent important ( si renseignements sur ancienne exposition )

Très sensible à l’échantillonnage

Niveau de causalité 1 Aucun Aucun

Études d'observation (2ème partie)

Études analytiques

Types d'étude

Enquêtes exposés-non exposés Enquêtes cas témoins

Caractéristiques

principales de l'étude

Comparaison : 2 groupes de personnes saines au départ

● exposés ● non exposés

Étude de la survenue ou non de la maladie ( taux d'incidence)

Étude prospective

Comparaison : 2 groupes● cas : malades

● témoins : sains Étude de l'exposition ultérieure à un

éventuel facteur de risque

Étude rétrospective

Objectif Démontrer une association entre un facteur (protecteur ou de risque) et une maladie

Collecte des résultats

Intervalle de confiance :

Si < 1 : facteur protecteurSi > 1 : facteur de risque

Si = 1 pas d'association significative ( en principe les résultats sont toujours donnés dans l'énoncé)

(nota :le RR est le rapport entre les incidences chez E+ et E-)

Calcul possible

Odds ratio et Risque relatif Uniquement Odds ratio ( = au RR pour maladies rares)

Atout Mise en évidence d'une association plus facile

Utile pour les maladies rares ou à longue durée d'apparition

Défaut Pas de causalité directe ( on parle plutôt d'association). Problème si maladies rares

ou longues à apparaître

Caractère très fictif de l'étudePas d'incidence

Niveau de causalité

2 3

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

107

Problème Solution

Erreur aléatoire ● Due aux fluctuations

d'échantillonnage : problème de représentativité de l'échantillon

● Problème de précision

● Calcul statistique, intervalle de confiance

● Augmentation éventuelle de la taille de l'échantillon si précision insuffisante

Erreurs systématiques ou

Biais

Biais de sélectio

nProblème de constitution des groupes

d'étude

● Constituer des groupes comparables

● Avoir un échantillon le plus représentatif possible (éviter les sujets-

types , volontaires ,etc ...) , avoir un groupe hétéroclite de sujets répondant

aux critères d'inclusion

● Témoins (enquête cas/témoins)et non exposés (enquête exposés/non exposés)

représentatifs notamment de la population (car ils représentent en

quelque sorte les groupes contrôles des études)

●Randomisation dans les ECR

●Biais d'inform

ationou de

classement

●Biais de

réalisation et biais

d'évaluation

(ECR)

Problème de mesure de l'exposition(enquête exposés-non

exposés) ou de la maladie (enquête cas-témoin)

La subjectivité du patient ou du médecin fausse la mesure (facteur

interne)

●Améliorer la qualité de l'information via la standardisation des outils utilisés et l'uniformisation des formations des

médecins participant aux études

●Diminuer le nombre de personnes qui arrêtent l'étude en cours de réalisation

( par exemple en facilitant l'observance)

● Pour les ECR , utilisation du double insu ou double aveugle

Biais de confusi

on

Non prise en compte d'un facteur externe qui a une activité à la fois sur le facteur de risque (ou protecteur) et

sur la maladie ( ex typique: l'âge) d'où une Erreur dans les relations

d'associations entre un facteur et la maladie

Être attentif aux facteurs de confusion

Réaliser une analyse rigoureuse en apportant aucune conclusion hâtive

Biais d'attritio

n

Analyse non objective et surtout faussée des résultats ( du fait par

exemple d'un respect toujours Analyse en ITT("comme si on avait

l'intention de le traiter")

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

108

imparfait du protocole dans les ECR, d'une déviance au protocole)

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

109

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

110

Épidémiologie QCMs

QCM 1 : Au cour d'une épidémie de grippe, on souhaite savoir si la fréquentation des transports en commun favorise la propagation de la maladie. Pour cela, on définit 2 groupes de personnes, l'une fréquentant les transports en commun plus de 3 jours par semaine, l'autre moins de 3 jour par semaine. On suit ces groupes pendant 3 mois. A. Il s'agit d'une étude cas-témoin.B. Il s'agit d'une étude analytique. C. La présence de sujets volontaires au sein d'un des groupes peut entraîner un biais de sélection.D. Un biais d'information lié à un étalonnage et un contrôle qualité insuffisants peut être réduit en augmentant le nombre de personnes inclues dans l'étude. E. On peut estimer un risque relatif.

QCM 2: Suite à la commercialisation d'un médicament, on souhaite étudier la conséquence sur le sommeil dans la population réelle. On réalise 2 groupes dans la population. L'un est exposé au médicament. L'autre constitue le groupe témoin. On trouve au bout de 8 mois de suivi, le tableau suivant :

Exposés Non-exposés

Insomnie 60 40

Absence d'insomnie 120 260

Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) : A. Cette étude nécessite une randomisation initiale. B. On peut calculer un risque relatif égal à 2,5.C. On peut calculer un risque relatif égal à 0,9. D. On peut calculer un odd ratio.E. L'indicateur de risque le plus adapté à ce test est le risque relatif.

QCM 3 : Concernant la méthodologie des essais cliniques randomisés, quelle(s) est(sont) la(les) proposition(s) inexacte(s) : A. La randomisation assure le maintien de la comparabilité entre les groupes tout au long de l'essai.B. Le simple insu implique que seul le malade ignore quel traitement lui est administré. C. Tout comme les études d'observation, on ne met pas en avant de lien de causalité.D. Ces essais possèdent le plus fort niveau de preuve.E. Une analyse en intention de traiter limite le biais d'attrition.

QCM 4 : Concernant les études d'observation, quelle(s) est(sont) la(les) proposition(s) exacte(s) : A. Une étude cas-témoin a le plus faible niveau de preuve. B. Un manque de précision peut être résolu en augmentant la taille de l'échantillon. C. Les groupes sont composés à partir de la population cible.D. Un biais de confusion est dû à un mauvais classement du sujet selon le statut exposé-non exposé.E. Ces études ont un plus faible niveau de preuve que les essais cliniques randomisés.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

111

QCM 5: On réalise une étude portant sur les facteurs de risque liés au développement des dépressions. On suppose que le cannabis est un facteur de risque. Pour le prouver, on réunit 200 personnes pour lesquelles une dépression a été soupçonnée. Sur ces 200 personnes, on déclare finalement que 20 d'entre elles ne sont pas atteintes. Sur les 20 personnes non-atteintes, 4 affirment qu'ils consommaient régulièrement du cannabis. Parmi les 180 personnes atteintes, 60 affirment qu'ils étaient des consommateurs réguliers. Quelle(s) est(sont) la(les) proposition(s) exacte(s) : A. Il s'agit d'une enquête analytique de type cas-témoin. B. Concernant l'indicateur de risque le plus adapté,on peut calculer un risque relatif égal à 17. C. Concernant l'indicateur de risque le plus adapté, on peut calculer un odd ratio égal à 2. D. Le recueil des donnés est prospectif. E. Cette enquête a un très faible niveau de preuve.

QCM 6 : A propos des études épidémiologiques observationnelles, indiquez si les propositions suivantes sont vraies ou fausses : A. Une étude cas-témoin permet d'étudier simultanément plusieurs facteurs de risque. B. Une étude exposés-non exposés nécessite souvent un grand nombre de sujets. C. Le temps de suivi dans une étude exposés – non exposés doit être identique pour tous les sujets.D. Une étude cas-témoin a le plus souvent un cout moindre qu'une étude exposés-non exposés.E. Une étude exposés-non exposés est appropriée quand la maladie est fréquente.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

112

Epidémiologie, ce qu'il fallait répondre :

1 : BCE 2 : BDE 3 : AC 4 : ABE 5 : ACE

6 : ABDE

Pourquoi certaines réponses sont fausses :

QCM 1 : A. Il s'agit d'une enquête de type exposés-non exposés. D. Un biais ne correspond pas à un manque de précision, mais à une erreur systématique dans la mesure d'un paramètre. Augmenter la taille de l'échantillon ne résout pas le problème.

QCM 2 : A. La randomisation concerne les essais cliniques et pas les études d'observation. C. Le risque relatif se calcul de la façon suivante:RR = (malades exposés / exposés) / (malades non-exposés / non-exposés) = (60/180) / (40/300) = 2,5

QCM 3 : (ATTENTION il fallait cocher les réponses INEXACTES !!!)A. La randomisation assure la comparabilité initiale des groupes. C'est l'insu qui la maintient tout au long de l'essai.C. Contrairement aux études d'observation, on met en évidence un lien de causalité.

QCM 4 : C. L'échantillon est constitué à partir de la population source.D. Il s'agit d'un biais d'information ou de classement.

QCM 5 : Grâce à l'énoncé, on réalise le tableau suivant:

Exposés Non-exposés Totaux

Dépression 60 120 180

Absence de dépression

4 16 20

Totaux 64 136 200

B.L'indicateur de risque le plus adapté est l'odds ratio qui se calcul ainsi:

odds ratio = (60 x16) / (4 x120) = 2 D. Le recueil des données est rétrospectif dans les enquêtes cas-témoin.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

113

Malades exposés x Non-malades non-exposés

Malades non-exposés x Non-malades exposés

QCM 6 : C. Cette condition n'est pas necessaire. E. VRAI. Cette réponse est en lien avec l'item B : comme il faut un grand nombre de sujets, la maladie doit être fréquente dans la population.

© Tous droits réservés au Tutorat Associatif Toulousain.Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.

114