MEMO-I402 Chapitre I: Statistiques avec...
Transcript of MEMO-I402 Chapitre I: Statistiques avec...
MEMO-I402Chapitre I: Statistiques avec Excel
Caroline Verhoeven
Table des matieres
1 Introduction
2 Statistiques descriptivesRepresentation numerique des donnees quantitativesCorrelation et regression
3 Tests d’hypotheseLa p-valeurEtapes d’un test d’hypotheseTest t pour 2 echantillons independantsTest t pour echantillon appariesExercices
Caroline Verhoeven MEMO-I402 2 / 36
Infos pratiques
Titulaire : Caroline Verhoeven
email :[email protected]
Site : http://homepages.ulb.ac.be/ ˜ cverhoev/teach.html
Horaire :les 11/02, 18/02, 25/02, 04/03, 18/03, 25/03 de 12h a 14h
Local : Salle COMFORT
Caroline Verhoeven MEMO-I402 3 / 36
Examen
Travail a rendre 4 semaines apres le dernier cours (le 15/04)Choisir un sujet qui vous plaıt. Sujet a rendre au plus tard le 01/04
2 ou 3 “questions scientifiques”Il faut des donnees
Le travail doit correspondre a 2 ou 3 exercices du type fait en coursLe travail doit contenir
Le fichier avec lequel vous avez travailleUn rapport de 2 a 3 pages avec :
1 une introduction au sujet2 la methode utilisee (pourquoi cette methode la)3 les resultats et conclusions
Caroline Verhoeven MEMO-I402 4 / 36
1. Introduction
Les logiciels
Voici quelques logiciels statistiques :
SAS
R
JMP
Minitab
SPSS
Mathematica
Caroline Verhoeven MEMO-I402 5 / 36
1. Introduction
Les logiciels
Voici quelques logiciels statistiques :
SAS
R
JMP
Minitab
SPSS
Mathematica
On peut egalement utiliser Excel
Caroline Verhoeven MEMO-I402 5 / 36
1. Introduction
Les logiciels
Voici quelques logiciels statistiques :
SAS
R
JMP
Minitab
SPSS
Mathematica
On peut egalement utiliser Excel
Caroline Verhoeven MEMO-I402 5 / 36
1. Introduction
Excel
Excel permet de faire certaines statistiques mais est limite
Caroline Verhoeven MEMO-I402 6 / 36
1. Introduction
Excel
Excel permet de faire certaines statistiques mais est limite
Le nom des fonctions en Excel depend de la langue
Caroline Verhoeven MEMO-I402 6 / 36
1. Introduction
Excel
Excel permet de faire certaines statistiques mais est limite
Le nom des fonctions en Excel depend de la langueOn peut trouver des traductions de ces noms sur les sites :
http://wwwhome.ewi.utwente.nl/ ˜ trieschn/excel/excel.htmlhttp://www.glossaire.be/english_french/glossaire_excel_fonction_anglais_francais.htm
Caroline Verhoeven MEMO-I402 6 / 36
2. Statistiques descriptives 1. Representation numerique des donnees quantitatives
Moyenne arithmetique deviation standard
Moyenne d’un echantillon
formule : x =
∑Ni=1 xi
NEn Excel : MOYENNE
Caroline Verhoeven MEMO-I402 7 / 36
2. Statistiques descriptives 1. Representation numerique des donnees quantitatives
Moyenne arithmetique deviation standard
Moyenne d’un echantillon
formule : x =
∑Ni=1 xi
NEn Excel : MOYENNE
Variance
formule : s2 =
∑Ni=1(xi − x)2
N − 1En Excel : VAR
Caroline Verhoeven MEMO-I402 7 / 36
2. Statistiques descriptives 1. Representation numerique des donnees quantitatives
Moyenne arithmetique deviation standard
Moyenne d’un echantillon
formule : x =
∑Ni=1 xi
NEn Excel : MOYENNE
Variance
formule : s2 =
∑Ni=1(xi − x)2
N − 1En Excel : VAR
Deviation standardformule s =
√s2
En Excel : ECARTYPE
Caroline Verhoeven MEMO-I402 7 / 36
2. Statistiques descriptives 1. Representation numerique des donnees quantitatives
La mediane et l’ecart interquartile
La mediane50% de sujets auront des mesures plus petites, 50% des mesuresplus grandesEn Excel : MEDIANE
Caroline Verhoeven MEMO-I402 8 / 36
2. Statistiques descriptives 1. Representation numerique des donnees quantitatives
La mediane et l’ecart interquartile
La mediane50% de sujets auront des mesures plus petites, 50% des mesuresplus grandesEn Excel : MEDIANE
Le centile pp% des sujets auront des mesures plus petitesEn Excel : CENTILE
Caroline Verhoeven MEMO-I402 8 / 36
2. Statistiques descriptives 1. Representation numerique des donnees quantitatives
La mediane et l’ecart interquartile
La mediane50% de sujets auront des mesures plus petites, 50% des mesuresplus grandesEn Excel : MEDIANE
Le centile pp% des sujets auront des mesures plus petitesEn Excel : CENTILE
l’ecart interquartileLe centile 75 - le centile 25En Excel : CENTILE(DATA,75)-CENTILE(DATA,25)
Caroline Verhoeven MEMO-I402 8 / 36
2. Statistiques descriptives 2. Exercices
Exercice 1
Prenez le fichier fer.xls sur le sitehttp://homepages.ulb.ac.be/ ˜ cverhoev/teach.html
Calculer la moyenne des taux de fer des aliments
Calculer la mediane des taux de fer des aliments
Calculer le 25eme et le 75eme percentile
Caroline Verhoeven MEMO-I402 9 / 36
2. Statistiques descriptives 2. Exercices
Exercice 3 I
Nous considerons une etude menee sur 110 personnes sur l’epaisseurde l’intima-media
Caroline Verhoeven MEMO-I402 10 / 36
2. Statistiques descriptives 2. Exercices
Exercice 3 II
Prenez le fichier intima media.xls sur le sitehttp://homepages.ulb.ac.be/ ˜ cverhoev/teach.html
Variable Unite ou Codagesexe 1=homme, 2=femmeage le jour de la visite Anneestaille cmpoids kgtabac 0=ne fume pas, 1=ne fume plus, 2=fumesport 0=non, 1=ouimesure mmalcool 0=ne boit pas, 1=boit occasionnellement, 2=boit regulierement
Caroline Verhoeven MEMO-I402 11 / 36
2. Statistiques descriptives 2. Exercices
Exercice 3 III
Determiner le nombre de personnes qui ne fument pas, fument pluset fument.
Caroline Verhoeven MEMO-I402 12 / 36
2. Statistiques descriptives 3. Correlation et regression
Le nuage de points I
Exemple 1
Pour de nombreuses races d’oiseaux, on a le meme partenaire anneeapres annee pour la reproduction. Chez certaines races, les partenairesmales et femelles migrent vers des endroits differents. Commentretrouvent-ils leur partenaire au printemps ?
En 2004, Gunnarsson et al. ont en-registre la date du retour de maleset de femelles s’etant accouple parle passe chez les barges a queuenoire. Sur le slide suivant, on voitcombien de jours apres le 31 marsles oiseaux sont revenus pour 10couples.
Caroline Verhoeven MEMO-I402 13 / 36
2. Statistiques descriptives 3. Correlation et regression
Le nuage de points II
Exemple 1
Couple femelle male1 24 222 36 353 35 354 35 445 38 466 50 507 55 558 56 569 57 56
10 69 59
Caroline Verhoeven MEMO-I402 14 / 36
2. Statistiques descriptives 3. Correlation et regression
Le nuage de points III
Comment voir le lien entre 2 variables quantitatives visuellement ?
Caroline Verhoeven MEMO-I402 15 / 36
2. Statistiques descriptives 3. Correlation et regression
Le nuage de points III
Comment voir le lien entre 2 variables quantitatives visuellement ?
30 40 50 60 7020
30
40
50
60
femelle
mal
e
le nombre de jours des femelles : coordonnees x
le nombre de jours des males : coordonnees y
En Excel : Choisir l’onglet Insertion et choisir Nuage
Caroline Verhoeven MEMO-I402 15 / 36
2. Statistiques descriptives 3. Correlation et regression
Droite de regression : Exemple I
Exemple 2
En 2004, Whitman et al. ont montre que la quantite de pigmentationsnoirs sur le nez des lions males augmentait avec leur age. Peut-ondeterminer l’age des lions males a partir de ces pigmentations ?Voici la proportion de pigmentations noirs du nez et l’age (en annees)pour 32 lions de Tanzanie.
noir age noir age noir age noir age0,21 1,1 0,23 2,4 0,30 4,3 0,48 7,30,14 1,5 0,22 2,1 0,42 3,8 0,44 7,30,11 1,9 0,20 1,9 0,43 4,2 0,34 7,80,13 2,2 0,17 1,9 0,59 5,4 0,37 7,10,12 2,6 0,15 1,9 0,60 5,8 0,34 7,10,13 3,2 0,27 1,9 0,72 6,0 0,74 13,10,12 3,2 0,26 2,8 0,29 3,4 0,79 8,80,18 2,9 0,21 3,6 0,10 4,0 0,51 5,4
Caroline Verhoeven MEMO-I402 16 / 36
2. Statistiques descriptives 3. Correlation et regression
Droite de regression : Exemple II
Exemple 2
L’exemple des lions nous donne ce nuage de points :
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
2468
1012
Porportion noir
Age
Caroline Verhoeven MEMO-I402 17 / 36
2. Statistiques descriptives 3. Correlation et regression
Droite de regression : Exemple II
Exemple 2
L’exemple des lions nous donne ce nuage de points :
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
2468
1012
Porportion noir
Age
Quelle est la “meilleure” droite passant a travers ces points ?
Caroline Verhoeven MEMO-I402 17 / 36
2. Statistiques descriptives 3. Correlation et regression
Droite de regression : Exemple II
Exemple 2
L’exemple des lions nous donne ce nuage de points :
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
2468
1012
Porportion noir
Age
Quelle est la “meilleure” droite passant a travers ces points ?
Caroline Verhoeven MEMO-I402 17 / 36
2. Statistiques descriptives 3. Correlation et regression
Droite de regression : Exemple II
Exemple 2
L’exemple des lions nous donne ce nuage de points :
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
2468
1012
Porportion noir
Age
Quelle est la “meilleure” droite passant a travers ces points ?
Caroline Verhoeven MEMO-I402 17 / 36
2. Statistiques descriptives 3. Correlation et regression
Droite de regression : Calcul
Equation d’une droitey = b0 + b1x
b0 : l’ordonnee a l’origine
b1 : pente
Caroline Verhoeven MEMO-I402 18 / 36
2. Statistiques descriptives 3. Correlation et regression
Droite de regression : Calcul
Equation d’une droitey = b0 + b1x
b0 : l’ordonnee a l’origine
b1 : pente
b0 ? b1 ?
Caroline Verhoeven MEMO-I402 18 / 36
2. Statistiques descriptives 3. Correlation et regression
Regression en Excel
Fim explicatif sur youtube :
Caroline Verhoeven MEMO-I402 19 / 36
2. Statistiques descriptives 4. Exercices
Exercices
Exercice 4Prendre le fichier lion.xlsx sur le site
Faire un nuage de points avec la proportion de noir du nez(horizontal) et l’age du lion (vertical)
Faire une regression lineaire pour ce nuage de points
Caroline Verhoeven MEMO-I402 20 / 36
2. Statistiques descriptives 4. Exercices
Exercices
Exercice 4Prendre le fichier lion.xlsx sur le site
Faire un nuage de points avec la proportion de noir du nez(horizontal) et l’age du lion (vertical)
Faire une regression lineaire pour ce nuage de points
Exerice 5Prendre le fichier intima media.xls sur le site
Faire un nuage de points de l’epaisseur de l’intima-media (vertical)en fonction de l’age (horizontal)
Faire une regression lineaire pour le nuage de points
Caroline Verhoeven MEMO-I402 20 / 36
3. Tests d’hypothese 1. La p-valeur
Principe de base
But : Utiliser les donnees d’un echantillon afin d’etudier unehypothese sur un parametre de la population
Caroline Verhoeven MEMO-I402 21 / 36
3. Tests d’hypothese 1. La p-valeur
Principe de base
But : Utiliser les donnees d’un echantillon afin d’etudier unehypothese sur un parametre de la population
Comparaison de 2 hypotheses contradictoires :
Caroline Verhoeven MEMO-I402 21 / 36
3. Tests d’hypothese 1. La p-valeur
Principe de base
But : Utiliser les donnees d’un echantillon afin d’etudier unehypothese sur un parametre de la population
Comparaison de 2 hypotheses contradictoires :Hypothese nulle (H0) :
Hypothese alternative (Ha) :
Caroline Verhoeven MEMO-I402 21 / 36
3. Tests d’hypothese 1. La p-valeur
Principe de base
But : Utiliser les donnees d’un echantillon afin d’etudier unehypothese sur un parametre de la population
Comparaison de 2 hypotheses contradictoires :Hypothese nulle (H0) :
Hypothese selon laquelle la population suit une loi donnee.Formulee comme une egalite
Exemple : le traitement n’a pas d’effet, effet=0
Hypothese alternative (Ha) :Hypothese selon laquelle la population ne suit pas une loi donnee.Formulee comme <, > ou 6=
En general : ce que le chercheur espere
Exemple : effet6= 0, effet> 0 ou effet< 0
Apres le test on rejette H0 (RH0) ou on ne rejette pas H0 (NRH0)
Caroline Verhoeven MEMO-I402 21 / 36
3. Tests d’hypothese 1. La p-valeur
Erreurs de test hypothese
RealiteH0 vraie H0 fausse
NRH0,
Erreur du type II/
RH0 Erreur du type I,/
Caroline Verhoeven MEMO-I402 22 / 36
3. Tests d’hypothese 1. La p-valeur
Erreurs de type I
Erreur du type I : Rejeter H0 si elle est vraie
Exemple : Conclure que l’entraınement a un effet alors que non
Il faut eviter ce type d’erreur
Caroline Verhoeven MEMO-I402 23 / 36
3. Tests d’hypothese 1. La p-valeur
Erreurs de type I
Erreur du type I : Rejeter H0 si elle est vraie
Exemple : Conclure que l’entraınement a un effet alors que non
Il faut eviter ce type d’erreur
Limiter le fait que la difference entre le resultat obtenu et H0 est duau hasard
Caroline Verhoeven MEMO-I402 23 / 36
3. Tests d’hypothese 1. La p-valeur
Erreurs de type I
Erreur du type I : Rejeter H0 si elle est vraie
Exemple : Conclure que l’entraınement a un effet alors que non
Il faut eviter ce type d’erreur
Limiter le fait que la difference entre le resultat obtenu et H0 est duau hasard
En general on accepte que la probabilite de se tromper est α = 0.05α : le taux significatif
Caroline Verhoeven MEMO-I402 23 / 36
3. Tests d’hypothese 1. La p-valeur
Taux significatif I
Cas : On a les donnees d’1 echantillon et on veut conclure si :
Caroline Verhoeven MEMO-I402 24 / 36
3. Tests d’hypothese 1. La p-valeur
Taux significatif I
Cas : On a les donnees d’1 echantillon et on veut conclure si :H0 : µ = µ0
Ha : µ > µ0
Caroline Verhoeven MEMO-I402 24 / 36
3. Tests d’hypothese 1. La p-valeur
Taux significatif I
Cas : On a les donnees d’1 echantillon et on veut conclure si :H0 : µ = µ0
Ha : µ > µ0
Caroline Verhoeven MEMO-I402 24 / 36
3. Tests d’hypothese 1. La p-valeur
Taux significatif I
Cas : On a les donnees d’1 echantillon et on veut conclure si :H0 : µ = µ0
Ha : µ > µ0
Supposons que les donnees donnent x > µ0
Exemple : On mesure 30 basketteurs et x = 201cm, la taille moyenne dela population masculine : µ0 = 175cm. En moyenne, les basketteurssont-ils plus grands que la taille moyenne de la population masculine ?Doit-on rejeter H0 ou non ?
Caroline Verhoeven MEMO-I402 24 / 36
3. Tests d’hypothese 1. La p-valeur
Taux significatif I
Cas : On a les donnees d’1 echantillon et on veut conclure si :H0 : µ = µ0
Ha : µ > µ0
Supposons que les donnees donnent x > µ0
Exemple : On mesure 30 basketteurs et x = 201cm, la taille moyenne dela population masculine : µ0 = 175cm. En moyenne, les basketteurssont-ils plus grands que la taille moyenne de la population masculine ?Doit-on rejeter H0 ou non ?
Μ0
Distribution d’echantillonage si H0
vraie
Caroline Verhoeven MEMO-I402 24 / 36
3. Tests d’hypothese 1. La p-valeur
Taux significatif I
Cas : On a les donnees d’1 echantillon et on veut conclure si :H0 : µ = µ0
Ha : µ > µ0
Supposons que les donnees donnent x > µ0
Exemple : On mesure 30 basketteurs et x = 201cm, la taille moyenne dela population masculine : µ0 = 175cm. En moyenne, les basketteurssont-ils plus grands que la taille moyenne de la population masculine ?Doit-on rejeter H0 ou non ?
Α
Μ0
x
Distribution d’echantillonage si H0
vraie
α = P(Y ≥ x)
Caroline Verhoeven MEMO-I402 24 / 36
3. Tests d’hypothese 1. La p-valeur
Taux significatif I
Cas : On a les donnees d’1 echantillon et on veut conclure si :H0 : µ = µ0
Ha : µ > µ0
Supposons que les donnees donnent x > µ0
Exemple : On mesure 30 basketteurs et x = 201cm, la taille moyenne dela population masculine : µ0 = 175cm. En moyenne, les basketteurssont-ils plus grands que la taille moyenne de la population masculine ?Doit-on rejeter H0 ou non ?
1 - Α
Α
Μ0
xNRH0 RH0
Distribution d’echantillonage si H0
vraie
α = P(Y ≥ x)
x ≥ x ⇒ RH0
x < x ⇒ NRH0
Caroline Verhoeven MEMO-I402 24 / 36
3. Tests d’hypothese 1. La p-valeur
Taux significatif II
H0 : µ = µ0, Ha : µ < µ0
Μ0
Distribution d’echantillonnage si H0 vraie
Caroline Verhoeven MEMO-I402 25 / 36
3. Tests d’hypothese 1. La p-valeur
Taux significatif II
H0 : µ = µ0, Ha : µ < µ0
Α
Μ0
x
Distribution d’echantillonnage si H0 vraie
α = P(Y ≤ x)
Caroline Verhoeven MEMO-I402 25 / 36
3. Tests d’hypothese 1. La p-valeur
Taux significatif II
H0 : µ = µ0, Ha : µ < µ0
1 - Α
Α
Μ0
xRH0 NRH0
Distribution d’echantillonnage si H0 vraie
α = P(Y ≤ x)
x ≤ x ⇒ RH0
x > x ⇒ NRH0
Caroline Verhoeven MEMO-I402 25 / 36
3. Tests d’hypothese 1. La p-valeur
Taux significatif II
H0 : µ = µ0, Ha : µ < µ0
1 - Α
Α
Μ0
xRH0 NRH0
Distribution d’echantillonnage si H0 vraie
α = P(Y ≤ x)
x ≤ x ⇒ RH0
x > x ⇒ NRH0
H0 : µ = µ0, Ha : µ 6= µ0
Μ0
Distribution d’echantillonnage si H0 vraie
Caroline Verhoeven MEMO-I402 25 / 36
3. Tests d’hypothese 1. La p-valeur
Taux significatif II
H0 : µ = µ0, Ha : µ < µ0
1 - Α
Α
Μ0
xRH0 NRH0
Distribution d’echantillonnage si H0 vraie
α = P(Y ≤ x)
x ≤ x ⇒ RH0
x > x ⇒ NRH0
H0 : µ = µ0, Ha : µ 6= µ0
Α�2 Α�2
Μ0
x2x1
Distribution d’echantillonnage si H0 vraie
α = P(Y ≤ x1 ou Y ≥ x2)
Caroline Verhoeven MEMO-I402 25 / 36
3. Tests d’hypothese 1. La p-valeur
Taux significatif II
H0 : µ = µ0, Ha : µ < µ0
1 - Α
Α
Μ0
xRH0 NRH0
Distribution d’echantillonnage si H0 vraie
α = P(Y ≤ x)
x ≤ x ⇒ RH0
x > x ⇒ NRH0
H0 : µ = µ0, Ha : µ 6= µ0
1 - Α
Α�2 Α�2
Μ0
x2x1RH0 NRH0 RH0
Distribution d’echantillonnage si H0 vraie
α = P(Y ≤ x1 ou Y ≥ x2)
x ≤ x1 ou x ≥ x2 ⇒ RH0
x1 < x < x2 ⇒ NRH0
Caroline Verhoeven MEMO-I402 25 / 36
3. Tests d’hypothese 1. La p-valeur
La valeur p (p-value) I
Supposons queH0 : µ = µ0
Ha : µ > µ0
Nous avons x des donnees
Μ0
Distribution d’echantillonnage siH0 vraie
Caroline Verhoeven MEMO-I402 26 / 36
3. Tests d’hypothese 1. La p-valeur
La valeur p (p-value) I
Supposons queH0 : µ = µ0
Ha : µ > µ0
Nous avons x des donnees
p
Μ0 x
x
Distribution d’echantillonnage siH0 vraie
p = P(Y ≥ x)
p ≤ α ⇒ RH0
Caroline Verhoeven MEMO-I402 26 / 36
3. Tests d’hypothese 1. La p-valeur
La valeur p (p-value) I
Supposons queH0 : µ = µ0
Ha : µ > µ0
Nous avons x des donnees
p
Μ0 x
xDistribution d’echantillonnage siH0 vraie
p = P(Y ≥ x)
p ≤ α ⇒ RH0
p > α ⇒ NRH0
Caroline Verhoeven MEMO-I402 26 / 36
3. Tests d’hypothese 1. La p-valeur
La valeur p (p-value) II
SiH0 : µ = µ0
Ha : µ < µ0
Μ0
Caroline Verhoeven MEMO-I402 27 / 36
3. Tests d’hypothese 1. La p-valeur
La valeur p (p-value) II
SiH0 : µ = µ0
Ha : µ < µ0
p
Μ0x
x
p = P(Y < x)
p ≤ α ⇒ RH0
Caroline Verhoeven MEMO-I402 27 / 36
3. Tests d’hypothese 1. La p-valeur
La valeur p (p-value) II
SiH0 : µ = µ0
Ha : µ < µ0
p
Μ0x
x p = P(Y < x)
p ≤ α ⇒ RH0
p > α ⇒ NRH0
Caroline Verhoeven MEMO-I402 27 / 36
3. Tests d’hypothese 1. La p-valeur
La valeur p (p-value) III
SiH0 : µ = µ0
Ha : µ 6= µ0
Μ0
x > µ0 ⇒ p/2 = P(Y ≥ x)
x < µ0 ⇒ p/2 = P(Y ≤ x)
et
p ≤ α ⇒ RH0
p > α ⇒ NRH0
Caroline Verhoeven MEMO-I402 28 / 36
3. Tests d’hypothese 1. La p-valeur
La valeur p (p-value) III
SiH0 : µ = µ0
Ha : µ 6= µ0
p�2
Μ0 x2
x
x > µ0 ⇒ p/2 = P(Y ≥ x)
x < µ0 ⇒ p/2 = P(Y ≤ x)
et
p ≤ α ⇒ RH0
p > α ⇒ NRH0
Caroline Verhoeven MEMO-I402 28 / 36
3. Tests d’hypothese 1. La p-valeur
La valeur p (p-value) III
SiH0 : µ = µ0
Ha : µ 6= µ0
p�2
Μ0 x2
x
x > µ0 ⇒ p/2 = P(Y ≥ x)
x < µ0 ⇒ p/2 = P(Y ≤ x)
et
p ≤ α ⇒ RH0
p > α ⇒ NRH0
Caroline Verhoeven MEMO-I402 28 / 36
3. Tests d’hypothese 2. Etapes d’un test d’hypothese
1 Choisir le niveau significatif α
Caroline Verhoeven MEMO-I402 29 / 36
3. Tests d’hypothese 2. Etapes d’un test d’hypothese
1 Choisir le niveau significatif α2 Formuler H0 et Ha
Caroline Verhoeven MEMO-I402 29 / 36
3. Tests d’hypothese 2. Etapes d’un test d’hypothese
1 Choisir le niveau significatif α2 Formuler H0 et Ha
3 Choisir le test approprie
Caroline Verhoeven MEMO-I402 29 / 36
3. Tests d’hypothese 2. Etapes d’un test d’hypothese
1 Choisir le niveau significatif α2 Formuler H0 et Ha
3 Choisir le test approprie4 Calculer la valeur p et comparer avec α
Caroline Verhoeven MEMO-I402 29 / 36
3. Tests d’hypothese 2. Etapes d’un test d’hypothese
1 Choisir le niveau significatif α2 Formuler H0 et Ha
3 Choisir le test approprie4 Calculer la valeur p et comparer avec α
5 Formuler une conclusion
Caroline Verhoeven MEMO-I402 29 / 36
3. Tests d’hypothese 2. Etapes d’un test d’hypothese
1 Choisir le niveau significatif α2 Formuler H0 et Ha
3 Choisir le test approprie4 Calculer la valeur p et comparer avec α
5 Formuler une conclusion
Caroline Verhoeven MEMO-I402 29 / 36
3. Tests d’hypothese 3. Test t pour 2 echantillons independants
Test de t pour 2 echantillons independants : principe
But : Conclure si les moyennes µ1 et µ2 de 2 populations sontegales ou non
Formulation des hypotheses :H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2, ou µ1 6= µ2)
Caroline Verhoeven MEMO-I402 30 / 36
3. Tests d’hypothese 3. Test t pour 2 echantillons independants
Test de t pour 2 echantillons independants : principe
But : Conclure si les moyennes µ1 et µ2 de 2 populations sontegales ou non
Formulation des hypotheses :H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2, ou µ1 6= µ2)
On considere 2 echantillons de N1 et N2 sujets
Caroline Verhoeven MEMO-I402 30 / 36
3. Tests d’hypothese 3. Test t pour 2 echantillons independants
Test de t pour 2 echantillons independants : principe
But : Conclure si les moyennes µ1 et µ2 de 2 populations sontegales ou non
Formulation des hypotheses :H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2, ou µ1 6= µ2)
On considere 2 echantillons de N1 et N2 sujets
Si σ21 = σ2
2, test t classique
Caroline Verhoeven MEMO-I402 30 / 36
3. Tests d’hypothese 3. Test t pour 2 echantillons independants
Test de t pour 2 echantillons independants : principe
But : Conclure si les moyennes µ1 et µ2 de 2 populations sontegales ou non
Formulation des hypotheses :H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2, ou µ1 6= µ2)
On considere 2 echantillons de N1 et N2 sujets
Si σ21 = σ2
2, test t classique
Si σ21 6= σ2
2, test t de Welch
Caroline Verhoeven MEMO-I402 30 / 36
3. Tests d’hypothese 3. Test t pour 2 echantillons independants
Test de t pour 2 echantillons independants : principe
But : Conclure si les moyennes µ1 et µ2 de 2 populations sontegales ou non
Formulation des hypotheses :H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2, ou µ1 6= µ2)
On considere 2 echantillons de N1 et N2 sujets
Si σ21 = σ2
2, test t classique
Si σ21 6= σ2
2, test t de Welch
D’abord tester si σ21 = σ2
2 avec Fisher
Caroline Verhoeven MEMO-I402 30 / 36
3. Tests d’hypothese 3. Test t pour 2 echantillons independants
Test t pour 2 echantillons independants : conditions
Conditions sur les donnees
Les echantillons doivent etre independants
Les echantillons ne peuvent pas etre biaises
Les donnees doivent etre normalement distribuees pour les 2echantillons ou N1 et N2 doivent etre assez grandsSi la distribution n’est pas trop differente de la normale, N1 ≥ 5 etN2 ≥ 5 est suffisant
Caroline Verhoeven MEMO-I402 31 / 36
3. Tests d’hypothese 3. Test t pour 2 echantillons independants
Test t pour 2 echantillons independants : conditions
Conditions sur les donnees
Les echantillons doivent etre independants
Les echantillons ne peuvent pas etre biaises
Les donnees doivent etre normalement distribuees pour les 2echantillons ou N1 et N2 doivent etre assez grandsSi la distribution n’est pas trop differente de la normale, N1 ≥ 5 etN2 ≥ 5 est suffisant
Il faut verifier si σ1 = σ2 ou pas
Caroline Verhoeven MEMO-I402 31 / 36
3. Tests d’hypothese 4. Test t pour echantillon apparies
Test t pour 2 echantillons apparies : principe
But : Tester si la moyenne reste la meme ou non pour les memessujets dans des conditions differentes
Caroline Verhoeven MEMO-I402 32 / 36
3. Tests d’hypothese 4. Test t pour echantillon apparies
Test t pour 2 echantillons apparies : Conditions
Conditions sur les donnees
Les sujets doivent etre selectionnes de maniere independante
Les echantillons ne peuvent pas etre biaises
Les donnees doivent etre normalement distribuees ou N ≥ 15
Caroline Verhoeven MEMO-I402 33 / 36
3. Tests d’hypothese 4. Test t pour echantillon apparies
Test t en Excel
Onglet Donnees → Utilitaire d’analyseFim explicatif sur youtube :
Caroline Verhoeven MEMO-I402 34 / 36
3. Tests d’hypothese 5. Exercices
Exercice 6
Pour beaucoup d’especes un male possedant untaux de testosterone eleve attirer plus facilementune femelle. On peut se poser la question s’il payeun prix pour ce taux eleve.Une des hypothese est que des males ayant untaux de testosterone eleve ont un systeme immuni-taire plus faible. Des biologise ont implante un tubepermeable contenant de la testosterone a des ca-rouges a epaulettes. Ils on mesure le taux d’anti-corps dans le sang avant et apres l’implantation.Les donnees se trouvent dans le fichieroiseau.xlsx
Y-a-t-il au seuil de 5% une difference entre le taux d’anticorps avantet apres l’implantation ?
Caroline Verhoeven MEMO-I402 35 / 36
3. Tests d’hypothese 5. Exercices
Exercice 7
Un biologiste regarde la longueur enmm des œufs de de coucou trouvesdans les nids de deux especes d’oi-seaux : le roitelet et la fauvette. Leroitelet est plus petit que la fauvette.Vous trouverez les donnees dans lefichier coucou.xls sur le site.
Le coucou adapte-t-il la taille de ses œufs en fonction de la taille dunid dans lequel il pond ? Autrement dit la longueur moyenne desœufs de nids de fauvettes est-elle plus grande que celle desroitelets, au seuil 5% ?
Caroline Verhoeven MEMO-I402 36 / 36