MEMO-I402 Chapitre I: Statistiques avec...

Post on 13-Jul-2020

21 views 0 download

Transcript of MEMO-I402 Chapitre I: Statistiques avec...

MEMO-I402Chapitre I: Statistiques avec Excel

Caroline Verhoeven

Table des matieres

1 Introduction

2 Statistiques descriptivesRepresentation numerique des donnees quantitativesCorrelation et regression

3 Tests d’hypotheseLa p-valeurEtapes d’un test d’hypotheseTest t pour 2 echantillons independantsTest t pour echantillon appariesExercices

Caroline Verhoeven MEMO-I402 2 / 36

Infos pratiques

Titulaire : Caroline Verhoeven

email :cverhoev@ulb.ac.be

Site : http://homepages.ulb.ac.be/ ˜ cverhoev/teach.html

Horaire :les 11/02, 18/02, 25/02, 04/03, 18/03, 25/03 de 12h a 14h

Local : Salle COMFORT

Caroline Verhoeven MEMO-I402 3 / 36

Examen

Travail a rendre 4 semaines apres le dernier cours (le 15/04)Choisir un sujet qui vous plaıt. Sujet a rendre au plus tard le 01/04

2 ou 3 “questions scientifiques”Il faut des donnees

Le travail doit correspondre a 2 ou 3 exercices du type fait en coursLe travail doit contenir

Le fichier avec lequel vous avez travailleUn rapport de 2 a 3 pages avec :

1 une introduction au sujet2 la methode utilisee (pourquoi cette methode la)3 les resultats et conclusions

Caroline Verhoeven MEMO-I402 4 / 36

1. Introduction

Les logiciels

Voici quelques logiciels statistiques :

SAS

R

JMP

Minitab

SPSS

Mathematica

Caroline Verhoeven MEMO-I402 5 / 36

1. Introduction

Les logiciels

Voici quelques logiciels statistiques :

SAS

R

JMP

Minitab

SPSS

Mathematica

On peut egalement utiliser Excel

Caroline Verhoeven MEMO-I402 5 / 36

1. Introduction

Les logiciels

Voici quelques logiciels statistiques :

SAS

R

JMP

Minitab

SPSS

Mathematica

On peut egalement utiliser Excel

Caroline Verhoeven MEMO-I402 5 / 36

1. Introduction

Excel

Excel permet de faire certaines statistiques mais est limite

Caroline Verhoeven MEMO-I402 6 / 36

1. Introduction

Excel

Excel permet de faire certaines statistiques mais est limite

Le nom des fonctions en Excel depend de la langue

Caroline Verhoeven MEMO-I402 6 / 36

1. Introduction

Excel

Excel permet de faire certaines statistiques mais est limite

Le nom des fonctions en Excel depend de la langueOn peut trouver des traductions de ces noms sur les sites :

http://wwwhome.ewi.utwente.nl/ ˜ trieschn/excel/excel.htmlhttp://www.glossaire.be/english_french/glossaire_excel_fonction_anglais_francais.htm

Caroline Verhoeven MEMO-I402 6 / 36

2. Statistiques descriptives 1. Representation numerique des donnees quantitatives

Moyenne arithmetique deviation standard

Moyenne d’un echantillon

formule : x =

∑Ni=1 xi

NEn Excel : MOYENNE

Caroline Verhoeven MEMO-I402 7 / 36

2. Statistiques descriptives 1. Representation numerique des donnees quantitatives

Moyenne arithmetique deviation standard

Moyenne d’un echantillon

formule : x =

∑Ni=1 xi

NEn Excel : MOYENNE

Variance

formule : s2 =

∑Ni=1(xi − x)2

N − 1En Excel : VAR

Caroline Verhoeven MEMO-I402 7 / 36

2. Statistiques descriptives 1. Representation numerique des donnees quantitatives

Moyenne arithmetique deviation standard

Moyenne d’un echantillon

formule : x =

∑Ni=1 xi

NEn Excel : MOYENNE

Variance

formule : s2 =

∑Ni=1(xi − x)2

N − 1En Excel : VAR

Deviation standardformule s =

√s2

En Excel : ECARTYPE

Caroline Verhoeven MEMO-I402 7 / 36

2. Statistiques descriptives 1. Representation numerique des donnees quantitatives

La mediane et l’ecart interquartile

La mediane50% de sujets auront des mesures plus petites, 50% des mesuresplus grandesEn Excel : MEDIANE

Caroline Verhoeven MEMO-I402 8 / 36

2. Statistiques descriptives 1. Representation numerique des donnees quantitatives

La mediane et l’ecart interquartile

La mediane50% de sujets auront des mesures plus petites, 50% des mesuresplus grandesEn Excel : MEDIANE

Le centile pp% des sujets auront des mesures plus petitesEn Excel : CENTILE

Caroline Verhoeven MEMO-I402 8 / 36

2. Statistiques descriptives 1. Representation numerique des donnees quantitatives

La mediane et l’ecart interquartile

La mediane50% de sujets auront des mesures plus petites, 50% des mesuresplus grandesEn Excel : MEDIANE

Le centile pp% des sujets auront des mesures plus petitesEn Excel : CENTILE

l’ecart interquartileLe centile 75 - le centile 25En Excel : CENTILE(DATA,75)-CENTILE(DATA,25)

Caroline Verhoeven MEMO-I402 8 / 36

2. Statistiques descriptives 2. Exercices

Exercice 1

Prenez le fichier fer.xls sur le sitehttp://homepages.ulb.ac.be/ ˜ cverhoev/teach.html

Calculer la moyenne des taux de fer des aliments

Calculer la mediane des taux de fer des aliments

Calculer le 25eme et le 75eme percentile

Caroline Verhoeven MEMO-I402 9 / 36

2. Statistiques descriptives 2. Exercices

Exercice 3 I

Nous considerons une etude menee sur 110 personnes sur l’epaisseurde l’intima-media

Caroline Verhoeven MEMO-I402 10 / 36

2. Statistiques descriptives 2. Exercices

Exercice 3 II

Prenez le fichier intima media.xls sur le sitehttp://homepages.ulb.ac.be/ ˜ cverhoev/teach.html

Variable Unite ou Codagesexe 1=homme, 2=femmeage le jour de la visite Anneestaille cmpoids kgtabac 0=ne fume pas, 1=ne fume plus, 2=fumesport 0=non, 1=ouimesure mmalcool 0=ne boit pas, 1=boit occasionnellement, 2=boit regulierement

Caroline Verhoeven MEMO-I402 11 / 36

2. Statistiques descriptives 2. Exercices

Exercice 3 III

Determiner le nombre de personnes qui ne fument pas, fument pluset fument.

Caroline Verhoeven MEMO-I402 12 / 36

2. Statistiques descriptives 3. Correlation et regression

Le nuage de points I

Exemple 1

Pour de nombreuses races d’oiseaux, on a le meme partenaire anneeapres annee pour la reproduction. Chez certaines races, les partenairesmales et femelles migrent vers des endroits differents. Commentretrouvent-ils leur partenaire au printemps ?

En 2004, Gunnarsson et al. ont en-registre la date du retour de maleset de femelles s’etant accouple parle passe chez les barges a queuenoire. Sur le slide suivant, on voitcombien de jours apres le 31 marsles oiseaux sont revenus pour 10couples.

Caroline Verhoeven MEMO-I402 13 / 36

2. Statistiques descriptives 3. Correlation et regression

Le nuage de points II

Exemple 1

Couple femelle male1 24 222 36 353 35 354 35 445 38 466 50 507 55 558 56 569 57 56

10 69 59

Caroline Verhoeven MEMO-I402 14 / 36

2. Statistiques descriptives 3. Correlation et regression

Le nuage de points III

Comment voir le lien entre 2 variables quantitatives visuellement ?

Caroline Verhoeven MEMO-I402 15 / 36

2. Statistiques descriptives 3. Correlation et regression

Le nuage de points III

Comment voir le lien entre 2 variables quantitatives visuellement ?

30 40 50 60 7020

30

40

50

60

femelle

mal

e

le nombre de jours des femelles : coordonnees x

le nombre de jours des males : coordonnees y

En Excel : Choisir l’onglet Insertion et choisir Nuage

Caroline Verhoeven MEMO-I402 15 / 36

2. Statistiques descriptives 3. Correlation et regression

Droite de regression : Exemple I

Exemple 2

En 2004, Whitman et al. ont montre que la quantite de pigmentationsnoirs sur le nez des lions males augmentait avec leur age. Peut-ondeterminer l’age des lions males a partir de ces pigmentations ?Voici la proportion de pigmentations noirs du nez et l’age (en annees)pour 32 lions de Tanzanie.

noir age noir age noir age noir age0,21 1,1 0,23 2,4 0,30 4,3 0,48 7,30,14 1,5 0,22 2,1 0,42 3,8 0,44 7,30,11 1,9 0,20 1,9 0,43 4,2 0,34 7,80,13 2,2 0,17 1,9 0,59 5,4 0,37 7,10,12 2,6 0,15 1,9 0,60 5,8 0,34 7,10,13 3,2 0,27 1,9 0,72 6,0 0,74 13,10,12 3,2 0,26 2,8 0,29 3,4 0,79 8,80,18 2,9 0,21 3,6 0,10 4,0 0,51 5,4

Caroline Verhoeven MEMO-I402 16 / 36

2. Statistiques descriptives 3. Correlation et regression

Droite de regression : Exemple II

Exemple 2

L’exemple des lions nous donne ce nuage de points :

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8

2468

1012

Porportion noir

Age

Caroline Verhoeven MEMO-I402 17 / 36

2. Statistiques descriptives 3. Correlation et regression

Droite de regression : Exemple II

Exemple 2

L’exemple des lions nous donne ce nuage de points :

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8

2468

1012

Porportion noir

Age

Quelle est la “meilleure” droite passant a travers ces points ?

Caroline Verhoeven MEMO-I402 17 / 36

2. Statistiques descriptives 3. Correlation et regression

Droite de regression : Exemple II

Exemple 2

L’exemple des lions nous donne ce nuage de points :

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8

2468

1012

Porportion noir

Age

Quelle est la “meilleure” droite passant a travers ces points ?

Caroline Verhoeven MEMO-I402 17 / 36

2. Statistiques descriptives 3. Correlation et regression

Droite de regression : Exemple II

Exemple 2

L’exemple des lions nous donne ce nuage de points :

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8

2468

1012

Porportion noir

Age

Quelle est la “meilleure” droite passant a travers ces points ?

Caroline Verhoeven MEMO-I402 17 / 36

2. Statistiques descriptives 3. Correlation et regression

Droite de regression : Calcul

Equation d’une droitey = b0 + b1x

b0 : l’ordonnee a l’origine

b1 : pente

Caroline Verhoeven MEMO-I402 18 / 36

2. Statistiques descriptives 3. Correlation et regression

Droite de regression : Calcul

Equation d’une droitey = b0 + b1x

b0 : l’ordonnee a l’origine

b1 : pente

b0 ? b1 ?

Caroline Verhoeven MEMO-I402 18 / 36

2. Statistiques descriptives 3. Correlation et regression

Regression en Excel

Fim explicatif sur youtube :

Caroline Verhoeven MEMO-I402 19 / 36

2. Statistiques descriptives 4. Exercices

Exercices

Exercice 4Prendre le fichier lion.xlsx sur le site

Faire un nuage de points avec la proportion de noir du nez(horizontal) et l’age du lion (vertical)

Faire une regression lineaire pour ce nuage de points

Caroline Verhoeven MEMO-I402 20 / 36

2. Statistiques descriptives 4. Exercices

Exercices

Exercice 4Prendre le fichier lion.xlsx sur le site

Faire un nuage de points avec la proportion de noir du nez(horizontal) et l’age du lion (vertical)

Faire une regression lineaire pour ce nuage de points

Exerice 5Prendre le fichier intima media.xls sur le site

Faire un nuage de points de l’epaisseur de l’intima-media (vertical)en fonction de l’age (horizontal)

Faire une regression lineaire pour le nuage de points

Caroline Verhoeven MEMO-I402 20 / 36

3. Tests d’hypothese 1. La p-valeur

Principe de base

But : Utiliser les donnees d’un echantillon afin d’etudier unehypothese sur un parametre de la population

Caroline Verhoeven MEMO-I402 21 / 36

3. Tests d’hypothese 1. La p-valeur

Principe de base

But : Utiliser les donnees d’un echantillon afin d’etudier unehypothese sur un parametre de la population

Comparaison de 2 hypotheses contradictoires :

Caroline Verhoeven MEMO-I402 21 / 36

3. Tests d’hypothese 1. La p-valeur

Principe de base

But : Utiliser les donnees d’un echantillon afin d’etudier unehypothese sur un parametre de la population

Comparaison de 2 hypotheses contradictoires :Hypothese nulle (H0) :

Hypothese alternative (Ha) :

Caroline Verhoeven MEMO-I402 21 / 36

3. Tests d’hypothese 1. La p-valeur

Principe de base

But : Utiliser les donnees d’un echantillon afin d’etudier unehypothese sur un parametre de la population

Comparaison de 2 hypotheses contradictoires :Hypothese nulle (H0) :

Hypothese selon laquelle la population suit une loi donnee.Formulee comme une egalite

Exemple : le traitement n’a pas d’effet, effet=0

Hypothese alternative (Ha) :Hypothese selon laquelle la population ne suit pas une loi donnee.Formulee comme <, > ou 6=

En general : ce que le chercheur espere

Exemple : effet6= 0, effet> 0 ou effet< 0

Apres le test on rejette H0 (RH0) ou on ne rejette pas H0 (NRH0)

Caroline Verhoeven MEMO-I402 21 / 36

3. Tests d’hypothese 1. La p-valeur

Erreurs de test hypothese

RealiteH0 vraie H0 fausse

NRH0,

Erreur du type II/

RH0 Erreur du type I,/

Caroline Verhoeven MEMO-I402 22 / 36

3. Tests d’hypothese 1. La p-valeur

Erreurs de type I

Erreur du type I : Rejeter H0 si elle est vraie

Exemple : Conclure que l’entraınement a un effet alors que non

Il faut eviter ce type d’erreur

Caroline Verhoeven MEMO-I402 23 / 36

3. Tests d’hypothese 1. La p-valeur

Erreurs de type I

Erreur du type I : Rejeter H0 si elle est vraie

Exemple : Conclure que l’entraınement a un effet alors que non

Il faut eviter ce type d’erreur

Limiter le fait que la difference entre le resultat obtenu et H0 est duau hasard

Caroline Verhoeven MEMO-I402 23 / 36

3. Tests d’hypothese 1. La p-valeur

Erreurs de type I

Erreur du type I : Rejeter H0 si elle est vraie

Exemple : Conclure que l’entraınement a un effet alors que non

Il faut eviter ce type d’erreur

Limiter le fait que la difference entre le resultat obtenu et H0 est duau hasard

En general on accepte que la probabilite de se tromper est α = 0.05α : le taux significatif

Caroline Verhoeven MEMO-I402 23 / 36

3. Tests d’hypothese 1. La p-valeur

Taux significatif I

Cas : On a les donnees d’1 echantillon et on veut conclure si :

Caroline Verhoeven MEMO-I402 24 / 36

3. Tests d’hypothese 1. La p-valeur

Taux significatif I

Cas : On a les donnees d’1 echantillon et on veut conclure si :H0 : µ = µ0

Ha : µ > µ0

Caroline Verhoeven MEMO-I402 24 / 36

3. Tests d’hypothese 1. La p-valeur

Taux significatif I

Cas : On a les donnees d’1 echantillon et on veut conclure si :H0 : µ = µ0

Ha : µ > µ0

Caroline Verhoeven MEMO-I402 24 / 36

3. Tests d’hypothese 1. La p-valeur

Taux significatif I

Cas : On a les donnees d’1 echantillon et on veut conclure si :H0 : µ = µ0

Ha : µ > µ0

Supposons que les donnees donnent x > µ0

Exemple : On mesure 30 basketteurs et x = 201cm, la taille moyenne dela population masculine : µ0 = 175cm. En moyenne, les basketteurssont-ils plus grands que la taille moyenne de la population masculine ?Doit-on rejeter H0 ou non ?

Caroline Verhoeven MEMO-I402 24 / 36

3. Tests d’hypothese 1. La p-valeur

Taux significatif I

Cas : On a les donnees d’1 echantillon et on veut conclure si :H0 : µ = µ0

Ha : µ > µ0

Supposons que les donnees donnent x > µ0

Exemple : On mesure 30 basketteurs et x = 201cm, la taille moyenne dela population masculine : µ0 = 175cm. En moyenne, les basketteurssont-ils plus grands que la taille moyenne de la population masculine ?Doit-on rejeter H0 ou non ?

Μ0

Distribution d’echantillonage si H0

vraie

Caroline Verhoeven MEMO-I402 24 / 36

3. Tests d’hypothese 1. La p-valeur

Taux significatif I

Cas : On a les donnees d’1 echantillon et on veut conclure si :H0 : µ = µ0

Ha : µ > µ0

Supposons que les donnees donnent x > µ0

Exemple : On mesure 30 basketteurs et x = 201cm, la taille moyenne dela population masculine : µ0 = 175cm. En moyenne, les basketteurssont-ils plus grands que la taille moyenne de la population masculine ?Doit-on rejeter H0 ou non ?

Α

Μ0

x

Distribution d’echantillonage si H0

vraie

α = P(Y ≥ x)

Caroline Verhoeven MEMO-I402 24 / 36

3. Tests d’hypothese 1. La p-valeur

Taux significatif I

Cas : On a les donnees d’1 echantillon et on veut conclure si :H0 : µ = µ0

Ha : µ > µ0

Supposons que les donnees donnent x > µ0

Exemple : On mesure 30 basketteurs et x = 201cm, la taille moyenne dela population masculine : µ0 = 175cm. En moyenne, les basketteurssont-ils plus grands que la taille moyenne de la population masculine ?Doit-on rejeter H0 ou non ?

1 - Α

Α

Μ0

xNRH0 RH0

Distribution d’echantillonage si H0

vraie

α = P(Y ≥ x)

x ≥ x ⇒ RH0

x < x ⇒ NRH0

Caroline Verhoeven MEMO-I402 24 / 36

3. Tests d’hypothese 1. La p-valeur

Taux significatif II

H0 : µ = µ0, Ha : µ < µ0

Μ0

Distribution d’echantillonnage si H0 vraie

Caroline Verhoeven MEMO-I402 25 / 36

3. Tests d’hypothese 1. La p-valeur

Taux significatif II

H0 : µ = µ0, Ha : µ < µ0

Α

Μ0

x

Distribution d’echantillonnage si H0 vraie

α = P(Y ≤ x)

Caroline Verhoeven MEMO-I402 25 / 36

3. Tests d’hypothese 1. La p-valeur

Taux significatif II

H0 : µ = µ0, Ha : µ < µ0

1 - Α

Α

Μ0

xRH0 NRH0

Distribution d’echantillonnage si H0 vraie

α = P(Y ≤ x)

x ≤ x ⇒ RH0

x > x ⇒ NRH0

Caroline Verhoeven MEMO-I402 25 / 36

3. Tests d’hypothese 1. La p-valeur

Taux significatif II

H0 : µ = µ0, Ha : µ < µ0

1 - Α

Α

Μ0

xRH0 NRH0

Distribution d’echantillonnage si H0 vraie

α = P(Y ≤ x)

x ≤ x ⇒ RH0

x > x ⇒ NRH0

H0 : µ = µ0, Ha : µ 6= µ0

Μ0

Distribution d’echantillonnage si H0 vraie

Caroline Verhoeven MEMO-I402 25 / 36

3. Tests d’hypothese 1. La p-valeur

Taux significatif II

H0 : µ = µ0, Ha : µ < µ0

1 - Α

Α

Μ0

xRH0 NRH0

Distribution d’echantillonnage si H0 vraie

α = P(Y ≤ x)

x ≤ x ⇒ RH0

x > x ⇒ NRH0

H0 : µ = µ0, Ha : µ 6= µ0

Α�2 Α�2

Μ0

x2x1

Distribution d’echantillonnage si H0 vraie

α = P(Y ≤ x1 ou Y ≥ x2)

Caroline Verhoeven MEMO-I402 25 / 36

3. Tests d’hypothese 1. La p-valeur

Taux significatif II

H0 : µ = µ0, Ha : µ < µ0

1 - Α

Α

Μ0

xRH0 NRH0

Distribution d’echantillonnage si H0 vraie

α = P(Y ≤ x)

x ≤ x ⇒ RH0

x > x ⇒ NRH0

H0 : µ = µ0, Ha : µ 6= µ0

1 - Α

Α�2 Α�2

Μ0

x2x1RH0 NRH0 RH0

Distribution d’echantillonnage si H0 vraie

α = P(Y ≤ x1 ou Y ≥ x2)

x ≤ x1 ou x ≥ x2 ⇒ RH0

x1 < x < x2 ⇒ NRH0

Caroline Verhoeven MEMO-I402 25 / 36

3. Tests d’hypothese 1. La p-valeur

La valeur p (p-value) I

Supposons queH0 : µ = µ0

Ha : µ > µ0

Nous avons x des donnees

Μ0

Distribution d’echantillonnage siH0 vraie

Caroline Verhoeven MEMO-I402 26 / 36

3. Tests d’hypothese 1. La p-valeur

La valeur p (p-value) I

Supposons queH0 : µ = µ0

Ha : µ > µ0

Nous avons x des donnees

p

Μ0 x

x

Distribution d’echantillonnage siH0 vraie

p = P(Y ≥ x)

p ≤ α ⇒ RH0

Caroline Verhoeven MEMO-I402 26 / 36

3. Tests d’hypothese 1. La p-valeur

La valeur p (p-value) I

Supposons queH0 : µ = µ0

Ha : µ > µ0

Nous avons x des donnees

p

Μ0 x

xDistribution d’echantillonnage siH0 vraie

p = P(Y ≥ x)

p ≤ α ⇒ RH0

p > α ⇒ NRH0

Caroline Verhoeven MEMO-I402 26 / 36

3. Tests d’hypothese 1. La p-valeur

La valeur p (p-value) II

SiH0 : µ = µ0

Ha : µ < µ0

Μ0

Caroline Verhoeven MEMO-I402 27 / 36

3. Tests d’hypothese 1. La p-valeur

La valeur p (p-value) II

SiH0 : µ = µ0

Ha : µ < µ0

p

Μ0x

x

p = P(Y < x)

p ≤ α ⇒ RH0

Caroline Verhoeven MEMO-I402 27 / 36

3. Tests d’hypothese 1. La p-valeur

La valeur p (p-value) II

SiH0 : µ = µ0

Ha : µ < µ0

p

Μ0x

x p = P(Y < x)

p ≤ α ⇒ RH0

p > α ⇒ NRH0

Caroline Verhoeven MEMO-I402 27 / 36

3. Tests d’hypothese 1. La p-valeur

La valeur p (p-value) III

SiH0 : µ = µ0

Ha : µ 6= µ0

Μ0

x > µ0 ⇒ p/2 = P(Y ≥ x)

x < µ0 ⇒ p/2 = P(Y ≤ x)

et

p ≤ α ⇒ RH0

p > α ⇒ NRH0

Caroline Verhoeven MEMO-I402 28 / 36

3. Tests d’hypothese 1. La p-valeur

La valeur p (p-value) III

SiH0 : µ = µ0

Ha : µ 6= µ0

p�2

Μ0 x2

x

x > µ0 ⇒ p/2 = P(Y ≥ x)

x < µ0 ⇒ p/2 = P(Y ≤ x)

et

p ≤ α ⇒ RH0

p > α ⇒ NRH0

Caroline Verhoeven MEMO-I402 28 / 36

3. Tests d’hypothese 1. La p-valeur

La valeur p (p-value) III

SiH0 : µ = µ0

Ha : µ 6= µ0

p�2

Μ0 x2

x

x > µ0 ⇒ p/2 = P(Y ≥ x)

x < µ0 ⇒ p/2 = P(Y ≤ x)

et

p ≤ α ⇒ RH0

p > α ⇒ NRH0

Caroline Verhoeven MEMO-I402 28 / 36

3. Tests d’hypothese 2. Etapes d’un test d’hypothese

1 Choisir le niveau significatif α

Caroline Verhoeven MEMO-I402 29 / 36

3. Tests d’hypothese 2. Etapes d’un test d’hypothese

1 Choisir le niveau significatif α2 Formuler H0 et Ha

Caroline Verhoeven MEMO-I402 29 / 36

3. Tests d’hypothese 2. Etapes d’un test d’hypothese

1 Choisir le niveau significatif α2 Formuler H0 et Ha

3 Choisir le test approprie

Caroline Verhoeven MEMO-I402 29 / 36

3. Tests d’hypothese 2. Etapes d’un test d’hypothese

1 Choisir le niveau significatif α2 Formuler H0 et Ha

3 Choisir le test approprie4 Calculer la valeur p et comparer avec α

Caroline Verhoeven MEMO-I402 29 / 36

3. Tests d’hypothese 2. Etapes d’un test d’hypothese

1 Choisir le niveau significatif α2 Formuler H0 et Ha

3 Choisir le test approprie4 Calculer la valeur p et comparer avec α

5 Formuler une conclusion

Caroline Verhoeven MEMO-I402 29 / 36

3. Tests d’hypothese 2. Etapes d’un test d’hypothese

1 Choisir le niveau significatif α2 Formuler H0 et Ha

3 Choisir le test approprie4 Calculer la valeur p et comparer avec α

5 Formuler une conclusion

Caroline Verhoeven MEMO-I402 29 / 36

3. Tests d’hypothese 3. Test t pour 2 echantillons independants

Test de t pour 2 echantillons independants : principe

But : Conclure si les moyennes µ1 et µ2 de 2 populations sontegales ou non

Formulation des hypotheses :H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2, ou µ1 6= µ2)

Caroline Verhoeven MEMO-I402 30 / 36

3. Tests d’hypothese 3. Test t pour 2 echantillons independants

Test de t pour 2 echantillons independants : principe

But : Conclure si les moyennes µ1 et µ2 de 2 populations sontegales ou non

Formulation des hypotheses :H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2, ou µ1 6= µ2)

On considere 2 echantillons de N1 et N2 sujets

Caroline Verhoeven MEMO-I402 30 / 36

3. Tests d’hypothese 3. Test t pour 2 echantillons independants

Test de t pour 2 echantillons independants : principe

But : Conclure si les moyennes µ1 et µ2 de 2 populations sontegales ou non

Formulation des hypotheses :H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2, ou µ1 6= µ2)

On considere 2 echantillons de N1 et N2 sujets

Si σ21 = σ2

2, test t classique

Caroline Verhoeven MEMO-I402 30 / 36

3. Tests d’hypothese 3. Test t pour 2 echantillons independants

Test de t pour 2 echantillons independants : principe

But : Conclure si les moyennes µ1 et µ2 de 2 populations sontegales ou non

Formulation des hypotheses :H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2, ou µ1 6= µ2)

On considere 2 echantillons de N1 et N2 sujets

Si σ21 = σ2

2, test t classique

Si σ21 6= σ2

2, test t de Welch

Caroline Verhoeven MEMO-I402 30 / 36

3. Tests d’hypothese 3. Test t pour 2 echantillons independants

Test de t pour 2 echantillons independants : principe

But : Conclure si les moyennes µ1 et µ2 de 2 populations sontegales ou non

Formulation des hypotheses :H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2, ou µ1 6= µ2)

On considere 2 echantillons de N1 et N2 sujets

Si σ21 = σ2

2, test t classique

Si σ21 6= σ2

2, test t de Welch

D’abord tester si σ21 = σ2

2 avec Fisher

Caroline Verhoeven MEMO-I402 30 / 36

3. Tests d’hypothese 3. Test t pour 2 echantillons independants

Test t pour 2 echantillons independants : conditions

Conditions sur les donnees

Les echantillons doivent etre independants

Les echantillons ne peuvent pas etre biaises

Les donnees doivent etre normalement distribuees pour les 2echantillons ou N1 et N2 doivent etre assez grandsSi la distribution n’est pas trop differente de la normale, N1 ≥ 5 etN2 ≥ 5 est suffisant

Caroline Verhoeven MEMO-I402 31 / 36

3. Tests d’hypothese 3. Test t pour 2 echantillons independants

Test t pour 2 echantillons independants : conditions

Conditions sur les donnees

Les echantillons doivent etre independants

Les echantillons ne peuvent pas etre biaises

Les donnees doivent etre normalement distribuees pour les 2echantillons ou N1 et N2 doivent etre assez grandsSi la distribution n’est pas trop differente de la normale, N1 ≥ 5 etN2 ≥ 5 est suffisant

Il faut verifier si σ1 = σ2 ou pas

Caroline Verhoeven MEMO-I402 31 / 36

3. Tests d’hypothese 4. Test t pour echantillon apparies

Test t pour 2 echantillons apparies : principe

But : Tester si la moyenne reste la meme ou non pour les memessujets dans des conditions differentes

Caroline Verhoeven MEMO-I402 32 / 36

3. Tests d’hypothese 4. Test t pour echantillon apparies

Test t pour 2 echantillons apparies : Conditions

Conditions sur les donnees

Les sujets doivent etre selectionnes de maniere independante

Les echantillons ne peuvent pas etre biaises

Les donnees doivent etre normalement distribuees ou N ≥ 15

Caroline Verhoeven MEMO-I402 33 / 36

3. Tests d’hypothese 4. Test t pour echantillon apparies

Test t en Excel

Onglet Donnees → Utilitaire d’analyseFim explicatif sur youtube :

Caroline Verhoeven MEMO-I402 34 / 36

3. Tests d’hypothese 5. Exercices

Exercice 6

Pour beaucoup d’especes un male possedant untaux de testosterone eleve attirer plus facilementune femelle. On peut se poser la question s’il payeun prix pour ce taux eleve.Une des hypothese est que des males ayant untaux de testosterone eleve ont un systeme immuni-taire plus faible. Des biologise ont implante un tubepermeable contenant de la testosterone a des ca-rouges a epaulettes. Ils on mesure le taux d’anti-corps dans le sang avant et apres l’implantation.Les donnees se trouvent dans le fichieroiseau.xlsx

Y-a-t-il au seuil de 5% une difference entre le taux d’anticorps avantet apres l’implantation ?

Caroline Verhoeven MEMO-I402 35 / 36

3. Tests d’hypothese 5. Exercices

Exercice 7

Un biologiste regarde la longueur enmm des œufs de de coucou trouvesdans les nids de deux especes d’oi-seaux : le roitelet et la fauvette. Leroitelet est plus petit que la fauvette.Vous trouverez les donnees dans lefichier coucou.xls sur le site.

Le coucou adapte-t-il la taille de ses œufs en fonction de la taille dunid dans lequel il pond ? Autrement dit la longueur moyenne desœufs de nids de fauvettes est-elle plus grande que celle desroitelets, au seuil 5% ?

Caroline Verhoeven MEMO-I402 36 / 36