Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf ·...

70
Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié proportionnel Sondage stratifié optimal Comment choisir les strates ? Sondage stratifié Myriam Maumy-Bertrand 1 1 IRMA, Université de Strasbourg Strasbourg, France Master 1ère Année 16-10-2014 Myriam Maumy-Bertrand Sondage stratifié

Transcript of Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf ·...

Page 1: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Sondage stratifié

Myriam Maumy-Bertrand1

1IRMA, Université de StrasbourgStrasbourg, France

Master 1ère Année 16-10-2014

Myriam Maumy-Bertrand Sondage stratifié

Page 2: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

RéférencesCe chapitre s’appuie essentiellement sur deux ouvrages :

1 « Les sondages : Principes et méthodes »de A.-M. Dussaix et J.M. Grosbras,P.U.F., Collection Que sais-je ?, 1993.

2 « Manuel de Sondages »de R. Clairin et P. Brion,téléchargeable à :http://www.ceped.org/cdrom/integral_publication_1988_2002/manuels/pdf/manuels_cpd_03.pdf

Myriam Maumy-Bertrand Sondage stratifié

Page 3: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Sommaire

1 Principe et objectifs

2 Formules d’estimation du sondage stratifié

3 Sondage stratifié proportionnel

4 Sondage stratifié optimal

5 Comment choisir les strates ?

Myriam Maumy-Bertrand Sondage stratifié

Page 4: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Dans un sondage aléatoire simple

toutes les combinaisons de n unités de l’échantillon parmi Néléments de la population U ont la même probabilité.

RemarqueMais certaines d’entre elles peuvent être indésirables.

Myriam Maumy-Bertrand Sondage stratifié

Page 5: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Exemple : salaire annuelSoit une population de 5 éléments. Nous relevons sur ces 5individus la variable d’intérêt « salaire annuel » (en milliersd’euros) :

13,15,17,25,30.

Parmi les échantillons à 2 unités, nous avons 2 cas extrêmes

(13,15) et (25,30)

qui se révèlent « mauvais » s’il s’agit d’estimer la moyenne

µ =13 + 15 + 17 + 25 + 30

5= 20.

Myriam Maumy-Bertrand Sondage stratifié

Page 6: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

RemarquesIl y a plusieurs types de classes dans cette population :• des classes d’individus « à salaires modestes »• des classes d’individus « à salaires élevés ».

Il serait malencontreux que :• les hasards de l’échantillonnage conduisent à n’interroger

que des individus appartenant à une seule de cescatégories

• ou l’échantillon soit trop déséquilibré en faveur de l’uned’elles.

Myriam Maumy-Bertrand Sondage stratifié

Page 7: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Le but du jeuExclure les échantillons extrêmes et améliorer la précision desestimateurs du chapitre précédent.

RemarquesNous avons constaté qu’à taille égale, un échantillon estplus efficace dans une population homogène que dansune population hétérogène.Plus précisément, l’erreur type d’estimation est liée à lavariance du caractère étudié dans la population.

Myriam Maumy-Bertrand Sondage stratifié

Page 8: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Le but du jeuDécouper la population en sous-ensembles, appelés desstrates, les plus homogènes possibles.

ConséquenceChaque sondage partiel s’effectue de façon efficace etl’assemblage des sondages partiels précis donnera desrésultats plus fiables qu’un sondage de même taille effectué« en vrac ».

Myriam Maumy-Bertrand Sondage stratifié

Page 9: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Quelques exemplesLes échantillons de ménages ou d’individus, dans lesenquêtes usuelles, sont stratifiés par région croisée partype d’habitat (taille des communes).Les échantillons d’entreprises sont stratifiés par secteur etpar taille, exprimée en effectifs salariés ou chiffre d’affaires.Les échantillons d’exploitations agricoles sont stratifiés partranches de surface.Les échantillons de jeunes sortis de l’enseignementsupérieur sont stratifiés par discipline.etc.

Myriam Maumy-Bertrand Sondage stratifié

Page 10: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Retour à l’exemple du salaire annuelPour une étude sur le « salaire annuel », il sera pertinentd’utiliser des critères liés :

à l’âge,au niveau d’études,éventuellement au sexe,

c’est-à-dire à des facteurs susceptibles d’expliquer lesdifférences de comportement au niveau des salaires.

Myriam Maumy-Bertrand Sondage stratifié

Page 11: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

DéfinitionStratifier correspond souvent à un objectif de réduction descoûts d’enquête ou d’optimisation de sa gestion.

RemarqueC’est en particulier le cas :

lorsque nous utilisons un critère de découpagegéographique comme la région,ou, dans les échantillons d’entreprises, un critère sectoriel,

ce qui permet alors, de spécialiser les enquêteurs.

Myriam Maumy-Bertrand Sondage stratifié

Page 12: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Retour à l’exemple du salaire annuelSupposons que nous sachons, a priori, que les 3 premiersindividus forment une catégorie de « salaires modestes » etque les 2 derniers soient catalogués « salaires élevés ».

Nous décidons alors que l’échantillon de 2 individus doitêtre constitué d’un représentant de chaque strate.Les échantillons possibles sont dans ce cas au nombre de6. Chacun des 3 individus de la première strate pouvantêtre associé à l’un des 2 autres de la seconde strate.

Myriam Maumy-Bertrand Sondage stratifié

Page 13: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Suite de l’exempleNotons y1 et y2 les valeurs obtenues dans l’échantillon.Nous ne pouvons plus, comme auparavant, faire lamoyenne arithmétique.En effet, l’unité échantillonnée dans la 1ère strate estdésignée pour en représenter 3, celle de la 2ième stratevaut pour 2.Il convient alors de pondérer chaque yi par le poids de lastrate dont yi est issue. Si µst désigne l’estimation de lamoyenne, alors nous avons :

µst =35

y1 +25

y2.

Myriam Maumy-Bertrand Sondage stratifié

Page 14: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Le tableau ci-dessous représente l’ensemble de tous lescas possibles.

échantillons avec stratificationy1 13,0 13,0 15,0 15,0 17,0 17,0y2 25,0 30,0 25,0 30,0 25,0 30,0µst 17,8 19,8 19,0 21,0 20,2 22,2

D’autre part, nous vérifions que la moyenne des 6 valeursde µst est égale à µ = 20. Cela signifie que la variablealéatoire µst a pour espérance mathématique µ. Donc µstest un estimateur sans biais de µ.

Myriam Maumy-Bertrand Sondage stratifié

Page 15: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

RemarqueNous remarquons surtout que la plage des estimations estbeaucoup plus resserrée autour de la cible que dans le cas dusondage aléatoire simple à probabilités égales sans remise(PESR).

En effet :les valeurs extrêmes sont moins éloignées,

l’écart-type vaut 1,40 au lieu de 3,95.

Myriam Maumy-Bertrand Sondage stratifié

Page 16: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

ConclusionIl y a moins de risque d’obtenir une « mauvaise » estimation deµ en réalisant un sondage stratifié plutôt qu’un sondage àPESR.

La stratification a permis, en utilisant de l’information auxiliaire(l’existence de deux sous-populations), d’améliorer la qualitéde l’estimateur de µ.

Myriam Maumy-Bertrand Sondage stratifié

Page 17: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Nous pouvons maintenant d’écrire la méthode générale.

Pour cela, nous allons avoir besoin d’introduire quelquesnotations.

RemarquePar la suite, nous nous placerons dans le cas d’un tiragealéatoire simple sans remise, à l’intérieur de chaque strate.

Myriam Maumy-Bertrand Sondage stratifié

Page 18: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Au niveau de la population U, pour la strate Uh (nous avons Hstrates de la population) :

L’effectif de la strate Uh dans la population est égal à Nh.La moyenne d’une variable d’intérêt Y est égale à :

µh =1

Nh

Nh∑k=1

yk .

La variance corrigée d’une variable d’intérêt Y est égale à :

σ2h,c =

1Nh − 1

Nh∑k=1

(yk − µh)2 .

Myriam Maumy-Bertrand Sondage stratifié

Page 19: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Au niveau de la population U

L’effectif de la population U est égal à N =∑H

h=1 Nh.La moyenne d’une variable d’intérêt Y , notée µY , est égaleà :

µY =1N

∑i∈U

yi =H∑

h=1

Nh

Nµh.

La variance non corrigée d’une variable d’intérêt Y estégale à :

σ2Y =

1N

∑i∈U

(yi − µY )2 =

1N

H∑h=1

∑i∈Uh

(yi − µY )2 .

Myriam Maumy-Bertrand Sondage stratifié

Page 20: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Formule de la décomposition de la varianceAinsi, nous avons :

σ2Y =

H∑h=1

Nh

Nσ2

h +H∑

h=1

Nh

N(µh − µY )

2 ,

le premier terme est noté σ2dans et le second terme est noté

σ2entre.

σ2dans = σ2

intra est une mesure globale de la dispersion de Yau sein des strates,σ2

entre = σ2inter est une mesure globale de la dispersion de

Y entre les strates.

Myriam Maumy-Bertrand Sondage stratifié

Page 21: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Au niveau de l’échantillon S, pour la strate Sh

L’effectif de la strate Sh de l’échantillon S est égal à nh.L’estimateur de la moyenne, dans la strate Sh est égal à :

µh =1nh

∑i∈Sh

Yi =1nh

nh∑i=1

Yi .

L’estimateur de la variance corrigée, dans la strate Sh estégal à :

S2h,c =

1nh − 1

nh∑i=1

(Yi − µh)2 .

Myriam Maumy-Bertrand Sondage stratifié

Page 22: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

Au niveau de l’échantillon S

L’effectif de l’échantillon S est égal à n =∑H

h=1 nh.L’estimateur de la moyenne, dans l’échantillon S est égalà :

µY =1n

∑i∈S

Yi =H∑

h=1

nh

nµh.

L’estimateur de la variance corrigée, dans l’échantillon Sest égal à :

S2n,c =

1n − 1

n∑i=1

(Yi − µ)2 .

Myriam Maumy-Bertrand Sondage stratifié

Page 23: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

IntroductionExempleObjectifsRetour à l’exempleNotations

RemarqueParagraphe 5.2 : détermination des tailles nh où h varie de 1 àH, de manière à minimiser la variance de l’estimateur de lamoyenne µY sous la contrainte que la taille n de l’échantillon Sest fixée a priori.

Myriam Maumy-Bertrand Sondage stratifié

Page 24: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

Sommaire

1 Principe et objectifs

2 Formules d’estimation du sondage stratifié

3 Sondage stratifié proportionnel

4 Sondage stratifié optimal

5 Comment choisir les strates ?

Myriam Maumy-Bertrand Sondage stratifié

Page 25: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

DéfinitionL’estimateur de la moyenne µ d’une population U par sondagestratifié se définit par :

µst =H∑

h=1

Nh

Nµh.

PropriétéNous montrons, par calcul, que cet estimateur est sansbiais :

E (µst) = µ.

Myriam Maumy-Bertrand Sondage stratifié

Page 26: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

DéfinitionL’estimateur du total T d’une population U par un sondagestratifié se définit par :

Tst =H∑

h=1

Nhµh.

PropriétéNous montrons, par calcul, que cet estimateur est sansbiais :

E(

Tst

)= T .

Myriam Maumy-Bertrand Sondage stratifié

Page 27: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

RemarqueCette formule peut aussi s’écrire sous la forme :

Tst =H∑

h=1

Nh

(1nh

nh∑i=1

Yi

)=

H∑h=1

( nh∑i=1

Nh

nhYi

).

Nous remarquons, dans la formule précédente, que Yi est

pondérée par le coefficientNh

nh, appelé coefficient

d’extrapolation (dont la valeur dépend de la strate Uh), afind’extrapoler (ou « d’étendre ») les résultats à la population.

Myriam Maumy-Bertrand Sondage stratifié

Page 28: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

DéfinitionL’estimateur d’une proportion πA d’une population ayant lacaractéristique A se fait, comme présenté dans un chapitreprécédent, par l’estimateur de la moyenne d’une variabled’intérêt qui vaut :

1 si l’unité a la caractéristique étudiée0 si l’unité n’a pas la caractéristique étudiée.

Myriam Maumy-Bertrand Sondage stratifié

Page 29: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

PropriétéNous montrons, par calcul, que :

Var ( µst ) =H∑

h=1

N2h

N2 (1− fh)σ2

h,c

nh,

où fh =nh

Nhest le taux de sondage correspondant et σ2

h,c est la

variance corrigée définie auparavant.

Myriam Maumy-Bertrand Sondage stratifié

Page 30: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

PropriétéNous montrons, par calcul, que :

Var(

Tst

)=

H∑h=1

N2h (1− fh)

σ2h,c

nh,

où fh =nh

Nhest le taux de sondage correspondant et σ2

h,c est la

variance corrigée définie auparavant.

Myriam Maumy-Bertrand Sondage stratifié

Page 31: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

RemarquesComment démontrez-vous ces formules ?Ces formules posent un problème. Lequel ?

Myriam Maumy-Bertrand Sondage stratifié

Page 32: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

Pour répondre à la dernière question posée, nous définissonsles deux quantités suivantes.

DéfinitionUn estimateur de la variance de µst se définit par :

Var ( µst ) =H∑

h=1

N2h

N2 (1− fh)s2

h,c

nh=

H∑h=1

N2h

N2 (1− fh)s2

hnh − 1

,

où fh est le taux de sondage correspondant et s2h,c est la

variance corrigée définie auparavant.

Myriam Maumy-Bertrand Sondage stratifié

Page 33: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

Définition

Un estimateur de la variance de Tst se définit par :

Var(

Tst

)=

H∑h=1

N2h (1− fh)

s2h,c

nh=

H∑h=1

N2h (1− fh)

s2h

nh − 1,

où fh est le taux de sondage correspondant et s2h,c est la

variance corrigée définie auparavant.

Myriam Maumy-Bertrand Sondage stratifié

Page 34: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

RemarqueCes deux estimateurs de la variance permettent de calculerl’écart-type de chaque estimateur. Par conséquent, comme auchapitre 1, nous pouvons construire des intervalles deconfiance au niveau de confiance égal à 1− α pour chacun desparamètres inconnus de la population.

Myriam Maumy-Bertrand Sondage stratifié

Page 35: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

DéfinitionL’intervalle de confiance asymptotique pour µ au niveau deconfiance égal à 1− α se définit par :]

µst − z1−α/2 ×√

Var ( µst ); µst + z1−α/2 ×√

Var ( µst )

[,

où z1−α/2 est le quantile d’ordre 1− α/2 de la loi normalecentrée et réduite.

Myriam Maumy-Bertrand Sondage stratifié

Page 36: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

DéfinitionL’intervalle de confiance asymptotique pour T au niveau deconfiance égal à 1− α se définit par :]

Tst − z1−α/2 ×√

Var(

Tst

); Tst + z1−α/2 ×

Var(

Tst

)[,

où z1−α/2 est le quantile d’ordre 1− α/2 de la loi normalecentrée et réduite.

Myriam Maumy-Bertrand Sondage stratifié

Page 37: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

Exemple bancaireUne société bancaire compte 50 000 clients répartis en :

40 000 « petits » clients10 000 « gros » clients.

Soit un sondage portant sur 200 clients répartis en :160 « petits » clients40 « gros » clients.

Nous nous intéressons au montant moyen µ des comptes aumoment de l’enquête et à la proportion π des clients prêts àsouscrire au nouveau produit financier.

Myriam Maumy-Bertrand Sondage stratifié

Page 38: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

Suite de l’exemple bancaireLe dépouillement du sondage donne les résultats suivants :

Statistiques Strate 1 Strate 2Effectif population N1 = 40 000 N2 = 10 000Effectif échantillon n1 = 160 n2 = 40Montant moyen µ1 = 12 µ2 = 58Variance corrigée s2

1 = 85 s22 = 930

Écart-type s1 = 9,22 s2 = 30,50Clients favorables nA,1 = 8 nA,2 = 22Proportion π1 = 5% π2 = 55%

Myriam Maumy-Bertrand Sondage stratifié

Page 39: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

Intervalle de confiance pour µ

µst =40 00050 000

×12+10 00050 000

×58 = 0,8×12+0,2×58 = 21,2

Var( µst ) = 0,64× 0,996× 85160

+ 0,04× 0,996× 93040

= 1,26492Écart-type =

√1,26492 ' 1,125

Intervalle de confiance à 95% pour µ :

µ ∈]21,2± 1,96× 1,125[,

c’est-à-dire :µ ∈]18,995;23,405[.

Myriam Maumy-Bertrand Sondage stratifié

Page 40: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

Intervalle de confiance pour π

πst =40 00050 000

× 0,05 +10 00050 000

× 0,55 = 15%

Var( πst ) = 0,64× 0,996× 0,05× 0,95160

+ 0,04× 0,996×0,55× 0,45

40= 4,3575× 10−4

Écart-type =√

4,3575× 10−2% ' 2,0875× 10−2%

Intervalle de confiance à 95% pour π :

π ∈]10,90%;19,10%[.

Myriam Maumy-Bertrand Sondage stratifié

Page 41: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Les trois estimateurs classiquesLes variances de µst et de TstLes estimations des variances de µst et de TstLes intervalles de confiance pour µ et pour TExemple

RemarqueSi dans le cas du sondage stratifié, nous avions estimé µ par

µY =H∑

h=1

nh

nµh

au lieu de

µst =H∑

h=1

Nh

Nµh

alors, nous aurions un estimateur biaisé de µ.

Myriam Maumy-Bertrand Sondage stratifié

Page 42: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

Sommaire

1 Principe et objectifs

2 Formules d’estimation du sondage stratifié

3 Sondage stratifié proportionnel

4 Sondage stratifié optimal

5 Comment choisir les strates ?

Myriam Maumy-Bertrand Sondage stratifié

Page 43: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

RemarqueLes formules ci-dessus sont valables quels que soient lesnombres d’unités statistiques tirées par strate.Le taux de sondage fh peut donc être variable d’une strate h àune autre.

DéfinitionUn sondage est appelé un sondage stratifié proportionnelquand le sondage stratifié est tel que les taux de sondagefh = nh

Nhsont les mêmes dans toutes les strates. Ainsi, nous

avons un taux de sondage global égal à f = nN = fh = nh

Nh·

Myriam Maumy-Bertrand Sondage stratifié

Page 44: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

RemarquesC’est ainsi que, dans un échantillon d’individus stratifié parsexe, les hommes et les femmes figurent au prorata deleur effectif dans la population étudiée.Dans l’application numérique du paragraphe précédent,nous avons considéré un échantillon représentatif de lapopulation des « petits clients » et des « gros clients ».

Myriam Maumy-Bertrand Sondage stratifié

Page 45: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

Là encore, il faut prendre garde à la définition exacte destermes utilisés.

DéfinitionLe terme « représentatif » signifie que l’échantillon a été dosépour « représenter » une répartition d’effectifs dans lapopulation.

RemarqueIl ne signifie pas que le sondage soit parfait, sans erreurs, nimême que la répartition soit la meilleure possible ! Il est doncpréférable, pour éviter les ambiguïtés, de parler d’échantillonproportionnel.

Myriam Maumy-Bertrand Sondage stratifié

Page 46: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

Propriétés

Les propriétés importantes de l’échantillon stratifiéproportionnel sont au nombre de 5 :

Les probabilités d’inclusion d’ordre 1 sont égales pour tousles individus de la population et valent le taux de sondageunique f = n/N.L’estimateur de la moyenne µ vaut alors :

µstp =1n

H∑h=1

( nh∑i=1

Yi

).

C’est donc la moyenne simple calculée sur l’échantillon quipermet d’estimer µY . Nous avons un sondageautopondéré.

Myriam Maumy-Bertrand Sondage stratifié

Page 47: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

Troisième propriétéLa variance de l’estimateur µstp est égale à :

Var ( µstp ) = (1− f )H∑

h=1

Nh

Nσ2

h,c

Remarque

L’expression de Var ( µstp ) montre que la précision de µstp estliée à l’homogénéité/hétérogénéité des individus au sein desstrates. Plus les strates sont homogènes (vis-à-vis de Y ), plusσ2

dans,c est faible, plus Var ( µstp ) est petite, plus µstp est précis.

Myriam Maumy-Bertrand Sondage stratifié

Page 48: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

Remarque

Si nous définissons : σ2dans,c =

∑Hh=1

NhN σ

2h,c nous avons alors

Var ( µstp ) =(1− f )

nσ2

dans,c .

Nous montrons que :

σ2dans,c = σ2

dans +1N

H∑h=1

σ2h,c .

σ2dans,c est, tout comme σ2

dans, une mesure globale de ladispersion Y au sein des strates.

Myriam Maumy-Bertrand Sondage stratifié

Page 49: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

RemarqueNous montrons que cette variance est liée à la variance del’estimateur µY issu du SAS à PE obtenu à partir du mêmenombre d’unités tirées. En effet, nous avons :

Var ( µY ) = Var ( µstp ) + (1− f )1n

H∑h=1

Nh

N(µh − µ)2 .

Que pouvez vous déduire de cette dernière égalité ?Nous en déduisons que le sondage stratifié représentatif aune variance d’estimateur toujours plus petite ou égale à lavariance de l’estimateur du sondage aléatoire simple à PE.

Myriam Maumy-Bertrand Sondage stratifié

Page 50: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

RemarqueLa variance de l’estimateur sera d’autant plus petite que lesstrates ont des moyennes différentes de µY .

Nous expliquons ce résultat en se rappelant que

Le sondage stratifié est basé sur le principe de :forcer le hasardimposer à l’échantillon de représenter la population stratepar strate.

Myriam Maumy-Bertrand Sondage stratifié

Page 51: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

Deux dernières propriétesL’estimateur de la variance de l’estimateur est égal à :

Var ( µstp ) = (1− f )H∑

h=1

Nh

NS2

h,c

L’intervalle de confiance asymptotique pour µ au niveau deconfiance égal à 1− α se définit par :]

µstp − z1−α/2

√Var ( µstp ); µstp + z1−α/2

√Var ( µstp )

[où z1−α/2 est le quantile d’ordre 1− α de la loi normalecentrée et réduite.

Myriam Maumy-Bertrand Sondage stratifié

Page 52: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

RemarqueNous avons établi les dernières propriétés pour l’estimateurstratifié de µY , mais nous pouvons bien sûr établir les mêmespropriétés pour l’estimateur de TY .

Myriam Maumy-Bertrand Sondage stratifié

Page 53: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

PropriétéNous allons comparer le sondage stratifié proportionnel ausondage aléatoire simple à PESR.

D(STP/PESR) =Var (µstp)

Var (µY )

=(1− f )

nσ2

dans,c/(1− f )

nσ2

c

=σ2

dans,c

σ2c·

Myriam Maumy-Bertrand Sondage stratifié

Page 54: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

Remarque

Si la taille N de la population est grande, alors σ2dans,c ' σ2

dans etσ2

c ' σ2. Par conséquent, nous avons :

D(STP/PESR) 'σ2

dansσ2 6 1.

Donc quand la taille N de la population est grande, le sondagestratifié proportionnel est plus efficace que le sondage aléatoiresimple à PESR.

Myriam Maumy-Bertrand Sondage stratifié

Page 55: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

Retour à l’exemple bancaire

Calculons s2dans,c :

s2dans,c = s2

intra =40 00050 000

× 85 +10 00050 000

× 930 = 254.

Puis estimons l’effet de sondage :

D(STP/PESR) =Var (µstp)

Var (µY )

'254200

338,56+254200

=254

592,56·

La variance d’échantillonnage a donc diminué de 43%.

Myriam Maumy-Bertrand Sondage stratifié

Page 56: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

DéfinitionPropriétésEffet de sondageExemple

RemarquePouvons-nous améliorer ces résultats ?

Oui, nous pouvons améliorer ces résultats comme nous leverrons dans le paragraphe suivant.

Myriam Maumy-Bertrand Sondage stratifié

Page 57: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Répartition optimale à taille fixeQuelques remarquesExemple

Sommaire

1 Principe et objectifs

2 Formules d’estimation du sondage stratifié

3 Sondage stratifié proportionnel

4 Sondage stratifié optimal

5 Comment choisir les strates ?

Myriam Maumy-Bertrand Sondage stratifié

Page 58: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Répartition optimale à taille fixeQuelques remarquesExemple

DéfinitionLa répartition optimale à taille fixe n consiste à respecterl’égalité :

nh

n=

Nhσh,cH∑

h=1

Nhσh,c

·

Myriam Maumy-Bertrand Sondage stratifié

Page 59: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Répartition optimale à taille fixeQuelques remarquesExemple

RemarquesLa théorie montre que cette répartition est celle qui fournitla variance la plus faible une fois les strates déterminées.Plus une strate est hétérogène vis-à-vis de Y , plus nousutilisons un taux de sondage f important.L’application de la formule pour calculer la répartitionoptimale suppose connues a priori les valeurs σh,c . Cepeut être le cas à partir d’études antérieures au sondage,mais en général il n’en est pas ainsi.

Myriam Maumy-Bertrand Sondage stratifié

Page 60: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Répartition optimale à taille fixeQuelques remarquesExemple

Deux dernières remarquesLorsque le critère de stratification est la taille des unités,nous constatons que l’écart-type est sensiblementproportionnel à la taille moyenne des unités de la strate.C’est un ordre de grandeur de cette taille moyenne quenous utilisons pour calculer la répartition des individusentre les strates.En pratique, nous utilisons la répartition de Neymanquand le phénomène étudié a une distribution trèsdissymétrique.Par contre, si ce phénomène a une distribution symétriquepar rapport à sa moyenne, un sondage stratifiéproportionnel fournit des résultats d’une qualitésuffisante.

Myriam Maumy-Bertrand Sondage stratifié

Page 61: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Répartition optimale à taille fixeQuelques remarquesExemple

Exemple bancaireNous tirons un échantillon de 200 clients de la sociétébancaire. Nous avons le choix entre :

une répartition proportionnelle (les calculs ont déjà étéfaits) ;la répartition de Neyman.

Myriam Maumy-Bertrand Sondage stratifié

Page 62: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Répartition optimale à taille fixeQuelques remarquesExemple

RemarqueRemarquons que l’échantillon de Neyman dépend du caractèreque nous voulons estimer en priorité. C’est pour ce caractèreque nous prendrons la variance en considération. En général,celle-ci ne sera pas connue a priori. Elle pourra être estimée àpartir d’une enquête antérieure ou d’études limitées.

Myriam Maumy-Bertrand Sondage stratifié

Page 63: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Répartition optimale à taille fixeQuelques remarquesExemple

Retour à l’exemple bancaireL’échantillon de Neyman est composé de :

110 « petits clients » contre 160et de 90 « gros clients » contre 40,

90 pour tenir compte de la plus grande variance de cesderniers.

Le calcul montre que la variance d’échantillonnage aurait étéégale à 0,91 au lieu de 1,27, soit un gain de 28% par rapport àla répartition proportionnelle.

Myriam Maumy-Bertrand Sondage stratifié

Page 64: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Répartition optimale à taille fixeQuelques remarquesExemple

ConclusionAinsi, nous perdons en simplicité des calculs du cas« proportionnel » puisque l’échantillon n’est plusautopondéré, mais nous gagnons en précision.C’est en vertu de considérations de cet ordre que, parexemple, les échantillons d’entreprises stratifiées partranches de taille (moins de 10 salariés, de 10 à 50salariés, etc.) sont répartis, non pas au prorata du nombred’entreprises des tranches, mais au prorata du nombretotal de salariés ou du chiffre d’affaires total.

Myriam Maumy-Bertrand Sondage stratifié

Page 65: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Sommaire

1 Principe et objectifs

2 Formules d’estimation du sondage stratifié

3 Sondage stratifié proportionnel

4 Sondage stratifié optimal

5 Comment choisir les strates ?

Myriam Maumy-Bertrand Sondage stratifié

Page 66: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

L’idéeDéterminer des strates les plus homogènes possibles, parrapport au sujet étudié.

Deux types de considérations vont conduire au choix descritères de stratification :

1. disponibilité des critères dans la base de sondage ;2. pertinence des différents critères pour créer des strates

homogènes. Ceci nécessite une connaissancesoit intuitive,soit venant d’études réalisées antérieurement.

Myriam Maumy-Bertrand Sondage stratifié

Page 67: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Nous prendrons généralement comme critères :

des critères relevant d’une typologie,

ExempleLa catégorie sociale

des critères de taille,

ExempleLe nombre de personnes du ménage

souvent en les croisant ensemble.

Myriam Maumy-Bertrand Sondage stratifié

Page 68: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Au niveau des unités de sondage « géographiques »Nous séparons souvent milieu rural et milieu urbain.

ExemplePour les villes, la stratification selon la région, l’activitédominante des localités.

Au niveau des ménages ou des individusUtilisation des critères qui peuvent être en corrélation avec lesujet d’étude.

ExempleLa CSP, le niveau d’étude, la taille du ménage, le typed’habitation, etc.

Myriam Maumy-Bertrand Sondage stratifié

Page 69: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

Une stratification peut êtretrès efficace pour l’étude d’un phénomène, par exemple lamortalité,

très peu efficace pour l’étude d’autres phénomènes, parexemple l’activité économique.

Cette situation se présente avec une acuité particulièrelorsqu’un échantillon est destiné à des études à objectifsmultiples.

Myriam Maumy-Bertrand Sondage stratifié

Page 70: Sondage stratifié - unistra.frirma.math.unistra.fr/~mmaumy/enseignement/M1Stats/chapitre2.pdf · Principe et objectifs Formules d’estimation du sondage stratifié Sondage stratifié

Principe et objectifsFormules d’estimation du sondage stratifié

Sondage stratifié proportionnelSondage stratifié optimal

Comment choisir les strates ?

AttentionPlus nous multiplions les strates, plus le gain d’efficacitédevient faible.

De plus, les résultats calculés au niveau de chaque strate nesont plus significatifs en raison de la petite taille de l’échantillon.

Myriam Maumy-Bertrand Sondage stratifié