Post on 30-Aug-2020
L’échantillonnage des enquêtes ménages
- hors Emploi et DOM -
Enquêtes et Sondages - CNAM - UE STA 108
Sylvie Rousseau 12/01/07
2
Sommaire
I. Les principes généraux
II. La principale base de sondage : l’échantillon-maître
III. L’échantillonnage d’une enquête
3
I. Principes généraux
I.1. Objectif d’une enquête-ménagesI.2. Cadre institutionnelI.3. Définition d’un ménageI.4. L’unité d’échantillonnage I.5. Principes d’échantillonnage I.6. Modes de collecte
4
I.1. Objectif d’une enquête-ménages
Fournir de l’information sur la population pour éclairer le débat socialExemples :
• un seuil de revenu ;
• la proportion de locataires ;• l’état de santé moyen de la population ;• …
5
I.2. Cadre institutionnelProgramme d’enquêtes annuel visé par le Conseil National de l’information Statistique (publié au JO).
Le CNIS assure la concertation entre les producteurs et les utilisateurs de statistiques publiques.Enquêtes « d'intérêt général et de qualité statistique », ayant successivement reçu :
Avis d'opportunité : l'enquête répond à un besoin d'intérêt public, elle ne fait pas double emploi avec d'autres sources statistiques ;Avis de conformité attestant de la qualité de l'opération.
Loi sur le secret statistique (1951)Loi "Informatique et libertés" (1978)
6
I.3. Définition d’un ménage
ménage-logement » : ensemble des personnes habitant le même logement au titre de leur résidence principale
« ménage-unité de vie » : ensemble des personnes partageant la même résidence habituelle et le même budget
7
I.4. L’unité d’échantillonnage
C’est le logement « ordinaire »En l’absence de registres de populationGrâce au recensement de la population et au suivi de la construction neuve
On construit des échantillons de logts ordinairesOn atteint les ménages et/ou les individus par l'intermédiaire de leur logement
8
I.5. Principes d’échantillonnage
Echantillons probabilistes de logementsTous les logements principaux possèdent la même probabilité de participer à l’enquêtei.e. chaque logt tiré représente w ménages
Ex : w ≅ 2 000 pour une enquête de taille 10 000
à moins de viser davantage certaines populations
Un même logt ne peut-être interrogé pour des enquêtes distinctes entre deux recensements
9
I.6. Modes de collecte
Enquêtes généralement en face à faceQuelques enquêtes par téléphone
Camme, ré-interrogations Loyers et Charges
Coûts de collecte Stabilité du réseau d'enquêteurs
localisation de l’échantillon
10
Conclusion
Tirage des échantillons en 2 temps
1ère phase de localisation des enquêtes, i.e. tirage de bases de sondage intermédiaires:
l’Echantillon-Maître (EM99) pour les logts recensés en 1999 La Base de Sondage des Logements Neufs (BSLN) pour les
logements construits après mars 1999
2ème phase de tirage des échantillons des enquêtes dans ces 2 bases de sondage intermédiaires
11
II. La principale base de sondage: l’Echantillon-Maître (EM)
Entre contraintes pratiques et désir de précision
Etablir une réserve de logements localiséepour alimenter la plupart des enquêtes ménages
hors DOM, enquête Emploi, enquêtes locales,…
Optimiser la précision des résultats nationaux
12
13
1. Taille de l’EM99
2 022 889 logements 7 % des logts recensés en mars 99
Réserve calibrée dans l’optique des prévisions suivantes :
10 enquêtes nationales par année,de 10 000 ménages chacune en moyenne,pendant 6 ans (d’octobre 2001 à fin 2007)
14
2. Constitution de l’EM99
L’EM s’obtient selon un tirage stratifiéà 1 ou 2 degrés selon la strate
15
Région RRCommunes
rurales =>UP
Choix d'UP Choix d'UP
Choixde districts
Choix de districts
Région RRUU de moins de20000 habitants
Région RRUU de 20000 à
100000 habitants
Région RRUU de Paris
Région RRUU de plus de
100000 habitants
Stratification
Région RRUP rurales
Région RRUP "petit urbain"
Choix d'UP
Région RRUP "moyen urbain"
Région RRdistricts de strate 2
Région RRdistricts de strate 3
Région RRdistricts de strate 4
Choixde districts
EM
Exhaustifen logements
16
a. Stratification quadrillant le territoire selon les régions et la densité d’habitat
Collecte des enquêtes en Direction RégionaleLe degré d’urbanisation explique assez bien le comportement des ménages
(ex : logement, conditions de vie, …)
Cette stratification est un élément de qualité
17
87 strates de tirage
Strate de gestion
Nombre de communes* au RP 99
Nombre d’unités urbaines au RP 99
Nombre de régions
0 30 611 - 22 1 3 167 1 762 22 2 1 097 180 22 3 1 294 52 20 4 396 1 1
Total 36 565 1 995 87 * : tous arrondissements compris
18
Région RRCommunes
rurales =>UP
Choix d'UP Choix d'UP
Choixde districts
Choix de districts
Région RRUU de moins de20000 habitants
Région RRUU de 20000 à
100000 habitants
Région RRUU de Paris
Région RRUU de plus de
100000 habitants
Stratification
Région RRUP rurales
Région RRUP "petit urbain"
Choix d'UP
Région RRUP "moyen urbain"
Région RRdistricts de strate 2
Région RRdistricts de strate 3
Région RRdistricts de strate 4
Choixde districts
EM
Exhaustifen logements
19
b. Localisation des enquêtes dans des UP (i) Définition des UP
En strates 0, 1 et 2, une UP correspond au rayon d’action d’un enquêteurEn strates 2, 3 et 4 une UP = une UU
20
b. Localisation des enquêtes dans des UP (i) Définition des UP
En strate 0, une UP est formée de :- une ou plusieurs communes rurales contigües- situées dans la même région - où résident des ménages au profil de revenu voisin- ayant entre 1 800 à 3 600 logements principaux
⇒plus de 30 000 communes rurales regroupées en 2 227 UP
En strate 1, une UP est formée de :- de 1 ou 2 UU proches de la même région- de profil de revenu moyen le plus semblable possible - d’au moins 1 800 logements principaux
21
b. Localisation des enquêtes dans des UP (ii) Calibrage des UP – réserve minimale
En strates 0, 1 et 2, chaque UP contient au moins
30 × 10 × 6 = 1800 logements
1 UP = 1 enquêteur 10 enquêtes /an pendant 6 ans≤ 30interviews
Dans les strates 2, 3 et 4 : UP de plus de 20000 habitants (tirage d’US)
22
b. Localisation des enquêtes dans des UP (ii) Calibrage des UP – allocations d’UP
Dans une des strates 0, 1 ou 2 d’une région donnée de taille 400 000 logts par exemple, on retiendra :
On enquête environ 1 UP = 1 enquêteur 1 logement sur 2000 ≥ 20 interviews
UP10201
2000400000
=×
23
b. Localisation des enquêtes dans des UP (ii) Calibrage des UP – allocations d’UP
Dans les strates 3 et 4, toutes les UP sont retenues et impactées avec un taux de sondage moyen de 1/2000Unité Urbaine
Nombre d'habitants
Nombre de logtsprincipaux
Nombre de FA
Nombre d’enquêteurs
Angoulême 100 000 46 000 23 1
2
≅ 4
≅ 7
Paris 9 644 507 4 039 349 2 020 ≅80
Reims 215 000 94 000 47
Nantes 500 000 234 000 117
Lille 1 001 000 388 000 194
24
b. Localisation des enquêtes dans des UP (iii) Tirage des UP
Stratifié dans 66 strates de tirage croisant 22 régions et les 3 strates de gestion 0, 1 et 2A probabilités inégales des UP proportionnellement à leur nombre de résidences principales dans la strate de tirageEquilibré sur des critères de revenu et d'âge au niveau de groupes de régions
revenu net total imposable (source DGI 1996)effectifs des 3 tranches d'âges [0,19] , [20,59] et [60,+] ans
(source RP99)
26
Région RRCommunes
rurales =>UP
Choix d'UP Choix d'UP
Choixde districts
Choix de districts
Région RRUU de moins de20000 habitants
Région RRUU de 20000 à
100000 habitants
Région RRUU de Paris
Région RRUU de plus de
100000 habitants
Stratification
Région RRUP rurales
Région RRUP "petit urbain"
Choix d'UP
Région RRUP "moyen urbain"
Région RRdistricts de strate 2
Région RRdistricts de strate 3
Région RRdistricts de strate 4
Choixde districts
EM
Exhaustifen logements
27
c. Choix de districts dans les UP retenues de plus de 20 000 habitants
Uniquement en strates de gestion 2, 3 et 4Tirage stratifié par groupes de communes pour garantir la dispersion géographique des districts Tirage à probabilités égales des districts dans l’UU (ex : 1 district sur 20 en strates 3 et 4)Tirage équilibré sur l’UU par la méthode du Cube sur les critères de revenu et d’âge
29
Région RRCommunes
rurales =>UP
Choix d'UP Choix d'UP
Choixde districts
Choix de districts
Région RRUU de moins de20000 habitants
Région RRUU de 20000 à
100000 habitants
Région RRUU de Paris
Région RRUU de plus de
100000 habitants
Stratification
Région RRUP rurales
Région RRUP "petit urbain"
Choix d'UP
Région RRUP "moyen urbain"
Région RRdistricts de strate 2
Région RRdistricts de strate 3
Région RRdistricts de strate 4
Choixde districts
EM
Exhaustifen logements
30
d. Désignation des logts retenus dans l’EM
Strates 0 et 1 : tous les logts des UP tirées
Strates 2, 3 et 4 : tous les logts des US sélectionnées dans les UP tirées
31
32
Ile de France
33
Bretagne
Quelques données numériques sur l'Echantillon-Maître
Strate 0 Strate 1 Strate 2 Strate 3 Strate 4 Total
Nombre d’UP au RP99
2 227 975 180 52 1 3 435
Nombre d’UP-EM 128 75 93 52 1 349
Nombre de communes EM
2 018 284 610 1317 415 4 644
Nombre total de logements RP99
7 382 976 4 934 454 3 839 693
7 988 099
4 549 934 28 696 156
Nombre total de logements EM
451 776 444 978 497 962 399 845 228 328 2 022 889
Proportion de logements EM
6 9 13 5 5 7
35
Remarque
En vue du tirage des enquêtes dans l’EM (qui obéit à un plan stratifié par groupes de communes), on a construit des groupes de communes en strates 0 et 1, avec :
- une commune en strate 1 - un regroupement de communes rurales
d’au moins 100 logements en strate 0
36
III. Echantillonnage d’une enquête
On échantillonne surtout des logements recensés comme principaux On sélectionne également des résidences secondaires, occasionnelles ou vacantes au RP99 pour tenir compte des changements intervenus depuis 1999On tire des logements neufs avec la même probabilité que les principaux (i.e. tous possèdent la même pondération)
37
III. Echantillonnage d’une enquêteDes enquêtes impactent davantage certaines catégories de populations
Mais après tirage de l’échantillon d’une telle enquête, l’ EM doit continuer d’être « représentatif » pour les enquêtes ultérieures
⇒ Tirage en 2 phases1) Tirage de S1 (n1 > n ) dans l’EM, à probas égales 2) Tirage de S2 dans S1 de taille n, à probas inégalesEnfin marquage dans l’EM des unités de S1
1 /2 1 /3
2 /3
1 /1
38
III. Echantillonnage d’une enquête
On impacte toutes les UP de l’EM Plan stratifié par groupes de communesTirage systématique des logts, dans chaque strate, sur un fichier trié par catégorie de logt au RPSi besoin, tirage en 2 phases
39
40
Conclusion et perspectives
Le contexte du nouveau recensement Enjeux organisationnels et choix méthodologiques
Choix des critères de stratificationZones d’emploi, activités économiques dominantes, Prix du locatif, proximité à des équipements, …
D’autres modes de collecteInternet, téléphone
De nouveaux besoins Panel de ménages, enquêtes locales
41
Bibliographiewww.cnis.frwww.insee.frL'échantillon maître de 1999 et application au tirage des unités primaires par la macro "Cube", L.Wilms, Journées de Méthodologie Statistique, 2002. La correction de la non-réponse par repondération et par imputation, N.Caron, Document de travail n°M0502,http://www.insee.fr/fr/nom_def_met/methodes/doc_travail/docs_doc_travail/M0502.pdfTechniques de sondage, P.Ardilly, Technip, 2006La méthode de partage des poids, P. Lavallée, Dunod, 2004