Tirage spatialement équilibré - INSEE

of 28/28
Introduction Plan de sondage Simulations Conclusion Utilisation des m´ ethodes d’´ echantillonnage spatialement ´ equilibr´ e pour le tirage des unit´ es primaires des enquˆ etes m´ enages de l’INSEE Cyril Favre-Martinoz, Thomas Merly-Alpa (INSEE) 9` eme Colloque Francophone sur les Sondages - Gatineau 14 octobre 2016 1/23 C. Favre-Martinoz, T. Merly-Alpa (INSEE) ´ Echantillonnage spatialement ´ equilibr´ e d’unit´ es primaires
  • date post

    21-Feb-2017
  • Category

    Science

  • view

    207
  • download

    0

Embed Size (px)

Transcript of Tirage spatialement équilibré - INSEE

  • IntroductionPlan de sondage

    SimulationsConclusion

    Utilisation des methodes dechantillonnagespatialement equilibre pour le tirage des unites

    primaires des enquetes menages de lINSEE

    Cyril Favre-Martinoz, Thomas Merly-Alpa (INSEE)

    9eme Colloque Francophone sur les Sondages - Gatineau

    14 octobre 2016

    1/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    Sommaire

    1 Introduction

    2 Plan de sondage

    3 Simulations

    4 Conclusion

    2/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    Sommaire

    1 Introduction

    2 Plan de sondage

    3 Simulations

    4 Conclusion

    3/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    LEM actuel

    Une ZAE (Zone dAction Enqueteur) est :

    une grande commune ;

    ou un regroupement de petites communes.

    Les donnees proviennent du recensement rotatif (systeme OCTOPUSSE).

    4/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    LEM actuel

    Tirage equilibre des ZAE sur quelques variables auxiliaires

    Nombre de residences principales et revenu fiscal par groupe derotation ;Nombre de residences principales par type despace : rural,periurbain, urbain ;Davantage de variables dequilibrage en Ile-de-France ;Un total de 488 ZAE non exhaustives tirees.

    5/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    Contexte

    Projet NAUTILE :

    Cycle dEM pour 10 ans : entree en vigueur des nouvelles zones en2020 ;

    Abandon de la base du recensement de la population ;

    Systeme issu des fichiers fiscaux (taxes locales, declarations derevenus) ;

    Plus de liberte pour mettre en oeuvre des techniques de sondagepoussees.

    6/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    Les objectifs

    Tirage dun echantillon dunites primaires selon trois criteres dequalite

    Une precision en termes dEQM raisonnable ;Une proximite avec le reseau denqueteurs raisonnable, afin de limiterles couts de collecte ;Un tirage spatialement reparti pour. . .

    limiter la correlation spatiale, synonyme de perte de precision auniveau globale ;une meilleure couverture de lespace national ;faciliter laffectation des enqueteurs.

    7/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    Les methodes de tirage spatialLe cas particulier du cube spatialement equilibre

    Sommaire

    1 Introduction

    2 Plan de sondageLes methodes de tirage spatialLe cas particulier du cube spatialement equilibre

    3 Simulations

    4 Conclusion

    8/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    Les methodes de tirage spatialLe cas particulier du cube spatialement equilibre

    Methodes de tirage spatialement reparties

    References :

    Grafstrom, A. (2012). Spatially correlated Poisson sampling. Journalof Statistical Planning and Inference, 142(1), 139-147.Grafstrom, A., Lundstrom, N. L., & Schelin, L. (2012). Spatiallybalanced sampling through the pivotal method. Biometrics,68(2),514-520.Grafstrom, A., & Tille, Y. (2013). Doubly balanced spatial samplingwith spreading and restitution of auxiliary totals.Environmetrics,24(2), 120-131.

    Les processus determinantaux : Loonis, V., & Mary, X. (2015). Plansde sondage determinantaux. JMS (2015).

    9/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    Les methodes de tirage spatialLe cas particulier du cube spatialement equilibre

    Principe du tirage spatialement equilibre

    En deux etapes

    p le nombre de contraintes dequilibrage

    On constitue des clusters de p+ 1 unites

    On lance une phase de decollage du cube sur ce cluster, on met ajour les probabilites dinclusion localement puis re-clustering. . .

    Lorsquil reste p unites a tirer, on applique la phase datterrissage.

    Implemente en R par Grafstrom dans le package BalancedSampling

    Contrairement a la macro Cube, la phase datterrissage ne peut sefaire quen supprimant successivement les contraintes dequilibrage

    10/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Sommaire

    1 Introduction

    2 Plan de sondage

    3 SimulationsDemarcheControle de lequilibrage spatialPrecision

    4 Conclusion

    11/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Type de plans

    Plusieurs tailles dechantillon : n = 488, 427, 366

    Niveau du tirage et de lequilibrage : grandes regions actuelles

    Comparaison entre le tirage equilibre spatialement et non equilibrespatialement (cube classique)

    La marge pour la comparaison : la precision sur lEM actuel.

    Alternative (non testee) : Tirage avec une phase dequilibrage auniveau regional suivi dune phase datterrissage regroupee au niveaunational

    12/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Variables dequilibrage

    Nombre de residences principales

    Type de zonage urbain : rural, periurbain et urbain

    3 classes dage : moins de 20 ans, de 20 a 59 ans et 60 ans et plus

    Nombre detrangers, de familles monoparentales, de familles degrande taille et de proprietaires

    Nombre de logements HLM

    13/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Resultats en termes de repartition spatiale

    Criteres de repartition spatiale :

    A loeil nu, en essayant de regarder la presence de clusters a lissuedu tirage ;

    Polygones de Voronoi ;

    Dautres criteres : Inertie sur les coordonnees geographiques ?

    14/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Reperage a loeil nu des clusters dUP

    0.04

    0.08

    0.1

    0.12

    0.15

    0.22

    1

    Probabilitd'inclusion

    50 km

    Tirage spatialement quilibr des ZAE en PACA

    C.F.M, 2015Fond de carte : GEOFLA 2082, IGN

    ZAE tiresPrfectureEnquteursGAP

    DIGNE

    NICE

    TOULON

    AVIGNON

    MARSEILLE

    15/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Reperage a loeil nu des clusters dUP

    0.04

    0.08

    0.1

    0.12

    0.15

    0.22

    1

    Probabilitd'inclusion

    50 km

    Tirage spatialement quilibr des ZAE en PACA

    C.F.M, 2015Fond de carte : GEOFLA 2082, IGN

    ZAE tiresPrfectureEnquteursGAP

    DIGNE

    NICE

    TOULON

    AVIGNON

    MARSEILLE

    15/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Reperage a loeil nu des clusters dUP

    0.04

    0.08

    0.1

    0.12

    0.15

    0.22

    1

    Probabilitd'inclusion

    50 km

    Tirage spatialement quilibr des ZAE en PACA

    C.F.M, 2015Fond de carte : GEOFLA 2082, IGN

    ZAE tiresPrfectureEnquteursGAP

    DIGNE

    NICE

    TOULON

    AVIGNON

    MARSEILLE

    15/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Reperage a loeil nu des clusters dUP

    0.04

    0.08

    0.1

    0.12

    0.15

    0.22

    1

    Probabilitd'inclusion

    50 km

    Tirage spatialement quilibr des ZAE en PACA

    C.F.M, 2015Fond de carte : GEOFLA 2082, IGN

    ZAE tiresPrfectureEnquteursGAP

    DIGNE

    NICE

    TOULON

    AVIGNON

    MARSEILLE

    15/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Reperage a loeil nu des clusters dUP

    0.04

    0.08

    0.1

    0.12

    0.15

    0.22

    1

    Probabilitd'inclusion

    50 km

    Tirage spatialement quilibr des ZAE en PACA

    C.F.M, 2015Fond de carte : GEOFLA 2082, IGN

    ZAE tiresPrfectureEnquteursGAP

    DIGNE

    NICE

    TOULON

    AVIGNON

    MARSEILLE

    15/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Reperage a loeil nu des clusters dUP

    0.04

    0.08

    0.1

    0.12

    0.15

    0.22

    1

    Probabilitd'inclusion

    50 km

    Tirage spatialement quilibr des ZAE en PACA

    C.F.M, 2015Fond de carte : GEOFLA 2082, IGN

    ZAE tiresPrfectureEnquteursGAP

    DIGNE

    NICE

    TOULON

    AVIGNON

    MARSEILLE

    15/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Les polygones de Voronoi

    Decoupage de lespace qui regroupe lensemble des points du planplus proches dune unite primaire tiree que de toutes les autresunites primaires tirees.

    On definit i comme la somme des probabilites dinclusion des UPincluses dans le polygone i.

    Si le plan est spatialement equilibre, on devrait avoir i 1 iOn definit lindicateur de Voronoi par :

    =1

    n

    ni

    (i 1)2

    16/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Les polygones de Voronoi : region Rhone-Alpes-Auvergne

    17/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Resultats en termes dequilibrage spatial

    n = 488 n = 427 n = 366

    CubeCube

    CubeCube

    CubeCube

    spatial spatial spatial 0.35 0.27 0.48 0.38 0.73 0.59

    Table 1 Valeur de lindicateur de Voronoi pour differentes taillesdechantillon

    18/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Resultats en termes de precision

    Figure 1 Ratio de lEQM pour le tirage considere par rapport a lEQM delEM actuel pour les variables auxiliaires

    19/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    DemarcheControle de lequilibrage spatialPrecision

    Resultats en termes de precision

    Figure 2 Ratio de lEQM pour le tirage considere par rapport a lEQM delEM actuel pour differentes variables dinteret

    20/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    Sommaire

    1 Introduction

    2 Plan de sondage

    3 Simulations

    4 Conclusion

    21/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    Resultats en termes de precision

    Pourquoi ces gains importants par rapport a lEM actuel :

    Une information disponible sur toute lUP et non plus seulement surles communes recensees ;On introduit cinq fois moins de contraintes dequilibrage ;Cela permet dajouter davantage de variables dequilibrage.

    Gain tirage equilibre vs non equilibre spatialement :

    On saffranchit de la correlation spatiale ;(x, y) : variable explicative de nombreux phenomenes (tourisme, etc) ;On se premunit du vieillissement de lequilibrage.

    22/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

  • IntroductionPlan de sondage

    SimulationsConclusion

    Les questions en suspens

    Quel niveau de tirage envisage : national, regional, departemental ?

    Combien dunites primaires ?

    Des nouvelles unites primaires,

    qui saffranchissent de la contrainte des groupes de rotation du RP ;plus homogenes entre elles et plus heterogenes en intra ;qui faciliteront le tirage equilibre.

    Comment estimer la variance ? Quelques elements de reponse dansla publication associee.

    23/23

    C. Favre-Martinoz, T. Merly-Alpa (INSEE) Echantillonnage spatialement equilibre dunites primaires

    IntroductionPlan de sondageLes mthodes de tirage spatialLe cas particulier du cube spatialement quilibr

    SimulationsDmarcheContrle de l'quilibrage spatialPrcision

    Conclusion