Grappe s

34
Présentation Grappes de tailles égales Grappes de tailles inégales Tirages de grappes à PI Tailles des grappes inconnues a priori Mise en oeuvre efficace Sondage par grappes Myriam Maumy 1 1 IRMA, Université Louis Pasteur Strasbourg, France Master 2ème Année 27-11-2005 Myriam Maumy Sondage par grappes

description

Grappes

Transcript of Grappe s

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Sondage par grappes

    Myriam Maumy1

    1IRMA, Universit Louis PasteurStrasbourg, France

    Master 2me Anne 27-11-2005

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Ce chapitre sappuie essentiellement sur :Mthodes statistiques des sondages,

    de Jean-Marie Grosbras,Economica.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    IntroductionDfinitionsNotations

    Pour rsumer, on a vu que la mthode de base est le SAS PE,qui nintgre aucune connaissance a priori des phnomnestudis.Lapport de renseignements lis ces phnomnes et fournispar des variables auxiliaires est susceptible damliorer laprcision des rsultats. Les mthodes sont la stratification a priori ou a posteriori (Chapitre 3 et

    Chapitre 5) les tirages probabilits ingales (Chapitre 4) les redressements par le quotient (Chapitre 6).

    Le choix dpend de la nature des informations auxiliaires et deleur degr de disponibilit.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    IntroductionDfinitionsNotations

    Ces mthodes supposent que la population des unitsconcernes est reprsente par une base de sondagecomplte et quon peut distinguer une unit des autres pouralimenter un chantillon. Dans la pratique, il arrive quil ny a pas de base desondage complte et disponible. Il arrive que les units soient groupes en paquets etquil soit plus conomique daccder ces donnes parpaquets, c--d par grappes.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    IntroductionDfinitionsNotations

    Les N units de la population sont rparties en Msous-ensembles, appels grappes ou units primaires. La grappe ( = 1, . . . ,M) contient N units de lapopulation, appeles units secondaires. On prend un chantillon de m grappes. La grappe i(i = 1, . . . ,m) de lchantillon est explore compltement (onexamine tous les grains).

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    IntroductionDfinitionsNotations

    Il y a 2 niveaux dobservation :

    le niveau primaire, c--d la grappe, indice par ( = 1, . . . ,M) dans la population, et par i (i = 1, . . . ,m)dans lchantillon

    le niveau secondaire, c--d lunit statistique vise.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    IntroductionDfinitionsNotations

    N = taille (nombre dunits secondaires) de la grappe .Y = valeur de la variable tudie pour lunit secondaire dela grappe .

    Y =N=1

    Y = total de la variable dans la grappe .

    N = 1M

    M=1

    N = taille moyenne des grappes.

    Y = 1M

    M=1

    Y = total moyen par grappe.

    Y =1

    N

    N=1

    Y =YN

    = moyenne de la variable lintrieur

    de la grappe .Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    IntroductionDfinitionsNotations

    La simple barre indique une moyenne par unit primaire.La double barre indique une moyenne au niveau unitsecondaire.Les relations avec les moyennes ou totaux densemble sont :

    N =M=1

    N;

    Y =M=1

    Y;

    Y = 1N

    M=1

    N=1

    Y =M=1

    NN Y =

    YN .

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dune moyenneComparaison avec le SAS

    Soit N0 la taille commune des grappes.Par consquent, on a

    = 1, . . . ,M, N = N0 = N

    etN = MN0.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dune moyenneComparaison avec le SAS

    On obtient alors :

    Y =M=1

    N0N Y

    =1M

    M=1

    Y.

    La moyenne gnrale est la moyenne arithmtique desmoyennes par grappe.Lestimation de Y est donc un problme destimation dans unSAS dont

    la population de rfrence est constitue des Y,les chantillons sont constitus de quantits calcules Y i .

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dune moyenneComparaison avec le SAS

    Supposons que les m grappes soient tires PESR, alors lesrsultats du Chapitre 2 montrent que lestimateur par grappes :

    yG =1m

    mi=1

    Y i

    estime sans biais la moyenne Y . Dautre part, on a

    Var[

    yG]

    =M m

    Mm1

    M 1M=1

    (Y Y )2

    Var[

    yG]

    =M m

    Mm1

    m 1m

    i=1(Y i yG)2.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dune moyenneComparaison avec le SAS

    Supposons que lon puisse raliser un chantillon de mmetaille n, sans tenir compte du groupement par grappes. On a

    n =m

    i=1Ni = mN0, puisque i ,Ni = N0.

    La moyenne Y est alors estime par :

    y = 1n

    nj=1

    yj .

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dune moyenneComparaison avec le SAS

    La variance de y est gale :

    Var[

    y]=

    N nNn S

    2c ,

    o

    S2c =1

    N 1M=1

    N=1

    (Y Y

    )2.

    Comme N = MN0 et n = mN0, on a alors :

    Var[

    y]=

    1N0

    M mMm S

    2c .

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dune moyenneComparaison avec le SAS

    On compare Var[

    y]

    Var[

    yG].

    Pour cela, on rappelle (slide 12) que

    Var[

    yG]' M mMm

    1M

    M=1

    (Y Y

    )2' M mMm

    2S2c ,

    o 2 est le rapport de corrlation inter-grappes

    2 =

    M=1

    N0(

    Y Y)2

    M=1

    N

    (Y Y

    )2 .

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dune moyenneComparaison avec le SAS

    Par consquent

    Var[

    yG]< Var

    [y] 2 < 1N0 .

    Le sondage par grappes est meilleur que le SAS si le rapportde corrlation inter-grappes est infrieur 1/N0. La conclusion est double :

    il est souhaitable que les moyennes des grappes Y soientle plus semblables possibleil nest pas souhaitable que la taille N0 des grappes soittrop leve.

    Le sondage par grappes est intressant sil y a beaucoup depetites grappes, le plus ressemblantes possible.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dune moyenneRemarques

    On rappelle (slide 11) que

    Y =M=1

    NN Y.

    Dans ce paragraphe, on va maintenant considrer que

    les tailles N ne sont plus gales,

    comme lindique le titre du paragraphe !

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dune moyenneRemarques

    CommeN = NM ,

    on peut alors crire

    Y = 1M

    M=1

    NN

    Y.

    On est encore ramen au problme de lestimation dunemoyenne simple, dlments de la forme N

    NY.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dune moyenneRemarques

    Supposons que les m grappes soient tires PESR, alors lesrsultats du Chapitre 2 montrent que lestimateur par grappes :

    yG =1m

    mi=1

    NiN

    Y i

    estime sans biais la moyenne Y . Dautre part, on a

    Var[

    yG]

    =M m

    Mm1

    M 1M=1

    (NN

    Y Y)2

    Var[

    yG]

    =M m

    Mm1

    m 1m

    i=1

    (NiN

    Y i yG)2

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dune moyenneRemarques

    Le nombre dunits statistiques de lchantillon est alatoire,car il dpend des grappes choisies. En effet, on a

    n =m

    i=1Ni .

    Si on calcule lesprance mathmatique de n, on trouve que

    E[n] = mN.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dune moyenneRemarques

    On pourrait comme dans le paragraphe prcdent, comparerle sondage par grappes de tailles ingales avec un SAS detaille mN.

    La conclusion est la suivante :

    Il est prfrable davoir beaucoup de grappes,dont la taille moyenne N soit faibleet dont les moyennes ne soient pas trop dissemblables.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dun totalEstimation dune moyenneProbabilits proportionnelles aux taillesRemarques

    Considrons des tirages de m grappes PIAR. chaquetirage, la grappe est retenue avec la probabilit P, avec :

    M=1

    P = 1.

    Daprs le chapitre 3, on rappelle que lestimateur du total Test gal :

    T = 1m

    mi=1

    YiPi

    .

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dun totalEstimation dune moyenneProbabilits proportionnelles aux taillesRemarques

    La variance de lestimateur T est gale :

    Var[

    T]=

    1m

    M=1

    P(

    YP

    Y)2

    .

    La variance estime de lestimateur T est gale :

    Var[

    T]=

    1m(m 1)

    mi=1

    (YiPi Y

    )2.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dun totalEstimation dune moyenneProbabilits proportionnelles aux taillesRemarques

    Remarque : Lestimateur dune moyenne sen dduit endivisant lestimateur du total T par N, et les variances par N2.

    Par consquent, lestimateur de la moyenne est gal :

    =1N

    1m

    mi=1

    YiPi

    .

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dun totalEstimation dune moyenneProbabilits proportionnelles aux taillesRemarques

    La variance de lestimateur est gale :

    Var [ ] =1

    N21m

    M=1

    P(

    YP

    Y)2

    .

    La variance estime de lestimateur est gale :

    Var [ ] =1

    N21

    m(m 1)m

    i=1

    (YiPi Y

    )2.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dun totalEstimation dune moyenneProbabilits proportionnelles aux taillesRemarques

    Si les totaux des grappes sont corrls avec le nombredunits quelles contiennent, il est naturel de choisir lesprobabilits P proportionnelles aux N.Do :

    = 1, . . . ,M P = NN .

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dun totalEstimation dune moyenneProbabilits proportionnelles aux taillesRemarques

    En portant ces probabilits dans les formules du paragraphe6.1., il vient :

    T = Nm

    mi=1

    YiNi

    =Nm

    mi=1

    Y i

    La variance de T est gale

    Var[

    T]=

    N2m

    M=1

    NN

    (Y Y

    )2.

    La variance estime de T est gale

    Var[

    T]=

    N2m(m 1)

    mi=1

    (Y i yG

    )2,

    o yG = (1/m)m

    i=1 y i .Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dun totalEstimation dune moyenneProbabilits proportionnelles aux taillesRemarques

    Les variances thoriques et estimes de yG se dduisent deVar

    [T]

    et de Var[

    T]

    en les divisant par N2 :

    Var[

    yG]=

    1m

    M=1

    NN

    (Y Y

    )2

    Var[

    yG]=

    1m(m 1)

    mi=1

    (Yi yG

    )2

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Estimation dun totalEstimation dune moyenneProbabilits proportionnelles aux taillesRemarques

    Lexamen des variances montre que lestimation dun total oudune moyenne est dautant plus prcise que les grappes sontde tailles faibles et de moyennes semblables.

    Le nombre dunits secondaires dans lchantillon estalatoire, puisque dependant des grappes retenues.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Taille globale N connueTaille globale N inconnue

    Il est clair quon ne pourra connatre que les tailles des grappesretenues dans lchantillon.

    A dfaut de renseignements complmentaires, les tirages degrappes se font PESR.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Taille globale N connueTaille globale N inconnue

    Il se peut que N soit connu, sans quon sache la rpartition desunits dans les grappes.Dans ce cas, la mthode est simple. Il suffit de se reporter lestimation dun total dans un sondage PESR (cf Chapitre 2). Rappel : Lestimateur du total est gal

    T = Mm

    mi=1

    Yi = MY .

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Taille globale N connueTaille globale N inconnue

    La variance et la variance estime de T sont galesrespectivement

    Var[T]= M2 M mMm S

    2c o S2c =

    1M 1

    M=1

    (Y Y

    )2et

    Var[T]= M2 M mMm s

    2c o s2c =

    1m 1

    m=1

    (Yi Y

    )2.

    DoyG = T/N = T/N.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Taille globale N connueTaille globale N inconnue

    Le paragraphe prcdent montre comment estimer un total.Le problme dans lestimation dune moyenne est quil fautestimer la taille N de la population comme on vient de le voiravec la dernire formule du transparent prcdent.

    Y = T/N yG = T/N.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Taille globale N connueTaille globale N inconnue

    Dune faon quivalente, si on considre le total moyen etleffectif moyen par grappe on a :

    Y = Y/N yG = Y/N,

    oY = 1

    m

    mi=1

    Yi

    et

    N = 1m

    mi=1

    Ni .

    On se retrouve donc dans la situation de lestimation dun ratio,telle que nous lavons tudie au paragraphe 8 du Chapitre 6.

    Myriam Maumy Sondage par grappes

  • PrsentationGrappes de tailles gales

    Grappes de tailles ingalesTirages de grappes PI

    Tailles des grappes inconnues a prioriMise en oeuvre efficace

    Pour tous les modles tudis dans ce chapitre les conclusionssont convergentes : il faut des grappes de taille rduite, et demoyennes semblables.Il est clair que cette condition est trs forte et nest en gnralpas respecte dans la pratique.Par contre, elle peut-tre approximativement respecte pourdes sous-ensembles de grappes.Il est donc essentiel de rflchir avant tout une bonnestratification de grappes, c--d telle que dans chaque strateles grappes soient le plus homognes possible.

    Myriam Maumy Sondage par grappes

    PrsentationIntroductionDfinitionsNotations

    Grappes de tailles galesEstimation d'une moyenneComparaison avec le SAS

    Grappes de tailles ingalesEstimation d'une moyenneRemarques

    Tirages de grappes PIEstimation d'un totalEstimation d'une moyenneProbabilits proportionnelles aux taillesRemarques

    Tailles des grappes inconnues a prioriTaille globale N connueTaille globale N inconnue

    Mise en oeuvre efficace