Chapitre4 Les sondages à probabilité inégales

20
Les sondages à probabilités inégales Mahamadou HARO Ingénieur Statisticien Économiste Séminaire de sondage Mahamadou HARO (Ingénieur Statisticien Économiste) Les sondages à probabilité inégales 11 Avril 2012 1 / 14

Transcript of Chapitre4 Les sondages à probabilité inégales

Page 1: Chapitre4 Les sondages à probabilité inégales

Les sondages à probabilités inégales

Mahamadou HARO

Ingénieur Statisticien Économiste

Séminaire de sondage

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 1 / 14

Page 2: Chapitre4 Les sondages à probabilité inégales

Plan de la présentation

1 Principe

2 Formules d’estimation dans le cas avec remise

3 Méthodes de tirage

4 Aperçu sur le sondage à probabilités inégales sans remise

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 2 / 14

Page 3: Chapitre4 Les sondages à probabilité inégales

Principe

Plan

1 Principe

2 Formules d’estimation dans le cas avec remise

3 Méthodes de tirage

4 Aperçu sur le sondage à probabilités inégales sans remise

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 3 / 14

Page 4: Chapitre4 Les sondages à probabilité inégales

Principe

Principe

On peut, dans certains cas, décider d’accorder à certaines unités uneprobabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :

Les sondages à probabilités inégales se justifient par le fait quedans certains cas et pour certains domaines d’étude, il estintéressant de donner à certaines unités à échantillonner uneprobabilité plus forte d’être tirée.lorsque les unités n’ont pas la même importance, en particulierlorsqu’elles ont des tailles très différentes, il peut être intéressantvoire avantageux, d’attribuer aux différentes unités de chances desortie inégales, les "grosses" unités ayant plus de chancesd’appartenir l’échantillon.

A l’intérieur d’un sondage à probabilités inégales on peutdistinguer deux cas selon le mode de tirage des unités. Dans lecas d’un tirage avec remise, la probabilité de tirage est souventproportionnelle à une mesure de taille et il est possible de calculerles estimations ainsi que les précisions. Par contre le mode detirage sans remise par l’approche de Horvitz-Thompson rendbeaucoup plus complexe la méthode d’estimation et le calcul desparamètres de qualité.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14

Page 5: Chapitre4 Les sondages à probabilité inégales

Principe

Principe

On peut, dans certains cas, décider d’accorder à certaines unités uneprobabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :

Les sondages à probabilités inégales se justifient par le fait quedans certains cas et pour certains domaines d’étude, il estintéressant de donner à certaines unités à échantillonner uneprobabilité plus forte d’être tirée.lorsque les unités n’ont pas la même importance, en particulierlorsqu’elles ont des tailles très différentes, il peut être intéressantvoire avantageux, d’attribuer aux différentes unités de chances desortie inégales, les "grosses" unités ayant plus de chancesd’appartenir l’échantillon.A l’intérieur d’un sondage à probabilités inégales on peutdistinguer deux cas selon le mode de tirage des unités. Dans lecas d’un tirage avec remise, la probabilité de tirage est souventproportionnelle à une mesure de taille et il est possible de calculerles estimations ainsi que les précisions. Par contre le mode detirage sans remise par l’approche de Horvitz-Thompson rendbeaucoup plus complexe la méthode d’estimation et le calcul desparamètres de qualité.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14

Page 6: Chapitre4 Les sondages à probabilité inégales

Principe

Principe

On peut, dans certains cas, décider d’accorder à certaines unités uneprobabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :

Les sondages à probabilités inégales se justifient par le fait quedans certains cas et pour certains domaines d’étude, il estintéressant de donner à certaines unités à échantillonner uneprobabilité plus forte d’être tirée.lorsque les unités n’ont pas la même importance, en particulierlorsqu’elles ont des tailles très différentes, il peut être intéressantvoire avantageux, d’attribuer aux différentes unités de chances desortie inégales, les "grosses" unités ayant plus de chancesd’appartenir l’échantillon.A l’intérieur d’un sondage à probabilités inégales on peutdistinguer deux cas selon le mode de tirage des unités. Dans lecas d’un tirage avec remise, la probabilité de tirage est souventproportionnelle à une mesure de taille et il est possible de calculerles estimations ainsi que les précisions. Par contre le mode detirage sans remise par l’approche de Horvitz-Thompson rendbeaucoup plus complexe la méthode d’estimation et le calcul desparamètres de qualité.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14

Page 7: Chapitre4 Les sondages à probabilité inégales

Formules d’estimation dans le cas avec remise

Plan

1 Principe

2 Formules d’estimation dans le cas avec remise

3 Méthodes de tirage

4 Aperçu sur le sondage à probabilités inégales sans remise

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 5 / 14

Page 8: Chapitre4 Les sondages à probabilité inégales

Formules d’estimation dans le cas avec remise

Formules d’estimation dans le cas avec remise

Chaque unité α de l’univers a la probabilité Aα d’être tirée à chacundes tirages et on tire un échantillon de taille n. On a

∑Nα=1 Aα = 1

(donc chaque Aα , est inférieur à 1 et souvent de valeur très faible).

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 6 / 14

Page 9: Chapitre4 Les sondages à probabilité inégales

Formules d’estimation dans le cas avec remise

Estimation d’un total

L’estimateur du total de la variable Y (sur l’univers) proposé à partir del’échantillon tiré est :

T̂ (Y ) =1n

n∑i=1

yi

Ai(1)

Où yi est la valeur de la variable Y pour l’unité sélectionnée au ièmetirage et Ai sa probabilité d’être sélectionnée à chaque tirage : on tientdonc compte des probabilités de tirage différentes pour produirel’estimation du total. Cet estimateur est sans biais :

E(T̂ (Y )) =N∑

α=1

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 7 / 14

Page 10: Chapitre4 Les sondages à probabilité inégales

Formules d’estimation dans le cas avec remise

Estimation d’une moyenne, d’un ratio

Pour estimer la moyenne Y on utilise l’estimateur

T̂ (Y )

N

Sa variance est :

V

(T̂ (Y )

N

)=

1N2 V (T̂ (Y ))

Un ratio est estimé comme le rapport de l’estimation de deux masses.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 8 / 14

Page 11: Chapitre4 Les sondages à probabilité inégales

Méthodes de tirage

Plan

1 Principe

2 Formules d’estimation dans le cas avec remise

3 Méthodes de tirage

4 Aperçu sur le sondage à probabilités inégales sans remise

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 9 / 14

Page 12: Chapitre4 Les sondages à probabilité inégales

Méthodes de tirage

Méthodes de tirage

Méthode des chiffres cumulés ;

Méthodes aréolaires utilisant des grilles de points.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14

Page 13: Chapitre4 Les sondages à probabilité inégales

Méthodes de tirage

Méthodes de tirage

Méthode des chiffres cumulés ;

Méthodes aréolaires utilisant des grilles de points.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14

Page 14: Chapitre4 Les sondages à probabilité inégales

Aperçu sur le sondage à probabilités inégales sans remise

Plan

1 Principe

2 Formules d’estimation dans le cas avec remise

3 Méthodes de tirage

4 Aperçu sur le sondage à probabilités inégales sans remise

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 11 / 14

Page 15: Chapitre4 Les sondages à probabilité inégales

Aperçu sur le sondage à probabilités inégales sans remise

Aperçu sur le sondage à probabilités inégales sansremise

Le modèle qui a été appliqué précédemment pour produire unestimateur est beaucoup plus difficile à utiliser : en effet, lesprobabilités de tirage se déforment au fur et à mesure qu’on réalise lestirages.

Au premier tirage A1i = Ai ;

Au deuxième tirage A2j =

A1j

1−A1i

sachant que c’est i qui a été tiré aupremier tirage ; etc.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 12 / 14

Page 16: Chapitre4 Les sondages à probabilité inégales

Aperçu sur le sondage à probabilités inégales sans remise

L’estimateur de Howitz-Thompson

On fait donc appel à une autre approche, que nous présenteronsrapidement : celle de Horvitz-Thompson. Le point de départ de cetteapproche développée pour les tirages sans remise est la probabilitéd’inclusion :

Πi probabilité que i appartienne à l’échantillon,Πij probabilité que i et j) soient simultanément dans l’échantillon.

Remarquons que si l’échantillon s est de taille fixe n, alors :

N∑α=1

Πα = n

L’estimateur de Horvitz-Thompson du total est

T̂ (Y ) =∑i∈s

yi

Πi

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14

Page 17: Chapitre4 Les sondages à probabilité inégales

Aperçu sur le sondage à probabilités inégales sans remise

L’estimateur de Howitz-Thompson

On fait donc appel à une autre approche, que nous présenteronsrapidement : celle de Horvitz-Thompson. Le point de départ de cetteapproche développée pour les tirages sans remise est la probabilitéd’inclusion :

Πi probabilité que i appartienne à l’échantillon,Πij probabilité que i et j) soient simultanément dans l’échantillon.

Remarquons que si l’échantillon s est de taille fixe n, alors :

N∑α=1

Πα = n

L’estimateur de Horvitz-Thompson du total est

T̂ (Y ) =∑i∈s

yi

Πi

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14

Page 18: Chapitre4 Les sondages à probabilité inégales

Aperçu sur le sondage à probabilités inégales sans remise

Dans la pratique...

Dans la pratique d’un tel sondage à probabilités inégales sansremise, on se fixe un "jeu" de Πi , et un algorithme respectant cejeu de probabilités (Ardilly, 1994, chapitre II.4.3.).Alors on calcule les Πij (ou on les détermine de manièreapproximative car, dans certains cas, le calcul rigoureux estimpossible) et on peut ainsi calculer la précision (par la variance)de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’auxΠi ).

Certains auteurs ont, par ailleurs, proposé des formulesd’approximation de la variance de l’estimateur deHorvitz-Thompson ne faisant intervenir que les Πi . Cette approcheest une approche générale, pas seulement limitée aux sondagesà probabilités inégales ; elle est présentée dans ce chapitre carétant la seule utilisable quand on tire à probabilités inégales sansremise.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14

Page 19: Chapitre4 Les sondages à probabilité inégales

Aperçu sur le sondage à probabilités inégales sans remise

Dans la pratique...

Dans la pratique d’un tel sondage à probabilités inégales sansremise, on se fixe un "jeu" de Πi , et un algorithme respectant cejeu de probabilités (Ardilly, 1994, chapitre II.4.3.).Alors on calcule les Πij (ou on les détermine de manièreapproximative car, dans certains cas, le calcul rigoureux estimpossible) et on peut ainsi calculer la précision (par la variance)de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’auxΠi ).Certains auteurs ont, par ailleurs, proposé des formulesd’approximation de la variance de l’estimateur deHorvitz-Thompson ne faisant intervenir que les Πi . Cette approcheest une approche générale, pas seulement limitée aux sondagesà probabilités inégales ; elle est présentée dans ce chapitre carétant la seule utilisable quand on tire à probabilités inégales sansremise.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14

Page 20: Chapitre4 Les sondages à probabilité inégales

Aperçu sur le sondage à probabilités inégales sans remise

Dans la pratique...

Dans la pratique d’un tel sondage à probabilités inégales sansremise, on se fixe un "jeu" de Πi , et un algorithme respectant cejeu de probabilités (Ardilly, 1994, chapitre II.4.3.).Alors on calcule les Πij (ou on les détermine de manièreapproximative car, dans certains cas, le calcul rigoureux estimpossible) et on peut ainsi calculer la précision (par la variance)de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’auxΠi ).Certains auteurs ont, par ailleurs, proposé des formulesd’approximation de la variance de l’estimateur deHorvitz-Thompson ne faisant intervenir que les Πi . Cette approcheest une approche générale, pas seulement limitée aux sondagesà probabilités inégales ; elle est présentée dans ce chapitre carétant la seule utilisable quand on tire à probabilités inégales sansremise.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14