Post on 03-Apr-2015
DIME – FRAGILE STATESDUBAI, MAY 31 – JUNE 4
Exploiter les Discontinuités pour Bien Évaluer
Eric Mvukiyehe, Columbia University
Introduction (1)
Contexte Nous souhaitons établir l’effet causal d’une intervention
Une assignation aléatoire n’est pas faisable
On ne peut pas exploiter le processus de sélection pour définir un groupe de comparaison
En général Individus, ménages, villages, ou autres entités sont exposés ou
non au traitement
La sélection d’individus dans le groupe de traitement empêche la comparaison traités/non-traités
Exemple: Les individus qui souhaitent participer dans un programme de micro-finance et ceux qui ne le souhaitent pas
Introduction (2)
Quand l’assignation aléatoire n’est pas faisable, comment exploiter le mode de mise en œuvre d’un programme afin d’évaluer son impact?
Proposition: La méthode « quasiment expérimentale »
Stratégie d’identification par la Discontinuité de la Régression (Regression Discontinuity Design, RDD)
La stratégie d’identification par la Discontinuité de la Régression (RDD)
RDD est un cousin proche de la méthode expérimentale Beaucoup plus proche que le reste des méthodes non-
expérimentales RDD se base sur la compréhension du processus de sélection
Il nous faut établir une règle de sélection bureaucratique/officielle et claire
Un score quantifiable et simple
L’assignation des unités au traitement se fait, de manière discontinue, sur base d’un seuil établi au préalable dans ce score. Cad, les unités qui obtiennent un score en dessous du seuil sont assigne a une condition et ceux qui scorent au dessus du seuil sont assigne a une autre condition. La stratégie RDD consiste a comparer les unités qui sont juste en
dessous du seuil et celles qui scorent juste au dessus du seuil
RDD: Mise en application concrète (1)
Réinsertion économique des anciens combattants: Supposons que vous voulez allouer les bénéfices aux individus les plus vulnérables:
Hypothèse: Le niveau de vulnérabilité affect la capacité des individus a s’intégrer économiquement (ex; un bon emploi ou avoir un bon revenu)
On peut utiliser l’âge comme un critère de vulnérabilité (en terme de état de santé , compétences, intelligence, expérience etc.) pour établir l’éligibilité. Par exemple, toute personne qui a 21 ans ou moins reçoit les bénéfices et toute personne qui a 21 ans ou plus n’en reçoit pas.
Observation: Cette politique implique que:Les individus d’âge 20 ans, 11 mois et 29 jours peuvent recevoir les bénéfices Les individus d’âge 21 ans, 0 mois et 1 jour ne peuvent pas recevoir les bénéfices
Mais peut-on réellement penser qu’une différence d’âge de quelques jours pourrait affecter le niveau de vulnérabilité en terme de état de sante, compétences etc.?)
Les individus nés avec quelques jours d’écart (c.a.d, situés de part et d’autre du seuil) sont traités différemment par ce critère
▪Cette différence est entièrement attribuable à un seuil arbitraire
RDD: Mise en application concrète (2)
En théorie, l’octroi des bénéfices aux individus vulnérables peut faciliter la réintégration économique.
Pour identifier l’impact des cette assistance sur la réintégration économique (ex, type d’emploi, revenu) on peut comparer:
Groupe de Traitement: individus d’âge 20 ans et 11 mois Groupe de Contrôle: individus qui viennent d’avoir 21 ans
Autour du seuil, on peut pratiquement imaginer que les individus ont été assignés au traitement de façon aléatoire
On peut dès lors estimer l’impact causal des bénéfices sur la réintégration des individus situés au voisinage du seuil
RDD: no effect0
5010
015
0
20 40 60 80 100pretest
posttest posttestFitted values
RDD: effect0
5010
015
0
20 40 60 80 100pretest
posttest2 posttest2Fitted values Fitted values
RDD: Analyse
Généralement l’analyse se fait en régressant the résultats (observed outcomes) sur le critère d’assignation au traitement
L’effet de traitement causera un déplacement de la ligne de régression qui lie le critère de sélection aux résultats vers le haut ou vers le bas
Ce déplacement doit se faire exactement au niveau du seuil. C’est pourquoi on appelle ce technique “régression discontinue.”
Note: Généralement l’analyse se limite aux observations qui sont dans le voisinage du seuil. Extrapoler au-delà de cette région requiert qu’on assume la création d’un contrefactuel pour chaque unité sur base d’extrapolation du modèle.
RDD: Analyze20
4060
8010
012
0F
itte
d va
lues
20 40 60 80 100pretest
Fitted values Fitted valuesFitted values Fitted values
Logique de la RDD
Assignation au traitement est faite sur la base d’un score continu, ou d’un classement
▪ Exemples: Ventes, âge, note d’examen, index de pauvreté, etc.▪ One ne peut pas utiliser les critères qui ne sont pas continue (par
exemple comme sexe ou appartenance ethnique) Les participants potentiels sont classés en fonction du
score Le seuil (point de discontinuité) qui définit l’éligibilité
est ▪ Clairement établi▪ Déterminé au préalable
L’assignation sur la base d’un seuil est souvent liée à une décision de type administratif
Participation doit être limitée dû a des contraintes budgétaires
Transparence de la sélection est essentielle
Exemple: Subvention Partielle (1)
Gouvernment propose une subvention partielle pour PMEs (formelles)
Éligibilité déterminée sur la base des ventes de l’année écoulée: Ventes < €5,000: Entreprise reçoit l’offre de subvention Ventes >= €5,000: Entreprise ne reçoit pas l’offre
Si le chiffre de ventes est mesuré avant l’annonce du plan de subvention In n’est pas possible de “manipuler” le chiffre de ventes
▪ Exemple: Chiffre de l’année écoulée déjà établi et enregistré
Facile à mesurer et à faire respecter
Subtilités de la méthode
2 types de discontinuités Nette (“sharp”) Floue (“Fuzzy”)
Retour a l’exemple…
Exemple: Discontinuité FloueSubvention Partielle Que faire si les entreprises ventes < €5,000 ne
réclament pas toutes la subvention? Raisons:
▪ Pas toutes au courant, peu d’information
▪ Pas toutes intéressées (subvention partielle)
Ces 2 raisons introduisent un biais de sélection (les entreprises qui réclament la subvention sont différentes à plusieurs niveaux)
Cependant: La proportion d’entreprises qui réclament varie de façon discontinue autour du seuil d’éligibilité De zéro à moins de 100%
C’est ce que l’on appelle une discontinuité floue (“Fuzzy” RDD)
0.2
5.5
.75
1
tre
atm
en
t pro
bab
ility
assignment variable
Sharp Design for Voucher receipt
0.2
5.5
.75
1
assignment variable
Fuzzy Design for Voucher receipt
Taux de Participation:Assignation Nette vs. Floue (Sharp vs. Fuzzy)
100%
0%
75%
0%
Variationsau-dessus du seuil
Discontinuité Nette vs. Floue (1)
Cas Idéal: Discontinuité Nette Discontinuité détermine de façon précise
l’exposition au traitement
▪ Ex.: Seules les individus de 21 ans et plus boivent de l’alcool, et ils en boivent tous (!!!)
▪ Ex.: Toutes les entreprises au chiffre < €5,000 réclament la subvention; les autres ne la reçoivent jamais
▪ Ex.: régime de taxation
Discontinuité Nette vs. Floue (2)
Discontinuité Floue Taux de participation au programme change de
façon discontinue au niveau du seuil d’éligibilité, mais pas à 100%▪ Certains individus de moins de 21 ans consomment de
l’alcool et/ou certains individus de plus de 21 ans n’en boivent pas
▪ Certaines entreprises au chiffre < €5,000 ne réclame pas la subvention
La règle d’éligibilité est respectée, mais l’ensemble du groupe de traitement ne s’y conforme pas
Validité Interne
Idée Générale Si le seuil d’éligibilité est arbitraire, les individus situés
immédiatement à gauche et à droite du seuil sont, par construction, extrêmement similaires
Différences de résultats peuvent être directement attribués au programme
Hypothèse Principale In ne se passe rien d’autre: en l’absence du programme, nous
n’observerions pas de discontinuité de résultat autour du seuil en question
Pourrait ne pas être vérifiée si▪ Alcool: Ceinture de sécurité cesse d’être obligatoire à 21 ans
▪ Subvention: Un taux de taxation réduit est en place visant les entreprises au chiffre < €5,000
Diagnostique: Profile de résultats avant et après l’intervention
outc
om
e
assignment variable
Baseline
assignment variable
Follow-up
Forme différente
Validité Externe
Cette méthode produit-elle des résultats généralisables? Groupe Contrefactuel pour la RDD
Individus exclus du groupe de traitement “de justesse”
Exemples: ▪ Individus qui ont mois de 21 ans mais plus de 20 ans et 10
▪ Entreprises au chiffre de ventes supérieur à €5,000 mais inférieur à €5,500
La mesure d’impact ne s’applique qu’aux individus / ménages / villages situés au voisinage du seuil d’éligibilité. Et donc on doit avoirs suffisamment d’observations dans cette région. Extrapoler au-delà de cette région requiert davantage d’hypothèses,
souvent peu testables
Une discontinuité floue exacerbe ce problème de mesure locale
La mise en oeuvre d’une RDD
Avantages majeurs Transparence
Illustration graphique simple, intuitive
Désavantages majeurs Demande beaucoup d’observations autour du seuil d’éligibilité
Les observations situées plus loin du seuil doivent porter un poids plus faible
Pourquoi? ▪ Seuls les individus proches du seuil se trouvent ,par chance, de part et
d’autre du seuil
▪ Si on pense aux entreprises qui ont un chiffre de €5,000 et celles qui rapportent €500
▪ Ou bien un jeune de 21 ans comparé à un de 16 ans
Analyse graphiqueo
utc
om
e
assignment variable
Conclusions
RDD se prête à l’évaluation prospective lorsque la randomisation n’est pas faisable Stratégie applicable à tout programme
qui se base sur un critère d’éligibilité (politique sur la base
Possibilité d’exploiter plusieurs seuils pour améliorer la validité externe▪ Menu de subventions qui visent différentes
tailles d’entreprises
Merci
24