La régression logistique. Régression logistique Mesure de la relation entre une variable...
-
Upload
armand-antoine -
Category
Documents
-
view
113 -
download
1
Transcript of La régression logistique. Régression logistique Mesure de la relation entre une variable...
La régression logistiqueLa régression logistique
Régression logistiqueRégression logistique
Mesure de la relation entre une variable dépendante Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes(dichotomique) et une ou plusieurs variables indépendantes
Utile dans la prédiction de la présence ou absence d’un Utile dans la prédiction de la présence ou absence d’un comportement (ex. succès ou échec, amélioration ou non) comportement (ex. succès ou échec, amélioration ou non)
Régression logistiqueRégression logistique
Exemple: Le nombre d’heures de travail par semaine par rapport à Exemple: Le nombre d’heures de travail par semaine par rapport à l’obtention d’une promotion.l’obtention d’une promotion.
Régression logistiqueRégression logistique
Une fonction linéaire ne permettra pas d’ajuster de façon optimale Une fonction linéaire ne permettra pas d’ajuster de façon optimale les données. Puisque la variable dépendante est dichotomique, un les données. Puisque la variable dépendante est dichotomique, un régression nonlinéaire (logistique) est la meilleure option.régression nonlinéaire (logistique) est la meilleure option.
0 1 1 2 2 p pu b b x b x b x
1ˆ
1 uy
e
Régression logistiqueRégression logistique
Régression logistiqueRégression logistique
Cependant, la méthode des moindres carrés n’est pas optimale Cependant, la méthode des moindres carrés n’est pas optimale pour trouver la solution des coefficients de régression. Il faut donc pour trouver la solution des coefficients de régression. Il faut donc utiliser la méthode du maximum du log de la vraisemblance. Le utiliser la méthode du maximum du log de la vraisemblance. Le but est de trouver les but est de trouver les bb qui maximisent qui maximisent LL((bb).).
0 1 2( , , , , )pb b b b b
1
ˆ ˆ( ) ln (1 ) ln(1 ) log-likelihood= ( )n
i i i ii
L b y y y y LL b
Régression logistiqueRégression logistique
ExempleExemple
( ) 55.6765L b 0
1
5.30945
0.110921
b
b
Régression logistiqueRégression logistique
Test d’hypothèse: Fonction de ressemblanceTest d’hypothèse: Fonction de ressemblance
L’idée est de comparer le rapport entre un modèle avec peu de L’idée est de comparer le rapport entre un modèle avec peu de coefficients par rapport à un modèle avec plus de coefficients. Par coefficients par rapport à un modèle avec plus de coefficients. Par exemple, un modèle avec les prédicteurs et un modèle sans les exemple, un modèle avec les prédicteurs et un modèle sans les prédicteurs.prédicteurs.
2 vraisemblance de la constante2ln
vraisemblance de la constante plus les coefficientsG = -
2 2 ( ) (0)G = LL b LL
Régression logistiqueRégression logistique
Test d’hypothèseTest d’hypothèse
ExempleExemple
2 2 -53.6765 -68.3315 29.3099G =
(0) -68.3315
( ) -53.6765
LL
LL b
Dans des échantillons élevés, Dans des échantillons élevés, GG22 se distribue selon un se distribue selon un 22. Les . Les degrés de liberté correspondent au nombre de prédicteurs dans le degrés de liberté correspondent au nombre de prédicteurs dans le modèle ayant le plus de prédicteurs moins celui qui en a le moins. modèle ayant le plus de prédicteurs moins celui qui en a le moins.
1 0 1dl
Régression logistiqueRégression logistique
Test d’hypothèseTest d’hypothèse
ExempleExemple2 29.3099G =
Comme le Comme le GG22>>22, alors nous concluons que le prédicteur , alors nous concluons que le prédicteur xx11 ne doit ne doit pas être enlevé de l’équation. Autrement dit, le nombre d’heure de pas être enlevé de l’équation. Autrement dit, le nombre d’heure de travail est significatif par rapport à l’obtention d’une promotion.travail est significatif par rapport à l’obtention d’une promotion.
1dl
2 (1,0.95) 3.84=
Régression logistiqueRégression logistique
Test d’hypothèse: Test de WaldTest d’hypothèse: Test de Wald
Permet d’identifier les prédicteurs qui sont significatif. Permet d’identifier les prédicteurs qui sont significatif. Le test se distribue selon un Le test se distribue selon un Z.Z.
i
i
b
bW Z
SE
Note: SPSS rapporte un Note: SPSS rapporte un WW==ZZ22
Régression logistiqueRégression logistique
Rapport de coteRapport de cote
Permet de mesurer l’augmentation (diminution) de la cote d’être Permet de mesurer l’augmentation (diminution) de la cote d’être dans une catégorie lorsque la valeur d’une unité est augmenté de 1.dans une catégorie lorsque la valeur d’une unité est augmenté de 1.
ibiRC e
Exemple:Exemple:
1 0.1109211 1.11731bRC e e
Pour chaque augmentation d’une Pour chaque augmentation d’une heure de travail, les chances de heure de travail, les chances de promotion augmente de 12% promotion augmente de 12%
Régression logistiqueRégression logistique
Tableau de classificationTableau de classification
Permet de voir le taux de bonnes et mauvaises classificationPermet de voir le taux de bonnes et mauvaises classification
Si le prédicteur est aussi Si le prédicteur est aussi dichotomique,dichotomique, alors il également possible de calculer le alors il également possible de calculer le rapport de coterapport de cote
Régression logistiqueRégression logistique
Force d’association ~ Force d’association ~ RR22
Permet de mesurer le pourcentage de variance expliquée.Permet de mesurer le pourcentage de variance expliquée.
2 ( )1
(0)
LL b
LL
McFaddenMcFadden
2( ) (0)2 1
LL b LLn
CSR e
Cox & SnellCox & Snell
22
2,CS
NMAX
RR
R
NagerlkerkeNagerlkerke
2(0)2 1
LLn
MAXR e
2 0.214468
2 0.254052CSR
2 0.340993NR
ExempleExemple
Fin!Fin!