La régression logistique. Régression logistique Mesure de la relation entre une variable...

15
La régression logistique La régression logistique

Transcript of La régression logistique. Régression logistique Mesure de la relation entre une variable...

Page 1: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

La régression logistiqueLa régression logistique

Page 2: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Régression logistiqueRégression logistique

Mesure de la relation entre une variable dépendante Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes(dichotomique) et une ou plusieurs variables indépendantes

Utile dans la prédiction de la présence ou absence d’un Utile dans la prédiction de la présence ou absence d’un comportement (ex. succès ou échec, amélioration ou non) comportement (ex. succès ou échec, amélioration ou non)

Page 3: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Régression logistiqueRégression logistique

Exemple: Le nombre d’heures de travail par semaine par rapport à Exemple: Le nombre d’heures de travail par semaine par rapport à l’obtention d’une promotion.l’obtention d’une promotion.

Page 4: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Régression logistiqueRégression logistique

Une fonction linéaire ne permettra pas d’ajuster de façon optimale Une fonction linéaire ne permettra pas d’ajuster de façon optimale les données. Puisque la variable dépendante est dichotomique, un les données. Puisque la variable dépendante est dichotomique, un régression nonlinéaire (logistique) est la meilleure option.régression nonlinéaire (logistique) est la meilleure option.

0 1 1 2 2 p pu b b x b x b x

1 uy

e

Page 5: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Régression logistiqueRégression logistique

Page 6: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Régression logistiqueRégression logistique

Cependant, la méthode des moindres carrés n’est pas optimale Cependant, la méthode des moindres carrés n’est pas optimale pour trouver la solution des coefficients de régression. Il faut donc pour trouver la solution des coefficients de régression. Il faut donc utiliser la méthode du maximum du log de la vraisemblance. Le utiliser la méthode du maximum du log de la vraisemblance. Le but est de trouver les but est de trouver les bb qui maximisent qui maximisent LL((bb).).

0 1 2( , , , , )pb b b b b

1

ˆ ˆ( ) ln (1 ) ln(1 ) log-likelihood= ( )n

i i i ii

L b y y y y LL b

Page 7: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Régression logistiqueRégression logistique

ExempleExemple

( ) 55.6765L b 0

1

5.30945

0.110921

b

b

Page 8: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Régression logistiqueRégression logistique

Test d’hypothèse: Fonction de ressemblanceTest d’hypothèse: Fonction de ressemblance

L’idée est de comparer le rapport entre un modèle avec peu de L’idée est de comparer le rapport entre un modèle avec peu de coefficients par rapport à un modèle avec plus de coefficients. Par coefficients par rapport à un modèle avec plus de coefficients. Par exemple, un modèle avec les prédicteurs et un modèle sans les exemple, un modèle avec les prédicteurs et un modèle sans les prédicteurs.prédicteurs.

2 vraisemblance de la constante2ln

vraisemblance de la constante plus les coefficientsG = -

2 2 ( ) (0)G = LL b LL

Page 9: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Régression logistiqueRégression logistique

Test d’hypothèseTest d’hypothèse

ExempleExemple

2 2 -53.6765 -68.3315 29.3099G =

(0) -68.3315

( ) -53.6765

LL

LL b

Dans des échantillons élevés, Dans des échantillons élevés, GG22 se distribue selon un se distribue selon un 22. Les . Les degrés de liberté correspondent au nombre de prédicteurs dans le degrés de liberté correspondent au nombre de prédicteurs dans le modèle ayant le plus de prédicteurs moins celui qui en a le moins. modèle ayant le plus de prédicteurs moins celui qui en a le moins.

1 0 1dl

Page 10: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Régression logistiqueRégression logistique

Test d’hypothèseTest d’hypothèse

ExempleExemple2 29.3099G =

Comme le Comme le GG22>>22, alors nous concluons que le prédicteur , alors nous concluons que le prédicteur xx11 ne doit ne doit pas être enlevé de l’équation. Autrement dit, le nombre d’heure de pas être enlevé de l’équation. Autrement dit, le nombre d’heure de travail est significatif par rapport à l’obtention d’une promotion.travail est significatif par rapport à l’obtention d’une promotion.

1dl

2 (1,0.95) 3.84=

Page 11: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Régression logistiqueRégression logistique

Test d’hypothèse: Test de WaldTest d’hypothèse: Test de Wald

Permet d’identifier les prédicteurs qui sont significatif. Permet d’identifier les prédicteurs qui sont significatif. Le test se distribue selon un Le test se distribue selon un Z.Z.

i

i

b

bW Z

SE

Note: SPSS rapporte un Note: SPSS rapporte un WW==ZZ22

Page 12: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Régression logistiqueRégression logistique

Rapport de coteRapport de cote

Permet de mesurer l’augmentation (diminution) de la cote d’être Permet de mesurer l’augmentation (diminution) de la cote d’être dans une catégorie lorsque la valeur d’une unité est augmenté de 1.dans une catégorie lorsque la valeur d’une unité est augmenté de 1.

ibiRC e

Exemple:Exemple:

1 0.1109211 1.11731bRC e e

Pour chaque augmentation d’une Pour chaque augmentation d’une heure de travail, les chances de heure de travail, les chances de promotion augmente de 12% promotion augmente de 12%

Page 13: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Régression logistiqueRégression logistique

Tableau de classificationTableau de classification

Permet de voir le taux de bonnes et mauvaises classificationPermet de voir le taux de bonnes et mauvaises classification

Si le prédicteur est aussi Si le prédicteur est aussi dichotomique,dichotomique, alors il également possible de calculer le alors il également possible de calculer le rapport de coterapport de cote

Page 14: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Régression logistiqueRégression logistique

Force d’association ~ Force d’association ~ RR22

Permet de mesurer le pourcentage de variance expliquée.Permet de mesurer le pourcentage de variance expliquée.

2 ( )1

(0)

LL b

LL

McFaddenMcFadden

2( ) (0)2 1

LL b LLn

CSR e

Cox & SnellCox & Snell

22

2,CS

NMAX

RR

R

NagerlkerkeNagerlkerke

2(0)2 1

LLn

MAXR e

2 0.214468

2 0.254052CSR

2 0.340993NR

ExempleExemple

Page 15: La régression logistique. Régression logistique Mesure de la relation entre une variable dépendante (dichotomique) et une ou plusieurs variables indépendantes.

Fin!Fin!