Post on 10-Apr-2020
giorgio.russolillo@cnam.fr
Les modèles d’équations structurelles à variables latentes
Cours de Statistique Multivariée Approfondie
Modèles d’équations structurelles à variables latentes
• Les modèles d’équation structurelles ou SEM permettent de quantifier des relations de cause à effet décrites par un modèle théorique
• L'intérêt se concentre sur les variables latentes (non observables par une voie directe): les variables psychologiques abstraits comme «intelligence», «satisfaction», «statut social», «capacité», «confiance»
• Les variables latentes sont mesurées par des indicateurs observables appelés variables manifestes.
• Les modéles d’équations tructurelles font le pont entre l’analyse de régression, l’analyse utilisant des graphes (path analysis) et l’analyse factorielle
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 2
SEM: conventions de dessin
3
or
or
or
or
Latent Variables (LV)
Manifest Variables (VM)
Unidirectional Path (cause-effect)
Bidirectional Path (correlation)
Feedback relation or reciprocal causation
or or ε εε
η η
x x
Errors
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
"Dessin" d'un modèle de régression
4
Ce modèle de régression multiple
y = β1x1 + β2x2 + ζ
Peut etre “dessiné” avec un diagramme de chemin (Path Diagram)
x1
x2
y
ζ
L’eereur est une variable latente
Variables Manifestes / Observées
1
β2
β1
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Modéles de chemin avec des variables manifestes
5
Le modèle de régression multiple peut être généralisée à des chemins où les variables endogènes sont à leur fois causes d’autres variables endogènes.
x1
ζ1
y2 y1
ζ2
γ11 β21
y1 = γ11 x1 + ζ1
y2 = β21 y1 + ζ2
y =y1y2
⎡
⎣⎢⎢
⎤
⎦⎥⎥
Γ = γ110
⎡
⎣⎢⎢
⎤
⎦⎥⎥
Β = 0 0β21 0
⎡
⎣⎢⎢
⎤
⎦⎥⎥
y = Γx +Βy +ζ
ζ =ζ1ζ2
⎡
⎣⎢⎢
⎤
⎦⎥⎥
x = x1[ ]
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Modèle factoriel
6
x1 = λ11 ξ1 + δ1
x2 = λ21 ξ1 + δ2
x3 = λ31 ξ1 + δ3
x =x1x2x3
⎡
⎣
⎢⎢⎢
⎤
⎦
⎥⎥⎥
Λ x =λ11λ21λ31
⎡
⎣
⎢⎢⎢
⎤
⎦
⎥⎥⎥
δ =δ1δ2δ3
⎡
⎣
⎢⎢⎢
⎤
⎦
⎥⎥⎥
ξ = ξ1[ ]
x = Λ xξ +δ
x3 x2 x1
ξ1
δ2 δ1 δ3
λ11 λ21 λ31
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Modèle factoriel multiple
7
x1 = λ11 ξ1 + δ1 , x2 = λ21 ξ1 + λ22 ξ2 + δ2 x3 = λ31 ξ1 + δ3 x4 = λ42 ξ2 + δ4
x5 = λ52 ξ2 + δ5 x6 = λ62 ξ2 + δ6
€
x =
x1x6
"
#
$ $ $
%
&
' ' '
€
Λx =
λ11 0λ21 λ22λ31 00 λ420 λ520 λ62
$
%
& & & & & & &
'
(
) ) ) ) ) ) )
€
δ =
δ1δ6
#
$
% % %
&
'
( ( (
€
ξ =ξ1ξ2
#
$ % &
' (
€
x = Λxξ + δ
x4 x3 x5 x6 x2 x1
ξ1 ξ2
δ1 δ2 δ3 δ4 δ5 δ6
λ11 λ21 λ31
λ22
λ42 λ52
λ62
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Modéle de chemin avec des variables latentes
8
ξ1
η2
η1
x1
x2
x3
y1
y3
y2
y4
y5
y6
y7
Structural Model or inner model
Measurement Model or outer model
Path Coefficients
γ21
β21
λx21
λx31
Loadings
δ1
ε3 ζ2
γ11
ζ1
λy11
λy21
ε4
ε5
ε6
ε7
δ2
δ3
e1
e2
λx11
λy32 λy42
λy52 λy62 λy72
Loadings
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Le modéle de mesure (externe) pour les VM exogènes
9
x1 = λx11 ξ1 + δ1
x2 = λx21 ξ1 + δ2
x3 = λx31 ξ1 + δ3
x =x1x2x3
⎡
⎣
⎢⎢⎢
⎤
⎦
⎥⎥⎥Λx =
λ11
x
λ21
x
λ31
x
⎡
⎣
⎢⎢⎢⎢
⎤
⎦
⎥⎥⎥⎥
δ =δ1δ 2δ 3
⎡
⎣
⎢⎢⎢
⎤
⎦
⎥⎥⎥
�
ξ = ξ1[ ]
�
x = Λxξ + δ�
P ×1( )
�
P ×M( )�
M ×1( )
�
P ×1( )
ξ1
x1
x2
x3
λx21
λx31
δ1
δ2
δ3
λx11
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Le modéle de mesure (externe) pour les VM endogènes
10
y3
η2
η1
y1
y2
y4
y5
y6
y7
ε3
λy 11
λy 21
ε4
ε5
ε6
ε7
e1
e2
λy32 λy42
λy62 λy72
λy52
y =
y1y2y3y4y5y6y7
⎡
⎣
⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢
⎤
⎦
⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥
ε =
ε1ε2ε3ε4ε5ε6ε7
⎡
⎣
⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢
⎤
⎦
⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥
η =η1η2
⎡
⎣⎢
⎤
⎦⎥Λ y =
λ11 0λ21
0000
0λ42
λ52
λ62
λ72
⎛
⎝
⎜⎜⎜⎜⎜⎜⎜⎜
⎞
⎠
⎟⎟⎟⎟⎟⎟⎟⎟
y = Λ yη +ε
y3
y1 = λ y11η1 + ε1y2 = λ y21η1 + ε2y3 = λ y32η2 + ε3y4 = λ y42η2 + ε4y5 = λ y52η2 + ε5y6 = λ y62η2 + ε6y7 = λ y72η2 + ε7
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Le modèle structurel (interne)
11
ξ1
η2
η1
γ21
β21
ζ2
γ11
ζ1
η1 = γ11 ξ1 + ζ1 η2 = γ21 ξ1 + β21η 1 + ζ2
Γ =γ 11γ 21
⎡
⎣⎢⎢
⎤
⎦⎥⎥Β =
0 0β21 0
⎡
⎣⎢⎢
⎤
⎦⎥⎥
η = Γξ +Βη +ζ
ζ =ζ1ζ 2
⎡
⎣⎢⎢
⎤
⎦⎥⎥
η =η1η2
⎡
⎣⎢⎢
⎤
⎦⎥⎥
ξ = ξ1[ ]
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Le modèle global
12
�
η = Γξ + Βη + ζ
ξ1
η2
η1
x1
x2
x3
y1
y3
y2
y4
y5
y6
y7
ε1
ε2
δ2
δ1
ε3 ζ2 ε4
ε5
ε6
ε7
δ3
ζ1
�
y = Λyη + ε
�
x = Λxξ + δ
�
η = I−B( )−1 Γξ + ζ( )
Modèles de mesure Modéle structurel
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Two families of methods for estimating paths models with latent variables
13
Le but est de reproduire de matrice de covariance de l'échantillon des variables manifestes à l'aide des paramètres du modèle: • c'est une approche confirmative visant à valider un
modèle
Le but est de fournir une estimation des scores de variables latentes • il est une approche plus exploratoire (stratégie
opérationnel)
SEM
Méthodes basées sur la covariance
Component-based Methods
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Les hypothèses du modèle
14
�
y = Λyη + ε
�
x = Λxξ + δ
�
η = I−B( )−1 Γξ + ζ( )
�
E x( ) = 0, E y( ) = 0, E ξ( ) = 0, E η( ) = 0, E δ( ) = 0, E ε( ) = 0, E ζ( ) = 0
�
E δ ′ ε ( ) = 0, E ζ ′ δ ( )( ) = 0, E ζ ′ ε ( ) = 0
�
E δ ′ ξ ( ) = 0, E δ ′ η ( ) = 0, E ε ′ ξ ( ) = 0, E ε ′ η ( ) = 0
�
E ζ ′ ξ ( ) = 0
ξ1
η2
η1
x1
x2
x3
y1
y3
y2
y4
y5
y6
y7
ε1
ε2
δ2
δ1
ε3 ζ2 ε4
ε5
ε6
ε7
δ3
ζ1
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Covariance Structure Analysis (CSA, aka LISREL)
15
�
Σ =Σxx
Σyx Σyy
⎡
⎣ ⎢
⎤
⎦ ⎥
ξ1
η2
η1
x1
x2
x3
y1
y3
y2
y4
y5
y6
y7
ε1
ε2
δ2
δ1
ε3 ζ2 ε4
ε5
ε6
ε7
δ3
ζ1
Une fois que le modèle est spécifié, la matrice de covariance des MV est exprimée en termes de paramètres du modèle
Σ Ω( ) = Σ Γ,B,Λ x ,Λ y ,Φ,Ψ,Θδ ,Θε( )Path Coefficients Loadings Exog. LV
Covariance Measurement Error Covariance
Structural Error Covariance
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Analysing the covariance
16
�
Σ =Σxx
Σyx Σyy
⎡
⎣ ⎢
⎤
⎦ ⎥
Population Covariance matrix
“Implied” covariance matrix
�
S =sxxsyx syy
⎡
⎣ ⎢
⎤
⎦ ⎥
Empirical covariance matrix
S ≈C
Σ Ω( ) =Λ xΦΛ 'x+Θδ
Λ y I −B( )−1Γ ′Φ Λ 'x Λ y I −B( )−1 ΓΦ ′Γ +Ψ( ) I −B( )−1′⎡⎣⎢
⎤⎦⎥Λ 'y+Θε
⎡
⎣
⎢⎢⎢
⎤
⎦
⎥⎥⎥
Estimation minimise une certaine fonction de la divergence entre la matrice de covariance (C) impliquée par le modèle et la matrice de covariance (S).
Estimated covariance matrix
Σ Ω̂( ) =C =Λ̂ xΦ̂Λ̂ 'x+ Θ̂δ
Λ̂ y I − B̂( )−1 Γ̂ ′Φ̂ Λ̂ 'x Λ̂ y I − B̂( )−1 Γ̂Φ̂ ′Γ̂ + Ψ̂( ) I − B̂( )−1'⎡⎣⎢
⎤⎦⎥Λ̂ 'y+ Θ̂ε
⎡
⎣
⎢⎢⎢
⎤
⎦
⎥⎥⎥
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Fonctions de divergence
17
FGLS =
12
tr W−1 S - C( )2⎡⎣⎢
⎤⎦⎥
Generalised Least Squares
( )212ULSF tr ⎡ ⎤= ⎣ ⎦S -C
Unweighted Least Squares ( ) ( )1log logMLF tr p q−= + − − +C SC S
Maximum Likelihood
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Considerations sur l’approache CSA
• Estimateurs avec de bonnes propriétés statistiques
• Les estimations sont obtenues au moyen de ML, ULS, WLS, GLS;
• Taille de l'échantillon: 200-400 cas pour 10-15 variables observées;
• L'identification du modèle (estimation unique des paramètres) peut être un problème (qui peut être résolu en imposant un ensemble de contraintes sur les paramètres)
• Aucune estimation directe de variables latentes -> ce n'est pas son objectif!!
18 Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Références
• K.A. Bollen : Structural Equations with Latent Variables, John Wiley & Sons., 1989 • R. Cudeck, S. Du Toit, D. Sörbom (Editors) : Structural Equation Modeling: Present and
Future - A Festschrift in honor of Karl G. Jöreskog, Scientific Software International Chicago, 2001
• R. Hoyle : Structural equation modeling: concepts, issues and applications, SAGE Publications, 1995
• K.G. Jöreskog & D. Sörbom : Advances in Factor Analysis and Structural Equation Models, Abt Books, 1979
• K.G. Jöreskog, D. Sörbom, S. Du Toit, M. Du Toit : LISREL8: New Statistical Features, Second Printing with Revisions, Scientific Software International Chicago, 2000
• D. Kaplan : Structural Equation Modeling: Foundations and Extensions, SAGE Publications, 2000
• Rex B. Kline : Principles and Practice of Structural Equation Modeling, The Guilford Press, New York, 2005
• D. Kaplan : Structural Equation Modeling: Foundations and Extensions, SAGE Publications, 2000
19 Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes