Rappel sur les concepts de base de statistiques et...
Transcript of Rappel sur les concepts de base de statistiques et...
Rappel sur les concepts de base de statistiques etstatistiques descriptives
Atelier de formation à l'analyse des données pour l'estimation des
stocks de carbone forestier, 30 juin�4 juillet 2014, Yaoundé
Nicolas Picard
Projet de renforcement des capacités institutionnelles en matière de
REDD+ pour la gestion durable des forêts dans le bassin du Congo
PREREDD (COMIFAC) Rappel sur les concepts de base de statistiques et statistiques descriptivesI 1 / 9
Panorama des statistiques et rappels
1 Panorama
2 Rappels de probabilités
3 Lois usuelles
4 Statistiques descriptives : cas unidimensionnel
5 Statistiques descriptives : cas multidimensionnel
6 Conclusion
Nicolas Picard (CIRAD / IRET) December 1, 2011 1 / 106
Utilité des statistiques en foresterieQuelques exemples
Inventorier une ressource forestière (stock de bois. . . )I on ne peut pas tout mesurerZ quelle règle d’échantillonnage pour estimer la ressource avec une
précision donnée ?
Mesurer des arbres (dendrométrie)I tarifs de cubage : prédire le volume en fonction du diamètre et/ou
de la hauteurI relation hauteur / diamètreZ comment établir une relation alors qu’il y a naturellement de la
variabilité ?
Nicolas Picard (CIRAD / IRET) December 1, 2011 2 / 106
Utilité des statistiques en foresterieQuelques exemples
Inventorier une ressource forestière (stock de bois. . . )I on ne peut pas tout mesurerZ quelle règle d’échantillonnage pour estimer la ressource avec une
précision donnée ?
å échantillonnageMesurer des arbres (dendrométrie)
I tarifs de cubage : prédire le volume en fonction du diamètre et/oude la hauteur
I relation hauteur / diamètreZ comment établir une relation alors qu’il y a naturellement de la
variabilité ?
å modélisation
Nicolas Picard (CIRAD / IRET) December 1, 2011 2 / 106
Utilité des statistiques en foresterieQuelques exemples (suite)
Comprendre l’écologie des espècesI relation sol / espèceZ comment tester une relation qui n’est pas univoque ?
Analyser des données d’inventaire d’aménagementI décrire la structuration des donnéesI définir des types de formations végétalesZ comment extraire l’information d’une masse de données ?Z comment classer des observations ?
Nicolas Picard (CIRAD / IRET) December 1, 2011 3 / 106
Utilité des statistiques en foresterieQuelques exemples (suite)
Comprendre l’écologie des espècesI relation sol / espèceZ comment tester une relation qui n’est pas univoque ?
å test statistiqueAnalyser des données d’inventaire d’aménagement
I décrire la structuration des donnéesI définir des types de formations végétalesZ comment extraire l’information d’une masse de données ?Z comment classer des observations ?
å statistiques descriptives (analyses multivariées)
Nicolas Picard (CIRAD / IRET) December 1, 2011 3 / 106
Statistiques et probabilités
Probabilité : théorie mathématique traitant des événementsaléatoiresStatistique : dès que l’on a affaire à des observations, des données
Z les statistiques s’appuient sur les probabilités. . .mais une partie des statistiques (en particulier les statistiquesdescriptives) ne font pas référence aux probabilités
Ce cours n’est pas un cours de mathématiques :approche intuitivesavoir quand utiliser les méthodes adéquatessavoir interpréter les résultatssavoir chercher de l’aide pour les analyses plus poussées !
Nicolas Picard (CIRAD / IRET) December 1, 2011 4 / 106
Panorama : probabilités
Probabilités
Variablealéatoire• fonction de
répartition• densité• moments• lois continues• lois discrètes• fonction
caractéristique
Couplede VA• loi jointe• loi marginale• loi condition-
-nelle
Vecteuraléatoire
Processusaléatoire• processus
temporel• processus
ponctuel
Nicolas Picard (CIRAD / IRET) December 1, 2011 5 / 106
Panorama : probabilités
Probabilités
Variablealéatoire• fonction de
répartition• densité• moments• lois continues• lois discrètes• fonction
caractéristique
Couplede VA• loi jointe• loi marginale• loi condition-
-nelle
Vecteuraléatoire
Processusaléatoire• processus
temporel• processus
ponctuel
Nicolas Picard (CIRAD / IRET) December 1, 2011 5 / 106
Panorama : probabilités
Probabilités
Variablealéatoire• fonction de
répartition• densité• moments• lois continues• lois discrètes• fonction
caractéristique
Couplede VA• loi jointe• loi marginale• loi condition-
-nelle
Vecteuraléatoire
Processusaléatoire• processus
temporel• processus
ponctuel
Nicolas Picard (CIRAD / IRET) December 1, 2011 5 / 106
Panorama : probabilités
Probabilités
Variablealéatoire• fonction de
répartition• densité• moments• lois continues• lois discrètes• fonction
caractéristique
Couplede VA• loi jointe• loi marginale• loi condition-
-nelle
Vecteuraléatoire
Processusaléatoire• processus
temporel• processus
ponctuel
Nicolas Picard (CIRAD / IRET) December 1, 2011 5 / 106
Panorama : probabilités
Probabilités
Variablealéatoire• fonction de
répartition• densité• moments• lois continues• lois discrètes• fonction
caractéristique
Couplede VA• loi jointe• loi marginale• loi condition-
-nelle
Vecteuraléatoire
Processusaléatoire• processus
temporel• processus
ponctuel
Nicolas Picard (CIRAD / IRET) December 1, 2011 5 / 106
Panorama : probabilités
Probabilités
Variablealéatoire• fonction de
répartition• densité• moments• lois continues• lois discrètes• fonction
caractéristique
Couplede VA• loi jointe• loi marginale• loi condition-
-nelle
Vecteuraléatoire
Processusaléatoire• processus
temporel• processus
ponctuel
Variablealéatoire• fonction de
répartition• densité• moments• lois continues• lois discrètes• fonction
caractéristique
Couplede VA• loi jointe• loi marginale• loi condition-
-nelle
Vecteuraléatoire
Journée 1
Nicolas Picard (CIRAD / IRET) December 1, 2011 5 / 106
Panorama : statistique exploratoire
Statistique exploratoire
Statistiques descriptives Analyses multivariées
Description d’une variable
• moyenne• médiane• quantiles• écart-type• graphiques
Liaison entre deux variables
• graphiques• numériques• ordinales• qualitatives• quantitative et qualitative
Analyse d’untableau
• ACP• AFC• AFCM
Couplage de2 tableaux• variables
instrumentales• co-inertie• canonique
Nicolas Picard (CIRAD / IRET) December 1, 2011 6 / 106
Panorama : statistique exploratoire
Statistique exploratoire
Statistiques descriptives Analyses multivariées
Description d’une variable
• moyenne• médiane• quantiles• écart-type• graphiques
Liaison entre deux variables
• graphiques• numériques• ordinales• qualitatives• quantitative et qualitative
Analyse d’untableau
• ACP• AFC• AFCM
Couplage de2 tableaux• variables
instrumentales• co-inertie• canonique
Nicolas Picard (CIRAD / IRET) December 1, 2011 6 / 106
Panorama : statistique exploratoire
Statistique exploratoire
Statistiques descriptives Analyses multivariées
Description d’une variable
• moyenne• médiane• quantiles• écart-type• graphiques
Liaison entre deux variables
• graphiques• numériques• ordinales• qualitatives• quantitative et qualitative
Analyse d’untableau
• ACP• AFC• AFCM
Couplage de2 tableaux• variables
instrumentales• co-inertie• canonique
Nicolas Picard (CIRAD / IRET) December 1, 2011 6 / 106
Panorama : statistique exploratoire
Statistique exploratoire
Statistiques descriptives Analyses multivariées
Description d’une variable
• moyenne• médiane• quantiles• écart-type• graphiques
Liaison entre deux variables
• graphiques• numériques• ordinales• qualitatives• quantitative et qualitative
Description d’une variable
• moyenne• médiane• quantiles• écart-type• graphiques
Liaison entre deux variables
• graphiques• numériques• ordinales• qualitatives• quantitative et qualitative
Journée 1
Analyse d’untableau
• ACP• AFC• AFCM
Couplage de2 tableaux• variables
instrumentales• co-inertie• canonique
Nicolas Picard (CIRAD / IRET) December 1, 2011 6 / 106
Panorama : statistique exploratoire
Statistique exploratoire
Statistiques descriptives Analyses multivariées
Description d’une variable
• moyenne• médiane• quantiles• écart-type• graphiques
Liaison entre deux variables
• graphiques• numériques• ordinales• qualitatives• quantitative et qualitative
Analyse d’untableau
• ACP• AFC• AFCM
Couplage de2 tableaux• variables
instrumentales• co-inertie• canonique
Nicolas Picard (CIRAD / IRET) December 1, 2011 6 / 106
Panorama : statistique exploratoire
Statistique exploratoire
Statistiques descriptives Analyses multivariées
Description d’une variable
• moyenne• médiane• quantiles• écart-type• graphiques
Liaison entre deux variables
• graphiques• numériques• ordinales• qualitatives• quantitative et qualitative
Analyse d’untableau
• ACP• AFC• AFCM
Couplage de2 tableaux• variables
instrumentales• co-inertie• canonique
Nicolas Picard (CIRAD / IRET) December 1, 2011 6 / 106
Panorama : statistique exploratoire
Statistique exploratoire
Statistiques descriptives Analyses multivariées
Description d’une variable
• moyenne• médiane• quantiles• écart-type• graphiques
Liaison entre deux variables
• graphiques• numériques• ordinales• qualitatives• quantitative et qualitative
Analyse d’untableau
• ACP• AFC• AFCM
Couplage de2 tableaux• variables
instrumentales• co-inertie• canonique
Classificationautomatique• hiérarchique• non hiérarchique
Nicolas Picard (CIRAD / IRET) December 1, 2011 6 / 106
Panorama : statistique exploratoire
Statistique exploratoire
Statistiques descriptives Analyses multivariées
Description d’une variable
• moyenne• médiane• quantiles• écart-type• graphiques
Liaison entre deux variables
• graphiques• numériques• ordinales• qualitatives• quantitative et qualitative
Analyse d’untableau
• ACP• AFC• AFCM
Couplage de2 tableaux• variables
instrumentales• co-inertie• canonique
Analyse d’untableau
• ACP• AFC• AFCM
Couplage de2 tableaux• variables
instrumentales• co-inertie• canonique
Classificationautomatique• hiérarchique• non hiérarchique
Journées 5 & 6
Nicolas Picard (CIRAD / IRET) December 1, 2011 6 / 106
Panorama : statistique inférentielle
Statistique inférentielle (1)
Distribution d’unéchantillon
• fonction derépartitionempirique
• moyenneempirique
• varianceempirique
• échantillongaussien
Estimation
• maximum devraisemblance
• moments• intervalle de
confiance• taille de
population
Échantillonnage
Nicolas Picard (CIRAD / IRET) December 1, 2011 7 / 106
Panorama : statistique inférentielle
Statistique inférentielle (1)
Distribution d’unéchantillon
• fonction derépartitionempirique
• moyenneempirique
• varianceempirique
• échantillongaussien
Estimation
• maximum devraisemblance
• moments• intervalle de
confiance• taille de
population
Échantillonnage
Nicolas Picard (CIRAD / IRET) December 1, 2011 7 / 106
Panorama : statistique inférentielle
Statistique inférentielle (1)
Distribution d’unéchantillon
• fonction derépartitionempirique
• moyenneempirique
• varianceempirique
• échantillongaussien
Estimation
• maximum devraisemblance
• moments• intervalle de
confiance• taille de
population
Échantillonnage
Nicolas Picard (CIRAD / IRET) December 1, 2011 7 / 106
Panorama : statistique inférentielle
Statistique inférentielle (1)
Distribution d’unéchantillon
• fonction derépartitionempirique
• moyenneempirique
• varianceempirique
• échantillongaussien
Estimation
• maximum devraisemblance
• moments• intervalle de
confiance• taille de
population
Échantillonnage
Nicolas Picard (CIRAD / IRET) December 1, 2011 7 / 106
Panorama : statistique inférentielle
Statistique inférentielle (1)
Distribution d’unéchantillon
• fonction derépartitionempirique
• moyenneempirique
• varianceempirique
• échantillongaussien
Estimation
• maximum devraisemblance
• moments• intervalle de
confiance• taille de
population
Échantillonnage
Tests
• ajustement• comparaison de
2 moyennes• comparaison
multiplede moyennes
• comparaison devariance
• du χ2
Nicolas Picard (CIRAD / IRET) December 1, 2011 7 / 106
Panorama : statistique inférentielle
Statistique inférentielle (1)
Distribution d’unéchantillon
• fonction derépartitionempirique
• moyenneempirique
• varianceempirique
• échantillongaussien
Estimation
• maximum devraisemblance
• moments• intervalle de
confiance• taille de
population
Échantillonnage
Tests
• ajustement• comparaison de
2 moyennes• comparaison
multiplede moyennes
• comparaison devariance
• du χ2
Journée 2
Nicolas Picard (CIRAD / IRET) December 1, 2011 7 / 106
Panorama : statistique inférentielle (suite)
Statistique inférentielle (2)
Modèle linéaire
• analyse de varianceà un facteur
• analyse de varianceà n facteurs
• régression simple• régression multiple• analyse de covariance• cas général
Dispositifs expérimentaux
Modèle nonlinéaire
Analysediscriminante
Nicolas Picard (CIRAD / IRET) December 1, 2011 8 / 106
Panorama : statistique inférentielle (suite)
Statistique inférentielle (2)
Modèle linéaire
• analyse de varianceà un facteur
• analyse de varianceà n facteurs
• régression simple• régression multiple• analyse de covariance• cas général
Dispositifs expérimentaux
Modèle nonlinéaire
Analysediscriminante
Nicolas Picard (CIRAD / IRET) December 1, 2011 8 / 106
Panorama : statistique inférentielle (suite)
Statistique inférentielle (2)
Modèle linéaire
• analyse de varianceà un facteur
• analyse de varianceà n facteurs
• régression simple• régression multiple• analyse de covariance• cas général
Dispositifs expérimentaux
Modèle nonlinéaire
Analysediscriminante
Nicolas Picard (CIRAD / IRET) December 1, 2011 8 / 106
Panorama : statistique inférentielle (suite)
Statistique inférentielle (2)
Modèle linéaire
• analyse de varianceà un facteur
• analyse de varianceà n facteurs
• régression simple• régression multiple• analyse de covariance• cas général
Dispositifs expérimentaux
Modèle nonlinéaire
Analysediscriminante
Nicolas Picard (CIRAD / IRET) December 1, 2011 8 / 106
Panorama : statistique inférentielle (suite)
Statistique inférentielle (2)
Modèle linéaire
• analyse de varianceà un facteur
• analyse de varianceà n facteurs
• régression simple• régression multiple• analyse de covariance• cas général
Dispositifs expérimentaux
Modèle nonlinéaire
Analysediscriminante
Nicolas Picard (CIRAD / IRET) December 1, 2011 8 / 106
Panorama : statistique inférentielle (suite)
Statistique inférentielle (2)
Modèle linéaire
• analyse de varianceà un facteur
• analyse de varianceà n facteurs
• régression simple• régression multiple• analyse de covariance• cas général
Dispositifs expérimentaux
Modèle nonlinéaire
Analysediscriminante
Modèle linéaire
• analyse de varianceà un facteur
• analyse de varianceà n facteurs
• régression simple• régression multiple• analyse de covariance• cas général Journées 3 & 4
Nicolas Picard (CIRAD / IRET) December 1, 2011 8 / 106
Et encore :
Statistique bayésienneSéries chronologiquesStatistiques spatiales :
I géostatistiqueI processus ponctuelsI lattices
Etc, etc.
Nicolas Picard (CIRAD / IRET) December 1, 2011 9 / 106
Panorama des statistiques et rappels
1 Panorama
2 Rappels de probabilités
3 Lois usuelles
4 Statistiques descriptives : cas unidimensionnel
5 Statistiques descriptives : cas multidimensionnel
6 Conclusion
Nicolas Picard (CIRAD / IRET) December 1, 2011 10 / 106
Probabilités : les basesApproche fréquentiste
Événement aléatoire défini par :I ses réalisations possiblesI la probabilité associée à chaque réalisation
Exemple : dé à 6 facesSi on note A1, . . . , An les réalisations possibles et Pr la mesure deprobabilité :
Pr(Ai ∪Aj) = Pr(Ai) + Pr(Aj) (i 6= j)n∑
i=1
Pr(Ai) = 1
Nicolas Picard (CIRAD / IRET) December 1, 2011 11 / 106
Probabilité conditionnelle et indépendance
Soient A et B deux événements aléatoiresProbabilité conditionnelle de A sachant B :
Pr(A|B) =Pr(A ∩B)
Pr(B)
Indépendance de A par rapport à B :
Pr(A|B) = Pr(A)
A indépendant de B :B indépendant de A
Pour des événements indépendants :
Pr(A ∩B) = Pr(A)× Pr(B)
Nicolas Picard (CIRAD / IRET) December 1, 2011 12 / 106
Variable aléatoireDéfinition
Application qui associe à chaque réalisation d’un événementaléatoire une valeur numérique (réelle)Exemple : dé à 6 faces ; on y associe X ∈ {1, 2, 3, 4, 5, 6}Exemple : statut d’un arbre pris au hasard en forêt
I dominant → 1I co-dominant → 2I dominé → 3
Exemple : diamètre d’un arbre pris au hasard en forêtD ∈ [dmin; +∞[
Nicolas Picard (CIRAD / IRET) December 1, 2011 13 / 106
Variable aléatoireDéfinition
Application qui associe à chaque réalisation d’un événementaléatoire une valeur numérique (réelle)Exemple : dé à 6 faces ; on y associe X ∈ {1, 2, 3, 4, 5, 6}Exemple : statut d’un arbre pris au hasard en forêt
I dominant → 1I co-dominant → 2I dominé → 3
Exemple : diamètre d’un arbre pris au hasard en forêtD ∈ [dmin; +∞[
Nicolas Picard (CIRAD / IRET) December 1, 2011 13 / 106
Variable aléatoireDéfinition
Application qui associe à chaque réalisation d’un événementaléatoire une valeur numérique (réelle)Exemple : dé à 6 faces ; on y associe X ∈ {1, 2, 3, 4, 5, 6}Exemple : statut d’un arbre pris au hasard en forêt
I dominant → 1I co-dominant → 2I dominé → 3
Exemple : diamètre d’un arbre pris au hasard en forêtD ∈ [dmin; +∞[
Nicolas Picard (CIRAD / IRET) December 1, 2011 13 / 106
Fonction de répartition
Définition :F (x) = Pr(X < x)
Fonction à valeurs dans [0, 1] monotone croissantePropriété :
Pr(a ≤ X < b) = F (b)− F (a)
Nicolas Picard (CIRAD / IRET) December 1, 2011 14 / 106
Différents types de variable
Variable discrèteI Variable ordinale
Exemple : statut de l’arbredominant > co-dominant > dominé
I Variable nominaleExemple : couleur du feuillagevert clair → 1 vert clair → 4vert foncé→ 2 ou bien vert foncé→ 8jaune → 3 jaune → 5
Variable continueExemple : diamètre
Nicolas Picard (CIRAD / IRET) December 1, 2011 15 / 106
Variable aléatoire discrèteLoi de probabilité
On indexe les modalités de la variable par des entiers 1, 2, 3, . . . , mLoi de probabilité : définie par Pr(X = i) pour tout i = 1, . . . ,m
Exemple : somme du lancer de deux dés à 6 faces
2 4 6 8 10 12
0.00
0.05
0.10
0.15
Pro
babi
lité
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
Nicolas Picard (CIRAD / IRET) December 1, 2011 16 / 106
Variable aléatoire discrèteFonction de répartition
Exemple : somme du lancer de deux dés à 6 faces
2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
1.0
Pro
babi
lité
1/36
3/36
6/36
10/36
15/36
21/36
26/36
30/36
33/36
35/36
Nicolas Picard (CIRAD / IRET) December 1, 2011 17 / 106
Variable aléatoire continueLoi de probabilité
Densité de probabilité :
Pr(x < X < x+ dx) = f(x) dx
Fonction de répartition :
F (b) =
∫ b
−∞f(x) dx
En d’autres termes :f(x) = F ′(x)
Nicolas Picard (CIRAD / IRET) December 1, 2011 18 / 106
Variable aléatoire continueExemple
X défini par :
Pr(X > x) =
{exp(−λx)1
f(x) =
{λ exp(−λx) (x ≥ 0)0 (x < 0)
x
Pr(a < X < b)
a b0
λ
0
f(x)
x
0
1
0
F(x)
Nicolas Picard (CIRAD / IRET) December 1, 2011 19 / 106
Changement de variable
Nouvelle variable aléatoire Y = ϕ(X) avec ϕ bijectiveFonction de répartition de Y :
G(y) =
{F (ϕ−1(y)) (ϕ croissante)1− F (ϕ−1(y)) (ϕ décroissante)
Densité de Y :
g(y) =f [ϕ−1(y)]
|ϕ′[ϕ−1(y)]|
Nicolas Picard (CIRAD / IRET) December 1, 2011 20 / 106
Indépendance de deux variables aléatoires
X et Y sont indépendantes si et seulement si :Fonction de répartition du couple (X,Y ) :
H(x, y) = Pr(X < x et Y < y) = F (x)G(y)
Densité du couple (X,Y ) :
h(x, y) = f(x) g(y)
Nicolas Picard (CIRAD / IRET) December 1, 2011 21 / 106
Moments d’une variable aléatoire
Moment non centré d’ordre p :
mp =
∫ ∞
−∞xp f(x) dx
Moment centré d’ordre p :
µp =
∫ ∞
−∞(x−m1)
p f(x) dx
Par définition, le moment non centré d’ordre 1 s’appelle l’espéranceNotation : E(X)
Par définition, le moment centré d’ordre 2 s’appelle la varianceNotation : Var(X)
Nicolas Picard (CIRAD / IRET) December 1, 2011 22 / 106
Espérance
Interprétation : tirons n valeurs de X de façon indépendante :x1, x2, . . . , xn
Z la moyenne empirique (x1 + x2 + . . .+ xn)/n converge vers E(X)
Espérance d’une somme de deux variables aléatoires :
E(X + Y ) = E(X) + E(Y )
Espérance d’un produit de deux variables aléatoires :
X et Y indépendantes : E(XY ) = E(X)E(Y )
Nicolas Picard (CIRAD / IRET) December 1, 2011 23 / 106
Espérance d’une fonction d’une variable aléatoire
Changement de variable Y = ϕ(X) (pas forcément bijective)Espérance :
E[ϕ(X)] =
∫ ∞
−∞ϕ(x) f(x) dx
Exemple : moment non centré d’ordre p = E(Xp)
Nicolas Picard (CIRAD / IRET) December 1, 2011 24 / 106
Variance
Variance :Var(X) = E[(X − E(X))2]
Z mesure la dispersion autour de l’espéranceAutre expression équivalente :
Var(X) = E(X2)− [E(X)]2
« espérance du carré moins le carré de l’espérance »Écart-type : σ =
√Var(X)
Variance d’une somme de variables aléatoires :
X et Y indépendantes : Var(X + Y ) = Var(X) + Var(Y )
� Unités : si X en m, Var(X) en m2 (mais σ en m)
Nicolas Picard (CIRAD / IRET) December 1, 2011 25 / 106
Quantiles et médiane
quantile d’ordre q = F−1(q)
c’est la probabilité p telleque Pr(X < p) = q
médiane = quantile 50%
0.0
0.2
0.4
0.6
0.8
1.0
x
F(x
)1e
r qua
rtile
méd
iane
3e q
uarti
le
Nicolas Picard (CIRAD / IRET) December 1, 2011 26 / 106
Mode(s)
Mode = maximum (local) de la densité de distribution
x
f(x)
Nicolas Picard (CIRAD / IRET) December 1, 2011 27 / 106
Couple de variables aléatoires
fonction de répartition :
H(x, y) = Pr(X < x et Y < y)
densité de distribution (variables continues) :
h(x, y) =∂2H
∂x∂y
densités marginales :
f(x) =
∫
Rh(x, y) dy F (x) = H(x,∞)
g(y) =
∫
Rh(x, y) dx G(y) = H(∞, y)
Nicolas Picard (CIRAD / IRET) December 1, 2011 28 / 106
Couple de VA : covariance
Covariance :
Cov(X,Y ) = E[(X − E(X)) (Y − E(Y ))]
Autre expression équivalente :
Cov(X,Y ) = E(XY )− E(X)E(Y )
Si X et Y sont indépendants, alors Cov(X,Y ) = 0
Cov(X,X) = Var(X)
Nicolas Picard (CIRAD / IRET) December 1, 2011 29 / 106
Vecteur aléatoire
généralise le couple de variables aléatoires à p variables aléatoiresX = (X1, X2, . . . , Xp)
fonction de répartition :
F (x1, x2, . . . , xp) = Pr(X1 < x1 et X2 < x2 et . . . et Xp < xp)
densité de distribution :
f(x1, x2, . . . , xp) =∂pF
∂x1 ∂x2 . . . ∂xp
Nicolas Picard (CIRAD / IRET) December 1, 2011 30 / 106
Vecteur aléatoire : moments d’ordre 1 et 2
espérance : vecteur de longueur p
E(X1, X2, . . . , Xp) = (E(X1),E(X2), . . . ,E(Xp)) = m
matrice de variance-covariance : matrice p× p
Cov(X) =
σ21 Cov(X1, X2) . . . Cov(X1, Xp)
Cov(X2, X1) σ22
......
. . .Cov(Xp, X1) . . . σ2
p
= E(XtX)−mtm
Z matrice symétriqueZ matrice diagonale si X1, . . . , Xm mutuellement indépendants
Nicolas Picard (CIRAD / IRET) December 1, 2011 31 / 106
Panorama des statistiques et rappels
1 Panorama
2 Rappels de probabilités
3 Lois usuelles
4 Statistiques descriptives : cas unidimensionnel
5 Statistiques descriptives : cas multidimensionnel
6 Conclusion
Nicolas Picard (CIRAD / IRET) December 1, 2011 32 / 106
Loi uniforme (U)Lois discrètes
Ex.: dé à n facesparamètre : n
X ∈ {1, 2, 3, . . . , n}Pr(X = k) =
1
npour tout k
E(X) =n+ 1
2
Var(X) =n2 − 1
21 2 3 4 5 6
0.00
0.05
0.10
0.15
x
Pr(X
=x)
Nicolas Picard (CIRAD / IRET) December 1, 2011 33 / 106
Loi de BernoulliLois discrètes
Ex.: lancer d’une pièce(pile ou face)Ex.: survie d’un arbreparamètre : p
X ∈ {0, 1}Pr(X = 1) = p (0 < p < 1)E(X) = p
Var(X) = p(1− p)−0.5 0.0 0.5 1.0 1.5
0.0
0.2
0.4
0.6
x
Pr(X
=x)
Nicolas Picard (CIRAD / IRET) December 1, 2011 34 / 106
Loi binomiale (B)Lois discrètes
Ex.: nombre d’arbres mortsparamètres : n et p
somme de n variables indépendantes et identiquement distribuées(i.i.d) ∼ Bernoulli(p)X ∈ {0, 1, . . . , n}Pr(X = k) = Ck
npk(1− p)n−k
E(X) = np
Var(X) = np(1− p)
propriété d’additivité :
X ∼ B(n, p)Y ∼ B(m, p)X et Y indépendantes
: X + Y ∼ B(n+m, p)
Nicolas Picard (CIRAD / IRET) December 1, 2011 35 / 106
Loi binomiale (B) (suite)
0 2 4 6 8 10
0.0
0.1
0.2
0.3
0.4
0.5
0.6
x
Pr(X
=x)
n = 10p = 0.05
0 2 4 6 8 10
0.0
0.1
0.2
0.3
0.4
x
Pr(X
=x)
n = 10p = 0.1
0 2 4 6 8 10
0.00
0.10
0.20
0.30
x
Pr(X
=x)
n = 10p = 0.2
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
0.25
x
Pr(X
=x)
n = 10p = 0.5
Nicolas Picard (CIRAD / IRET) December 1, 2011 36 / 106
Loi de Poisson (P)Lois discrètes
paramètre : µ
X ∈ N
Pr(X = k) = exp(−µ)µk
k!E(X) = Var(X) = µ
Loi de référence pour les variables de comptageSi E(X) < Var(X), sous-dispersionSi E(X) > Var(X), sur-dispersionpropriété d’additivité :
X ∼ P(µ)Y ∼ P(λ)X et Y indépendantes
: X + Y ∼ P(λ+ µ)
Nicolas Picard (CIRAD / IRET) December 1, 2011 37 / 106
Loi de Poisson (P) (suite)
0 2 4 6 8 10
0.0
0.1
0.2
0.3
0.4
0.5
0.6
x
Pr(X
=x)
µ = 0.5
0 2 4 6 8 10
0.00
0.10
0.20
0.30
x
Pr(X
=x)
µ = 1.5
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
x
Pr(X
=x)
µ = 3
0 2 4 6 8 10
0.00
0.05
0.10
0.15
x
Pr(X
=x)
µ = 5
Nicolas Picard (CIRAD / IRET) December 1, 2011 38 / 106
Origines de la loi de Poisson
1 Limite d’une loi binomiale : soit un événement A de probabilité ptrès faible (< 0.1) que l’on essaie d’obtenir quelques fois enrépétant l’expérience un grande nombre de fois (n > 50). Lenombre de réalisations de A suit une loi binomiale B(n, p) avec :
B(n, p) ≈ P(np)
2 Processus temporel de Poisson :I temps d’attente indépendantsI la loi du nombre d’événements arrivant dans l’intervalle {t; t+ T}
ne dépend que de TI deux événements ne peuvent pas arriver simultanément
Alors le nombre d’événements suit une loi de Poisson3 Processus spatial de Poisson
Nicolas Picard (CIRAD / IRET) December 1, 2011 39 / 106
Autres loi discrètes
loi géométriqueloi hypergéométriqueloi de Pascalloi binomiale négativeetc. (N.ML. Johnson, A.W. Kemp & S. Kotz, 2005, UnivariateDiscrete Distributions, 3e édition, John Wiley & Sons, New York,646 p.)
Nicolas Picard (CIRAD / IRET) December 1, 2011 40 / 106
Loi uniformeLois continues
paramètre : a et b
X ∈ [a, b]
f(x) = 1/(b− a) pourx ∈ [a, b], 0 sinonF (x) = (x− a)/(b− a)pour x ∈ [a, b]
E(X) = (a+ b)/2
Var(X) = (b− a)2/12
x
f(x)
a b
1
b − a
Nicolas Picard (CIRAD / IRET) December 1, 2011 41 / 106
Loi exponentielleLois continues
paramètre : µ
X > 0
f(x) = µ exp(−µx) pourx > 0, 0 sinonF (x) = 1− exp(−µx) pourx > 0
E(X) = 1/λ
Var(X) = 1/λ2
x
f(x)
µ
Nicolas Picard (CIRAD / IRET) December 1, 2011 42 / 106
Loi de Laplace-Gauss (N )Lois continues
aussi appelée « loi normale»paramètre : m et σ
X ∈ R
f(x) =1
σ√2π
exp
[−1
2
(x−m
σ
)2]
E(X) = m
Var(X) = σ2
x
f(x)
m− 3σ
m− 2σ
m− σ m
m+ σ
m+ 2σ
m+ 3σ
Nicolas Picard (CIRAD / IRET) December 1, 2011 43 / 106
Quelques propriétés de la loi normale
quantiles à 95 % :
Pr(m− 1.96σ < X < m+ 1.96σ) = 0.95
propriété d’additivité :
X ∼ N (m,σ)Y ∼ N (p, τ)X et Y indépendantes
: X + Y ∼ N (m+ p,√σ + τ)
convergence de la loi de Poisson vers la loi normale : X ∼ P(µ)
X − µ√µ
−→µ→∞
N (0, 1)
Nicolas Picard (CIRAD / IRET) December 1, 2011 44 / 106
Théorème central-limite
il justifie le rôle central de la loi normale(Xn) suite de variables aléatoires i.i.d d’espérance µ et d’écart-typeσ
1√n
(X1 +X2 + . . .+Xn − nµ
σ
)−→n→∞
N (0, 1)
Nicolas Picard (CIRAD / IRET) December 1, 2011 45 / 106
Loi du chi-deux (χ2)Lois continues
Définition :U1, U2, . . . , Up
i.i.d∼ N (0, 1)
p∑
i=1
U2i ∼ χ2
p
paramètre : p ∈ N∗
X > 0
E(X) = p
Var(X) = 2p0 10 20 30 40 50 60 70
0.0
0.1
0.2
0.3
0.4
0.5
x
f(x)
1
2
345678910
15 20 25 30 40 50
Nicolas Picard (CIRAD / IRET) December 1, 2011 46 / 106
Loi de Fisher-Snedecor (F )Lois continues
Définition :X ∼ χ2
n
Y ∼ χ2p
X et Y indépendantsX/n
Y/p∼ F (n, p)
paramètre : n et p
Nicolas Picard (CIRAD / IRET) December 1, 2011 47 / 106
Loi de Student (T )Lois continues
Définition :U ∼ N (0, 1)
X ∼ χ2n
X et U indépendants
U√X/n
∼ T (n)
paramètre : n
E(X) = 0 (n > 1)Var(X) = n/(n− 2)(n > 2) −4 −2 0 2 4
0.0
0.1
0.2
0.3
0.4
x
f(x)
n = 1n = 2n = 5n = 10n = 50
Nicolas Picard (CIRAD / IRET) December 1, 2011 48 / 106
Autres lois continues
loi gammaloi bêta (type I, type II)loi de l’arc sinusloi log-normaleloi de Weibullloi Cauchyloi de Gumbelloi du T 2 de Hotellingloi du Λ de WilksEtc. (N.L. Johnson & S. Kotz, 1970, Distributions in Statistics:Continuous Univariate Distributions, vol.1, John Wiley & Sons,New York, 300 p.)
Nicolas Picard (CIRAD / IRET) December 1, 2011 49 / 106
Loi multinomiale (M)Loi multivariée discrète
Généralise la loi binomiale à k modalitésDéfinition :
I soit X variable modale à k modalitésI soit pi la probabilité de tirer la modalité iI on fait n tirages indépendants de XI soit Ni le nombre de fois où l’on a tiré la ie modalité
(N1, N2, . . . , Nk) ∼ M(n, p1, p2, . . . , pk)
Loi :
Pr(N1 = n1, . . . , Nk = nk) =n!
n1!n2! . . . nk!pn11 pn2
2 . . . pnkk
Nicolas Picard (CIRAD / IRET) December 1, 2011 50 / 106
Loi multinomiale (suite)
Espérance :
E(N1, N2, . . . , Nk) = (np1, np2, . . . , npk)
Résultat à la base du test du χ2 :
k∑
i=1
(Ni − npi)2
npi−→n→∞
χ2k−1
Nicolas Picard (CIRAD / IRET) December 1, 2011 51 / 106
Loi multinormaleLoi multivariée continue
Définition : X est un vecteur gaussien à p dimensions si toutecombinaison linéaire de ses composantes suit une loi deLaplace-Gaussdensité de probabilité :
f(x1, x2, . . . , xp) =1
(2π)p/2√detΣ
exp
(−1
2t(x−m)Σ−1(x−m)
)
avec m = espérance du vecteur et Σ = matrice devariance-covariance
Nicolas Picard (CIRAD / IRET) December 1, 2011 52 / 106
Loi multinormale (suite)
x
y
f(x,y)
x
y
f(x,y)
−3 −2 −1 0 1 2 3
−3
−2
−1
01
23
x
y
−3 −2 −1 0 1 2 3
−3
−2
−1
01
23
x
y
Nicolas Picard (CIRAD / IRET) December 1, 2011 53 / 106
Autres lois multivariées
loi de WishartEtc. (N.L. Johnson & S. Kotz (1972) Distributions in Statistics:Continuous Multivariate Distributions, vol.2, John Wiley & Sons,New York)
Nicolas Picard (CIRAD / IRET) December 1, 2011 54 / 106
Panorama des statistiques et rappels
1 Panorama
2 Rappels de probabilités
3 Lois usuelles
4 Statistiques descriptives : cas unidimensionnel
5 Statistiques descriptives : cas multidimensionnel
6 Conclusion
Nicolas Picard (CIRAD / IRET) December 1, 2011 55 / 106
Présentation des données : variable numérique discrète
Variable prenant des valeurs entières (plus rarement décimales)Nombre de valeurs distinctes assez faibles (. 20)Exemple : nombre de semis d’une essence dans 48 placeaux
24 19 13 0 26 16 0 0 0 13 15 0 0 9 12 1011 13 22 18 8 0 0 0 13 0 0 7 19 0 0 190 0 0 11 19 9 0 19 0 11 17 10 0 16 15 0
Nicolas Picard (CIRAD / IRET) December 1, 2011 56 / 106
Présentation des données : tableau statistiqueVariable numérique discrète
1ère colonne : observationsdistinctes rangées par ordrecroissant2e colonne : effectif3e colonne : effectif cumulé4e colonne : fréquence5e colonne : fréquence cumulée
x n N f F0 20 20 41.7 41.77 1 21 2.1 43.88 1 22 2.1 45.89 2 24 4.2 50.0
10 2 26 4.2 54.211 3 29 6.2 60.412 1 30 2.1 62.513 4 34 8.3 70.815 2 36 4.2 75.016 2 38 4.2 79.217 1 39 2.1 81.218 1 40 2.1 83.319 5 45 10.4 93.822 1 46 2.1 95.824 1 47 2.1 97.926 1 48 2.1 100.0
Nicolas Picard (CIRAD / IRET) December 1, 2011 57 / 106
Présentation des données : « stem-and-leaf »Variable numérique discrète
« tige » : chiffre des dizaines« feuille » : chiffre des unités
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 7 8 9 91 0 0 1 1 1 2 3 3 3 31 5 5 6 6 7 8 9 9 9 9 92 2 42 6
Nicolas Picard (CIRAD / IRET) December 1, 2011 58 / 106
Présentation des données : variable qualitative
Tableau statistiqueExemple : répartition de la population active selon la catégoriesocioprofessionnelle (France, 1988)
CSP effectif fréquenceagriculteurs 1312 6.1artisans, commerçants 1739 8.1cadres 2267 10.6professions intermédiaires 4327 20.1employés 5815 27.0ouvriers 6049 28.1
Nicolas Picard (CIRAD / IRET) December 1, 2011 59 / 106
Présentation des données : variable quantitative continue
Découpage en classesTableau statistique sur les classesExemple : diamètres de 255 sapelli (Entandrophragma cylindricum)avec D ≥ 10 cm
classe effectif fréquence[10, 20) 145 56.9[20, 30) 23 9.0[30, 40) 13 5.1[40, 50) 1 0.4[50, 60) 4 1.6[60,∞) 69 27.1
Nicolas Picard (CIRAD / IRET) December 1, 2011 60 / 106
Représentation graphique : diagramme en bâtonsVariable quantitative discrète
Exemple du nombre de semis dans 48 placeaux
0 5 10 15 20 25
510
1520
Nombre de semis
Effe
ctif
Nicolas Picard (CIRAD / IRET) December 1, 2011 61 / 106
Représentation graphique : diagramme cumulatifVariable quantitative discrète
Exemple du nombre de semis dans 48 placeaux
0 5 10 15 20 25 30
010
2030
40
Nombre de semis
Effe
ctif
cum
ulé
Nicolas Picard (CIRAD / IRET) December 1, 2011 62 / 106
Représentation graphique : diagramme en colonnesVariable qualitative
Exemple des catégories socioprofessionnelles
Effe
ctif
020
0040
0060
00
agric
ulteu
rs
artis
ans..
.
cadr
es
prof
s. int
erm
.
emplo
yés
ouvr
iers
Nicolas Picard (CIRAD / IRET) December 1, 2011 63 / 106
Représentation graphique : diagramme en barreVariable qualitative
Exemple des catégories socioprofessionnellesE
ffect
if cu
mul
é
050
0015
000
050
0015
000
agriculteursartisans...cadresprofs. interm.employésouvriers
Nicolas Picard (CIRAD / IRET) December 1, 2011 64 / 106
Représentation graphique : diagramme en secteursVariable qualitative
Exemple des catégories socioprofessionnelles
agriculteurs
artisans...
cadresprofs. interm.
employés
ouvriers
Nicolas Picard (CIRAD / IRET) December 1, 2011 65 / 106
Représentation graphique : courbe cumulativeVariable quantitative continue
Exemple des diamètres de sapelli
50 100 150
0.0
0.2
0.4
0.6
0.8
1.0
Diamètre (cm)
Fré
quen
ce c
umul
ée
Nicolas Picard (CIRAD / IRET) December 1, 2011 66 / 106
Représentation graphique : histogrammeVariable quantitative continue
Exemple des diamètres de sapelli
Diamètre (cm)
Effe
ctif
0 50 100 150
050
100
150
Nicolas Picard (CIRAD / IRET) December 1, 2011 67 / 106
Représentation graphique : histogramme (suite)Variable quantitative continue
Exemple des diamètres de sapelli
Diamètre (cm)
Den
sité
de
fréq
uenc
e
50 100 150
0.00
0.04
0.08
Nicolas Picard (CIRAD / IRET) December 1, 2011 68 / 106
Représentation graphique : courbe de densitéVariable quantitative continue
Exemple des diamètres de sapelli
0 50 100 150 200
0.00
00.
010
0.02
0
N = 255 Bandwidth = 11.29
Den
sité
Nicolas Picard (CIRAD / IRET) December 1, 2011 69 / 106
Représentation graphique : boîte à moustachesVariable quantitative continue
Exemple des diamètres de sapelli
5010
015
0
Dia
mèt
re (
cm)
Nicolas Picard (CIRAD / IRET) December 1, 2011 70 / 106
Résumés numériquesVariable quantitative continue
une variable :I moyenneI écart-typeI coefficient de variationI quartiles et médiane
deux variables : corrélation. . .n variables : matrice des corrélations. . .
Nicolas Picard (CIRAD / IRET) December 1, 2011 71 / 106
La moyenne empirique
Moyenne arithmétique :
x =1
n(x1 + x2 + . . .+ xn)
Il existe d’autres moyennes :I moyenne géométrique : n
√x1 . . . xn
→ certains indices économiquesI moyenne quadratique :
√(x2
1 + . . .+ x2n)/n
→ diamètre équivalentI moyenne harmonique :
1
1n
(1x1
+ . . .+ 1xn
)
Nicolas Picard (CIRAD / IRET) December 1, 2011 72 / 106
La médiane empirique
x1 < x2 < . . . < xn
m = x(n+1)/2 ouxn/2 + xn/2+1
2
Nicolas Picard (CIRAD / IRET) December 1, 2011 73 / 106
Le quantile empirique α
x1 < x2 < . . . < xnxm tel que
m
n= α
Exemple : quantile à 95 %
Nicolas Picard (CIRAD / IRET) December 1, 2011 74 / 106
L’écart-type empirique
Variance empirique :
s2 =1
n
n∑
i=1
(xi − x)2
Écart-type empirique : s =√s2
Nicolas Picard (CIRAD / IRET) December 1, 2011 75 / 106
Cas de la loi normale
Relation entre moyenne (m), écart-type (σ) et quantiles :
95 % des observations sont comprises entrem− 1.96σ
etm+ 1.96σ
Nicolas Picard (CIRAD / IRET) December 1, 2011 76 / 106
Limites de l’écart-typeValeur relative et absolue
Un écart-type de 500 g pour la masse n’a pas la même significationselon la taille de l’animal :
Nicolas Picard (CIRAD / IRET) December 1, 2011 77 / 106
Panorama des statistiques et rappels
1 Panorama
2 Rappels de probabilités
3 Lois usuelles
4 Statistiques descriptives : cas unidimensionnel
5 Statistiques descriptives : cas multidimensionnel
6 Conclusion
Nicolas Picard (CIRAD / IRET) December 1, 2011 79 / 106
Liaison entre deux variables quantitativesMéthode graphique
Nuage de points :une des variables sur l’axe des x
l’autre sur l’axe des y
Nicolas Picard (CIRAD / IRET) December 1, 2011 80 / 106
Coefficient de corrélation linéaire
Définition :ρ =
Cov(X,Y )
σXσY
Estimation :
Cov(X,Y ) =1
n
n∑
i=1
(Xi − X)(Yi − Y )
Remarque :
Cov(X,X) =1
n
n∑
i=1
(Xi − X)2 = Var(X) = S2X
donc ρ(X,X) = 1
Nicolas Picard (CIRAD / IRET) December 1, 2011 81 / 106
Coefficient de corrélation linéaire (suite)
Le coefficient de corrélation linéaire est aussi :la racine carrée du coefficient de détermination de la régressionlinéaire de Y par rapport à X
le pourcentage de variance expliquée par cette régression linéaire
Nicolas Picard (CIRAD / IRET) December 1, 2011 82 / 106
Il quantifie la « force » de la relation linéaireet varie entre −1 et 1
−2 −1 0 1 2
−2
−1
01
2
X
Y
R = 0
−3 −2 −1 0 1 2−
2−
10
12
X
Y
R = 0.3
−2 −1 0 1 2 3
−2
−1
01
2
X
Y
R = 0.5
−2 −1 0 1 2
−2
−1
01
2
X
Y
R = 0.7
−3 −2 −1 0 1 2
−2
−1
01
2
X
Y
R = 0.9
−2 −1 0 1 2−
2−
10
12
X
Y
R = −0.7
Nicolas Picard (CIRAD / IRET) December 1, 2011 83 / 106
Les pièges du coefficient de corrélation linéaire
§ρ = 0.77 ρ = 0.66
ρ = 0.8 ρ = 0.76
Nicolas Picard (CIRAD / IRET) December 1, 2011 84 / 106
Réchauffement climatiqueCorrélation positive. . .
Nicolas Picard (CIRAD / IRET) December 1, 2011 85 / 106
Réchauffement climatique. . . ou corrélation négative ?
Nicolas Picard (CIRAD / IRET) December 1, 2011 86 / 106
Liaison entre deux variables ordinales
Coefficient de corrélation des rangs τ de Kendall :k = 1 si Xi < Xj et Yi < Yj , ou si Xi > Xj et Yi > Yj
k = −1 sinonS =
∑k sur les n(n− 1)/2 couples
τ =2S
n(n− 1)
Nicolas Picard (CIRAD / IRET) December 1, 2011 87 / 106
Liaison entre une variable quantitative et une variablequalitative
Rapport de corrélation :
η2 =Var[E(Y |X)]
Var(Y )
C’est aussi :la racine carrée du coefficient de détermination de l’analyse devariance de Y par rapport à X
le coefficient de corrélation multiple de Y par rapport aux variablesindicatrices des modalités de X
la racine carrée du coefficient de détermination de la régressionmultiple de Y par rapport à ces variables indicatrices
Nicolas Picard (CIRAD / IRET) December 1, 2011 88 / 106
Liaison entre une variable quantitative et une variablequalitativeReprésentation graphique
Boîtes parallèles : une boîte à moustache de la variable quantitative parmodalité de la variable qualitative
a b c d e f
−2
02
46
8
Modalités
Val
eurs
Nicolas Picard (CIRAD / IRET) December 1, 2011 89 / 106
Liaison entre deux variables qualitatives
Coefficient de corrélation canonique : c’est la valeur maximale(autre que 1) du coefficient de corrélation linéaire entre unecombinaison linéaire des variables indicatrices des modalités de Xet une combinaison linéaire des variables indicatrices des modalitésde Y
C’est aussi la première valeur propre (autre que 1) de l’analysecanonique des tableaux disjonctifs complets formés à partir de Xet Y
Nicolas Picard (CIRAD / IRET) December 1, 2011 90 / 106
Liaison entre deux variables qualitatives
Statistique du χ2 sur table de contingence
Yj...
Xi · · · nij · · · ni....n.j n
X2 =∑
i
∑
j
(nij −
ni.n.j
n
)2
ni.n.j
n
Nicolas Picard (CIRAD / IRET) December 1, 2011 91 / 106
Liaison entre deux variables qualitativesReprésentation graphique
Diagramme en barres : un diagramme pour l’une des variables parmodalité de l’autre variableExemple : durée d’obtention du DEUG en fonction de l’âged’obtention du bac
<18 18 19 >19
Âge d’obtention du bac (ans)
Effe
ctif
010
020
030
040
0
moy. 18 19 >19
Âge d’obtention du bac (ans)
Fré
quen
ce
0.0
0.2
0.4
0.6
0.8
1.0
Durée d’obtention du DEUG
2 ans3 ans4 ans
Nicolas Picard (CIRAD / IRET) December 1, 2011 92 / 106
Liaison entre n variables
Liaison deux à deux :matrice des corrélationsgraphiques
j L’absence de liaisons 2 à 2 ne signifie pas qu’il n’y apas de liaisons entre 3, 4. . . variables j
Contre-exemple : (X,Y, Z) avecX ∼ loi uniforme dans {−1, 1}Y ∼ loi uniforme dans {−1, 1} indépendamment de X
Z = X × Y
Nicolas Picard (CIRAD / IRET) December 1, 2011 93 / 106
Relation entre n variables : tableau des nuages de points
Exemple des iris :
Sepal.Length
2.0 3.0 4.0 0.5 1.5 2.5
4.5
5.5
6.5
7.5
2.0
3.0
4.0
Sepal.Width
Petal.Length
12
34
56
7
4.5 5.5 6.5 7.5
0.5
1.5
2.5
1 2 3 4 5 6 7
Petal.Width
Nicolas Picard (CIRAD / IRET) December 1, 2011 95 / 106
Panorama des statistiques et rappels
1 Panorama
2 Rappels de probabilités
3 Lois usuelles
4 Statistiques descriptives : cas unidimensionnel
5 Statistiques descriptives : cas multidimensionnel
6 Conclusion
Nicolas Picard (CIRAD / IRET) December 1, 2011 96 / 106
Démarche
Question scientifique↓
Quelle méthode ? Quel dispositif de mesure ?↓
Acquisition, puis structuration des données↓
Analyses exploratoires↓
Analyse pour répondre à la question
Nicolas Picard (CIRAD / IRET) December 1, 2011 97 / 106