Tableux_multidimension.pdf

13
Prof. CHRAYAH Mohamed

Transcript of Tableux_multidimension.pdf

  • Prof. CHRAYAH Mohamed

  • Tableaux individus x variables

    L'tude d'une population compose dindividus s'effectue par rapport un certain nombre de critres appels "variables" . Ces rsultats statistiques s'expriment usuellement par un tableau de nombres deux dimensions :

    o Rij indique la valeur de la variable Rj pour l'individu i. Il y a n individus et p variables. Un tel tableau peut donc tre reprsent par une matrice n lignes et p colonnes :

  • Tableaux individus x variables

    On peut aussi donner une reprsentation gomtrique de la population tudie dans 2 espaces complmentaires :

    espace Rp ou espace des individus : espace Rn ou espace des variables :

    un individu i est reprsent par un point p une variable Rj est reprsente

    coordonnes (Ri1, Ri2, ...., Rij, ..., Rip) par un point n coordonnescoordonnes (Ri1, Ri2, ...., Rij, ..., Rip) par un point n coordonnes

    (R1j, R2j, ...., Rij, ..., Rnj)

  • Tableaux individus x variables

    L'tude exemple : rpartition de 20 lves d'une classe suivant leurs notes (sur 20) dans trois matires : Maths (R1), Physique (R2),Gographie (R3) :

  • Tableaux de contingence

    Un tableau de contingence est un tableau de deux sries (mais on peut en envisager plus de deux) de caractres ou variables qualitatifs X et Y possdant des modalits Y1, Y2, ....., Yp et X1, X2, ....., Xn exhaustives et exclusives les unes des autres. On notera qu'ici les individus n'apparaissent pas explicitement.

    O kij reprsente le nombre d'individus qui possdent la fois les modalits Xi et Yj. A noter que X1, X2, ....., Xn et Y1, Y2, ....., Yp reprsentent des "valeurs" (ou modalits) qualitatives des variables X et Y.

  • Tableaux de contingenceUn tableau exemple : tude d'une population de consommateurs achetant des produits

    quivalents A, B, C (X = A, B, C) et se rpartissant par catgorie socio-professionnelle (CS : cadres suprieurs, PI : professions intermdiaires, AC : artisans, commerants, AO : agriculteurs, ouvriers) (Y = CS, PI, AC, AO) :

    Un tableau de contingence peut tre transform en un tableau de frquences. Il suffit de diviser chaque valeur par l'effectif total. On peut aussi considrer les frquences marginales dont les sommes verticalement et horizontalement sont bien sr gales 1.

    Reprenons l'exemple prcdent. L'effectif total est 300.

  • Tableaux de contingence

    Un tableau de contingence ou de frquences peut tre considr comme un cas particulier d'un tableau individus x variables. En effet, on peut considrer que les modalits de la premire variable reprsentent des individus et que les modalits de la seconde variable sont elles mmes des variables. Toutefois si cette assimilation est valable pour des calculs, des variables. Toutefois si cette assimilation est valable pour des calculs, elle n'est plus valable pour les interprtations qu'on en tirera.

  • Covariance et corrlation

    Reprenons le tableau individus x variables.

    Tout d'abord, rappelons les relations suivantes concernant la moyenne (ou esprance mathmatique), la variance et l'cart-type :

  • Covariance et corrlationpi reprsente le poids statistique de l'individu i. Dans la majorit des cas, on a

    simplement .

    Les quantits reprsentent les valeurs de la variable centre Xj et les

    quantits reprsentent les valeurs de la variable centre et rduite xj.

    Intressons-nous maintenant aux relations qui peuvent exister entre les variables. On dfinit la covariance cov(Rj, Rk) et la corrlation cor(Rj, Rk) entre deux On dfinit la covariance cov(Rj, Rk) et la corrlation cor(Rj, Rk) entre deux variables Rj et Rk par :

    Si les indices j et k sont gaux, on a cor(Rj, Rj) = Vj et cor(Rj, Rj) = 1.

    L'ensemble des valeurs cov(Rj, Rk) et cor(Rj, Rk) peut tre rang dans des matrices : la matrice des covariances et la matrice des corrlations. Par exemple pour trois variables R1, R2, R3, on aura pour matrice des covariances C et pour matrice des corrlations c :

  • Covariance et corrlation

    Ces matrices sont symtriques car cov(Rj, Rk) = cov(Rk, Rj).

    La corrlation ou coefficient de corrlation cor(Rj, Rk) possde la proprit particulire d'tre compris entre -1 et +1. En effet, rappelons l'ingalit de Schwarz (vieux rsultat mathmatique) :

    o Ai et Bi sont des nombres rels. Appliquons cette relation cjk = cor(Rj, Rk) :

    ce qui montre que -1 cjk +1.

  • Covariance et corrlation

    exemple : Reprenons l'exemple des lves et de leurs notes, prsent en dbut de chapitre. Calculons les valeurs des variables

    centres, rduites ainsi que les matrices de covariance et de corrlation. Les calculs ont t faits avec un tableur (eleves.xls ). On

    supposera que tous les lves ont le mme poids statistique (1/20).supposera que tous les lves ont le mme poids statistique (1/20).