Rapport Ad

download Rapport Ad

of 17

Transcript of Rapport Ad

La

LAnalyse des donnes

Encadr par: M.HARTI

Ralis par: GHAYOUBA maha El RACHEQ Mohammed OUALI ALAMI Mohammed ZEROUAL Abdellah TAJMOUATI Mehdi

REMERCIEMENTS

Remerciements les plus sincres toutes les personnes qui auront contribu de prs ou de loin l'laboration de ce mmoire.

Remerciements au Professeur Harti pour ses indications et la richesse de ses enseignements qui ont contribu l'laboration de ce travail.

Une pense de gratitude tous les consultants et internautes rencontrs lors des recherches effectues et qui ont accept de rpondre aux questions avec gentillesse.

Sommaire

INTRODUCTION.. page 4

1 re PARTIE : Prsentation de L'outil de travail

Logiciel Sphinx. page 5

2me PARTIE : PRESENTATION DE L'ETUDE

Rgression Multiple pages 6-8

Analyse des composantes principales pages 9-14

Analyse factorielle des correspondances pages 15-17

Introduction

La sant bucco-dentaire est le bon tat de sant de la bouche dune personne, en particulier la bonne sant de ses dents et de ses gencives. La carie et les maladies parodontales sont les affections bucco-dentaires les plus frquentes selon les mdecins. Elles posent un problme de sant partout dans le monde.

Cette tude a valu la sant bucco-dentaire et les habitudes dhygine de jeunes tudiants Fs afin de mettre en place un programme de prvention dans les coles. Le questionnaire a permis dobtenir des renseignements sur la frquence du brossage et sur les moyens utiliss pour lhygine bucco-dentaire ainsi que latteinte carieuse des dents.

Lenqute comporte un chantillon de 47 personnes bien cible via un questionnaire sous la forme dun formulaire web qui traire la fiabilit de linformation et qui gre les diffrents cas dexceptions, linformation est stocke dans une base de donne. Lchantillon cible englobe des tudiants dune cole prive suprieure et public ainsi que une masse de lycens issu dun tablissement prive et public.

LOGICIEL SPHINX

Sphinx est un logiciel d'enqute et d'analyse de donnes. Il permet dassister dans chacune des quatre grandes tapes de ralisation d'une enqute:

La ralisation du questionnaire.La saisie des rponses.Les traitements quantitatifs des donnes et l'analyse des donnes qualitatives.La rdaction du rapport d'tude.

Rgression multiple

On effectue une rgression multiple car on dispose de plusieurs variables explicatives.

Cette enqute reprsente le cas ou plusieurs facteurs influencent le phnomne quon cherche expliquer.

Pour liminer leffet dautres facteurs on ne raisonne que sur la strate des individus qui ont un bon tat de sante et qui brossent les dents un minimum de fois. Apres filtrage on obtient 20 observations suivantes sont disponibles pour lanalyse.

Apres dfinition de la variable expliquer (Etat de sante) et des variables explicatives on obtient le graphe de corrlation ci-dessous:

Le calcul est fait selon la mthode pas pas ascendante, les termes sont classs dans l'ordre de leur importance pour l'explication de la variable (tat de sant).

Equation de la rgression :

Dans un premier temps le modle est comme suivant:

etat.sante = -0.345*nombre.carie.precedement - 0.432*nombre.carie.actuel +0.791*frequence(fois/jour) - 0.223*nombre.visite.dentiste - 0.007*satisfaction.visite -0.296*SEXE + 4.516

Les variables dur (min), CHANGEZ-VOUS LA BROSSE DENTS ?, nbr.compagne, ge : ne sont pas significatives et n'ont pas t prises en compte dans la rgression pas pas car elles sont faiblement corrl ce qui ninfluence gure le rsultat de lquation de rgression.

Les 6 variables expliquent 85.0% de la variance de la variable (tat de sante), ainsi que le Coefficient de corrlation multiple : R = 0,92

Cest la variable la plus fortement corrle qui a t choisie en premier. Il faut notamment faire attention aux variables explicatives auto corrles.

Certains termes de l'quation sont peu influents, leur rapport coefficient / cart-type est infrieur 1,96, il sagit des variablessatisfaction.visite etsexe et qui est fortement corrl avec la variable frquence ce qui ncessite de la retirer ce qui donne le modle suivant:

Equation de la rgression :

etat.sante = -0.379 * nombre.carie.precedement -0.449 * nombre.carie.actuel +1.057 * frequence(fois/jour) -0.215 * nombre.visite.dentiste -0.008 * satisfaction.visite +3.769

Les 5 variables expliquent 84.2% de la variance de la variable etat.santeCoefficient de corrlation multiple : R = 0,92

Attention aux variables explicatives auto corrles car lexistence de plusieurs variables corrls entre elles, donne un effet ngatif.Dans un autre contexte la variable nombre.visite.dentiste est retire ainsi le modle gnr est comme suivant:

Equation de la rgression :

etat.sante = -0.657 * nombre.carie.precedement -0.441 * nombre.carie.actuel +0.657 * frequence(fois/jour) -0.125 * SEXE : +3.567

Les 4 variables expliquent 71.6% de la variance de tat.santeCoefficient de corrlation multiple : R = 0,85

Apres une rflexion intuitive et dans le cadre de parfaire lanalyse, on se contentera pas de lexamen de coefficient de corrlation. Il faut galement une estimation prcise des coefficients de rgression. Le paramtre F rend compte de cette information.

La premire variable introduite nest pas la variable nombre.carie.precedement. En effet bien que fortement corrl avec variable tat.sante il se dduit quon doit tenir compte de la variable nombre.visite.dentiste et puisque la variable sexe est corrle avec la variable frquence, elle est carte ce qui nous ramne a un modle sous la forme:

Equation de la rgression :

etat.sante = -0.667 * nombre.carie.precedement -0.444 * nombre.carie.actuel +0.778 * frequence(fois/jour) +3.222

Les 3 variables expliquent 71.4% de la variance de etat.santeCoefficient de corrlation multiple : R = 0,85

Le premier model reste meilleur et il dmontre quune bonne hygine bucco-dentaire dans le milieu des jeunes tudiant est nettement lie a la frquence de brossage exprime par le nombre de fois par jour ainsi que le nombre de visite chez le dentiste et videment le nombre de dents carieuses qui refltent clairement la situation de lindividu.

Analyse des composantes principales

Lanalyse en composantes principales aide dcrire et explorer un ensemble dobservations rassembles sous la forme dun tableau de donnes.

Dterminer le nombre daxes de lanalyse

Pour rpondre cette question, il faut consulter le tableau des valeurs propres qui accompagne LACP. Linertie de chaque axe et linertie cumule figurent galement dans ce tableau.f1f2f3f4f5f6f7f8f9f10

Valeur propre3,1181,9431,4490,9080,8760,7250,3810,2950,220,085

% expliqu31,19%19,43%14,49%9,08%8,76%7,25%3,81%2,95%2,20%0,85%

% cumul31,19%50,62%65,11%74,19%82,95%90,20%94,00%96,96%99,15%100,00%

Il est important que les valeurs propres des axes retenus restituent une bonne proportion de lanalyse. Cela signifie que la somme de l'inertie explique par chacun des axes reprsente une partie importante de l'inertie totale. Cette somme est une mesure de la fiabilit de la lecture des figures reprsentant les individus comme les variables et donc de la qualit globale explicative de l'analyse. Les axes (1) et (2) ont t retenu alors que le 3me reste sous rserve.

Analyse des Variables

Loutil Sphinx gnre les diffrentes figures concernant les variables comme suivant:

Contribution des variables Coordonnes des variables f1 f2 f3

nombre.visite.dentiste19,78%0,67%1,05%

satisfaction.visite9,88%15,15%8,66%

etat.sante21,10%1,28%15,09%

nombre.carie.precedement17,94%10,56%1,27%

nombre.carie.actuel12,32%4,76%5,49%

frequence(fois/jour)0,80%1,64%47,84%

durre(min)5,39%0,05%0,47%

CHANGEZ-VOUS LA BROSSE DENTS ?3,64%28,41%8,76%

nbr.compagne0,89%22,10%6,88%

AGE :8,27%15,39%4,48%

f1 f2 f3

nombre.visite.dentiste-0,785-0,1140,123

satisfaction.visite0,555-0,543-0,354

etat.sante0,1580,4680,017

nombre.carie.precedement-0,748-0,453-0,136

nombre.carie.actue-0,620,304-0,282

frequence(fois/jour)-0,158-0,1780,833

durre(min)0,41-0,032-0,082

CHANGEZ-VOUS LA BROSSE DENTS ?-0,3370,7430,356

nbr.compagne0,167-0,6550,316

AGE :0,5080,547-0,255

Le tableau donne, pour les 2 premires composantes, les contributions relatives (positives et ngatives) des critres.

Figure 1:La carte montre les positions des 10 critres.27 observations ne sont pas prises en compte (non-rponse au moins un des critres).50.6% de la variance est explique par les deux axes reprsents.

Interprtation des axes:

Laxe (1) contient 31,2% de linformation initiale:

Cet axe oppose dune part des variables caractristiques dune population en bonne sante caractris par une satisfaction des visites du mdecin et par un ge considrable dautre part une population ayant un tat dhygine bucco-dentaire dplorable caractris par un nombre important de visite chez le dentiste et plusieurs dents carieuses avant comme aprs la visite .

Laxe (2) contient 19,4% de linformation initiale:

Cet axe oppose dune part des variables caractristiques dune part une population moins jeune cible par les compagnes de prvention dautre part une population plus ge et qui ressente le besoin de changer la brosse a dent rgulirement.

Interprtation Des Individus

On applique ACP sur Les individus ce qui revient a trait chaque observation, Sphinx gnre une reprsentation des individus, et dans lintrt de mettre une cohrence dans cette reprsentation on assimile les observations a leur taux de satisfaction de la visite du dentiste.

Axe 1:

Dune part on remarque quil existe d es individus qui ont les mmes caractristiques il sagit de N32, N13, N8 des individus interprtables car ils disposent dune grande contribution qui rend stable la reprsentation dautre part on les observations N36 et 26 ont des caractristiques communes.

Axe 2:

On remarque de laxe 2 regroupe deux individus N5 N25 qui ont les mmes caractristiques,

On limine les observations qui ont une faible contribution comme on limine les observations qui ont un cosinus proche de 0 ce qui remet en cause la qualit de la reprsentation.

ObservationsAxe (1)Axe (2)

ncoord(1)cos(1) ctr(1)coord(2)cos(2) ctr(2)qualit

3-0,03400,00%-0,080,0020,01%0,002

40,8840,1930,53%1,4720,5352,37%0,728

5-0,6210,0260,26%-3,3680,76912,42%0,796

6-1,2190,061,01%-1,0840,0471,29%0,107

82,060,272,90%-0,760,0370,63%0,307

10-1,2370,2691,05%0,04600,00%0,269

120,2410,0110,04%1,3560,3492,01%0,36

132,2970,6283,60%-0,5740,0390,36%0,667

160,2240,0080,03%-1,50,372,46%0,378

220,2390,0090,04%1,5480,3892,62%0,399

250,440,0140,13%-3,0830,67910,41%0,692

26-4,2820,75912,51%0,440,0080,21%0,767

271,5840,4271,71%0,9950,1691,08%0,596

28-1,5010,4391,54%0,0530,0010,00%0,44

322,8110,5645,39%-0,4440,0140,22%0,579

350,2960,0090,06%0,890,0790,87%0,088

36-3,5490,8548,59%0,4330,0130,21%0,867

402,0030,5042,74%1,2340,1911,67%0,695

410,1360,0030,01%1,6850,3933,11%0,396

45-0,7720,2230,41%0,7380,2040,60%0,427

La carte montre les coordonnes des 20 observations.27 observations ne sont pas prises en compte (non-rponse au moins un des critres).50.6% de la variance est explique par les deux axes reprsents.Chaque observation est reprsente par un point.

Figure 2

La projection des individus sur les variables

La projection est reprsent par le nuage des points suivant: Figure 3

Laxe 1:Dune part on nobserve que les individus caractris par un bon tat de sante affirme un pourcentage de satisfaction lors de la visite chez le mdecin, plus g et appartenant a une classe moyenne dautre part les individus de sante dfectueuse accumule les visites chez le dentiste car ils disposent dun nombre important de dents carieuses avant et aprs la visite ce qui revient a dire que la visite est insatisfaisante .

Laxe 2:

Prcise que les individus cible par les compagnes de prvention sont moins jeune et essaient de modifier leur habitudes dhygine.

Analyse factorielle des correspondances

1) Interprtation des Axes

LAFC du tableau considr fournit des valeurs propres suivantes:

f1 f2 f3 f4 f5 f6 f7 f8

Valeur propre0,7270,2030,1740,1640,1310,1190,0920,065

% expliqu40,19%11,21%9,61%9,07%7,23%6,58%5,11%3,59%

% cumul40,19%51,40%61,01%70,08%77,31%83,88%89,00%92,59%

Dans notre enqute les deux premiers axes expliquent prs de 51,40% de linertie: une reprsentation des variables et des individus sur les plans 1-2 .de plus le pourcentage dinertie sur laxe 3 est inferieur 10% donc ltude de cet axe napparait pas ncessaire.

Dans notre enqute et daprs les rsultats prcdents, on peut se contenter dun facteur seulement que lon interprtera en saidant des tableaux contenant les contributions des variables dhygine et des observations a la construction de chaque axes.

2) Analyse des lignes et des colonnes du tableau

Laxe 1 contient 40,19% de linformation initiale.

Cet axe oppose dune part les individus qui respectent les normes de lhygine bucco-dentaire: excellente N (17,37), bonne N(15,43) , et dautre part les individus dans une situation extrme: mauvaise N(3,35) , trs mauvaise N(26,36) .Interprtation de laxe 1: cest un facteur de diffrenciation entre les individus selon ltat dhygine dentaire.

Laxe 2 contient 11,21% de linformation initiale, nanmoins il ne sinscrit pas dans la logique de lAFC.

Analyse des correspondances multiples:

Variables :type.visite, etat.sante, carie.actuel(oui,non), BROSSEZ-VOUS APRS CHAQUE REPAS ?, marque(Signal,Colgate,Miswak,Autre), demobrossage(oui,non), SEXE .

Figure 4

La carte montre les positions des 20 modalits et les coordonnes des 45 observations. 51,40% de la variance est explique par les deux axes reprsents.

Sur le graphe laxe 1 apparait immdiatement comme laxe de ltat dhygine croissant: a gauche (trs mauvais) a droite (excellent) , les autres catgories stagent entre ces deux extrmes.

On note par ailleurs que chaque tat dhygine sloigne du centre dans la mme direction que le moyen de brossage utilis. Le moyen dominant (miswak) se trouve gauche ou la prsence du sexe masculin. Le moyen (signal) ou autre prciser (sensodyne) est dans la mme direction que la moyenne du sexe fminin ayant un bon tat dhygine dentaire.

On note aussi que certains tat dhygine mal dfinie du point de vue sante sloignent du centre dans la direction perpendiculaire correspondant a laxe n2.Cet axe peut ici tre interprt: on remarque en effet que le bas du graphique est occup par les proccups par lesthtique alors que le haut comprend en majorit des adeptes de la prvention. Sans oublie la variable sante qui est commune au deux monde.

Pourquoi ne pas ajouter la variable qui dtermine la dure que prend lindividu pour changer la brosse afin de vrifier lhomognit de notre analyse et davoir la certitude que leffet de Gutmann a t vit.

Figure 5

Lvidence que la variable (0a3mois) rejoint la partie gauche ceci dit les individus en bon tat change la brosse dans un dlai de moins de 3 mois alors que les individus en mauvais tat sont ceux qui ngligent cette prcaution dhygine dentaire.

3