traitement et analyse des données

45
Module 5 Modes de codification, d’archivage et de traitement des données recueillies pour l’élaboration des indicateurs Module 5_socio eco 1 1

Transcript of traitement et analyse des données

Page 1: traitement et analyse des données

Module 5

Modes de codification, d’archivage et de traitement des données recueillies pour

l’élaboration des indicateurs

Module 5_socio eco1 1

Page 2: traitement et analyse des données

Module 5_socio eco 22

INTRODUCTION AU MODULE 5

Page 3: traitement et analyse des données

Module 5_socio eco 33

Les participants sont introduits aux notions et méthodes de dépouillement, de traitement et d'analyse des données socio économiques (codification, saisi des données, tableau de données, archivage et traitement des données, etc.

Objectifs

Les participants ont pris connaissance d'exemples pratiques d'appui et d'illustration

Page 4: traitement et analyse des données

Module 2_socio eco 44

AgendaJOURNEE 2

14h30 Introduction du module 5 et rappel des acquis du module 4 (Durée : 15')

14h45 •Présentation PowerPoint par le formateur : Introduction aux méthodes de dépouillement, de codification de données socio économiques (codification des données, numérique, alpha numérique, saisi des données qualitatives et quantitatives, etc., exemples et méthodes de traitement et d'analyse des données recueillies pour l’élaboration des résultats, etc. (Durée : 25')•Questions/réponses, discussion générale avec modération sur les aspects présentés dans le PowerPoint, synthèse (Durée : 40')•Constitution de groupes (Durée : 10')

16h00 Pause café

Page 5: traitement et analyse des données

5

16h30 Travaux de groupes : exercice sur le saisi et l'analyse des données, (moyenne, médiane, écart type, etc.).

(Durée : 45') Restitution des résultats, discussions, leçons tirées, enseignements

(Durée : 15')

17h30Synthèse générale : Discussions et harmonisation : Questions/réponses, discussion générale

(Durée : 30')

Page 6: traitement et analyse des données

6Module 5_socio eco 6

PRÉSENTATION POWERPOINT

INTRODUCTION AUX MÉTHODES DE

DÉPOUILLEMENT, DE CODIFICATION ET

D’ANALYSE DE DONNÉES SOCIO ÉCONOMIQUES

Page 7: traitement et analyse des données

7

CODIFICATION DES QUESTIONNAIRES

En quoi consiste une codification ? L’opération de codification consiste à reconvertir le langage ordinaire du questionnaire en un langage qui s’apprête au traitement informatique.

C’est quoi un code ?Au sens strict un code est un “ dictionnaire des équivalences entre deux langages “ (Le Robert)

Module 5_socio eco

Page 8: traitement et analyse des données

8

CODIFICATION DES QUESTIONNAIRES

Pourquoi un code ? Rendre possible le traitement et l’analyse numérique de données récoltées surtout

Comment procéder ?

L’opération de codification correspond à un chiffrement, elle consiste à accorder un

chiffre unique à une variable, à une modalité ou une réponse donnée.

Module 5_socio eco

Page 9: traitement et analyse des données

9

CODIFICATION DES QUESTIONNAIRES

Types de codes?

Numérique : composé uniquement de chiffres :

Simple : 1 à nDécimal : 1, 2, 3, …

11, 12, 13, 21, 22, 23, 31, 32, 33,… 111, 112, 121, 122, 131, 132, etc.

Alphanumérique : combine des chiffres et des alphabets, comme par exemple : 12a,

12b, 12c ou A1, A2, A3.Module 5_socio eco

Page 10: traitement et analyse des données

10

CODIFICATION DES QUESTIONNAIRESÉtape de la codification ?

Elle s'effectue en général en deux temps :

Pré codage du questionnaire : Codification préalable des questions fermées et semi fermées

Codage a posteriori : Codification complémentaires après la réalisation des enquêtes sur terrain (Codification des réponses aux questions ouvertes, etc.)

Module 5_socio eco

Page 11: traitement et analyse des données

11

CODIFICATION DES QUESTIONNAIRES

Exemples pratiques

Module 5_socio eco

Questions fermées  1. L’exploitant recrute-t-il de la main d’œuvre extérieure ? Code : [1. Oui, 2. Non]

En cas de oui

En cas de Non

1

2

Page 12: traitement et analyse des données

12

CODIFICATION DES QUESTIONNAIRES

Exemples pratiques

Module 5_socio eco

Questions fermées  2. Niveau d’instruction : Code : 1. Analphabète, 2. Ecole primaire, 3. Niveau secondaire, 4.

Niveau supérieur

En cas Analphabète

En cas Ecole primaireEtc….

1

2

Page 13: traitement et analyse des données

13

CODIFICATION DES QUESTIONNAIRESExemples pratiques

Module 5_socio eco

Questions semi fermées  Quelle est l’activité secondaire du chef de l'UE ? Code : 1. Agriculture; 2. Élevage; 3. Cueillette; 4. Exploitation du bois; 5. Commerce; 6. Fonctionnaire; 7. Artisanat; 8. Apiculture; 9.Tourisme; 10. Autre (préciser) :…………… En cas de Agriculture

En cas de ÉlevageEtc.En cas de « autre »

1

2

10Puis inscrire la réponse

Page 14: traitement et analyse des données

14

CODIFICATION DES QUESTIONNAIRESExemples pratiques

Module 5_socio eco

Questions ouvertes  Quels objectifs en termes de production espérez-vous atteindre à l’issue de la prochaine campagne agricole ? …………………………………………………………………..………………………………………………………………………………………………………………………………………………………………

Le codage est effectué lors de l'opération de dépouillement après avoir cerner les réponses et les grouper, après quoi un code leur sera accordé.

CODIFICATION DES QUESTIONNAIRESExemples pratiques

Questions ouvertes 

CODIFICATION DES QUESTIONNAIRESExemples pratiques

Page 15: traitement et analyse des données

15

Exemple : si, pour un échantillon de 50 individus, les réponses à la question se présentent comme suit : Augmenter la production : 25 individus Améliorer la qualité : 10 individus Accroître la part de la production biologique : 8

individus Diverses réponses différentes pour les 7 restants

Le code sera par exemple le suivant : 1. Augmenter la production, 2. Améliorer la qualité, 3. Accroître la part de la production biologique, 4. autres

Questions ouvertes 

CODIFICATION DES QUESTIONNAIRESExemples pratiques

Éclater en deux diapo

Page 16: traitement et analyse des données

16

DÉPOUILLEMENT ET TRANSCRIPTION SUR TABLEAU DES DONNÉES

DépouillementEnsemble d'opérations de vérification et d'épuration des questionnaires, de finalisation de la codification

Cas simples d'échantillon réduit

un traitement manuel permet de faire ressortir les résultats et leur interprétation.

Cas pratiques de grandes enquêtes

Le dépouillement

informatique est une nécessaire.

Page 17: traitement et analyse des données

17

DÉPOUILLEMENT ET TRANSCRIPTION SUR TABLEAU DES DONNÉES

Transcription sur tableau des données Le tableau de données est une matrice (tableau à double entrée) constitué de n lignes (individus) et m colonnes (caractères)

CaractèresN Individus

V1 V2 … Vj …..

Vm M caractères

Ind. 1…….Ind. i…..Ind. n

Page 18: traitement et analyse des données

18

DÉPOUILLEMENT ET TRANSCRIPTION SUR TABLEAU DES DONNÉES

Transcription sur tableau des données Exemple simple CaractèresIndividus

Age**(Années)

Activité principale*

Superficie (Ha)**

……

1 65 20 0,4 …2 40 21 1,5 …3 30 21 0,8 …4 83 21 2,0 ………. ……. ……. ……. …

* Variables qualitative, ** Variables quantitatives

Page 19: traitement et analyse des données

19

DÉPOUILLEMENT ET TRANSCRIPTION SUR TABLEAU DES DONNÉES

Transcription sur tableau des données

Saisie et apurement des données

Après la saisie des données, procéder à la vérification des erreurs et de la validité des données introduite dans une opération d'apurement.

L'apurement éviterait d'obtenir des résultats aberrants dont l'interprétation pourrait induire le spécialiste en erreur.

Page 20: traitement et analyse des données

20

Individus

<

Caractères

<

EXEMPLE DE TABLEAU DE DONNÉES : PROGRAMME ROSELT/OSS (EXTRAIT DU TABLEAU DE DONNÉES SUR EXCEL DE L'ENQUÊTE NIVEAU 2 (UE)

Cas de l’observatoire de MH, IRA, Tunisie

Page 21: traitement et analyse des données

21

EXEMPLE DE TABLEAU DE DONNÉES TABLEAU FORMAT SPSS (Cas de l’observatoire de MH, IRA, Tunisie)

Individus

<

Caractères<

Page 22: traitement et analyse des données

22

TRAITEMENT ET ANALYSE DES DONNÉES

Quand l’opération de T&A des données pourra être entamée ?

Après avoir été rassuré de la fiabilité du tableau à la suite de l’apurement.

Dans la pratique des itérations entre dépouillement et traitement des données s'avèrent parfois nécessaires (résultats douteux ou incompatibles)

Donc, des corrections ultimes sont apportées dans le tableau de données.

Module 5_socio eco

Page 23: traitement et analyse des données

23

TRAITEMENT ET ANALYSE DES DONNÉES

Deux grandes catégories de T&A des données (selon les besoins de l'approche méthodologique adoptée) :

Analyse générale ou tri à plat

Analyses complexes exigeant la maîtrise de la modélisation et/ou de l'économétrie

Module 5_socio eco

Page 24: traitement et analyse des données

24

TRAITEMENT ET ANALYSE DES DONNÉES

Analyse générale ou tri à plat

Module 5_socio eco

Deux grandes familles d'analyse :

Cas des variables qualitatives

Cas des variables quantitatives

Page 25: traitement et analyse des données

25

TRAITEMENT ET ANALYSE DES DONNÉES

Analyse de fréquences

Module 5_socio eco

Fréquence : Nombre de fois le cas est présent

Pourcentage :

Pourcentage cumulé : Somme des pourcentages précédents

100)néchantillol’ de totalNombre

présent est cas le fois de Nombre( X

Cas des variables qualitatives

Page 26: traitement et analyse des données

26

TRAITEMENT ET ANALYSE DES DONNÉES

Module 5_socio eco

Exemple : Résultats des analyses des fréquences de la variable « niveau d'instruction »

VariablesFréquence Pourcentage

Pourcentage Cumulé

Analphabète 9 36.0 36.0Koutteb (Ecole coranique) 3 12.0 48.0

Ecole primaire 11 44.0 92.0Niveau secondaire 2 8.0 100.0

Total 25 100.0

Page 27: traitement et analyse des données

27

TRAITEMENT ET ANALYSE DES DONNÉES

Module 5_socio eco

Représentations graphiques

Histogramme de fréquences avec la courbe de la loi normale

Secteurs ou Fromage

Page 28: traitement et analyse des données

28

TRAITEMENT ET ANALYSE DES DONNÉES

Analyses descriptives

Module 5_socio eco

Cas des variables quantitativesJe pense qu’il est important de faire une diapo pour chaque param. Avec formule et intérêt

Page 29: traitement et analyse des données

29

TRAITEMENT ET ANALYSE DES DONNÉES

Analyses descriptives

Module 5_socio eco

Cas des variables quantitatives

La moyenne : la moyenne arithmétique, que l’on se contente généralement d’appeler moyenne tout court, se calcule de la manière suivante :

1 2 3 ... ....i nX X X X XX

n

où X1 , X2 , X3, …, Xn sont les valeurs successives de la variable envisagée, et n le nombre total d’observations.

iXXn

X se lit "x barre"

Page 30: traitement et analyse des données

Module 5_socio eco 30

Distribution de fréquences

1 1 2 2 .... ....i i n nF X F X F X F XXn

i iF X

Xn

Exemple : Soient les âges observés dans une classe d’école primaire. L’âge moyen des enfants sera de

1*8 14*9 11*10 3*11 1*1230

X

La moyenne = 9,6 ans ou 9ans 8mois.Il y a en effet 30 observations au total, correspondant à l’effectif des 30 élèves de la classe.

Page 31: traitement et analyse des données

Module 5_socio eco 31

La variance et écart-type : la variance est égale à la somme des carrés des écarts à la moyenne rapportée à l’effectif de la population. L’écart-type est la racine carrée de la variance.

22 ( )

ou n-1f x xn

2( ) ou n-1f x xn

L’écart-type :

La variance.

Page 32: traitement et analyse des données

32

La médiane : la médiane est le paramètre qui divise la distribution en deux parties égales. Dans une distribution simple, si le nombre d’observations est impair, il n’y a aucun calcul à effectuer. Soit, pour 7 entreprises d’une région donnée, les effectifs de leurs personnels respectifs : 15 25 66 74 87 194 432.La médiane de la distribution est la 4iéme observation, soit 74. De part et d’autre de 74, en effet, il y a 3 observations. Si le nombre d’observations est pair la médiane correspond à la moyenne arithmétique des deux observations centrales.

Page 33: traitement et analyse des données

33

TRAITEMENT ET ANALYSE DES DONNÉES

Module 5_socio eco

Exemple : Analyse descriptive de 3 variables quantitatives :a. Tableau de données et commande des analyse sur SPSS

Variables analysées Analyses demandées

Page 34: traitement et analyse des données

34

TRAITEMENT ET ANALYSE DES DONNÉES

Module 5_socio eco

b. Tableau des résultats des analyses descriptives (ha)

  Min Max Somme Moyenne Écart type Médiane

Superficie totale des terres privées 2 80 819 23 20 20Superficie arboricole totale 0 52 503 14 13 10Superficie totale des cultures annuelles

0 74 420 12 17 5

Page 35: traitement et analyse des données

3535

Fin de la présentation

Merci pour votre attention

Page 36: traitement et analyse des données

36

Pause-café

Module 5_socio eco

Page 37: traitement et analyse des données

Module 5_socio eco 3737

TRAVAUX DE GROUPES DES PARTICIPANTS:

EXERCICE CODIFICATION, SAISI ET ANALYSE DES

DONNÉES QUALITATIVES ET QUANTITATIVES

Travail en 2 groupes

Page 38: traitement et analyse des données

38

Termes de références pour les travaux de groupes

Objectif Exercice et apprentissage des participants à la codification, le saisi et l’analyse des données qualitatives et quantitatives

Durée : 45 minutes

Page 39: traitement et analyse des données

39

ORGANISATION Les participants sont organisés en 2 groupes de travail. Le support est constitué des questionnaires de l'exercice du

module 4 (il faut insister lors de l'exercice du M4 sur les questions V et IX dans l'extrait du questionnaire, de bien soigner ces parties qui devront servir l'exercice du M5 en continuation).

Groupe 1 Le groupe 1 est chargé de la codification, saisi et analyse des

variables qualitatives. Les supports sont constitués par l'ensemble des

questionnaires remplis lors du module 1, Il prendra comme exercice la question :

V. IDENTIFICATION DE L’ACTIVITE PRINCIPALE (PAGES 2 ET 3 DANS LE QUESTIONNAIRE)

Page 40: traitement et analyse des données

40

Groupe 2

Le groupe 2 est chargé de la codification, saisi et analyse des variables quantitatives.

Les supports sont constitués par l'ensemble des questionnaires remplis lors du module 4,

Il prendra comme exercice la question :IX. FORMATION DES REVENUS DE L’UE

(PAGES 5 ET 6 DANS LE QUESTIONNAIRE)

Page 41: traitement et analyse des données

41

TÂCHES DE CHAQUE GROUPE

Rassemblement des questionnaires auprès des binômes,

Extrait des pages correspondantes aux travaux du groupe (groupe 1 pages 2 et 3, groupe 2 : pages 5 et 6)

Dépouillement des données

Vérification des questionnaires, (bien remplis, données manquantes, retour aux enquêtés, etc.)

Page 42: traitement et analyse des données

42

Vérification des codes pré établis et codage des questions ouvertes éventuellement

Constitution du tableau des données et saisi des informations

Analyses pertinentes par type de variables

Evaluation des résultats obtenus

Restitution de l'exercice, enseignements tirés, difficultés etc.

Valorisation du document d'appui relatif aux résultats obtenus par l'équipe de l'ira pour le cas de l'observatoire de menzel habib relatif aux questions traitées.

Page 43: traitement et analyse des données

4343

Fin de la présentation

Merci pour votre attention

Page 44: traitement et analyse des données

Module 5_socio eco 4444

RESTITUTION PAR LES RAPPORTEURS DES TRAVAUX DE

GROUPES

Page 45: traitement et analyse des données

Module 5_socio eco 4545

DISCUSSION GÉNÉRALE :

DIFFICULTÉS, LEÇONS TIRÉES