Rapport de mission - Afrique Centrale · Le présent rapport fait état, dans une seconde partie,...
Transcript of Rapport de mission - Afrique Centrale · Le présent rapport fait état, dans une seconde partie,...
RAPPORT DE FORMATION
Contrat de Désendettement et de Développement
Programme d’Appui à la Recherche – 2013
Techniques de collecte,
de traitement statistique
et d’analyses factorielles multivariées,
avec le logiciel R, de données
issues d’expérimentations agricoles
Formations du 3 au 7 juin et du 9 au 13 septembre
Michel Ndoumbé Nkeng, Irad, Douala, Cameroun
Christian Cilas, Cirad, Montpellier, France
Ce rapport a été élaboré dans le cadre du Contrat de Désendettement
et de Développement - Programme d'Appui à la Recherche par
Michel Ndoumbé Nkeng et Christian Cilas.
Formations du 3 au 7 juin et du 9 au 13 septembre 2013.
Techniques de collecte, de traitement statistique et d’analyses
factorielles multivariées, avec le logiciel R, de données issues
d’expérimentations agricoles.
© Cirad, Direction régionale en Afrique Centrale, 2013.
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues
d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M. Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
3
Sommaire
INTRODUCTION .............................................................................................................. 4
PREMIERE SESSION DE FORMATION – JUIN 2013 .................................................... 5
Objectifs de la formation .......................................................................................................... 5
Déroulement de l’atelier............................................................................................................ 5
> Les participants ................................................................................................................. 5
> Démarche pédagogique..................................................................................................... 5
Résultats obtenus ..................................................................................................................... 6
Conclusion et recommandations ............................................................................................. 6
DEUXIEME SESSION DE FORMATION – SEPTEMBRE 2013 ...................................... 8
Objectifs de la formation .......................................................................................................... 8
Déroulement de l’atelier............................................................................................................ 8
> Les participants ................................................................................................................. 9
> Démarche pédagogique..................................................................................................... 9
Résultats obtenus ..................................................................................................................... 9
Conclusion et recommandations ........................................................................................... 10
ANNEXES ...................................................................................................................... 11
Annexe 1. Liste des participants à la première session de formation ................................ 12
Annexe 2. Chronogramme détaillé du premier atelier .......................................................... 13
Annexe 3. Liste des participants à la deuxième session de formation ............................... 14
Annexe 4. Chronogramme détaillé du second atelier........................................................... 15
Annexe 5. Liste des abréviations ........................................................................................... 16
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues
d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M. Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
4
Introduction
Il est généralement reconnu que la recherche est la pierre angulaire du développement
technologique. Dans cette recherche, celle agronomique est l’un des principaux facteurs de
l’amélioration de la production alimentaire mondiale des trente dernières années. Au Cameroun
comme dans tous les pays en voie de développement, les progrès technologiques en agriculture
sont, en grande partie, tributaires des résultats de la recherche agronomique. Ces progrès
contribuent à l’accroissement de la production alimentaire et des revenus des paysans,
participant ainsi à la lutte contre la pauvreté.
La recherche agronomique procède par expérimentation ou par des enquêtes dans la recherche
des solutions aux problèmes de production. Les données ainsi collectées doivent ensuite être
analysées et interprétées. Malheureusement, du fait de leur capacité limitée à effectuer les
analyses statistiques de ces données collectées sur le terrain, les chercheurs ont assez souvent
beaucoup de mal à publier les résultats des travaux de recherche dans les revues scientifiques.
Dans le but d’assurer une mise à niveau de ces scientifiques en matière de maîtrise d’utilisation
de logiciel de traitement et d’analyses statistiques des données, l’équipe de coordination des
projets C2D–PAR a organisé une première session de formation intitulée « Techniques de
collecte et de traitement statistique », avec le logiciel R, des données issues d’expérimentations
agricoles ». Le présent rapport fait état, dans une première partie, du déroulement des travaux
et de quelques recommandations formulées lors de cette session.
Suite à ce premier atelier, une des recommandations formulées était l’organisation d’une autre
session de formation, portant sur des modules statistiques plus avancés. C’est dans ce cadre
que s’est inscrit une deuxième session de formation du 9 au 13 septembre 2013.
Outre la présence du biostatisticien Irad, les participants ont également bénéficié de la présence
d’un biostatisticien senior du Cirad, avec qui l’atelier a été co-animé.
Le présent rapport fait état, dans une seconde partie, du déroulement des travaux et de
quelques recommandations formulées à l’issue de cette seconde session de formation.
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues
d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M. Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
5
Première session de formation - juin 2013
Objectifs de la formation L’objectif général de la formation était de fournir aux chercheurs impliqués, les outils
méthodologiques nécessaires pour affiner leurs protocoles d’essais ou d’enquête et mieux traiter
les données qui en sont issues.
De manière spécifique, il s’est agi de :
Parcourir les principes généraux d’expérimentation agricole et d’enquête.
Effectuer et interpréter quelques techniques classiques d’analyses statistiques.
Familiariser les chercheurs à l’utilisation d’un logiciel spécialisé d’analyses statistiques (R).
Déroulement de l’atelier L’atelier s’est déroulé durant cinq jours consécutifs, du 3 au 7 juin 2013. Les horaires de travail
allaient de 9h00 à 17h00. Chacune des journées était ponctuée par deux pauses (10h30 –
11h00, 13h00-14h00).
La première journée de la formation, présidée par le directeur général adjoint de l’Irad
accompagné du représentant du directeur régional du Cirad, a commencé par un partage des
termes de référence. Cet exercice s’est effectué en deux phases successives :
Présentation de l’orientation et contenu de l’atelier.
Présentation de la démarche pédagogique.
A partir du deuxième jour, les travaux commençaient par une restitution de la journée
précédente, faite par les participants.
> Les participants Il y a eu 17 participants, représentant neuf projets, notamment les projets « Plantain »,
« Manioc », « Pomme de terre », « Sorgho », « Riz », « Légumineuses », « Horticulture »,
« Agroforesterie », et « Volaille » (cf. figure 1). 18 % des participants étaient de sexe féminin.
L’absence des membres du projet « Agrosystèmes du Nord » a été déplorée.
La modération et l’animation de l’atelier ont été assurées par Michel Ndoumbé Nkeng,
biométricien. (cf. liste des participants en annexe 1)
> Démarche pédagogique Pendant la formation, le consultant a alterné exposés théoriques et travaux pratiques. Au cours
des travaux pratiques, les participants ont travaillé chacun sur leur poste. Les participants ont
été responsabilisés par projet pour prendre des notes afin d’élaborer le compte rendu le
lendemain et de s’assurer du respect du timing. Les exposés des restitutions journalières ont
servi au consultant de moyen d’évaluation progressive du degré de maîtrise des connaissances
acquises. Les divers exposés du consultant ont été progressivement remis aux participants.
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues
d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M. Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
6
Une évaluation a permis un examen de la formation à la fin de la session. Elle a consisté à
emmener les formés à porter un jugement sur la pertinence des thèmes, la démarche
pédagogique et le degré d’assimilation. En fin de formation, des attestations ont été remises aux
participants.
Résultats obtenus À l’issue de cet atelier, les résultats suivants ont été obtenus :
Les participants se sont approprié les notions de principes généraux d’expérimentation et
d’enquête.
Les participants se sont davantage familiarisés à l’utilisation du logiciel d’analyses
statistiques R.
Les participants des sont familiarisés aux notions de traitement de base des données,
notamment :
- Mise en forme et apurement des données.
- Transfert des données vers le logiciel R.
- Statistique descriptive (techniques graphiques et résumés numériques).
- Analyse de régressions.
- Analyse de variance et tests de comparaisons des moyennes.
- Analyse de covariance.
Conclusion et recommandations Au vu des résultats de l’évaluation par les participants, il est possible d’affirmer que les travaux
de cet atelier se sont bien déroulés. L’ambiance était cordiale et détendue. Les 6 objectifs liés à
cette formation ont été atteints. Les participants ont jugé les méthodes pédagogiques très
satisfaisantes. Ils ont loué le professionnalisme du formateur dont l’approche était active,
participative et instructive. Ils ont, pour la plupart, apprécié le fait d’avoir insisté sur l’étape de
mise en forme des données avec MS EXCEL, pratique qui leur permettait d’avoir un aperçu
global des données, préalable aux analyses statistiques proprement dites. La disponibilité d’une
connexion Internet dans la salle de formation a été grandement appréciée.
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues
d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M. Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
7
Certains participants ont néanmoins eu à déplorer l’environnement de travail, qu’ils n’ont pas
trouvé adéquat tant au niveau de l’espace (salle jugée petite pour le nombre de participants) que
de la climatisation. D’autres participants ont estimé que le formateur était par moments très
rapide dans les explications.
Du fait de la proximité du lieu de formation avec les bureaux des chercheurs locaux, certains ont
souvent dus être sollicités pour d’autres services.
De façon générale, les participants ont émis le vœu que ce genre d’expérience puisse se
renouveler.
A l’issue de cet atelier, les recommandations suivantes peuvent être formulées :
Pour capitaliser les notions acquises au cours de cette formation, il serait nécessaire qu’à
court terme, un autre atelier soit organisé avec les mêmes participants, pour aborder des
modules plus avancés, notamment ceux relatifs aux techniques d’analyses factorielles
multivariées (analyses en composantes principales, analyse factorielle des
correspondances, classification ascendante hiérarchique et analyse discriminante) et/ou au
modèle linéaire généralisé.
Il serait souhaitable que le prochain atelier se tienne hors des locaux de l’Irad, voire hors de
la ville de Yaoundé, pour que tous les participants puissent pleinement se consacrer à la
formation proprement dite.
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues
d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M. Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
8
Deuxième session de formation -
septembre 2013
Objectifs de la formation L’objectif général de cette deuxième session de formation était de familiariser les chercheurs à
la pratique des techniques d’analyses factorielles multivariées afin de mieux valoriser les
données issues d’enquêtes ou d’expérimentations agricoles.
De manière spécifique, il s’est agi de :
Parcourir les principes généraux d’expérimentation agricole et d’enquête.
Effectuer et interpréter quelques techniques classiques d’analyses statistiques.
Familiariser les chercheurs à l’utilisation d’un logiciel spécialisé d’analyses statistiques, R.
Déroulement de l’atelier L’atelier s’est déroulé durant cinq jours consécutifs, du 9 au 13 septembre 2013. Les horaires de
travail allaient de 9h00 à 17h00. Chacune des journées était ponctuée par deux pauses (10h30
– 11h00, 13h00-14h00).
La première journée de la formation, co-présidée par le directeur régional du Cirad et le
directeur général adjoint de l’Irad, a commencé par un partage des termes de référence, sur le
même principe que celui suivi lors de la première formation.
Par la suite, le déroulement de cet atelier s’est reposé les mêmes bases que celles du
précédent atelier ayant eu lieu en juin.
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues
d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M. Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
9
> Les participants Il y a eu 12 participants, représentant les dix projets C2D-PAR, notamment les projets
« Plantain », « Manioc », « Pomme de terre », « Sorgho », « Riz », « Légumineuses »,
« Horticulture », « Agroforesterie », « Volaille », et « Agrosystèmes du Nord » (cf. figure 1), avec
25% des participants du genre féminin.
La formation a été assurée par Dr Christian Cilas (biométricien – Cirad) et Dr Michel Ndoumbe
Nkeng (biométricien – Irad). (cf. liste des participants en annexe 3).
> Démarche pédagogique La démarche pédagogique de cette formation est en tout point identique à celle de la formation
précédente (cf. page 5 ci-dessus).
Résultats obtenus À l’issue de cet atelier, les participants sont capables de :
Effectuer et interpréter une analyse en composantes principales (Principal Component
Analysis).
Effectuer et interpréter une analyse des correspondances (Correspondance analysis).
Effectuer et interpréter une analyse discriminante (Discriminant analysis).
Effectuer et interpréter une analyse de classification ascendante hiérarchique (Cluster
analysis).
Les participants se sont également davantage familiarisés à l’utilisation du logiciel d’analyses
statistiques R, logiciel statistique libre et gratuit.
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues
d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M. Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
10
Conclusion et recommandations Tout comme lors de l’atelier tenu au mois de juin, il est possible d’affirmer au vu des résultats de
l’évaluation par les participants, que les travaux de cet atelier se sont bien déroulés ; l’ambiance
était cordiale et détendue ; les objectifs liés à cette formation ont été atteints. Les participants
ont globalement trouvé l’environnement de travail calme et convivial. Les méthodes
pédagogiques et le contenu de la formation ont été jugés très satisfaisants.
Certains participants ont néanmoins eu à déplorer le cadre de travail qu’ils ont trouvé restreint,
avec une connexion Internet pas toujours satisfaisante. D’autres participants ont estimé que,
lors des exposés théoriques, les formateurs étaient par moments très rapides. Pour d’autres
encore, la partie du cours sur l’analyse spatiale leur a paru superflue.
Les formateurs ont exprimé leur disponibilité à répondre aux sollicitations éventuelles des
participants.
A l’issue de cet atelier, la principale recommandation formulée est que les participants
présentent à leurs équipes respectives et aux autres membres des projets ce qu’ils ont appris
durant ces sessions de formation. Ceci les amènerait, non seulement à revisiter de fond en
comble les notions acquises, mais aussi à partager ces connaissances avec leurs autres
collègues.
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues
d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M. Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
11
Annexes
1. Liste des participants à la première session de formation.
2. Chronogramme détaillé du premier atelier.
3. Liste des participants à la deuxième session de formation.
4. Chronogramme détaillé du second atelier.
5. Liste des abréviations.
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M.
Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
12
Annexe 1. Liste des participants à la première session de formation
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M.
Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
13
Annexe 2. Chronogramme détaillé du premier atelier
Horaires Journée
03.06.2013 04.06.2013 05.06.2013 06.06.2013 07.06.2013
9H00 -
10H30
Inscription des participants.
Partage des TDR.
Désignation des rapporteurs.
Mot DR/Cirad.
Mot d’ouverture (DG/Irad).
Restitution jour 1.
Principes généraux
d’expérimentation.
Rappel de quelques
dispositifs expérimentaux
classiques.
Restitution jour 2.
Exercices pratiques
Mise en forme des
données et transfert
vers le logiciel R.
Restitution jour 3.
Exercices pratiques
Test d’indépendance de
deux caractères
qualitatifs.
Restitution jour 4.
Exercices pratiques
Statistique inférentielle:
Comparaison des
moyennes de 2
échantillons indépendants.
10H30 –
11H00 Pause-café Pause-café Pause-café Pause-café Pause-café
11H00 –
13H00
Présentation générale de la
problématique de
l’harmonisation du système de
traitement des données issues
des essais.
Rappel de quelques
dispositifs expérimentaux
classiques (suite).
Exercices pratiques
Statistique descriptive:
Techniques graphiques.
Exercices pratiques
Statistique inférentielle:
Comparaison des
moyennes de 2
échantillons
indépendants.
Exercices pratiques
Statistique inférentielle:
Comparaison des
moyennes de plus de 2
échantillons (ANOVA 1).
13H00 –
14H00 Pause déjeuner Pause déjeuner Pause déjeuner Pause déjeuner Pause déjeuner
14H00 –
17H00
Installation et présentation du
logiciel spécialisé d’analyses
statistiques R.
Exercices pratiques
Elaboration d’un dictionnaire
des données et d’un masque
de saisies.
Exercices pratiques
Statistique descriptive :
Résumés numériques.
Exercices pratiques
Statistique inférentielle :
Analyse de corrélation et
de régression linéaire.
Analyse des résidus.
Synthèse formation.
Evaluation de l’atelier.
Fin de l’atelier.
NB : Tous les exercices pratiques se feront avec le logiciel R.
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M.
Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
14
Annexe 3. Liste des participants à la deuxième session de formation
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M.
Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
15
Annexe 4. Chronogramme détaillé du second atelier
Horaires Journée
03.06.2013 04.06.2013 05.06.2013 06.06.2013 07.06.2013
9H00 -
10H30
Inscription des participants.
Partage des TDR.
Désignation des rapporteurs.
Mot DR/Cirad.
Mot d’ouverture (DG/Irad).
Restitution jour 1.
Analyse bivariée: Analyse
des corrélations.
Restitution jour 2.
Test d’indépendance de deux
caractères qualitatifs.
Analyse factorielle des
correspondances (AFC).
Restitution jour 3.
Classification
ascendante hiérarchique
(CAH).
Restitution jour 4.
Introduction aux
techniques d’analyse
spatiale
(notions de
géostatistique).
10H30 –
11H00 Pause-café Pause-café Pause-café Pause-café Pause-café
11H00 –
13H00
Rappel des notions de
Statistique descriptive.
Analyse en composantes
principales (ACP).
Exercices pratiques
Analyse factorielle des
correspondances (AFC).
Exercices pratiques
Classification
ascendante hiérarchique
(CAH).
Synthèse formation.
Evaluation de l’atelier.
Fin de l’atelier.
13H00 –
14H00 Pause déjeuner Pause déjeuner Pause déjeuner Pause déjeuner Pause déjeuner
14H00 –
17H00
Exercices pratiques
Rappel Statistique descriptive :
techniques graphiques et
résumés numériques.
Exercices pratiques
Analyse en composantes
principales (ACP).
Exercices pratiques
Analyse factorielle des
correspondances multiples
(ACM).
Introduction à l’analyse
discriminante (AD).
NB : Tous les exercices pratiques se feront avec le logiciel R.
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues
d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M. Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
16 16
Annexe 5. Liste des abréviations
ACP, Analyse en composantes principales.
ACM, Analyse factorielle des correspondances multiples.
AD, Analyse discriminante.
AFC, Analyse factorielle des correspondances.
ANOVA, Analyse de la variance.
C2D, Contrat de désendettement et de développement.
CAH, Classification ascendante hiérarchique.
CIRAD, Centre de coopération internationale en recherche agronomique pour le développement.
DG, Directeur général.
DR, Directeur régional.
IRAD, Institut de recherche agricole pour le développement.
PAR, Programme d’appui à la recherche.
SAF, Système agroforestier.
TDR, Termes de références.
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues
d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M. Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
17 17
NOTES
Formation - Techniques traitement statistique et d’analyses factorielles multivariées, avec le logiciel R, de données issues
d’expérimentations agricoles. Sessions 3-7 juin et 9-13 septembre 2013. M. Ndoumbé Nkeng (Irad), C. Cilas (Cirad).
18 18
Direction régionale Afrique centrale
Rue Joseph Elig Essono Balla
Yaoundé, Cameroun
Tél. : +237 22 21 25 41
www.cirad.fr