ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e...
Transcript of ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e...
ENSAE – Ecole Nationale de la Statistique
et de l’Analyse Economique
Formation continue
Statistique descriptive Analyse des données multi-dimensionnelles
Modélisation Enquête et sondage Séries temporelles Logiciels statis-
tique Data Science Cartographie Modélisation économique
Méthodes micro économétrique d'évaluation d'impact web-craping (extaction de données sur le web) Modélisation en équilibre Général Calculable Initiation à la cartographie Thématique Programmation financière Panorama du Big Data Modèles VAR et VECM Python intermédiaire Excel intermédiaire Machine learning Micro simulation Python initiation R intermédiaire Stata initiation Excel initiation Python avancé VB sous Excel Excel avancé Data mining Text mining R initiation Phil carto R avancé Arc-GIS Spark Julia
Conception d'enquête, élaboration de questionnaire, le secret statistique Statistique 2 : description et mesure de la liaison entre deux variables
Statistique et méthodes de régression pour données spatiales Méthodes de régression pour données qualitatives
Panorama des méthodes d’analyse des données Correction de la non-réponse dans les enquêtes
Régression linéaire et analyse de la variance Statistique 1 : introduction à la statistique Analyse des séries temporelles avec Excel Modèles ARMA, ARMAX et ARCH-GARCH
Panorama des méthodes de sondages Les indices : construction et utilisation Analyse des séries temporelles avec R Désaisonnaliser une série temporelle
Econométrie des données de panel Statistique descriptive avec Excel
Analyse des données avec Spad Statistique non paramétrique Statistique descriptive avec R
Analyse des données avec R Méthodes de redressement
Techniques de scoring Sondages avec R
Deep learning Echantillonnage
Catalogue 2019/2020
ANSD : Agence Nationale de la Sta-tistique et de la Démographie ENSAE : Ecole Nationale de la Statis-tique et de l’Analyse Economique
SOMMAIRE
Statistique descriptive
Analyse des données multidimensionnelles
Modélisation
Enquête et sondage
Séries temporelles
Logiciels statistiques
Data Science
Cartographie thématique
Modélisation économique
ANSD : Agence Nationale de la Statistique et de la Démographie ENSAE : Ecole Nationale de la Statistique et de l’Analyse Economique
Renseignements pratiques
07
13
17
23
31
37
57
67
71
76
ENSAE Ecole Nationale de la Statistique
et de l’Analyse Économique
Formation continue
Statistique 1 : introduction à la statistique Statistique 2 : description et mesure de la liaison entre deux variables
Les indices : construction et utilisation Statistique descriptive avec Excel
Statistique descriptive avec R
ANSD : Agence Nationale de la Sta-tistique et de la Démographie ENSAE : Ecole Nationale de la Statis-tique et de l’Analyse Economique
Stati
stiq
ue
des
crip
tive
Panorama des méthodes d’analyse des données Analyse des données avec Spad
Analyse des données avec R
An
alys
e d
es
do
nn
ées
mu
lti-
dim
ensi
on
nel
les
Régression linéaire et analyse de la variance Méthodes de régression pour données qualitatives
Statistique et méthodes de régression pour données spatiales Économétrie des données de panel
Statistique non paramétrique
Mo
dél
isati
on
Conception d'enquête, élaboration de questionnaire Le secret statistique: principes et pratiques
Echantillonnage Panorama des méthodes de sondages
Méthodes de redressement Correction de la non-réponse dans les enquêtes
Sondages avec R Enq
uêt
e et
So
nd
age
Analyse des séries temporelles avec Excel Analyse des séries temporelles avec R Désaisonnaliser une série temporelle
Modèles ARMA, ARMAX et ARCH-GARCH Modèles VAR et VECM Sé
ries
tem
po
relle
s
p. 08 p. 09 p. 10 p. 11 p. 12
…………………………………………... …………………….. ……………………
……………………..
……………………………………………………………….
p. 14 p. 15 p. 16
………………………………………………………………………………………………………….
p. 18 p. 19 p. 20 p. 21 p. 22
……………………………………………………………………………………………………………………………………………………
p. 24 p. 25 p. 26 p. 27 p. 28 p. 29 p. 30
………………………………………………………………………………………………………….
p. 32 p. 33 p. 34 p. 35 p. 36
ENSAE Ecole Nationale de la Statistique
et de l’Analyse Économique
Formation Continue
Rocade Fann Bel - air Cerf - volant BP 116 Dakar RP Sénégal
Rocade Fann Cerf-volant. BP 116 RP,, Dakar
Logiciels
Statisti
qu
es
Data
Science
C
artograp
hie
Thém
atiq
ue
Mo
délisati
on
Econ
om
iqu
e
Panorama du Big Data Panorama des méthodes de Data mining Méthodes avancées de Data Mining Machine learning Deep learning Text mining web-scraping (extraction de données sur le web) Techniques de scoring
Modélisation en équilibre Général Calculable Méthodes micro économétriques d’évaluation d’impact Programmation financière
Généralités sur la cartographie Thématique La préparation d’un fond de carte (PHILDIGIT) La réalisation de cartes thématiques
Construire des tableaux de bord et gérer vos données avec Excel
Créer un programme personnalisé avec Excel et le VBA
R initiation, intermédiaire, avancé
Python initiation, intermédiaire, avancé
Cspro/ Survey Solution/ ODK Collect
Stata
GAMS
SPSS
Eviews
Hadoop
Spark
……………………… ……………………… ……………………… ……………………… ……………………… ……………………… ……………………… ………………………
…………………………
…………………………
…………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………
…………………… …………………… …………………….
……………………. ……………………. …………………….
p. 58 p. 59 p. 60 p. 61 p. 62 p. 63 p. 64 p. 65
p. 38
p. 39
p. 40
p. 43
p. 46
p. 49
p. 50
p. 51
p. 52
p. 53
p. 54
p. 68 p. 69 p. 70
p. 72 p. 73 p. 74
STATISTIQUE DESCRIPTIVE
Statistique 1 : introduction a la statistique
Statistique 2 : description et mesure de la liaison entre deux variables
Les indices : construction et utilisation
Statistique descriptive avec Excel
Statistique descriptive avec R
1
2
3
4
5
ST
AT
IST
IQU
E D
ES
CR
IPT
IVE
Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-
tion des connaissances, cette formation alterne expose s the oriques et applications
pratiques / cas concrets / travaux sur ordinateur.
Statistique 1 : introduction à la statistique
Objectifs Maî triser les concepts de la statistique descriptive. Savoir re aliser des traite-
ments simples sur des donne es unidimensionnelles et pre senter les re sultats ob-
tenus a l’aide de tableaux, de graphiques et d’indicateurs nume riques.
Contenu Apprendre a organiser, traiter, analyser et pre senter l’information, tel est l’objet
de cette formation d’initiation a la statistique, construite a partir d’exemples pra-
tiques. La formation a une orientation pratique forte : les apre s-midis et la der-
nie re journe e sont consacre s a des e tudes de cas avec traitement de donne es a
l’aide d’Excel.
ST
AT
IST
IQU
E
DE
SC
RIP
TIV
E
Les concepts de la statistique
De finitions : population, unite statistique, variables, modalite s
Les diffe rents types de caracte res : caracte res qualitatifs et quantitatifs, variables
discre tes et continues
Construction de tableaux statistiques
Les graphiques
Variables qualitatives : diagramme en tuyaux d’orgue, diagramme circulaire
Variables quantitatives : diagramme en ba tons, histogramme, courbe cumulative
Autres repre sentations graphiques
Résumer l’information et choisir la caractéristique la plus appro-
priée
Caracte ristiques de position : moyenne arithme tique, me diane, mode, autres
moyennes, quantiles
Boî te a moustaches (box-plot)
Caracte ristiques de dispersion : variance et e cart-type, coefficient de variation, e cart
absolu me dian, e tendue, intervalles inter-quantiles
Étude de la concentration
Courbe de Lorenz, indice de Gini
Cas de synthèse (dernière journée)
Dure e 3 jours ou 21 heures
Niveau
Initiation
Déjeuner
offert
Logiciels utilise s
Excel
Repe res bibliographiques
Grais, B. (2003), Statistique
descriptive, Dunod, 3e me e di-
tion
Py, B. (2013), La statistique
sans formule mathématique:
comprendre la logique et maîtri-
ser les outils, Pearson, 3e me
e dition
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 7
Statistique 2 : description et mesure de la liaison entre deux
variables
Objectifs Re aliser des traitements simples sur des donne es bidimensionnelles.
Calculer des indicateurs permettant de mesurer la liaison entre deux variables.
Contenu Cette formation est un prolongement de la formation Statistique 1 et permet de
re aliser des traitements sur des donne es bidimensionnelles. La formation a une
orientation pratique forte, de nombreux exemples et exercices seront propose s
avec Excel.
ST
AT
IST
IQU
E
DE
SC
RIP
TIV
E
Cas de deux variables qualitatives
Les tableaux de contingence, distributions marginales et conditionnelles,
repre sentation graphique
Cas de deux variables quantitatives
Repre sentation graphique
L’ajustement line aire (droite de re gression), la covariance, le coefficient de
corre lation line aire
Cas de deux variables ordinales
Coefficient de corre lation de rang de Spearman
Cas des variables discrètes
La courbe de re gression
Cas d’une variable qualitative et d’une variable quantitative
Repre sentation graphique
Les moyennes et variances conditionnelles et marginales
L’analyse de variance a un facteur, le rapport de corre lation
Mise en œuvre des notions vues au cours de la formation au travers de diffe rentes
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 8
Prérequis Niveau de statistique correspondant a la formation Statistique 1 et connais-
sances de base d’Excel.
Dure e 3 jours ou 21 heures
Niveau
Initiation
Déjeuner
offert
Logiciels utilise s
Excel
Repe res bibliographiques
Grais, B. (1998), Me thodes sta-
tistiques, Dunod, 3e me e dition
Py, B. (2013), La statistique
sans formule mathématique:
comprendre la logique et maîtri-
ser les outils, Pearson, 3e me
e dition
Les indices : construction et utilisation
Objectifs Savoir bien utiliser des indices existants.
Savoir construire des indices correspondant aux besoins propres de l’utilisateur.
Contenu Les instituts de statistique diffusent re gulie rement une batterie importante
d’indices e conomiques comme l’indice des prix a la consommation ou l’indice de
la production industrielle. Par ailleurs, chacun peut e tre amene a construire des
indices qui lui sont propres de façon a synthe tiser une information foisonnante.
Cette formation vise a fournir une vision d’ensemble des principales questions
me thodologiques lie es a la construction des indices statistiques. Elle s’appuie sur
des exemples concrets pour montrer le type de questions qui se posent, en les re-
plaçant dans une proble matique plus ge ne rale. Des applications simples sur ta-
bleur comple tent la formation.
ST
AT
IST
IQU
E
DE
SC
RIP
TIV
E
Pourquoi et pour qui construit-on des indices ?
Les indices classiques
Différentes approches des indices: statistiques, axiomatiques ou
économiques
Le chaînage des indices, les changements de base
Quelques problèmes particuliers : données collectées, évolution
des produits, données manquantes, méthodes hédoniques…
Dure e 3 jours ou 21 heures
Niveau
Initiation
Déjeuner
offert
Logiciels utilise s
Excel
Repe res bibliographiques
Caillaud, A. (1998), Pour com-
prendre l’indice des prix, Insee
Me thode n°81-82
Berthier, J.P. (2005), Introduc-
tion a la pratique des indices
statistiques, Insee Document de
travail M0503
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 9
Prérequis Une connaissance ge ne rale des statistiques descriptives (formation Statistique
1 : introduction a la statistique).
Statistique descriptive avec Excel
Objectifs A l’issue de cette formation, les participants seront capables de : Calculer une suc-
cession de statistiques descriptives,
Re aliser les graphiques adapte s les plus courants
Contenu Cette formation est un prolongement de la formation Statistique 1 et permet de
re aliser des traitements sur des donne es bidimensionnelles. La formation a une
orientation pratique forte, de nombreux exemples et exercices seront propose s
avec Excel.
ST
AT
IST
IQU
E
DE
SC
RIP
TIV
E
Cas de deux variables qualitatives
Les tableaux de contingence, distributions marginales et conditionnelles,
repre sentation graphique
Cas de deux variables quantitatives
Repre sentation graphique
L’ajustement line aire (droite de re gression), la covariance, le coefficient de
corre lation line aire
Cas de deux variables ordinales
Coefficient de corre lation de rang de Spearman
Cas des variables discrètes
La courbe de re gression
Cas d’une variable qualitative et d’une variable quantitative
Repre sentation graphique
Les moyennes et variances conditionnelles et marginales
L’analyse de variance a un facteur, le rapport de corre lation
Atelier
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 10
Prérequis Connaissance des bases the oriques de la statistique descriptive (formations Statistique 1
et Statistique 2) et connaissances de base du logiciel Excel (formation Excel Initiation).
Dure e 3 jours ou 21 heures
Niveau
Initiation
Déjeuner
offert
Logiciels utilise s
Excel
Repe res bibliographiques
Grais, B. (1998), Me thodes sta-
tistiques, Dunod, 3e me e dition
Py, B. (2013), La statistique
sans formule mathématique:
comprendre la logique et maîtri-
ser les outils, Pearson, 3e me
e dition
Statistique descriptive avec R
Objectifs A l’issue de cette formation, les participants seront capables de : Calculer une succession de statistiques descriptives, Re aliser les graphiques adapte s les plus courants, Combiner diffe rentes analyses dans un me me programme.
ST
AT
IST
IQU
E
DE
SC
RIP
TIV
E
Manipulation de données Importer un fichier de donne es Discre tiser une variable continue Identifier et compter des donne es manquantes, identifier des individus atypiques Re cupe rer un sous ensemble de donne es (subset) Fusionner des donne es (merge) Agre ger des donne es Mettre en forme des donne es re pe te es (format long et wide)
Description d’une à deux variables Repre sentation des distributions statistiques univarie es E dition des caracte ristiques de position (moyenne, me diane, quantiles..) et de dispersion (variance, e cart-type….) Repre sentation d’une variable Repre sentation des distributions bi varie es sous forme de tableaux E dition d’indicateurs de liaison entre variables (statistique du khi-deux, V de Cramer, coefficient de corre lation line aire…) ODDS, ODDS ratio, Risque Ratio
Les graphiques avec R Diffe rents types de graphique propose s dans R : plot , ggplot Ajouts d’e le ments sur un graphique Exporter un graphique
Mettre en forme les résultats Re aliser une e bauche de quatre pages (objectifs, plan, tableau, graphique) ou d’une pre sentation, a l’aide des e le ments de statistiques pre sente s au cours de la formation
Dure e 3 jours ou 21 heures
Niveau
Initiation
Déjeuner
offert
Logiciels utilise s
R et Excel
Repe res bibliographiques
Everitt, B.S et Hothorn, T.
(2009), A handbook of Statisti-
cal analysis using R, 2nd edi-
tion, CRC Press
Muenchen, R.A. (2008), R for
SAS and SPSS users, Springer
Murrel, P. (2011), R graphics,
2nd edition, CRC press
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 11
Prérequis Connaissance des bases the oriques de la statistique descriptive (formations Statistique
1 et Statistique 2) et connaissances de base du logiciel R (formation Initiation a R) .
Contenu La formation est consacre e a la pre sentation des principales proce dures du logiciel R per-
mettant de faire de la statistique descriptive. Gra ce a plusieurs exercices d’applications,
les stagiaires seront amene s a mettre en œuvre ces proce dures afin de synthe tiser un ta-
bleau de donne es (re partition par sexe et CSP, classement des jeux vide os, re partition des
causes de mortalite par pays). Cette formation contient e galement quelques rappels en
statistique descriptive uni- et bi-varie e.
ANALYSE DE DONNÉES
MULTI-DIMENSIONNELLE
Panorama des me thodes d’analyse des donne es
Analyse des donne es avec Spad
Analyse des donne es avec R
1
2
3
AN
AL
YS
E D
ES
DO
NN
ÉE
MU
LT
I-
DIM
EN
SIO
NN
EL
LE
Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-
tion des connaissances, cette formation alterne expose s the oriques et applications
pratiques / cas concrets / travaux sur ordinateur.
Objectifs Pouvoir dialoguer avec les spe cialistes de ce domaine et comprendre leurs
conclusions.
Contenu
Introduction générale
Objectifs de l’analyse des données et panorama des méthodes
Les me thodes usuelles d’analyse d’un tableau de donne es
Analyse en Composantes Principales
Analyse des Correspondances Multiples
Classification d’individus
Les méthodes avancées d’analyse de données
L’analyse de tableaux multiples
Quelques logiciels d’analyse des donne es
Dure e 3 jours ou 21 heures
Niveau
Tout public
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 13
Prérequis Bonnes connaissances en statistique descriptive, maî trise du formalisme
mathe matique.
Panorama des méthodes d’analyse
des données AN
AL
YS
E D
ES
DO
N-
NÉ
E M
UL
TI-
DIM
EN
SIO
NN
EL
LE
Repe res bibliographiques
Escofier, B. et J. Pagès (2008),
Analyses factorielles simples et
multiples, Dunod
Bouroche J.M., Saporta G.
(2011), L’analyse des données,
PUF , que sais-je 1854
AN
AL
YS
E D
ES
DO
N-
NÉ
E M
UL
TI-
DIM
EN
SIO
NN
EL
LE
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 14
Dure e 3 jours ou 21 heures
Niveau
Initiation
Déjeuner
offert
Logiciels utilise s
SPAD et Excel
Repe res bibliographiques
Grais, B. (1998), Me thodes sta-
tistiques, Dunod, 3e me e dition
Py, B. (2013), La statistique
sans formule mathe matique:
comprendre la logique et maî -
triser les outils, Pearson, 3e me
e dition
Objectifs Savoir choisir et re aliser de façon autonome des analyses factorielles et classifications,
avec le logiciel Spad. Selon la proble matique et la nature des donne es, et en interpre ter
les re sultats.
Prérequis Bonnes Connaissance des bases the oriques de la statistique descriptive (formations
Statistique 1 et Statistique 2) et connaissances de base du logiciel Spad (formation Spad
Initiation). Notions de calcul matriciel souhaitables.
Contenu Les me thodes factorielles (analyse en composantes principales, analyse des corres-
pondances) permettent au travers de techniques de visualisation, de re sumer, struc-
turer et synthe tiser l’information contenue dans des masses volumineuses de don-
ne es. Les me thodes de classification permettent, en se parant les unite s statisques
d’une population en groupes homoge nes, de cre er une typologie : cre er ou identifier
des groupes d’individus, de zones ge ographiques ou encore d’entreprises par
exemple. Les stagiaires mettrons en œuvre ces me thodes au moyen de nombreux
exercices pratiques avec le logiciel Spad.
Analyse d’un nuage de points
Inertie. Recherche des axes principaux d’inertie. Composantes principales. Repre sentations
graphiques. Aides a l’interpre tation.
Analyse en composantes principales
Analyse du nuage des individus. Proprie te s des composantes principales. Analyse du nuage
des variables. Interpre tation des re sultats.
Analyse des correspondances
Nuages des profils-lignes et des profils-colonnes, la distance du khi-deux. Analyse des
nuages des profils. Liens entre les analyses. Interpre tation des re sultats.
Analyse des correspondances multiples
Analyse des correspondances sur le tableau disjonctif complet. Proprie te s de l’ACM. Ana-lyse du tableau de Burt.
Données manquantes
Introduction a la gestion des donne es manquantes dans les me thodes d’analyse factorielle
Classification
Classification ascendante hie rarchique : principe, strate gies d’agre gation, aides a l’interpre -tation. Me thodes de partitionnement : les me thodes des centres mobiles, les nue es dyna-miques. Classification mixte.
Analyse des données avec Spad
Objectifs Savoir choisir et re aliser de façon autonome des analyses factorielles et classifications, avec
le logiciel R (package FactoMineR), selon la proble matique et la nature des donne es, et en
interpre ter les re sultats.
Contenu Les me thodes factorielles (analyse en composantes principales, analyse des correspon-
dances) permettent au travers de techniques de visualisation, de re sumer, structurer et
synthe tiser l’information contenue dans des masses volumineuses de donne es. Les me -
thodes de classification permettent, en se parant les unite s statistiques d’une population en
groupes homoge nes, de cre er une typologie : cre er ou identifier des groupes d’individus, de
zones ge ographiques ou encore d’entreprises par exemple. Les stagiaires mettrons en
œuvre ces me thodes au moyen de nombreux exercices pratiques avec le logiciel R.
Analyse d’un nuage de points
Inertie. Recherche des axes principaux d’inertie. Composantes principales. Repre senta-
tions graphiques. Aides a l’interpre tation.
Analyse en composantes principales
Analyse du nuage des individus. Proprie te s des composantes principales. Analyse du
nuage des variables. Interpre tation des re sultats.
Analyse des correspondances
Nuages des profils-lignes et des profils-colonnes, la distance du khi-deux. Analyse des
nuages des profils. Liens entre les analyses. Interpre tation des re sultats.
Analyse des correspondances multiples
Analyse des correspondances sur le tableau disjonctif complet. Proprie te s de l’ACM. Analyse du tableau de Burt.
Données manquantes
Introduction a la gestion des donne es manquantes dans les me thodes d’analyse facto-rielle
Classification
Classification ascendante hie rarchique : principe, strate gies d’agre gation, aides a l’inter-pre tation. Me thodes de partitionnement : les me thodes des centres mobiles, les nue es dynamiques. Classification mixte.
Dure e 3 jours ou 21 heures
Niveau
Avancé
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 15
Prérequis Bonnes Connaissance des bases the oriques de la statistique descriptive (formations Statis-
tique 1 et Statistique 2) et connaissances de base du logiciel R (formation R Initiation). No-
tions de calcul matriciel souhaitables.
Analyse des données avec R AN
AL
YS
E D
ES
DO
N-
NÉ
E M
UL
TI-
DIM
EN
SIO
NN
EL
LE
Logiciels utilise s
R
Repe res bibliographiques
B. Escoffier et J. Pages (2016), Analyses factorielles simples et multiples, 5e édition, Dunod
Husson, F., S. Lê et J. Pagès
(2009), Analyse des données avec
R, Presse universitaire de Rennes
MODÉLISATION
Re gression line aire et analyse de la variance
Me thodes de re gression pour donne es qualitatives
Statistique et me thodes de re gression pour donne es spatiales
1
2
3
4
5
MO
DÉ
LIS
AT
ION
Econome trie des donne es de panel 4
Statistique non parame trique 5
Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-
tion des connaissances, cette formation alterne expose s the oriques et applications
pratiques / cas concrets / travaux sur ordinateur.
Objectifs Etre en mesure de construire un mode le de re gression pour expliquer ou pre voir
des phe nome nes, et analyser l’influence de facteurs qualitatifs dans ce type de mo-
de les.
Contenu Il s’agit d’apprendre a mettre en relation des variables a partir d’observations statistiques,
a maî triser la construction et l’e tude de mode les de re gression entrant dans le cadre du
mode le line aire ge ne ral, pour expliquer ou pre voir des phe nome nes, et a savoir analyser
l’influence de facteurs qualitatifs. Cette formation est conseille e a ceux qui souhaitent
suivre les formations Analyse discriminante et segmentation et Méthodes de régression sur
données qualitatives.
Régression simple
Aspects descriptifs : me thode des moindres carre s
Aspects statistiques : validation du mode le, tests concernant les coefficients, e tude des
re sidus et des points influents
Utilisation du mode le en pre vision
Régression multiple
E tudes pre alables a la construction d’un mode le : repre sentation graphique des individus
et des variables
Pre sentation du mode le : estimation des parame tres, tests, e tude de la qualite du mode le
Le proble me de la se lection des variables : les me thodes de re gression pas a pas, choix du
“meilleur” mode le
L’introduction de variables qualitatives dans un mode le de re gression multiple
Analyse de la variance à un facteur
Le mode le a effets fixes, tests de comparaisons multiples, analyse de la variance non para-
me trique
Analyse de la variance à deux facteurs et plus
La notion d’interactions
Utilisation de variables quantitatives et qualitatives dans le cadre du mode le line aire ge -
ne ral (analyse de la covariance)
Applications informatiques
Mise en œuvre des me thodes de re gression et d’analyse de la variance sous R
Dure e 4 jours ou 28 heures
Niveau
Avancé
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 17
Prérequis Connaissances de base en statistique, en particulier les notions d’estimation et de
test (formation Statistique 3).
MO
DÉ
LIS
AT
ION
Logiciels utilise s
R, Excel
Repe res bibliographiques
B. Escoffier et J. Pages (2016),
Analyses factorielles simples
et multiples, 5e e dition, Du-
nod
Régression linéaire et analyse de la variance
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
18
Dure e 5 jours ou 35 heures
Niveau
Avance
Déjeuner
offert
Logiciels utilise s
Stata, R
Repe res bibliographiques
Crepon, B. et N. Jacquemet
(2010), E conome trie : me -
thodes et applications, de Boeck
Universite
W. Greene, W. H., T. Azomahou
et N. Couderc (2009), E cono-
me trie, Pearson Education
Objectifs Comprendre et maî triser les me thodes de re gression a mettre en œuvre lorsque la va-
riable de pendante est qualitative (binaire ou cate gorielle) et en pre senter les re sultats
de manie re intelligible et originale.
Prérequis Connaissances de base en e conome trie (formation Econométrie 1).
Contenu La formation pre sente les aspects the oriques et pratiques de la re gression logistique
et plus largement des principaux mode les e conome triques propres aux variables de -
pendantes qualitatives (binaire ou cate gorielle). Cette situation se rencontre dans
diffe rents champs d’application : choix financiers, notation du risque, segmentation
de cliente le, marketing, e conomie du travail, e conomie de l’environnement, e tude des
comportements, etc. La re gression logistique permet de tenir compte de la nature
discre te de la variable de pendante qui peut prendre deux valeurs (variables binaires
de pendantes). Celle-ci peut se ge ne raliser au cas ou la variable a expliquer prend
plus de deux modalite s et les me thodes mises en œuvre ainsi que l’interpre tation des
re sultats doivent tenir compte de leur nature ordonne e ou pas.
Chacune de ces situations est illustre e par des exemples concrets sur les me thodes a
mettre en œuvre et sur la meilleure manie re de pre senter les re sultats obtenus.
Les modèles à variables qualitatives binaires : probit et logit
Introduction : des exemples, formalisation
Estimation et interpre tation des parame tres
Validite des re sultats
Applications
Les variables qualitatives polytomiques
Introduction : des exemples, formalisation
Variables a modalite s ordonne es
Variables a modalite s non ordonne es
Variables a choix emboite s
Applications
Méthodes de régression pour données
qualitatives
MO
DÉ
LIS
AT
ION
Objectifs
Comprendre les enjeux de la prise en compte des effets spatiaux en statistique et en e cono-
me trie, mettre en œuvre les me thodes d’estimation ade quates et interpre ter les parame tres
associe s aux variables spatiales.
Contenu Il s’agit L’analyse de donne es spatiales exige la mise en œuvre d’outils statistiques spe ci-
fiques. L’un des plus classiques est la mesure de l’autocorre lation spatiale. Les me thodes
de l’e conome trie spatiale ont e te de veloppe es pour tenir compte de cette de pendance spa-
tiale dans les analyses statistiques classiques et e viter que celle-ci n’introduise des biais
dans l’estimation des parame tres.
La formation pre sente les outils de base de la statistique spatiale qui vont comple ter et
enrichir l’approche strictement cartographique. Elle s’attache ensuite a pre senter les ma-
nie res de formaliser les effets spatiaux (effet de de bordement et de de pendance spatiale,
he te roge ne ite ) et les diffe rentes spe cifications e conome triques spatiales ainsi que leur
estimation par diffe rentes me thodes. Les tests de spe cifications les plus courants seront
e galement expose s. La formation est illustre e par des exemples issus de la litte rature re -
cente dans ce domaine et des applications a partir des logiciels R ou Stata.
Analyse Introduction : nécessité de la prise en compte de la di-
mension spatiale
Introduction à la statistique spatiale
La boî te a outils d’analyse des donne es spatiales
Analyse exploratoire des donne es spatiales et tests
L’étude de l’autocorrélation spatiale en économétrie
Une typologie des mode les spatiaux
Effet multiplicateur et effet de diffusion spatial
Mode le spatialement autore gressif
Mode le a erreur spatialement autocorre le e
Mode le de Durbin spatial
Les tests de spe cification
L’étude de l’hétérogénéité spatiale en économétrie
Instabilite des parame tres et infe rence statistique
La re gression ge ographique ponde re e
Dure e 5 jours ou 35 heures
Niveau
Avancé
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 19
Prérequis Connaissances en e conome trie (formations Économétrie 1 et Économétrie 2 indis-
pensables ; formation Au-delà de la corre lation: l’e conome trie pour estimer une rela-
tion causale souhaitable)
Statistique et méthodes de régression pour
données spatiales
MO
DÉ
LIS
AT
ION
Logiciels utilise s
R, Stata
Repe res bibliographiques
BDroesbeje, J.J., Lejeune, M. et
Saporta, G. (2006), Analyse sta-
tistique des donne es spatiales,
ed. Technip
Dubé, J. et Legros, D. (2014),
Econome trie spatiale applique e
des microdonne es, ISTE Editions
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
20
Dure e 5 jours ou 35 heures
Niveau
Expert
Déjeuner
offert
Logiciels utilise s
SAS, Stata, R
Objectifs Face a des donne es de panels, savoir choisir la mode lisation la plus pertinente en fonction de
ses besoins, connaitre les avantages et limites des diffe rents mode les statistiques classiquement
utilise s.
Prérequis Tre s bonnes connaissances en e conome trie (formation Econométrie 2).
Contenu Les donne es de panel se caracte risent par l’existence d’observations re pe te es pour un me me
individu. Cette configuration de donne es – tre s courante aujourd’hui - offre des possibilite s
spe cifiques d’exploitations statistiques, notamment en matie re d’e valuation de politiques pu-
bliques. Elles permettent par exemple de prendre en compte l’impact e ventuel de caracte ris-
tiques individuelles inobservables et de se rapprocher de l’impact causal de la variable d’inte -
re t.
Cette formation initiera aux me thodes classiques de l’e conome trie sur donne es de panel (a la
fois lorsque la variable explique e est continue ou qualitative) et sensibilisera les participants
a deux enjeux importants en pre sence de ce type de donne es : la prise en compte de l’he te ro-
ge ne ite individuelle inobserve e et l’identification de la de pendance d’e tat.
Les modèles à variables qualitatives binaires : probit et logit
Introduction : des exemples, formalisation Estimation et interpre tation des parame tres
Économétrie des données de panels
MO
DÉ
LIS
AT
ION
Modèles de panels avec variable expliquée
continue
Rappel sur les moindres carre s ordinaires Pre sentation du mode le a effet fixe, proprie te s, me thodes d’estimation Exercices d’estimation sur ordinateur Pre sentation du mode le a effet ale atoire, proprie te s, me -thodes d’estimation Exercice de programmation et d’estimation sur ordina-teur Spe cification a la Mundlak ou a la Chamberlain (effets corre le s) Exercice sur ordinateur Modèles dynamiques
Notion d’exoge ne ite / exoge ne ite faible Me thodes des variables instrumentales Me thodes moments ge ne ralise s Rappel sur le maximum de vraisemblance et me thode de
Wooldridge dans le cas du mode le line aire gaussien Exercices de programmation sur ordinateur
Modèles à variable dépendante binaire
Rappel sur l’e conome trie des mode les a variables qualita-tives en coupe, le cas des e tats absorbants, pre sentation du proble me des parame tres incidents, mode le logit-conditionnel (sans de pendance d’e tat) binaire et multino-mial, mode les logit et probit a effet ale atoire. Exercice de programmation des diffe rents mode les sur ordinateur Les mode les de se lection : rappel sur le mode le de se lec-tion en coupe, discussion des mode les de se lection avec effets fixes ou a effets corre le s
Ouverture sur les modèles dynamiques avec
variables expliquées binaires
Objectifs Comprendre la logique de la statistique non parame trique et mettre en œuvre des
tests et des me thodes d’estimation non parame triques.
Contenu La statistique parame trique est le cadre standard de la statistique. Les mode les
statistiques sont alors de crits par un nombre fini de parame tres. En statistique
non parame trique, aucune hypothe se n’est faite a priori sur la loi sous-jacente.
Nous pouvons par exemple faire un test statistique sans spe cifier de loi a priori
sur la ou les variable(s) utilise e(s). Il en est de me me si on veut examiner une liai-
son entre variables sans hypothe se sur les lois de celles-ci. Les copules mode lisent
la de pendance. Le bootstrap permet d’e valuer la sensibilite de ces estimateurs par
re e chantillonnage.
Nous finirons par une bre ve description de l’estimation non parame trique pour
grands e chantillons.
Tests non paramétriques :
Petits e chantillons, lois non gaussiennes
Mesures de liaisons non paramétriques
Bootstrap et applications :
Estimation ponctuelle et calcul d’intervalles de confiances sur petits e chantillons
Estimation non paramétrique :
Histogramme, me thodes a noyau
Dure e 5 jours ou 35 heures
Niveau
Expert
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 21
Prérequis Connaissances Comprendre la logique de la statistique non parame trique et mettre
en œuvre des tests et des me thodes d’estimation non parame triques.
Statistique non paramétrique
MO
DÉ
LIS
AT
ION
Logiciels utilise s
R
Repe res bibliographiques
Capéraà, P. et Van Cutsem, B.
(1988), Méthodes et modèles en
statistique non paramétrique,
presse de l’Universite de Laval,
Dunod
Efron, B. (2011) An introduction
to bootstrap methods with appli-
cations to R, John Wiley & Sons
ENQUÊTES ET SONDAGES
Conception d'enque te, e laboration de questionnaire
Le secret statistique : principes et pratiques
Panorama des me thodes de sondages
1
2
4
4
5
EN
QU
ÊT
ES
ET
SO
ND
AG
ES
Me thodes de redressement 5
Correction de la non-re ponse dans les enque tes 6
Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-
tion des connaissances, cette formation alterne expose s the oriques et applications
pratiques / cas concrets / travaux sur ordinateur.
5 Sondages avec R 7
5 E chantillonnage 3
Objectifs Savoir mettre en place une enque te et re diger un questionnaire.
Contenu Cette formation propose d’analyser les diffe rentes phases de mise en place d’une
enque te statistique (hormis l’e chantillonnage et le redressement qui font l’objet
des formations Sondages 1 et 2). La phase de re daction du questionnaire est de -
taille e; les sources d’erreurs possibles sont aborde es ainsi que les outils ou me -
thodes permettant de re duire ces erreurs. Une participation active des stagiaires
est sollicite e.
La conception d’enquête
L’enque te, une me thode particulie re de recueil de l’information
Objectifs, champ, unite s
Les e tapes de la conception d’enque te
Les me thodes de collecte : en face a face, par te le phone, par internet, postale
Repre sentativite et non-re ponse
Le questionnaire
La conception de questionnaire
Les diffe rents types de questions
La re daction des questions (importance de la formulation et de l’ordre)
Les erreurs de mesure
Le lien questionnaire, base de donne es et traitement
Applications
Examen de questionnaires de ja conçus et utilise s
Les proce dures de test
Ce qu’il faut savoir d’une enque te pour juger du questionnaire
Travaux pratiques a partir de projets de questionnaires expose s par les partici-
pants.
Dure e 2 jours ou 14 heures
Niveau
Initiation
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 23
Conception d'enquête, élaboration de
questionnaire
EN
QU
ÊT
ES
ET
SO
ND
AG
ES
Repe res bibliographiques
Singly F. de (1992), L’enque te et
ses me thodes : le question-
naire, collection sociologie,
E ditions Nathan
Statistique Canada (2010), Me -
thodes et pratiques d’en-
que tes
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
24
Dure e 1 jour ou 7 heures
Niveau
Tout public
Déjeuner
offert
Logiciels utilise s
SAS, Stata, R
Repe res bibliographiques
Willenborg, L. et T. de Waal
(2000), Elements of Statistical
Disclosure Control, Lecture
Notes in Statistics, vol 155 ,
Springer-Verlag
Nicolas, J. (2012), Traitement
de la confidentialité statistique
dans les tableaux : expérience de
la Direction des Statistiques
d’Entreprises, Journe es de Me -
thodologie Statistique 2012
Objectifs Comprendre Avoir les connaissances le gales en matie re de gestion du secret statis-
tique.
Savoir prendre en compte le secret statistique lors de l’e laboration et lors de la diffu-
sion de toutes les informations statistiques mises a disposition sous forme de tableaux
de donne es agre ge es.
Contenu La gestion du secret en matie re de statistique est un souci de plus en plus pre sent ces der-
nie res anne es. D’un co te , les organismes producteurs de statistiques sont pousse s a publier
des donne es toujours plus de taille es ; de l’autre, ces me mes organismes ont l’obligation le gale
et morale de garantir la confidentialite des informations qui leur ont e te confie es par les per-
sonnes ou entreprises. Cette confidentialite est vitale pour obtenir une bonne coope ration
des re pondants et maintenir la meilleure qualite possible des informations collecte es.
Par application de la loi de 1951 sur l’obligation, la coordination et le secret en matie re de
statistiques, les organismes du Syste me Statistique Public français ont notamment l’obliga-
tion de contro ler la divulgation statistique dans les informations qu’ils mettent a disposition,
en minimisant le risque que des informations sensibles sur des individus ou des entreprises
puissent e tre divulgue es a partir des donne es diffuse es.
La loi du 7 juin 1951 :
donne es sur les me nages et individus ; donne es sur les entreprises
Problèmes et critères dans …
Les tableaux de fre quence, aussi appele s tableaux de comptage
Les tableaux de volume : ventilation d’une variable telle que le chiffre d’affaires
ou le revenu
Les tableaux issus d’enque te : prise en compte des poids
Les tableaux lie s par une des variables de ventilation
Les tableaux hie rarchise s : exemple de la NAF, variable posse dant une structure
emboî te e.
Les méthodes de gestion du secret statistique
La restructuration des tableaux
La suppressions des cases sous secret
Gestion du secret statistique via le logiciel ?-Argus
Le secret statistique : principes et pratiques
EN
QU
ÊT
ES
ET
SO
ND
AG
ES
Objectifs Acque rir les notions the oriques ne cessaires a la mise en œuvre des principales me -
thodes d’e chantillonnage.
Contenu L’accent de la formation est mis sur les me thodes probabilistes de tirage d’e chan-
tillon, mais la me thode des quotas est e galement aborde e. Chaque me thode fait
l’objet d’une pre sentation the orique et des exemples tire s de la pratique des son-
dages a l’Insee ou dans d’autres organismes permettent d’illustrer les proprie te s
de la me thode.
Généralités sur les enquêtes par sondage
Les composantes d’une enque te par sondage, les bases de sondage, la notion d’es-
timation et de pre cision, les diffe rents types d’erreur
Les sondages empiriques
La me thode des quotas
Le sondage aléatoire simple
Estimation d’une moyenne, d’une proportion, pre cision, algorithmes de tirage,
cas des panels
Le sondage à probabilités inégales
Estimation, pre cision, choix des probabilite s de tirage, tirage a probabilite s pro-
portionnelles a la taille, algorithmes de tirage, tirage en deux phases
Le sondage stratifié
Estimation, pre cision, constitution des strates, allocation de l’e chantillon dans les
strates
Les sondages à plusieurs degrés (sondage en grappes, sondage à
deux degrés)
Diffe rentes me thodes de tirage au premier degre , estimation, pre cision, effet de
grappe
Échantillonnage équilibré, notion de sondages indirects
Dure e 3 jours ou 21 heures
Niveau
Initiation
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 25
Prérequis Bonnes connaissances en statistique descriptive et notions de probabilite s et de
the orie de l’estimation.
Échantillonnage
EN
QU
ÊT
ES
ET
SO
ND
AG
ES
Logiciels utilise s
Excel, R
Repe res bibliographiques
Ardilly, P. (2006), Les tech-
niques de sondage, Technip
(2e me e dition)
Tillé, Y. (2001), The orie des
sondages, Dunod
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
26
Dure e 2 jours ou 14 heures
Niveau
Tout public
Déjeuner
offert
Repe res bibliographiques
Ardilly, P. (2006), Les tech-
niques de sondage, Technip
(2e me e dition)
Tillé, Y. (2001), The orie des
sondages, Dunod
Objectifs Connaî tre l’ensemble des concepts et me thodes intervenant lors des diffe rentes
phases d’une enque te par sondage : vocabulaire de la the orie des sondages, princi-
pales me thodes d’e chantillonnage, de redressement et de traitement de la non-
re ponse.
Prérequis Bonnes connaissances en statistique descriptive, maî trise du formalisme mathe ma-
tique.
Contenu La formation pre sente un panorama de la me thodologie utilise e dans les diffe rentes
phases de la re alisation d’une enque te par sondage. L’accent est mis sur les principes
ge ne raux des concepts et me thodes, et sur leur utilisation dans la pratique des en-
que tes. De nombreux exemples illustrent cette formation.
Généralités sur les enquêtes par sondage
Population de re fe rence, bases de sondage
Les composantes d’une enque te par sondage
La notion d’estimation et de pre cision: qualite s d’un estimateur
Les diffe rents types d’erreur
Les méthodes d’échantillonnage
Le sondage ale atoire simple
Le sondage a probabilite s ine gales
Aperçu sur les algorithmes de tirage d’e chantillon
Le sondage stratifie
Les sondages a plusieurs degre s (sondage en grappes, sondage a deux degre s)
Echantillonnage en deux phases
Le sondage e quilibre
Les méthodes de redressement
Post-stratification
Estimateur par le ratio
Me thode du raking ratio
Calage sur marges
Les méthodes de correction de la non-réponse
Analyse des facteurs influençant la non-re ponse
Me thodes de reponde ration (correction de la non-re ponse totale)
Me thodes d’imputation (correction de la non-re ponse partielle)
Panorama des méthodes de sondages
EN
QU
ÊT
ES
ET
SO
ND
AG
ES
Objectifs Comprendre les enjeux d’une correction de la non re ponse et du redressement, sa-
voir manipuler CALMAR et e tre capable de re aliser le redressement d’une enque te.
Contenu La formation apporte aux participants les notions the oriques et les re ponses pra-
tiques indispensables a la mise en œuvre de me thodes intervenant apre s la collecte
des donne es d’une enque te: les techniques de redressement d’e chantillon et de trai-
tement de la non-re ponse.
Chaque me thode fait l’objet d’une pre sentation the orique, d’une mise en œuvre pra-
tique des concepts the oriques, permettant d’illustrer les proprie te s de la me thode, et
d’exemples tire s de la pratique des sondages a l’Insee ou dans d’autres organismes.
Le logiciel SAS est utilise , mais la connaissance pre alable de ce logiciel n’est pas ne -
cessaire.
Régression simple
Aspects descriptifs : me thode des moindres carre s
Aspects statistiques : validation du mode le, tests concernant les coefficients,
e tude des re sidus et des points influents
Utilisation du mode le en pre vision
Bref rappel sur les méthodes d’échantillonnage
Les méthodes de redressement
Estimateur par le ratio
Estimateur par la re gression
Post-stratification sur un ou deux crite res
Calage sur marges, calage ge ne ralise
Les méthodes de correction de la non-réponse
Analyse des facteurs influençant la non-re ponse
Me thodes de reponde ration (correction de la non-re ponse totale)
Me thodes d’imputation (correction de la non-re ponse partielle et correction de la
non-re ponse totale)
Dure e 3 jours ou 21 heures
Niveau
Avancé
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 27
Prérequis Connaissances sur les me thodes d’e chantillonnage (formation Sondages 1).
Méthodes de redressement
EN
QU
ÊT
ES
ET
SO
ND
AG
ES
Logiciels utilise s
SAS, R; Excel
Repe res bibliographiques
BArdilly, P. (2006), Les tech-
niques de sondage, Technip
(2e me e dition)
Caron,N. (2005), La correction
de la non-re ponse par repon-
de ration et par imputation,
Insee Document de travail M0502
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
28
Dure e 3 jours ou 21 heures
Niveau
Expert
Déjeuner
offert
Repe res bibliographiques
Ardilly, P. (2006), Les tech-
niques de sondage, Technip
(2e me e dition)
Objectifs Comprendre les me canismes de correction de la non-re ponse les plus utilise s, e tre en
mesure d’appre cier la qualite des estimations en contexte de non-re ponse.
Prérequis Connaissances des me thodes ge ne rales d’e chantillonnage et d’estimation (avoir acquis
les e le ments the oriques du niveau des formations Sondages 5 et Sondages 6).
Contenu La Cette formation propose des comple ments aux techniques pre sente es dans Son-
dages 1 et Sondages 2. Elle est adapte e au contexte de l’estimation en pre sence de
non-re ponse dans les enque tes par sondage.
Elle propose en premier lieu d’e clairer les fondements des me thodes de reponde ra-
tion les plus fre quemment mises en œuvre pour corriger la non-re ponse totale. On
insiste en particulier sur les techniques de calage, qui dans certaines circonstances
permettent de traiter le cas des me canismes de re ponse dits ‘non-ignorables’, pour
lesquels le comportement de re ponse est directement de pendant de la question
pose e.
On aborde e galement les principales me thodes d’imputation, utilise es pluto t pour
corriger la non-re ponse partielle, soit dans une approche classique ou les ale as res-
tent de la nature d’un e chantillonnage, soit en utilisant des mode les de comporte-
ment qui conside rent les variables d’inte re t comme ale atoires.
Généralités sur le traitement de la non-réponse
Les méthodes de repondération
La non-re ponse totale : conse quences en matie re de biais et de variance
Me canisme de re ponse ignorable
Les principaux mode les d’estimation de la probabilite de re ponse
Calcul d’erreur en pre sence de non-re ponse totale
Les techniques de calage applique es a la correction de la non-re ponse ; calage dit «
en une e tape » ; macro Calmar2 (traitement de la non-re ponse non-ignorable)
Méthode d‘imputation
Les principales me thodes d’imputation (imputation par la moyenne, par le ratio,
par la re gression, hot-deck, me thode du plus proche voisin)
Conse quences sur l’estimation des parame tres de dispersion ou d’association
Calcul d’erreur lorsque l’ale a est un ale a d’e chantillonnage en population finie
Calcul d’erreur lorsque la variable d’inte re t est mode lise e ; me canisme de re ponse
ignorable
Correction de la non-réponse dans
les enquêtes
EN
QU
ÊT
ES
ET
SO
ND
AG
ES
Objectifs Savoir mettre en œuvre avec le logiciel R des me thodes classiques d’e chantillonnage,
d’estimation, de calcul de pre cision, de redressement et de traitement de la non re -
ponse.
Contenu La formation est axe e sur l’utilisation des fonctions du module “Sampling”, de velop-
pe par Yves Tille et Alina Matei pour le logiciel R. Ce module permet de se lectionner
des e chantillons selon plusieurs me thodes, de traiter les proble mes de non-re ponse,
d’ajuster des donne es d’enque tes sur des donne es de recensement, et d’e valuer la
pre cision des estimations ainsi obtenues.
La formation met l’accent sur la mise en pratique et de ce fait, une connaissance,
me me sommaire, du logiciel R serait pre fe rable. Par ailleurs, les notions the oriques
seront rappele es brie vement.
Régression simple
Aspects descriptifs : me thode des moindres carre s
Aspects statistiques : validation du mode le, tests concernant les coefficients,
Courte Introduction sur le logiciel R
Prise en main de R
Chargement du module “Sampling”
Fonctions de base
Importation de donne es dans R
Dure e 5 jours ou 35 heures
Niveau
Avancé
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 29
Prérequis Connaissances Connaissance des me thodes d’e chantillonnage et d’estimation en son-
dage. Quelques notions sur le logiciel R sont pre fe rables (formation R Initiation).
Sondages avec R
EN
QU
ÊT
ES
ET
SO
ND
AG
ES
Logiciels utilise s
R
Les fonctions d’échantillonnage
Me thode du Cube
Sondage ale atoire simple
Sondage syste matique
Sondage a probabilite s ine gales
Sondage stratifie
Sondage a deux degre s
Les fonctions d’estimation et de redressement
Estimateur de Horvitz-Thompson
Estimateur post-stratifie
Estimateur par le ratio
Estimateur par la re gression et estimateur par le calage
Les fonctions de calcul de précision
SÉRIES TEMPORELLES
Analyse des se ries temporelles avec Excel
Analyse des se ries temporelles avec R
De saisonnaliser une se rie temporelle
1
2
3
4
5
SÉ
RIE
S T
EM
PO
RE
LL
ES
Mode les ARMA, ARMAX et ARCH-GARCH 4
Mode les VAR et VECM 5
Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-
tion des connaissances, cette formation alterne expose s the oriques et applications
pratiques / cas concrets / travaux sur ordinateur.
Objectifs Etre en mesure de mettre en œuvre les me thodes de base de l’analyse des se ries tem-
porelles avec Excel.
Contenu La formation propose d’approfondir la connaissance d’ Excel pour mettre en ap-
plication les me thodes d’analyse des se ries temporelles. Les stagiaires seront
amene s a mettre en œuvre ces me thodes au moyen de nombreux exercices pra-
tiques.
Rappel sur l’environnement de travail d’Excel
Rappel des étapes et des objectifs de l’analyse des séries tempo-
relles
Les structures de séries temporelles dans Excel
Lecture et différentes représentations graphiques d’une série tem-
porelle
Décomposition d’une série temporelle
Prévision avec les méthodes de lissage exponentiel
La modélisation ARIMA
Quelques prolongements
Dure e 3 jours ou 21 heures
Niveau
Avancé
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 31
Prérequis Connaissance de base en analyse des se ries temporelles. Quelques notions sur Excel
sont pre fe rables
Analyse des séries temporelles avec Excel SÉ
RIE
S T
EM
PO
RE
LL
ES
Logiciels utilise s
Excel
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
32
Dure e 3 jours ou 21 heures
Niveau
Avance
Déjeuner
offert
Logiciels utilise s
R
Repe res bibliographiques
Aragon, Y. (2011), Séries tem-
porelles avec R. Méthodes et cas,
Springer
Objectifs Etre en mesure de mettre en œuvre les me thodes de base de l’analyse des se ries tempo-
relles avec le logiciel R.
Prérequis Connaissances de base en analyse des se ries temporelles. Quelques notions sur le logi-
ciel R sont pre fe rables
Contenu La formation propose d’approfondir la connaissance du logiciel R pour mettre en ap-
plication les me thodes d’analyse des se ries temporelles. Les stagiaires seront amene s
a mettre en œuvre ces me thodes au moyen de nombreux exercices pratiques.
Les modèles à variables qualitatives binaires : probit et logit
Rappel sur l’environnement de travail de R
Rappel des étapes et des objectifs de l’analyse des séries temporelles
Les structures de séries temporelles dans R : les objets ts
Lecture et différentes représentations graphiques d’une série
temporelle
Décomposition d’une série temporelle
Prévision avec les méthodes de lissage exponentiel
La modélisation ARIMA
Quelques prolongements
Analyse des séries temporelles avec R
SÉ
RIE
S T
EM
PO
RE
LL
ES
Objectifs Cette formation permet d’aborder un aspect essentiel pour toute publication de
donne es a posteriori : la de saisonnalisation d’une se rie temporelle.
Contenu L’analyse d’une se rie temporelle, comme toute e tude statistique, ne peut e chapper
a une phase exploratoire permettant de comprendre et d’appre cier les phe no-
me nes temporels influant sur la grandeur e tudie e : saisonnalite , effets calendaires,
points extre mes, conditions climatiques… Leur prise en compte est ne cessaire
pour une bonne analyse de la conjoncture. Les me thodes statistiques permettant
de de composer une se rie temporelle sont nombreuses, varie es et parfois com-
plexes. Les cas pratiques seront ide alement traite s sous le logiciel (libre) JDE-
METRA+, des comple ments pouvant e tre donne s sous R et SAS. Des applications
de la de saisonnalisation pourront e tre effectue es sur les propres jeux de donne es
des stagiaires.
Composantes d’une série temporelle et modèles associés
Stationnarité et autocorrélogrammes (simple et partiel)
Eléments d’analyse spectrale
Moyennes mobiles
Principes de désaisonnalisation d’une série temporelle et diagnos-
tics de qualité
La correction des effets de calendrier
Utilisation de la méthode TRAMO-SEATS
Utilisation de la méthode X-12-ARIMA
Dure e 3 jours ou 21 heures
Niveau
Avancé
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 33
Prérequis Une connaissance des mode les ARMA peut s’ave rer utile.
Désaisonnaliser une série temporelle
SÉ
RIE
S T
EM
PO
RE
LL
ES
Logiciels utilise s
JDemetra+, R, SAS
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
34
Dure e 5 jours ou 35 heures
Niveau
Expert
Déjeuner
offert
Logiciels utilise s
Eviews, R
Objectifs Cette formation propose de mode liser et pre voir une se rie temporelle a l’aide des mo-
de les e labore s par Box et Jenkins : la famille ARMA.
Prérequis Bonnes connaissances en statistique infe rentielle.
Contenu Les mode les ARMA permettent de mode liser des se ries temporelles pour lesquelles
la seule dynamique passe e permet de les appre hender. Ces mode les line aires sont
encore tre s utilise s en pratique. En pre sence de variables exoge nes, les mode les AR-
MAX constituent une alternative inte ressante. Un comple ment sur les mode les ARCH-
GARCH, directement issus du monde financier, permettent d’e largir le domaine d’ap-
plicabilite des mode les ARMA, notamment lorsque les re sidus ne peuvent pas e tre
conside re s comme gaussiens. Les cas pratiques seront ide alement traite s sous R,
mais pourront e galement e tre mis en œuvre sous SAS.
Stationnarité et autocorrélogrammes (simples et partiels).
Modèles ARMA : identification, estimation et prévision.
Traitement de la non-stationnarité : modèles ARIMA et SARIMA.
Pratique de la modélisation ARMA.
Compléments sur les modèles ARMAX.
Compléments sur les modèles ARCH-GARCH.
Modèles ARMA, ARMAX et ARCH-GARCH
SÉ
RIE
S T
EM
PO
RE
LL
ES
Objectifs Comprendre Cette formation permet de modéliser et prévoir des séries temporelles multiva-
riées, notamment dans le domaine économique.
Contenu La mode lisation vectorielle ou multivarie e permet d’e tudier la dynamique jointe
de plusieurs se ries : Lorsque les se ries sont stationnaires, il s’agit d’une ge ne rali-
sation de l’e tude des processus AR. La popularite des mode les vectoriels autore -
gressifs (VAR) est lie e a leur souplesse d’utilisation et a leur capacite a tester des
hypothe ses e conomiques. Lorsque les se ries ne sont pas stationnaires mais coin-
te gre es, les mode les vectoriels a correction d’erreur (VECM) permettent de spe ci-
fier des relations stables a long terme tout en analysant dans le me me temps la
dynamique de court terme des variables conside re es. Les mode les VAR structu-
rels (SVAR) comple tent cette approche multivarie e. Les cas pratiques seront ide a-
lement traite s sous R, mais pourront e galement e tre mis en œuvre sous SAS.
Généralités sur les séries temporelles multivariées.
Modèles vectoriels autorégressifs (VAR).
Tests de stationnarité.
Analyse de la dynamique des modèles VAR.
Tests de Causalité.
Modèles vectoriels à correction d’erreur (VECM).
Tests de cointégration.
Compléments sur les modèles VAR structurels (SVAR).
Dure e 4 jours ou 28 heures
Niveau
Expert
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 35
Prérequis Bonnes connaissances des mode les ARMA.
Modèles VAR et VECM SÉ
RIE
S T
EM
PO
RE
LL
ES
Logiciels utilise s
Eviews, R, SAS
LOGICIELS STATISTIQUES
Gams
SPSS
Eviews
Spark
Hadoop
LO
GIC
IEL
S S
TA
TIS
TIQ
UE
S
Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-
tion des connaissances, cette formation alterne expose s the oriques et applications
pratiques / cas concrets / travaux sur ordinateur.
Programmation avec Julia
Stata 12
CsPro / Survey Solution / ODK Collect
Python initiation / Python Interme diaire / Python avance
R initiation / R Interme diaire / R avance 3 / 4 / 5
Cre er un programme personnalise avec Excel et le VBA 2
Excel : construire des tableaux de bord et ge rer vos donne es avec Excel 1
13
14
15
16
17
18
6 / 7 / 8
9/10/11
Objectifs Maî triser la construction et la maintenance de tableaux de bord avec Excel. Maî tri-
ser la gestion des donne es sous Excel.
Contenu Il Excel est le logiciel le plus utilise pour stocker ou ge rer des donne es. Excel pro-
pose de nombreux outils extre mement puissants pour la gestion des donne es
qu’elles soient stocke es directement dans Excel ou dans des bases de donne es ex-
ternes. Gra ce a Excel, vous pouvez construire des tableaux de bord permettant un
reporting clair et efficace.
Cette formation vous apprend a maî triser les outils de gestion de donne es, a appli-
quer les bonnes pratiques pour la gestion des donne es sous Excel et a construire
des rapports de taille s et automatise s avec Excel.
Les données dans Excel
Principes et organisation
Les outils de gestion (re fe rences, filtres, tri…)
Les relations internes entre les donne es dans Excel
Les données externes
La mise en relations de base de donne es
La re cupe ration de bases de donne es externes
Les outils du reporting
L’utilisation de visualisations adapte es
Introduction a l’utilisation des tableaux croise s dynamiques
Construction de macros pour automatiser les proce dures
Rapide introduction au langage VBA
Application : construction d’un tableau de bord personnalise
Augmenter votre productivité avec Excel
Trucs et astuces pour augmenter votre productivite
Les applications pour Office : de nouvelles fonctionnalite s en constante e volution
Dure e 5 jours ou 35 heures
Niveau
Initiation
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 37
Prérequis Tout public.
Excel : construire des tableaux de bord et
gérer vos données avec Excel
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Logiciel utilise
Excel
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
38
Dure e 5 jours ou 35 heures
Niveau
Avance
Déjeuner
offert
Logiciels utilise s
Excel
Objectifs Maî triser l’utilisation de l’e diteur VBE et du langage VBA pour cre er des programmes
personnalise s et ope rationnels.
Prérequis Une maî trise d’Excel est demande e. De plus, une connaissance de base en programma-
tion serait appre cie e.
Contenu Excel est plus qu’un simple tableur, il a son propre langage de programmation : le
VBA (Visual Basic for Applications). Le VBA, langage a la fois simple et tre s complet,
permet d’automatiser un certain nombre de ta ches et me me de cre er des pro-
grammes personnalise s complexes. Cette formation vous apprend a passer du simple
enregistrement de macros Excel a la mise en place de programmes permettant d’ef-
fectuer des calculs re pe te s et complexes. Ces programmes peuvent e tre appele soit
en utilisant des formules spe cifiques soit gra ce a des interfaces cre e es sur mesure.
Les modèles à variables qualitatives binaires : probit et logit
Introduction : des exemples, formalisation
Estimation et interpre tation des parame tres
Introduction au langage VBA
Principes et fonctionnement
Application : e criture d’une premie re fonction de gestion de donne es
L’environnement VBE
Pre sentation de l’e diteur
Principe du de bogage en VBA
La programmation
Trucs et astuces pour e tre plus efficace
La gestion des sources de donne es en VBA
Cre ation d’une interface avec le VBA
Application : e criture d’un programme en VBA pour automatiser une analyse
statistique
Créer un programme personnalisé avec
Excel et le VBA
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Objectifs Manipuler une session de travail R, distinguer les objets R, mettre en œuvre des fonc-
tions de R pour manipuler un jeu de donne es
Contenu
Le livre Statistique avec R vous sera offert lors de cette formation
La formation est consacre e a la pre sentation des fonctionnalite s de base du logi-
ciel R, accompagne e d’exemples d’utilisations. Les stagiaires mettront en œuvre le
logiciel, sous la forme d’exercices d’application.
Généralités
Pre sentation et installation du logiciel R et de Rstudio
GUIs et IDEs
Prise en main et premiers pas
Fonctions et packages
Utilisation des aides
Les objets de R
Vecteurs, facteurs, matrices, listes, data.frames
Manipulation de données avec R
Importation et exportation de donne es
Cre ation et recodage de variables
Se lection et regroupements de donne es
Initiation aux graphes avec R
Manipulation des fene tres graphiques
Re alisation et personnalisation de graphes de base avec R
Premières analyses de statistique descriptive avec R
Présentation de R markdown pour générer des rapports
Dure e 3 jours ou 21 heures
Niveau
Initiation
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 39
Prérequis Sans e tre obligatoires des notions de base en programmation ainsi que des connais-
sances de base en techniques statistiques sont un plus.
Public visé : toute personne souhaitant acque rir les bases de R
R initiation
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Logiciels utilise s
R
Repe res bibliographiques
P-A. Cornillon et al. (2012), Sta-
tistique avec R, Presses Universi-
taires de Rennes.
Cornillon P.-A. et Éric Matzner-
Løber (2010), Régression avec R,
Springer.
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
40
Dure e 2 jours ou 14 heures
Niveau
Expert
Déjeuner
offert
Objectifs Acque rir les outils et techniques permettant d’effectuer des traitements sur les don-
ne es, plus rapidement et plus efficacement.
Connaî tre les principaux packages d’analyse statistique.
Prérequis Connaissance de base du logiciel R
Contenu
Le livre Statistique avec R vous sera offert lors de cette formation
Cette formation s’adresse a des stagiaires ayant de ja manipule le logiciel R, de si-reux d’approfondir leurs connaissances sur ses fonctionnalite s. Une premie re journe e sera consacre e aux fonctionnalite s de base avec un accent mis sur la ma-nipulation de jeux de donne es, le graphe et la programmation. Une deuxie me journe e sera consacre e a la prise en main de packages particuliers pour la re gression line aire, la re gression logistique, les arbres de de cision, l’ana-lyse de donne es. Le logiciel sera mis en œuvre au travers d’exercices concrets d’application..
Manipulation de données dans R
Importation et exportation Cre ation et recodage de variables Se lection et regroupement de variables Manipulation des dates Fusion de tableaux de donne es Premie res analyses descriptives Les fonctions apply
Le graphe avec R
Manipulation des fene tres graphiques Graphes de base Personnalisation de graphes
La programmation avec R
Cre ation de ses propres fonctions R Boucles Structures de contro le
Packages
Focus sur quelques packages en particulier pour des analyses statistiques pous-se es : re gression line aire, re gression logistique, arbres de de cision, analyse de donne es.
R Intermédiaire
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Logiciels utilise s
R
Repe res bibliographiques
P-A. Cornillon et al. (2012), Sta-
tistique avec R, Presses Universi-
taires de Rennes.
Cornillon P.-A. et Éric Matzner-
Løber (2010), Régression avec R,
Springer.
Objectifs Acque rir des notions avance es de programmation avec R, traiter de larges jeux de
donne es avec R, paralle liser et passer a l’e chelle, Concevoir une application web uti-
lisant R pour effectuer les calculs. R Shiny est un outil particulie rement efficace pour
cre er des applications web interactives avec R.
A la fin de la journe e, les stagiaires pourront de velopper leur propre application.
Contenu R / Programmation avancée
Rappel des structures des objets et fonctionnement interne.
Programmation de base
Programmation objets S3
Comparaison de performances entre structure vectorielle et boucles
Ame lioration du code (Rcpp, paralle lisation)
Cre ation d’un package avec plusieurs objectifs (gestion de projet, diffusion d’ou-
tils…)
Dure e 3 jours ou 21 heures
Niveau
Expert
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 41
Prérequis Une utilisation re gulie re de R et de pre fe rence avoir fait R Interme diaire.
R avancé
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
R / Passage à l’échelle
Traitement de larges jeux de donne es avec R
Pre sentation et utilisation de datatable et de dplyr pour traiter de donne es volu-
mineuses
Pre sentation du calcul paralle le
Passage a l’e chelle
Connexion avec les diffe rentes bases de donne es (SQL, NOSQL)
Pre sentation de l’environnement Hadoop, imple mentations en R
Pre sentation d’Apache Spark et inte gration avec R
R / Créer une application R Shiny
Introduction a R Shiny, structure et the me d’une application Shiny
Interface utilisateur avec des exemples d’inputs courants
Imple mentation co te serveur et dialogue avec l’interface, exemple d’outputs cou-
rants
Interactivite et maî trise de la re activite : expressions re actives, expressions iso-
le es, affichage conditionnel
Logiciels utilise s
R
Repe res bibliographiques
P-A. Cornillon et al. (2012), Sta-
tistique avec R, Presses Universi-
taires de Rennes.
Cornillon P.-A. et Éric Matzner-
Løber (2010), Régression avec R,
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
42
Objectifs Manipuler une session de travail Python Distinguer les objets Python Mettre en œuvre des fonctions de Python pour manipuler un jeu de donne es
Python initiation
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Dure e 3 jours ou 21 heures
Niveau
Initiation
Déjeuner
offert
Contenu La formation est consacre e a la pre sentation des fonctionnalite s de base du lan-gage Python, accompagne e d’exemples d’utilisations. Les stagiaires mettront en œuvre le langage, sous la forme d’exercices d’application. Généralités
Pre sentation et installation du langage Python Prise en main et premiers pas de Python Notebook Fonctions et packages Utilisation des aides
Les objets de Python
Vecteurs Facteurs Matrices Listes data.frames
Manipulation de données avec Python
Importation et exportation de donne es Cre ation et recodage de variables Se lection et regroupements de donne es
Initiation au graphe avec Python
Manipulation des fene tres graphiques
Re alisation et personnalisation de graphes de base avec Python
Premières analyses de statistique descriptive avec Python
Logiciels utilise s
Python / Jupyter / Pandas
Objectifs Acque rir les outils et techniques permettant d’effectuer des traitements sur les
donne es, plus rapidement et plus efficacement.
Connaî tre les principaux packages d’analyse statistique.
Contenu Cette formation s’adresse a des stagiaires ayant de ja manipule des donne es avec
le langage Python, de sireux d’approfondir leurs connaissances sur ses fonction-
nalite s.
Une premie re journe e sera consacre e aux fonctionnalite s de base avec un accent
mis sur la manipulation de jeux de donne es :
Manipulation de donne es avec Pandas
Importation et exportation
Cre ation et recodage de variables
Gestion des formats de donne es structure s (JSON, XML)
Acce s a des donne es en ligne via une API web
Interface avec une base de donne es SQL.
La seconde journe e sera consacre e a la pre sentation de la librairie scikit-learn
pour l’apprentissage statistique (qui contient les mode les usuels de re gression,
re gression logistique et bien plus encore) et au de veloppement de programmes
complets (cre ation de fonctions, chaî ne de traitement comple te de la re cupe ra-
tion des donne es a l’utilisation du mode le).
Dure e 2 jours ou 14 heures
Niveau
Avancé
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 43
Prérequis Connaissance de base du langage Python (un de butant ou un ancien utilisateur
ayant peu de pratique s’orientera pluto t vers la formation Python Initiation).
Python intermédiaire
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Logiciels utilise s
Python, Pandas, Scikit Learn
Repe res bibliographiques
Wes McKinney, Python for Da-
ta Analysis, e ditions O’Reilly
Jake Vanderplas, Python Data
Science Handbook: Essential
Tools for working with Data,
e ditons O’Reilly
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
44
Dure e 3 jours ou 21 heures
Niveau
Expert
Déjeuner
offert
Logiciels utilise s
Python
Repe res bibliographiques
G. Swinnen, Apprendre a pro-
grammer avec Python, e d.
Eyrolles
E. Biernat, M. Lutz, Data
Science : fondamentaux et
e tudes de cas, e d. Eyrolles
S. Bird, E. Klein, E. Loper, Natu-
ral Language Processing
with Python, e d. O’Reilly
Objectifs Permettre a l’utilisateur maî trisant l’informatique de cisionnelle sous Python de de se
perfectionner sur une the matique spe cifique, permettre a l’utilisateur maî trisant
l’informatique de cisionnelle sous Python de de se perfectionner sur une the matique
spe cifique et permettre a l’utilisateur maî trisant l’informatique de cisionnelle sous Py-
thon de de se perfectionner sur une the matique spe cifique.
Prérequis Utilisation re gulie re de Python.
Contenu Python pour la data science et le machine learning
Apprentissage et analyse statistique avec sci-kit learn & xgboost : revue des tech-
niques, gestion des ensembles d’apprentissage et de test, e valuation des mode les.
Python avancé
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Python pour le text mining
Mise en œuvre des me thodes d’analyse textuelle en utilisant la librairie NLTK.
Développement d’interfaces graphiques et dataviz avancée
Utilisation de la librairie de visualisation Plotly.
Cre ation d’interfaces graphiques avec Bokeh.
Dash pour cre er des applications web, Principes et extensions via du javascript.
Comparaison avec R Shiny
Introduction a la de finition d’APIs (Application Programming Interface) et mise en
place avec Flask
Objectifs Acque rir des connaissances et techniques permettant de concevoir des applica-
tions de collectes et des masques de saisie robustes gra ce a Cspro.
Contenu
Manipulation des dictionnaires de donne es
Cre ation des formulaires
Contro les de base
Contro les avance s et utilisation des dictionnaires externes
Remonte e des donne es et synchronisation
Dure e 5 jours ou 35 heures
Niveau
Tout public
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 45
Prérequis Bonne connaissance en logique, en algorithme et en programmation
Cspro
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Logiciels utilise s
Cspro
Cspro
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
46
Dure e 5 jours ou 35 heures
Déjeuner
offert
Logiciels utilise s
Survey solution
Objectifs Acque rir des connaissances et techniques permettant de concevoir les supports de col-
lecte de donne es.
Contenu Elaboration des formulaires a partir du questionnaire sur la plateforme
Mise en place des contro les de cohe rence de base
Maitrise du flux des e changes d’informations entre les diffe rents acteurs in-
tervenant dans le processus de collecte
Gestion des donne es
Survey solution
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Niveau
Tout public
Objectifs Acque rir des connaissances et techniques permettant de concevoir les supports
de collecte de donne es.
Contenu Concepts de base
Pre paration des feuilles Excel pour la conception du questionnaire.
Imple mentation d’un questionnaire (cas pratique)
Etude de quelques fonctions utiles d’ODK Collect
Pre sentation de quelques plateformes pour la synchronisation et la re-
monte e des donne es
Dure e 5 jours ou 35 heures
Niveau
Tout public
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 47
Prérequis La bonne connaissance d'Excel sera tre s utile
ODK Collect
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Logiciels utilise s
Excel, ODK
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
48
Dure e 5 jours ou 35 heures
Niveau
Initiation
Déjeuner
offert
Logiciels utilise s
Stata
Objectifs Connaî tre les outils permettant d’effectuer les ta ches essentielles avec le logiciel
(manipulation de donne es, graphiques, estimations).
Contenu La formation est consacre e a la pre sentation des fonctionnalite s du logiciel Stata ac-
compagne e d’exemples d’utilisations. Les principales fonctions de statistiques des-
criptives (moyenne, variance, quartiles, corre lation entre deux variables) seront pas-
se es en revue. Cette formation abordera en de tail la confection des graphiques sur
Stata. La dernie re partie du module sera consacre e a une initiation a la programma-
tion sur Stata. Les stagiaires mettront en œuvre le logiciel, sous forme d’exercices
d’application.
Prise en main du logiciel
Familiarisation avec l’environnement Utiliser des donne es Regarder les donne es
Manipulation des données logi-
ciel
Gestion des bases de donne es : tri, fu-sion, concate nation Cre er/supprimer des donne es Manipuler les formats des variable
Faire des statistiques descriptives
Utiliser les statistiques descriptives pour la cre ation de variables Statistiques descriptives
Faire des graphiques
Diffe rents types de graphiques Edition des graphiques Sauvegarde, etc.
Méthodes de régression simples
Mode le line aire Mode le logistique
Tests e le mentaires
Introduction à la programma-
tion : une petite introduction à la
pratique de la programmation
avec Stata
Stata
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Objectifs Acque rir les outils et techniques permettant d’effectuer des traitements sur les
donne es, plus rapidement et plus efficacement.
Connaî tre les principales fonctions d’analyse statistique.
Contenu Cette formation s’adresse a des stagiaires ayant de ja manipule des donne es avec
Gams, de sireux d’approfondir leurs connaissances sur ses fonctionnalite s.
Une premie re journe e sera consacre e aux fonctionnalite s de base avec un accent
mis sur la manipulation de jeux de donne es :
Manipulation de donne es avec Gams
Importation et exportation
Cre ation et recodage de variables
La seconde journe e sera consacre e a la pre sentation des fonctions pour l’appren-
tissage statistique (qui contient les mode les usuels de re gression, re gression lo-
gistique et bien plus encore) et au de veloppement de programmes (cre ation de
fonctions, chaî ne de traitement comple te de la re cupe ration des donne es a l’utili-
sation du mode le).
Dure e 5 jours ou 35 heures
Niveau
Avancé
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 49
Prérequis Connaissance de base en programmation et en algorithme sera d’une tre s grande
utilite
Gams
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Logiciels utilise s
Gams
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
50
Dure e 5 jours ou 35 heures
Niveau
Tout public
Déjeuner
offert
Logiciels utilise s
SPSS
Objectifs Acque rir les outils et techniques permettant d’effectuer des analyses de donne es de
manie re efficace, performante et cohe rente.
Contenu Cette formation s’adresse a des personnes ayant de ja manipule des donne es avec
SPSS, de sireux d’approfondir leurs connaissances sur ses fonctionnalite s.
Une premie re journe e sera consacre e aux fonctionnalite s de base avec un accent
mis sur la prise en main du logiciel
Prise en main du logiciel
Manipulation de donne es avec SPSS
Importation et exportation
Cre ation et recodage de variables
Statistiques uni et multi-dimensionnelles
Analyses e conome triques fondamentales
Bonnes pratiques et points forts du logiciel
SPSS
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Objectifs Acque rir les outils et techniques permettant d’effectuer des traitements sur les
donne es, plus rapidement et plus efficacement.
Contenu Cette formation s’adresse a des stagiaires ayant de ja manipule des donne es avec
Eviews, de sireux d’approfondir leurs connaissances sur ses fonctionnalite s.
Une premie re journe e sera consacre e aux fonctionnalite s de base avec un accent
mis sur la prise en main du logiciel et la manipulation de jeux de donne es :
Prise en main du logiciel
Manipulation de donne es avec Eviews
Importation et exportation
Cre ation et recodage de variables
Statistiques uni et multi-dimensionnelles
Analyses e conome triques fondamentales
Bonnes pratiques et points forts du logiciel
Dure e 5 jours ou 35 heures
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 51
Prérequis Connaissance de base en programmation et en algorithme sera d’une tre s grande
utilite
Eviews
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Logiciels utilise s
Eviews
Niveau
Tout public
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
52
Dure e 5 jours ou 35 heures
Niveau
Avance
Déjeuner
offert
Logiciels utilise s
Hadoop
Objectifs Manipuler une session de travail Hadoop
Cre er et manipuler les e le ments de programmation distribue e sur la plateforme Ha-doop
Mettre en oeuvre des composantes Hadoop pour l’analyse de donne es
Contenu La formation est consacre e a la pre sentation des fonctionnalite s de base de la plate-
forme Hadoop et sa programmation distribue e, accompagne e d’exemples d’utilisa-
tions. Les stagiaires mettront en œuvre le logiciel, sous la forme d’exercices d’appli-
cation.
Généralités
Pre sentation et installation de la plate-
forme Hadoop
Introduction au langage Scala de Hadoop
Les concepts de base de Hadoop
Les composants d’une exe cution re par-
tie. Exe cution interactive et cre ation
d’applications autonomes
L’unite de distribution : l’ensemble de
donne es re silient distribue .
Programmation avec Rdds élé-
mentaires
Cre ation de RDDs e le mentaires
Ope rations : transformations, actions,
e valuations faibles.
Passage de fonctions vers Spark.
Persistance d’un RDD.
Manipulation de Rdds clé/valeur
Cre ation de RDDs cle /valeur
Transformations : agre gations, regrou-
pement, jointures et ordonnancements
Actions sur RDDs cle /valeur
Charge et sauvegarde de données
Fichiers : texte, documents (JSON), va-
leurs se pare es par virgules et par se pa-
rateurs tabulaires.
Hadoop
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Objectifs Manipuler une session de travail Spark
Cre er et manipuler les e le ments de programmation distribue e sur la plateforme Spark
Mettre en oeuvre des composantes Spark pour l’analyse de donne es
Contenu La formation est consacre e a la pre sentation des fonctionnalite s de base de la pla-
teforme Spark et sa programmation distribue e,accompagne e d’exemples d’utilisa-
tions. Les stagiaires mettront en oeuvre le logiciel, sous la forme d’exercices d’ap-
plication.
Généralités
Pre sentation et installation de la plate-
forme Spark
Introduction au langage Scala de Spark
Les concepts de base de Spark
Les composants d’une exe cution re par-
tie. Exe cution interactive et cre ation
d’applications autonomes
L’unite de distribution : l’ensemble de
donne es re silient distribue (Resilient
Distributed Datasets- RDDs).
Programmation avec Rdds élé-
mentaires
Cre ation de RDDs e le mentaires
Ope rations : transformations, actions,
e valuations faibles.
Passage de fonctions vers Spark.
Persistance d’un RDD.
Manipulation de Rdds clé/
valeur
Cre ation de RDDs cle /valeur
Transformations : agre gations, regrou-
pement, jointures et ordonnancements
Actions sur RDDs cle /valeur
Charge et sauvegarde de don-
nées
Fichiers : texte, documents (JSON), va-
leurs se pare es par virgules et par se pa-
rateurs tabulaires.
Dure e 5 jours ou 35 heures
Niveau
Initiation
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 53
Spark
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
Logiciels utilise s
Spark, Scala
Repe res bibliographiques
Holden Karau, Andy Konwinski,
Patrick Wendell et Matei Zharia
(2015), Learning Spark,
O’Reilly Media Inc.
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
54
Dure e 5 jours ou 35 heures
Niveau
Avance
Déjeuner
offert
Objectifs Etre Manipuler une session de travail Julia
Distinguer les diffe rents types de Julia
Mettre en œuvre des fonctions de Julia pour manipuler un jeu de donne es
Contenu Sans e tre obligatoires des notions de base en programmation ainsi que des connais-
sances de base en techniques statistiques sont un plus.
Généralités
Pre sentation et installation de Julia
Prise en main et premiers pas de Julia
(en mode console ou jupyter)
Gestionnaire des packages
Les types en Julia
Introduction ge ne rale des types en Julia
Arborescence des types
Types concrets et abstraits
Les types de base
Arbre des types nume riques
Chaî nes de caracte res
Types multidimensionnels (Array, Vec-
tor, Matrix)
Tuples (nomme es ou pas)
Les structures mutables ou pas (struct,
mutable struct)
Package DataFrames.jl
Matrice de donne es (DataFrame)
Donne es qualitatives ou cate go-
rielles (CategoricalArray)
Utilisation des outils développés
en Julia
Fonctions
Cre ation minimale d’une fonction
(sans contrainte de rapidite )
Appels de fonction
De couverte du paradigme tout en UN
langage
Boucle “for” pour du code rapide
Introduction a la notion d’ite rateur
(via les UnitRange, StepRange, …)
Optimiser une fonction en spe ci-
fiant les types des arguments
Manipulation de données avec
Julia
Importation et exportation de donne es
Cre ation et recodage de variables
Se lection et regroupements de donne es
Initiation au graphique avec Julia
Manipulation des fene tres graphiques
Re alisation et personnalisation de graphes de base
Premières analyses de statistique
descriptive avec Julia
Programmation avec Julia
LO
GIC
IEL
S
ST
AT
IST
IQU
ES
DATA SCIENCE
Panorama du Big Data
Panorama des me thodes de Data Mining
Machine Learning
Deep Learning
Text mining
1
2
4
5
6
DA
TA
SC
IEN
CE
Web-scraping (extaction de donne es sur le web) 7
Techniques de scoring 8
Me thodes avance es de Data Mining 3
Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-
tion des connaissances, cette formation alterne expose s the oriques et applications
pratiques / cas concrets / travaux sur ordinateur.
Panorama du Big Data
Objectif Avoir une vision des diffe rents aspects des Big Data.
Contenu La formation pre sente les diffe rents aspects des Big Data : les usages, les technolo-
gies et les impacts dans l’entreprise et la socie te , en pre sentant son origine, ses
dernie res applications, les technologies spe cifiques mais aussi l’organisation des
projets et des e quipes de data science, et les sources d’informations pour suivre le
sujet au-dela de la journe e.
DA
TA
SC
IEN
CE
Qu’est-ce que les Big Data ? Qu’est-ce que les Big Data ? Comment caracte riser les Big Data et expliquer leur essor Origines et bre ve histoire Implication technologique Illustrations d’applications des Big Data Nouveaux mode les e conomiques Nouvelles sources de donne es Data Lake et entrepo t de donne es
Technologies et outils propres aux Big Data
Enjeux technologiques, data centers, clusters Pre sentation des principes de MapReduce (calcul distribue ) Acteurs des technologies Big Data Zoom sur Hadoop et ses outils Outils et environnement de mode lisation
Impacts, organisation, compétence des équipes
Risques des Big Data Equipe Big Data & data lab Conduite des projets Big Data Me tiers & compe tences S’informer et se former
Dure e 2 jours ou 14 heures
Niveau
Tout public
Déjeuner
offert
Repe res bibliographiques
Martin Kleppman (2016). De-
signing Data-Intensive Applica-
tions, O’Reilly
Tom White (2014). Hadoop,
the definite guide, O’Reilly
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 56
Prérequis La formation sera « grand public » mais sera plus facile a suivre si l’on a une cer-
taine sensibilite a la question du traitement des donne es, avec quelques notions
de base en statistique.
Panorama des méthodes de Data Mining
Objectifs Comprendre la de marche du Data Mining et quand elle peut s’appliquer ou non.
Connaî tre le fonctionnement et les re sultats a attendre des principales techniques statistiques employe es (scoring, typologies).
Contenu La formation pre sente sans formalisme mathe matique les principales techniques
de la statistique de cisionnelle utilise es sous le terme de « Data Mining ». Des de -
monstrations pratiques sur des cas concrets seront re alise es par l’intervenant. Les
me thodes seront plus de crites dans leur intuition et sur leurs conse quences pra-
tiques, logiciel, temps de calcul, performances, donne es ne cessaires, outils gra-
phiques, etc.
DA
TA
SC
IEN
CE
Présentation du data mining
De finition, positionnement par rapport a la statistique Principales applications Panorama des techniques employe es Pre sentation de l’offre logicielle Cycle d’un projet
Analyse descriptive
Typologies et segmentation
Modélisation de phénomènes binaires
Re gression moindres carre s Re gression logistique
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 57
Prérequis Notions statistiques de base (moyenne, comptage).
Dure e 3 jours ou 21 heures
Niveau
Tout public
Déjeuner
offert
Méthodes avancées de Data Mining
Objectif Faire le lien entre les me thodes de Data Mining usuelles et les me thodes issues de
la recherche re cente en apprentissage statistique, comme les me thodes a noyaux
(SVM et SVR entre autres) et les me thodes d’agre gation (boosting, bagging, fore ts
ale atoires).
Savoir mettre en œuvre ces me thodes sur des cas pratiques et juger de leur perti-
Contenu La formation de crit les principales me thodes de data mining issues de la re-
cherche actuelle en apprentissage statistique, cible leurs difficulte s et leurs avan-
tages et e value leurs performances.
Des applications sur des jeux de donne es simule es et re elles seront mises en
œuvre a l’aide du logiciel libre R.
DA
TA
SC
IEN
CE
Statistique, apprentissage et data mining De finitions, positionnement Principales applications Panorama des me thodes et de l’offre logicielle Choix d’une me thode et ajustement des parame tres
Méthodes à noyaux, SVM et SVR
Support Vector Machines pour la discrimination binaire ou multi-classes Support Vector Regression pour la re gression Ajustement des parame tres
Méthodes d’agrégation et bootstrap
Agre gation de re gles de pre diction : inte re t Principe du bootstrap Me thodes de boosting (Adaboost et logitboost)
Dure e 3 jours ou 21 heures
Niveau
Avance
Déjeuner
offert
Logiciel utilise
R
Repe res bibliographiques
N. Cristianini et J. Shawe-
Taylor(2000), An introduction
to support vector machines,
Cambridge University Press
T. Hastie, J. Friedman et R.
Tibshirani(2009), The ele-
ments of Statistical Learning:
Data Mining, Inference and Pre-
diction, Springer-Verlag New
York Inc
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 58
Prérequis Notions statistiques de base, me thodes de discrimination usuelles (re gression
logistique, arbres de de cision), re gression line aire.
Machine Learning
Objectifs Comprendre ce qu’est le Machine Learning, la nature des proble mes qu’il permet de re soudre. Apprendre a mettre en œuvre les principaux algorithmes sur des don-ne es re elles, a analyser leurs re sultats, et comparer leurs performances.
Contenu
DA
TA
SC
IEN
CE
Introduction
Méthodes d’agrégation ou méthodes d’ensemble
Bagging et fore ts ale atoires : re duction de variance; Mesures d’importance des variables Agre gation d’arbres de de cision Boosting : re duction de biais
Support Vector Machines (SVM), et méthodes à noyaux
Support Vector Machines line aires Support Vector Machines non line aires Astuce du noyau et ge ne ralisation
Réseaux de neurones
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 59
Prérequis De bonnes bases en statistique infe rentielle, en particulier en analyse discrimi-
nante par arbres de de cision et en re gression line aire. De bonnes notions de pro-
grammation avec R. Niveau correspondant a la formation Mode lisation et initia-
tion au machine learning.
Dure e 2 jours ou 14 heures
Logiciel utilise
R
Niveau
Tout public
Déjeuner
offert
Deep Learning
Objectif De couvrir le deep learning et ses applications, dont le transfer learning
Mettre en œuvre les principaux environnements de deep learning
Contenu
DA
TA
SC
IEN
CE
Découvrir l’approche deep learning et ses applications
Comprendre la différence avec les approches de machine lear-
ning Rappel des principes du machine learning Apprentissage supervise et non supervise L’optimisation
Comprendre le transfer learning
Découvrir les principaux environnements de deep learning
Tensorflow Keras
Utiliser les ressources du cloud et les GPU
Choix Installation
Découvrir les différents types de réseaux
Re seaux convolutionnels Re seaux re currents
Mettre en œuvre : atelier sur les réseaux convolutionnels (1 jour)
Pre parer et traiter les images pour le deep learning (en Python) Utiliser le transfer learning
Dure e 2 jours ou 14 heures
Niveau
Avance
Déjeuner
offert
Logiciel utilise
Python
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 60
Prérequis Premie re pratique de Python, connaissance du shell script, familiarite avec les
statistiques et l’analyse
Text Mining
Objectifs Mettre en œuvre les me thodes de la statistique textuelle sur des corpus de nature diffe rente (questions ouvertes, entretiens, mots associe s, articles de presse, pages Web, etc.) a l’aide de logiciels spe cifiques (IraMuTeQ, SpadT, R.TeMiS) Interpre ter, pre senter et valoriser les re sultats.
Contenu
DA
TA
SC
IEN
CE
Situer le Text Mining par rapport aux méthodes de la statistique
textuelle et au développement des méthodes.
Identifier les apports de la statistique textuelle et inte re t par rapport a l’analyse qualitative et l’utilisation de logiciels d’aide a la lecture de textes (NVivo, Sonal).
Collecter des données textuelles non structurées et des métadon-
nées associés et les préparer en corpus analysables.
Mettre en œuvre le traitement d’un corpus par les méthodes de
statistique textuelle
Construire un lexique associe , lemmatiser (ou pas), pre parer des tableaux lexicaux, et produire des statistiques uni ou multivarie es associe s.
Interpréter les résultats
Mots du lexique, concordances, mots spe cifiques, plans factoriels et arbres de
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 61
Prérequis Connaissance de base en statistique descriptive (formations Statistique 1
et Statistique 2)
Dure e 2 jours ou 14 heures
Logiciel utilise
Packages spe cifiques de R,
IraMuTeQ (me thode Alceste)
Repe res bibliographiques
Lebart, L. et Salem, A.
(1994), Statistique tex-
tuelle Paris, Dunod, 342 p.
Garnier B., Guérin-Pace F.
2010 Appliquer les me thodes
de la statistique textuelle Paris,
CEPED, 86 p. (Les Clefs pour
(Te le chargeable a partir du site
du Ceped : http://
www.ceped.org/?Appliquerles-
methodes-de-la)
Niveau
Tout public
Déjeuner
offert
Web-scraping (extaction de données sur le web)
Objectif Acque rir les notions the oriques et pratiques ne cessaires a la mise en œuvre des
techniques d’acquisition automatise es de donne es sur le web.
Contenu La formation se concentre sur les me thodes d’extraction de donne es structure es
ou semi-structure es depuis une page web (“web scraping”) ou une interface de
programmation. Chaque me thode fait l’objet d’une pre sentation the orique et
d’exemples pratiques de programmation. La formation ne cessite une connaisse de
base en programmation.
DA
TA
SC
IEN
CE
Les droits d’utilisation des données disponibles sur le web Pre sentation des concepts de licences sur les donne es, du mouvement OpenData et des principales licences.
Récupérer des données fournies par une interface de program-mation (API) De finition d’une API, reque tage, exemples pratiques avec Python et R.
Récupérer des données d’un site web
De finition du web scraping, parcours de pages web, exemples pratiques avec Python et R, utilisation des Apis Web (Google, Twitter…)
Exemples d’outils pour faciliter le web scraping
Outils pour extraire depuis des sites statiques ou sites fortement dynamiques (ajax): Scrapy, PhantomJS, etc.
Problèmes avancés d’extractions de données
Dure e 2 jours ou 14 heures
Niveau
Avance
Déjeuner
offert
Logiciels utilise s
R, Python, Google Chrome
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 62
Prérequis Connaissances de base en traitement de donne es, programmation (ide alement
en python), formation Les donne es structure es sur le web ou connaissances de
HTTP, HTML, CSS, XML, JSON, XPath, CSS selectors, regex.
Techniques de scoring
Objectifs Savoir construire un score pour la pre diction d’un phe nome ne binaire, depuis la phase d’e chantillonnage jusqu’aux restitutions finales.
Contenu La formation propose une pre sentation du concept de Data Mining et un panorama des me thodes
statistiques regroupe es sous ce terme – me thodes classiques de la statistique (analyse discrimi-
nante, re gression logistique) et me thodes plus ” informatiques ” (arbres de de cision, re seaux de neu-
rones). De nombreux exemples issus de diffe rents secteurs d’activite illustreront ces me thodes. Le
but est de pre senter les techniques et les pie ges de l’e tude de donne es volumineuses, avec un objec-
tif d’aide a la de cision. Cette formation ne recourt que peu au formalisme mathe matique. Les forma-
tions Analyse discriminante et segmentation et Me thodes de re gression pour donne es qualita-
tives permettront aux statisticiens d’approfondir la the orie et la mise en œuvre des me thodes pre -
dictives classiques.
DA
TA
SC
IEN
CE
Présentation du data mining De finition, positionnement par rapport a la statistique Principales applications Panorama des techniques pre dictives et descriptives employe es Pre sentation de l’offre logicielle Cycle d’un projet de scoring
Analyse descriptive liminaire Graphiques utiles Caracte risation par des tests statistiques Se lection de variables par des tests (e galite de moyennes, de me dianes, de distributions, khi-2) Gestion des donne es manquantes
Arbres de décision Construction d’un arbre Trois algorithmes : CHAID, CART, C4.5 – diffe rences et similitudes Exploration statistique avec des arbres Mode lisation avec des arbres
Analyse discriminante Principe de l’analyse discriminante line aire Me thode DISQUAL et fonction de score Forces et faiblesses
Régression logistique Principe de la re gression logistique binaire Commentaire d’un mode le Forces et faiblesses
Comparaison des méthodes de scoring E valuer la qualite d’un mode le : courbe ROC, courbe de lift Mise en oeuvre : transformer une probabilite en de cision Performance et robustesse : l’importance du jeu de test
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 63
Prérequis Connaissances de base en calcul des probabilite s et en statistique (test, re gression li-
ne aire).
Dure e 5 jours ou 35 heures
Logiciel utilise
R
Repe res bibliographiques
Tuffery S. (2017), Data Mining
et Statistique De cisionnelle,
Technip (5e me e dition)
Tuffery S. (2010), E tude de cas
en statistique De cisionnelle,
Technip (2e me e dition)
Tuffery S. (2017), Mode lisation
pre dictive et apprentissage sta-
tistique avec R, Technip (2e me
e dition)
Niveau
Tout public
Déjeuner
offert
CARTOGRAPHIE
THEMATIQUE
Ge ne ralite s sur la cartographie the matique
La pre paration d’un fond de carte (PHILDIGIT)
La re alisation de cartes the matiques
1
2
3
CA
RT
OG
RA
PH
IE T
HE
MA
TIQ
UE
Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-
tion des connaissances, cette formation alterne expose s the oriques et applications
pratiques / cas concrets / travaux sur ordinateur.
Généralités sur la cartographie Thématique
Objectifs
Comprendre l’inte re t des repre sentations the matiques et connaitre les
types de repre sentations graphiques
Contenu
CA
RT
OG
RA
PH
IE
TH
EM
AT
IQU
E
La cartographie thématique
Le cartogramme
Les logiciels de cartographie automatique
Eléments nécessaires pour une cartographie thématique
La sémiologie graphique
Les règles de la conception cartographique
La nature et le type de la mesure pour les types de carte
Les méthodes de discrétisation
Dure e 2 jours ou 14 heures
Niveau
Initiation
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 65
La préparation d’un fond de carte (PHILDIGIT)
Objectifs
Etre en mesure de re aliser tout le ne cessaire a l’e laboration d’une carte the -
matique., en particulier le fond de carte
Contenu
CA
RT
OG
RA
PH
IE
TH
EM
AT
IQU
E
Installation et présentation du logiciel
Etapes de la digitalisation
Préparation du tableau des données (fichier Excel)
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30
Prérequis
Avoir des notions de base sur la cartographie the matique. Dure e
2 jours ou 14 heures
Niveau
Initiation
Déjeuner
offert
Logiciels utilise s
PHILDIGIT
66
La réalisation de cartes thématiques
Objectifs
E tre capable de repre senter sur une carte, des indicateurs avec un logiciel
de cartographie open source.
Contenu
CA
RT
OG
RA
PH
IE
TH
EM
AT
IQU
E
Sous PHILCARTO
Installation et présentation du logiciel
Les cartes en surfaces colorées ou choroplèthes
Les méthodes de discrétisation
Les cartes en semis de points
Les cartes en cercles proportionnels sur surfaces colorées
Les cartes en cercles proportionnels colorés
Les cartes en demi-cercles affrontés
Les cartes en secteurs
Sous QGIS
Installation et pre sentation du logiciel
Re alisation de cartes et manipulations
Dure e 5 jours ou 35 heures
Niveau
Initiation
Déjeuner
offert
Logiciels utilise s
PHILCARTO et QGIS
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 67
Prérequis
Connaitre les notions de base en cartographie the matique et e tre en me-
sure de re aliser un fond de carte.
MODELISATION
ECONOMIQUE
Mode lisation en e quilibre Ge ne ral Calculable
Me thodes micro e conome triques d’e valuation d’impact
1
2
MO
DE
LIS
AT
ION
EC
ON
OM
IQU
E
Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-
tion des connaissances, cette formation alterne expose s the oriques et applications
pratiques / cas concrets / travaux sur ordinateur.
Programmation financie re 3
Modélisation en équilibre Général Calculable
Objectifs Maî triser la mode lisation en e quilibre ge ne ral calculable.
Contenu Tout comme les mode les macro-e conome triques, les mode les d’e quilibre ge ne ral
calculable sont couramment utilise s pour l’e valuation des conse quences macro-
e conomiques de mesures de politique e conomique. Leur horizon de simulation
rele ve cependant du long terme et leurs spe cifications s’appuient strictement sur
la micro-e conomie du consommateur et du producteur.
La formation comporte tant des aspects the oriques qu’applique s. Les travaux diri-
ge s se de roulent dans l’environnement logiciel GAMS, principal outil de mode lisa-
tion en e quilibre ge ne ral calculable sur le plan international.
MO
DE
LIS
AT
ION
EC
ON
OM
IQU
E
Introduction Pre sentation des familles de mode les d’e quilibre ge ne ral calculable – mise en perspective historique
Techniques de modélisation Construction d’un mode le statique d’e quilibre ge ne ral calculable : approche the orique. Nous aborderons ici la notion de loi de Walras, de matrice de comptabilite sociale, de calibrage. Les formes fonctionnelles usuelles (ces, Cobb-Douglas, Leontief) et leurs proprie te s seront pre sente es rapidement.
Construction d’un modèle Construction, pas a pas, de deux mode les statiques simples (en autarcie, sans et avec de penses publiques), dans l’environnement gams. Plusieurs simulations seront effectue es et commente es. Pre sentation d’un mode le dynamique : un document de travail de taille pre sentera un mode le d’e quilibre ge ne ral calculable dynamique a anticipations parfaites, dont le code gams et les re sultats de simulations seront ensuite commente s en de tail
Dure e 5 jours ou 35 heures
Niveau
Avance
Déjeuner
offert
Logiciels utilise s
Gams
Repe res bibliographiques
Brillet, J.-L. (1994), Mode lisa-
tion e conome trique, Economica
Épaulard, A. (1997), Les mo-
de les applique s de la macroe co-
nomie, Topos, Dunod
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 69
Prérequis Connaissances de base en macroe conomie et en e conome trie.
Méthodes micro économétriques d’évaluation d’impact
Objectifs L’objectif du cours est de fournir aux participants les outils ne cessaires a l’e va-
luation d’impact de politiques ou de projets mene s. Le cours se tourne vers les
me thodes micro e conome trique d’e valuation. Les diffe rences entre les me thodes
seront pre sente es afin de ressortir les cas ide aux d’application de chacune des
me thodes.
Contenu
MO
DE
LIS
AT
ION
EC
ON
OM
IQU
E
Les différences de différence
Les variables instrumentales
Les régressions sur discontinuité
Contrôler des observables: le matching
Au-delà de la moyenne : les régressions de quantile
De l’estimation à l’interprétation
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 70
Dure e 5 jours ou 35 heures
Niveau
Avance
Déjeuner
offert
Logiciels utilise s
Stata, R
Repe res bibliographiques
Brillet, J.-L. (1994), Mode lisa-
tion e conome trique, Economica
Épaulard, A. (1997), Les mo-
de les applique s de la macroe co-
nomie, Topos, Dunod
Programmation financière
Objectifs L’objectif du cours est de permettre aux e le ves de comprendre les me canismes
d’e laboration et de mise en œuvre des politiques macroe conomique et financie re
dans le cadre des programmes d’ajustement structurels conduit par le FMI et la
Banque Mondiale. Ce se minaire doit permettre aux inge nieurs statisticiens e co-
nomistes de s’inte grer efficacement dans la haute administration e conomique et
financie re.
Contenu
MO
DE
LIS
AT
ION
EC
ON
OM
IQU
E
Introduction générale
Définition de la programmation financière
Introduction a partir d’une e tude de cas
Ro le du FMI
Analyse sectorielle
Le secteur re el
L’administration publique
La balance des paiements
Le secteur mone taire
Les interrelations
Méthode de projection
Elaboration d’un scénario de référence
Dure e 5 jours ou 35 heures
Niveau
Avance
Déjeuner
offert
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30 71
Prérequis Connaissances de base en macroe conomie et en e conome trie.
RENSEIGNEMENTS
PRATIQUES
RE
NS
EIG
NE
ME
NT
S P
RA
TIQ
UE
S
Les formations sur mesure sont organisées pour répondre
aux besoins spécifiques d’entreprises ou d’administration.
Une équipe professionnelle à votre disposition
L’unité de formation continue de l’ENSAE de Dakar offre des
formations adaptées aux enjeux actuels et donc aux attentes
des entreprises et organisations.
Un membre de l’e quipe pe dagogique de l’ENSAE est le premier responsable
dans le traitement de chaque demande. Il est le contact privile gie , garant de
la continuite des e changes, pour accompagner l’organisme dans cette de -
marche. Il analyse la proble matique , assure l’inge nierie pe dagogique adap-
te e aux futurs participants et organise la formation. Il identifie les interve-
nants qui sont les plus indique s pour la mise en œuvre de la formation. Il su-
pervise e galement les aspects administratifs et logistiques de la formation.
Ces formations permettent une plus grande flexibilite en termes de dates, de
lieu et de contenu.
Le contenu des formations sur mesure peut e tre une adaptation d’une fiche
pre sente e dans ce catalogue ou peut traiter un autre domaine d’expertise de
l’ENSAE.
Notre devoir est de vous apporter quelle que soit votre de-
mande la réponse la plus conforme, assurant votre entière
satisfaction.
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30
Ils nous ont fait confiance
Au Sénégal: ANSD, Observatoire National de la Parite (ONP), Ministe re de la sante et de l’action sociale, Ministe re de la formation professionnelle, de l’apprentissage et de l’artisanat (MFPAA), Ministe re de l’Edu-cation Nationale (MEN), Ministe re de l’Agriculture et de l’Equipement Rural (MAER), UCAD, Campus franco se ne galais, etc.
Organismes étrangers ou internationaux: USAID, Abt Associate, INSTAT Mali, PNUD, World Vision, Coo-pe ration Canadienne, Coope ration Espagnole, Universite Paris Dauphine, IRD, PSL, etc.
Des activités consacrées essentiellement à des formations sur mesure pour répondre à des besoins spécifiques
La formation continue a l’ENSAE n’est pas as-
sujettie a la TVA. Les prix indique s sont nets.
Afin de faciliter l’acce s aux doctorants et e tu-
diants aux formations, l’ENSAE leur propose
des tarifs pre fe rentiels. Ils peuvent se rappro-
cher de l’e quipe de formation continue pour
plus d’informations.
Pour les formations sur mesure se tenant des
journe es comple tes dans les locaux de
l’ENSAE, les de jeuners et les pauses cafe du
matin et du soir sont aussi offertes. Un trai-
teur est contracte pour assurer le service de
restauration.
Un kit compose d’une cle USB avec le contenu
du cours, un port document et du mate riel
didactique est distribue lors de chaque ses-
sion.
L’e quipe de l’unite de formation continue est
charge de proposer un tarif sur mesure cor-
respondant aux formation demande es.
N’he sitez pas a prendre contact avec les
membres de l’administration de l’ENSAE pour
des renseignements supple mentaires concer-
nant les tarifs des formations.
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30
Les tarifs Modalités
d’inscriptions
Chacune des formations concerne un public
spe cifique et clairement identifie . Veuillez
vous re fe rer a la fiche de pre sentation des for-
mations pour ve rifier que vous respectez les
pre requis de finis.
La validation des crite res/profils de finis pour
chacune des formations est l’impe ratif pour
l’inscription aux dites formations.
Pour les entreprises et administrations, la si-
gnature d’une convocation avec l’ANSD ou
l’ENSAE sera ne cessaire pour l’effectivite des
formations.
A l’issue de chaque session de formation, une
attestation de participation sera de livre e aux
participants.
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30
Annulation
Toute annulation doit e tre signale e par e crit
(par courrier ou courrier e lectronique) a
l’ENSAE au moins deux semaines avant le de -
but de la formation.
Pour toute annulation parvenant moins de
deux semaines avant le de but de la formation,
l’ENSAE se re serve le droit de facturer 50%
des droits d’inscription.
En cas d’absence ou d’annulation reçue apre s
le de but de la formation, la totalite des droits
d’inscription sera exigible.
Horaires de
formations
Contact
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30 Email : [email protected] www.ensae.edu.sn
09h00 - 17h00
Sauf exception, nos
journe es de formation
durent 7 heures
Nos partenaires qui nous accompagnent dans nos formations
ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar
Tel: 33 859 43 30
Campus franco-sénégalais Université Paris Dauphine UCAD Uni-
versité Paris-Saclay USAID Canada (LAVAL Montréal) IRD ABT
Associates Ministère de la santé et de l’action sociale MAER World
Vision ONP INSTAT Coopération espagnole PNUD ANSD Minis-
tère de l’éducation nationale Ministère de la formation profession-
nelle de l’apprentissage et de l’artisanat.
Bulletin d’inscription Valable pour toutes les formations de l’ENSAE
Chaque participant recevra un courrier lui donnant toutes les informations sur l’organisation
de la session, trois semaines avant son déroulement
INTITULE ET DATES DE LA FORMATION :
> ORGANISME : Adresse :
Nom du responsable de formation :
Téléphone : Fax :
Mél (pour l’envoi de la convention et de la convocation) :
Adresse de facturation (Si différente) :
> PERSONNE A INSCRIRE Nom :
Niveau de formation :
Téléphone : Fax :
Mél (pour l’envoi de la convocation) :
Formation(s) déjà suivie(s) à l’ENSAE :
Mme M Prénom :
Fonction actuelle :
Motivations et attentes vis-à-vis de cette formation :
Signature et Date :
Il est également possible de s’inscrire par le web :
http://www.ensae.sn/
ENSAE Formation Continue
Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30
Plan d’accès à l’ENSAE
Départ : Marche de Colobane, Dakar
12 minutes de marche sur une distance de 900m
Rocade Fann Cerf-volant.
BP 116 RP,, Dakar
Tel: 33 859 43 30
Email : [email protected]
http://www.ensae.edu.sn/