ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e...

78
ENSAE – Ecole Nationale de la Statistique et de l’Analyse Economique Formation continue Statistique descriptive Analyse des données multi-dimensionnelles Modélisation Enquête et sondage Séries temporelles Logiciels statis- tique Data Science Cartographie Modélisation économique Méthodes micro économétrique d'évaluaon d'impact web-craping (extacon de données sur le web) Modélisaon en équilibre Général Calculable Iniaon à la cartographie Thémaque Programmaon financière Panorama du Big Data Modèles VAR et VECM Python intermédiaire Excel intermédiaire Machine learning Micro simulaon Python iniaon R intermédiaire Stata iniaon Excel iniaon Python avancé VB sous Excel Excel avancé Data mining Text mining R iniaon Phil carto R avancé Arc-GIS Spark Julia Concepon d'enquête, élaboraon de quesonnaire, le secret stasque Stasque 2 : descripon et mesure de la liaison entre deux variables Stasque et méthodes de régression pour données spaales Méthodes de régression pour données qualitaves Panorama des méthodes danalyse des données Correcon de la non-réponse dans les enquêtes Régression linéaire et analyse de la variance Stasque 1 : introducon à la stasque Analyse des séries temporelles avec Excel Modèles ARMA, ARMAX et ARCH-GARCH Panorama des méthodes de sondages Les indices : construcon et ulisaon Analyse des séries temporelles avec R Désaisonnaliser une série temporelle Econométrie des données de panel Stasque descripve avec Excel Analyse des données avec Spad Stasque non paramétrique Stasque descripve avec R Analyse des données avec R Méthodes de redressement Techniques de scoring Sondages avec R Deep learning Echanllonnage Catalogue 2019/2020 ANSD : Agence Nationale de la Sta- tistique et de la Démographie ENSAE : Ecole Nationale de la Statis- tique et de l’Analyse Economique

Transcript of ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e...

Page 1: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE – Ecole Nationale de la Statistique

et de l’Analyse Economique

Formation continue

Statistique descriptive Analyse des données multi-dimensionnelles

Modélisation Enquête et sondage Séries temporelles Logiciels statis-

tique Data Science Cartographie Modélisation économique

Méthodes micro économétrique d'évaluation d'impact web-craping (extaction de données sur le web) Modélisation en équilibre Général Calculable Initiation à la cartographie Thématique Programmation financière Panorama du Big Data Modèles VAR et VECM Python intermédiaire Excel intermédiaire Machine learning Micro simulation Python initiation R intermédiaire Stata initiation Excel initiation Python avancé VB sous Excel Excel avancé Data mining Text mining R initiation Phil carto R avancé Arc-GIS Spark Julia

Conception d'enquête, élaboration de questionnaire, le secret statistique Statistique 2 : description et mesure de la liaison entre deux variables

Statistique et méthodes de régression pour données spatiales Méthodes de régression pour données qualitatives

Panorama des méthodes d’analyse des données Correction de la non-réponse dans les enquêtes

Régression linéaire et analyse de la variance Statistique 1 : introduction à la statistique Analyse des séries temporelles avec Excel Modèles ARMA, ARMAX et ARCH-GARCH

Panorama des méthodes de sondages Les indices : construction et utilisation Analyse des séries temporelles avec R Désaisonnaliser une série temporelle

Econométrie des données de panel Statistique descriptive avec Excel

Analyse des données avec Spad Statistique non paramétrique Statistique descriptive avec R

Analyse des données avec R Méthodes de redressement

Techniques de scoring Sondages avec R

Deep learning Echantillonnage

Catalogue 2019/2020

ANSD : Agence Nationale de la Sta-tistique et de la Démographie ENSAE : Ecole Nationale de la Statis-tique et de l’Analyse Economique

Page 2: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data
Page 3: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

SOMMAIRE

Statistique descriptive

Analyse des données multidimensionnelles

Modélisation

Enquête et sondage

Séries temporelles

Logiciels statistiques

Data Science

Cartographie thématique

Modélisation économique

ANSD : Agence Nationale de la Statistique et de la Démographie ENSAE : Ecole Nationale de la Statistique et de l’Analyse Economique

Renseignements pratiques

07

13

17

23

31

37

57

67

71

76

Page 4: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Ecole Nationale de la Statistique

et de l’Analyse Économique

Formation continue

Statistique 1 : introduction à la statistique Statistique 2 : description et mesure de la liaison entre deux variables

Les indices : construction et utilisation Statistique descriptive avec Excel

Statistique descriptive avec R

ANSD : Agence Nationale de la Sta-tistique et de la Démographie ENSAE : Ecole Nationale de la Statis-tique et de l’Analyse Economique

Stati

stiq

ue

des

crip

tive

Panorama des méthodes d’analyse des données Analyse des données avec Spad

Analyse des données avec R

An

alys

e d

es

do

nn

ées

mu

lti-

dim

ensi

on

nel

les

Régression linéaire et analyse de la variance Méthodes de régression pour données qualitatives

Statistique et méthodes de régression pour données spatiales Économétrie des données de panel

Statistique non paramétrique

Mo

dél

isati

on

Conception d'enquête, élaboration de questionnaire Le secret statistique: principes et pratiques

Echantillonnage Panorama des méthodes de sondages

Méthodes de redressement Correction de la non-réponse dans les enquêtes

Sondages avec R Enq

uêt

e et

So

nd

age

Analyse des séries temporelles avec Excel Analyse des séries temporelles avec R Désaisonnaliser une série temporelle

Modèles ARMA, ARMAX et ARCH-GARCH Modèles VAR et VECM Sé

ries

tem

po

relle

s

p. 08 p. 09 p. 10 p. 11 p. 12

…………………………………………... …………………….. ……………………

……………………..

……………………………………………………………….

p. 14 p. 15 p. 16

………………………………………………………………………………………………………….

p. 18 p. 19 p. 20 p. 21 p. 22

……………………………………………………………………………………………………………………………………………………

p. 24 p. 25 p. 26 p. 27 p. 28 p. 29 p. 30

………………………………………………………………………………………………………….

p. 32 p. 33 p. 34 p. 35 p. 36

Page 5: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Ecole Nationale de la Statistique

et de l’Analyse Économique

Formation Continue

Rocade Fann Bel - air Cerf - volant BP 116 Dakar RP Sénégal

Rocade Fann Cerf-volant. BP 116 RP,, Dakar

Logiciels

Statisti

qu

es

Data

Science

C

artograp

hie

Thém

atiq

ue

Mo

délisati

on

Econ

om

iqu

e

Panorama du Big Data Panorama des méthodes de Data mining Méthodes avancées de Data Mining Machine learning Deep learning Text mining web-scraping (extraction de données sur le web) Techniques de scoring

Modélisation en équilibre Général Calculable Méthodes micro économétriques d’évaluation d’impact Programmation financière

Généralités sur la cartographie Thématique La préparation d’un fond de carte (PHILDIGIT) La réalisation de cartes thématiques

Construire des tableaux de bord et gérer vos données avec Excel

Créer un programme personnalisé avec Excel et le VBA

R initiation, intermédiaire, avancé

Python initiation, intermédiaire, avancé

Cspro/ Survey Solution/ ODK Collect

Stata

GAMS

SPSS

Eviews

Hadoop

Spark

……………………… ……………………… ……………………… ……………………… ……………………… ……………………… ……………………… ………………………

…………………………

…………………………

…………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………

…………………… …………………… …………………….

……………………. ……………………. …………………….

p. 58 p. 59 p. 60 p. 61 p. 62 p. 63 p. 64 p. 65

p. 38

p. 39

p. 40

p. 43

p. 46

p. 49

p. 50

p. 51

p. 52

p. 53

p. 54

p. 68 p. 69 p. 70

p. 72 p. 73 p. 74

Page 6: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

STATISTIQUE DESCRIPTIVE

Statistique 1 : introduction a la statistique

Statistique 2 : description et mesure de la liaison entre deux variables

Les indices : construction et utilisation

Statistique descriptive avec Excel

Statistique descriptive avec R

1

2

3

4

5

ST

AT

IST

IQU

E D

ES

CR

IPT

IVE

Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-

tion des connaissances, cette formation alterne expose s the oriques et applications

pratiques / cas concrets / travaux sur ordinateur.

Page 7: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Statistique 1 : introduction à la statistique

Objectifs Maî triser les concepts de la statistique descriptive. Savoir re aliser des traite-

ments simples sur des donne es unidimensionnelles et pre senter les re sultats ob-

tenus a l’aide de tableaux, de graphiques et d’indicateurs nume riques.

Contenu Apprendre a organiser, traiter, analyser et pre senter l’information, tel est l’objet

de cette formation d’initiation a la statistique, construite a partir d’exemples pra-

tiques. La formation a une orientation pratique forte : les apre s-midis et la der-

nie re journe e sont consacre s a des e tudes de cas avec traitement de donne es a

l’aide d’Excel.

ST

AT

IST

IQU

E

DE

SC

RIP

TIV

E

Les concepts de la statistique

De finitions : population, unite statistique, variables, modalite s

Les diffe rents types de caracte res : caracte res qualitatifs et quantitatifs, variables

discre tes et continues

Construction de tableaux statistiques

Les graphiques

Variables qualitatives : diagramme en tuyaux d’orgue, diagramme circulaire

Variables quantitatives : diagramme en ba tons, histogramme, courbe cumulative

Autres repre sentations graphiques

Résumer l’information et choisir la caractéristique la plus appro-

priée

Caracte ristiques de position : moyenne arithme tique, me diane, mode, autres

moyennes, quantiles

Boî te a moustaches (box-plot)

Caracte ristiques de dispersion : variance et e cart-type, coefficient de variation, e cart

absolu me dian, e tendue, intervalles inter-quantiles

Étude de la concentration

Courbe de Lorenz, indice de Gini

Cas de synthèse (dernière journée)

Dure e 3 jours ou 21 heures

Niveau

Initiation

Déjeuner

offert

Logiciels utilise s

Excel

Repe res bibliographiques

Grais, B. (2003), Statistique

descriptive, Dunod, 3e me e di-

tion

Py, B. (2013), La statistique

sans formule mathématique:

comprendre la logique et maîtri-

ser les outils, Pearson, 3e me

e dition

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 7

Page 8: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Statistique 2 : description et mesure de la liaison entre deux

variables

Objectifs Re aliser des traitements simples sur des donne es bidimensionnelles.

Calculer des indicateurs permettant de mesurer la liaison entre deux variables.

Contenu Cette formation est un prolongement de la formation Statistique 1 et permet de

re aliser des traitements sur des donne es bidimensionnelles. La formation a une

orientation pratique forte, de nombreux exemples et exercices seront propose s

avec Excel.

ST

AT

IST

IQU

E

DE

SC

RIP

TIV

E

Cas de deux variables qualitatives

Les tableaux de contingence, distributions marginales et conditionnelles,

repre sentation graphique

Cas de deux variables quantitatives

Repre sentation graphique

L’ajustement line aire (droite de re gression), la covariance, le coefficient de

corre lation line aire

Cas de deux variables ordinales

Coefficient de corre lation de rang de Spearman

Cas des variables discrètes

La courbe de re gression

Cas d’une variable qualitative et d’une variable quantitative

Repre sentation graphique

Les moyennes et variances conditionnelles et marginales

L’analyse de variance a un facteur, le rapport de corre lation

Mise en œuvre des notions vues au cours de la formation au travers de diffe rentes

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 8

Prérequis Niveau de statistique correspondant a la formation Statistique 1 et connais-

sances de base d’Excel.

Dure e 3 jours ou 21 heures

Niveau

Initiation

Déjeuner

offert

Logiciels utilise s

Excel

Repe res bibliographiques

Grais, B. (1998), Me thodes sta-

tistiques, Dunod, 3e me e dition

Py, B. (2013), La statistique

sans formule mathématique:

comprendre la logique et maîtri-

ser les outils, Pearson, 3e me

e dition

Page 9: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Les indices : construction et utilisation

Objectifs Savoir bien utiliser des indices existants.

Savoir construire des indices correspondant aux besoins propres de l’utilisateur.

Contenu Les instituts de statistique diffusent re gulie rement une batterie importante

d’indices e conomiques comme l’indice des prix a la consommation ou l’indice de

la production industrielle. Par ailleurs, chacun peut e tre amene a construire des

indices qui lui sont propres de façon a synthe tiser une information foisonnante.

Cette formation vise a fournir une vision d’ensemble des principales questions

me thodologiques lie es a la construction des indices statistiques. Elle s’appuie sur

des exemples concrets pour montrer le type de questions qui se posent, en les re-

plaçant dans une proble matique plus ge ne rale. Des applications simples sur ta-

bleur comple tent la formation.

ST

AT

IST

IQU

E

DE

SC

RIP

TIV

E

Pourquoi et pour qui construit-on des indices ?

Les indices classiques

Différentes approches des indices: statistiques, axiomatiques ou

économiques

Le chaînage des indices, les changements de base

Quelques problèmes particuliers : données collectées, évolution

des produits, données manquantes, méthodes hédoniques…

Dure e 3 jours ou 21 heures

Niveau

Initiation

Déjeuner

offert

Logiciels utilise s

Excel

Repe res bibliographiques

Caillaud, A. (1998), Pour com-

prendre l’indice des prix, Insee

Me thode n°81-82

Berthier, J.P. (2005), Introduc-

tion a la pratique des indices

statistiques, Insee Document de

travail M0503

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 9

Prérequis Une connaissance ge ne rale des statistiques descriptives (formation Statistique

1 : introduction a la statistique).

Page 10: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Statistique descriptive avec Excel

Objectifs A l’issue de cette formation, les participants seront capables de : Calculer une suc-

cession de statistiques descriptives,

Re aliser les graphiques adapte s les plus courants

Contenu Cette formation est un prolongement de la formation Statistique 1 et permet de

re aliser des traitements sur des donne es bidimensionnelles. La formation a une

orientation pratique forte, de nombreux exemples et exercices seront propose s

avec Excel.

ST

AT

IST

IQU

E

DE

SC

RIP

TIV

E

Cas de deux variables qualitatives

Les tableaux de contingence, distributions marginales et conditionnelles,

repre sentation graphique

Cas de deux variables quantitatives

Repre sentation graphique

L’ajustement line aire (droite de re gression), la covariance, le coefficient de

corre lation line aire

Cas de deux variables ordinales

Coefficient de corre lation de rang de Spearman

Cas des variables discrètes

La courbe de re gression

Cas d’une variable qualitative et d’une variable quantitative

Repre sentation graphique

Les moyennes et variances conditionnelles et marginales

L’analyse de variance a un facteur, le rapport de corre lation

Atelier

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 10

Prérequis Connaissance des bases the oriques de la statistique descriptive (formations Statistique 1

et Statistique 2) et connaissances de base du logiciel Excel (formation Excel Initiation).

Dure e 3 jours ou 21 heures

Niveau

Initiation

Déjeuner

offert

Logiciels utilise s

Excel

Repe res bibliographiques

Grais, B. (1998), Me thodes sta-

tistiques, Dunod, 3e me e dition

Py, B. (2013), La statistique

sans formule mathématique:

comprendre la logique et maîtri-

ser les outils, Pearson, 3e me

e dition

Page 11: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Statistique descriptive avec R

Objectifs A l’issue de cette formation, les participants seront capables de : Calculer une succession de statistiques descriptives, Re aliser les graphiques adapte s les plus courants, Combiner diffe rentes analyses dans un me me programme.

ST

AT

IST

IQU

E

DE

SC

RIP

TIV

E

Manipulation de données Importer un fichier de donne es Discre tiser une variable continue Identifier et compter des donne es manquantes, identifier des individus atypiques Re cupe rer un sous ensemble de donne es (subset) Fusionner des donne es (merge) Agre ger des donne es Mettre en forme des donne es re pe te es (format long et wide)

Description d’une à deux variables Repre sentation des distributions statistiques univarie es E dition des caracte ristiques de position (moyenne, me diane, quantiles..) et de dispersion (variance, e cart-type….) Repre sentation d’une variable Repre sentation des distributions bi varie es sous forme de tableaux E dition d’indicateurs de liaison entre variables (statistique du khi-deux, V de Cramer, coefficient de corre lation line aire…) ODDS, ODDS ratio, Risque Ratio

Les graphiques avec R Diffe rents types de graphique propose s dans R : plot , ggplot Ajouts d’e le ments sur un graphique Exporter un graphique

Mettre en forme les résultats Re aliser une e bauche de quatre pages (objectifs, plan, tableau, graphique) ou d’une pre sentation, a l’aide des e le ments de statistiques pre sente s au cours de la formation

Dure e 3 jours ou 21 heures

Niveau

Initiation

Déjeuner

offert

Logiciels utilise s

R et Excel

Repe res bibliographiques

Everitt, B.S et Hothorn, T.

(2009), A handbook of Statisti-

cal analysis using R, 2nd edi-

tion, CRC Press

Muenchen, R.A. (2008), R for

SAS and SPSS users, Springer

Murrel, P. (2011), R graphics,

2nd edition, CRC press

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 11

Prérequis Connaissance des bases the oriques de la statistique descriptive (formations Statistique

1 et Statistique 2) et connaissances de base du logiciel R (formation Initiation a R) .

Contenu La formation est consacre e a la pre sentation des principales proce dures du logiciel R per-

mettant de faire de la statistique descriptive. Gra ce a plusieurs exercices d’applications,

les stagiaires seront amene s a mettre en œuvre ces proce dures afin de synthe tiser un ta-

bleau de donne es (re partition par sexe et CSP, classement des jeux vide os, re partition des

causes de mortalite par pays). Cette formation contient e galement quelques rappels en

statistique descriptive uni- et bi-varie e.

Page 12: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ANALYSE DE DONNÉES

MULTI-DIMENSIONNELLE

Panorama des me thodes d’analyse des donne es

Analyse des donne es avec Spad

Analyse des donne es avec R

1

2

3

AN

AL

YS

E D

ES

DO

NN

ÉE

MU

LT

I-

DIM

EN

SIO

NN

EL

LE

Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-

tion des connaissances, cette formation alterne expose s the oriques et applications

pratiques / cas concrets / travaux sur ordinateur.

Page 13: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Pouvoir dialoguer avec les spe cialistes de ce domaine et comprendre leurs

conclusions.

Contenu

Introduction générale

Objectifs de l’analyse des données et panorama des méthodes

Les me thodes usuelles d’analyse d’un tableau de donne es

Analyse en Composantes Principales

Analyse des Correspondances Multiples

Classification d’individus

Les méthodes avancées d’analyse de données

L’analyse de tableaux multiples

Quelques logiciels d’analyse des donne es

Dure e 3 jours ou 21 heures

Niveau

Tout public

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 13

Prérequis Bonnes connaissances en statistique descriptive, maî trise du formalisme

mathe matique.

Panorama des méthodes d’analyse

des données AN

AL

YS

E D

ES

DO

N-

E M

UL

TI-

DIM

EN

SIO

NN

EL

LE

Repe res bibliographiques

Escofier, B. et J. Pagès (2008),

Analyses factorielles simples et

multiples, Dunod

Bouroche J.M., Saporta G.

(2011), L’analyse des données,

PUF , que sais-je 1854

Page 14: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

AN

AL

YS

E D

ES

DO

N-

E M

UL

TI-

DIM

EN

SIO

NN

EL

LE

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 14

Dure e 3 jours ou 21 heures

Niveau

Initiation

Déjeuner

offert

Logiciels utilise s

SPAD et Excel

Repe res bibliographiques

Grais, B. (1998), Me thodes sta-

tistiques, Dunod, 3e me e dition

Py, B. (2013), La statistique

sans formule mathe matique:

comprendre la logique et maî -

triser les outils, Pearson, 3e me

e dition

Objectifs Savoir choisir et re aliser de façon autonome des analyses factorielles et classifications,

avec le logiciel Spad. Selon la proble matique et la nature des donne es, et en interpre ter

les re sultats.

Prérequis Bonnes Connaissance des bases the oriques de la statistique descriptive (formations

Statistique 1 et Statistique 2) et connaissances de base du logiciel Spad (formation Spad

Initiation). Notions de calcul matriciel souhaitables.

Contenu Les me thodes factorielles (analyse en composantes principales, analyse des corres-

pondances) permettent au travers de techniques de visualisation, de re sumer, struc-

turer et synthe tiser l’information contenue dans des masses volumineuses de don-

ne es. Les me thodes de classification permettent, en se parant les unite s statisques

d’une population en groupes homoge nes, de cre er une typologie : cre er ou identifier

des groupes d’individus, de zones ge ographiques ou encore d’entreprises par

exemple. Les stagiaires mettrons en œuvre ces me thodes au moyen de nombreux

exercices pratiques avec le logiciel Spad.

Analyse d’un nuage de points

Inertie. Recherche des axes principaux d’inertie. Composantes principales. Repre sentations

graphiques. Aides a l’interpre tation.

Analyse en composantes principales

Analyse du nuage des individus. Proprie te s des composantes principales. Analyse du nuage

des variables. Interpre tation des re sultats.

Analyse des correspondances

Nuages des profils-lignes et des profils-colonnes, la distance du khi-deux. Analyse des

nuages des profils. Liens entre les analyses. Interpre tation des re sultats.

Analyse des correspondances multiples

Analyse des correspondances sur le tableau disjonctif complet. Proprie te s de l’ACM. Ana-lyse du tableau de Burt.

Données manquantes

Introduction a la gestion des donne es manquantes dans les me thodes d’analyse factorielle

Classification

Classification ascendante hie rarchique : principe, strate gies d’agre gation, aides a l’interpre -tation. Me thodes de partitionnement : les me thodes des centres mobiles, les nue es dyna-miques. Classification mixte.

Analyse des données avec Spad

Page 15: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Savoir choisir et re aliser de façon autonome des analyses factorielles et classifications, avec

le logiciel R (package FactoMineR), selon la proble matique et la nature des donne es, et en

interpre ter les re sultats.

Contenu Les me thodes factorielles (analyse en composantes principales, analyse des correspon-

dances) permettent au travers de techniques de visualisation, de re sumer, structurer et

synthe tiser l’information contenue dans des masses volumineuses de donne es. Les me -

thodes de classification permettent, en se parant les unite s statistiques d’une population en

groupes homoge nes, de cre er une typologie : cre er ou identifier des groupes d’individus, de

zones ge ographiques ou encore d’entreprises par exemple. Les stagiaires mettrons en

œuvre ces me thodes au moyen de nombreux exercices pratiques avec le logiciel R.

Analyse d’un nuage de points

Inertie. Recherche des axes principaux d’inertie. Composantes principales. Repre senta-

tions graphiques. Aides a l’interpre tation.

Analyse en composantes principales

Analyse du nuage des individus. Proprie te s des composantes principales. Analyse du

nuage des variables. Interpre tation des re sultats.

Analyse des correspondances

Nuages des profils-lignes et des profils-colonnes, la distance du khi-deux. Analyse des

nuages des profils. Liens entre les analyses. Interpre tation des re sultats.

Analyse des correspondances multiples

Analyse des correspondances sur le tableau disjonctif complet. Proprie te s de l’ACM. Analyse du tableau de Burt.

Données manquantes

Introduction a la gestion des donne es manquantes dans les me thodes d’analyse facto-rielle

Classification

Classification ascendante hie rarchique : principe, strate gies d’agre gation, aides a l’inter-pre tation. Me thodes de partitionnement : les me thodes des centres mobiles, les nue es dynamiques. Classification mixte.

Dure e 3 jours ou 21 heures

Niveau

Avancé

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 15

Prérequis Bonnes Connaissance des bases the oriques de la statistique descriptive (formations Statis-

tique 1 et Statistique 2) et connaissances de base du logiciel R (formation R Initiation). No-

tions de calcul matriciel souhaitables.

Analyse des données avec R AN

AL

YS

E D

ES

DO

N-

E M

UL

TI-

DIM

EN

SIO

NN

EL

LE

Logiciels utilise s

R

Repe res bibliographiques

B. Escoffier et J. Pages (2016), Analyses factorielles simples et multiples, 5e édition, Dunod

Husson, F., S. Lê et J. Pagès

(2009), Analyse des données avec

R, Presse universitaire de Rennes

Page 16: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

MODÉLISATION

Re gression line aire et analyse de la variance

Me thodes de re gression pour donne es qualitatives

Statistique et me thodes de re gression pour donne es spatiales

1

2

3

4

5

MO

LIS

AT

ION

Econome trie des donne es de panel 4

Statistique non parame trique 5

Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-

tion des connaissances, cette formation alterne expose s the oriques et applications

pratiques / cas concrets / travaux sur ordinateur.

Page 17: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Etre en mesure de construire un mode le de re gression pour expliquer ou pre voir

des phe nome nes, et analyser l’influence de facteurs qualitatifs dans ce type de mo-

de les.

Contenu Il s’agit d’apprendre a mettre en relation des variables a partir d’observations statistiques,

a maî triser la construction et l’e tude de mode les de re gression entrant dans le cadre du

mode le line aire ge ne ral, pour expliquer ou pre voir des phe nome nes, et a savoir analyser

l’influence de facteurs qualitatifs. Cette formation est conseille e a ceux qui souhaitent

suivre les formations Analyse discriminante et segmentation et Méthodes de régression sur

données qualitatives.

Régression simple

Aspects descriptifs : me thode des moindres carre s

Aspects statistiques : validation du mode le, tests concernant les coefficients, e tude des

re sidus et des points influents

Utilisation du mode le en pre vision

Régression multiple

E tudes pre alables a la construction d’un mode le : repre sentation graphique des individus

et des variables

Pre sentation du mode le : estimation des parame tres, tests, e tude de la qualite du mode le

Le proble me de la se lection des variables : les me thodes de re gression pas a pas, choix du

“meilleur” mode le

L’introduction de variables qualitatives dans un mode le de re gression multiple

Analyse de la variance à un facteur

Le mode le a effets fixes, tests de comparaisons multiples, analyse de la variance non para-

me trique

Analyse de la variance à deux facteurs et plus

La notion d’interactions

Utilisation de variables quantitatives et qualitatives dans le cadre du mode le line aire ge -

ne ral (analyse de la covariance)

Applications informatiques

Mise en œuvre des me thodes de re gression et d’analyse de la variance sous R

Dure e 4 jours ou 28 heures

Niveau

Avancé

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 17

Prérequis Connaissances de base en statistique, en particulier les notions d’estimation et de

test (formation Statistique 3).

MO

LIS

AT

ION

Logiciels utilise s

R, Excel

Repe res bibliographiques

B. Escoffier et J. Pages (2016),

Analyses factorielles simples

et multiples, 5e e dition, Du-

nod

Régression linéaire et analyse de la variance

Page 18: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

18

Dure e 5 jours ou 35 heures

Niveau

Avance

Déjeuner

offert

Logiciels utilise s

Stata, R

Repe res bibliographiques

Crepon, B. et N. Jacquemet

(2010), E conome trie : me -

thodes et applications, de Boeck

Universite

W. Greene, W. H., T. Azomahou

et N. Couderc (2009), E cono-

me trie, Pearson Education

Objectifs Comprendre et maî triser les me thodes de re gression a mettre en œuvre lorsque la va-

riable de pendante est qualitative (binaire ou cate gorielle) et en pre senter les re sultats

de manie re intelligible et originale.

Prérequis Connaissances de base en e conome trie (formation Econométrie 1).

Contenu La formation pre sente les aspects the oriques et pratiques de la re gression logistique

et plus largement des principaux mode les e conome triques propres aux variables de -

pendantes qualitatives (binaire ou cate gorielle). Cette situation se rencontre dans

diffe rents champs d’application : choix financiers, notation du risque, segmentation

de cliente le, marketing, e conomie du travail, e conomie de l’environnement, e tude des

comportements, etc. La re gression logistique permet de tenir compte de la nature

discre te de la variable de pendante qui peut prendre deux valeurs (variables binaires

de pendantes). Celle-ci peut se ge ne raliser au cas ou la variable a expliquer prend

plus de deux modalite s et les me thodes mises en œuvre ainsi que l’interpre tation des

re sultats doivent tenir compte de leur nature ordonne e ou pas.

Chacune de ces situations est illustre e par des exemples concrets sur les me thodes a

mettre en œuvre et sur la meilleure manie re de pre senter les re sultats obtenus.

Les modèles à variables qualitatives binaires : probit et logit

Introduction : des exemples, formalisation

Estimation et interpre tation des parame tres

Validite des re sultats

Applications

Les variables qualitatives polytomiques

Introduction : des exemples, formalisation

Variables a modalite s ordonne es

Variables a modalite s non ordonne es

Variables a choix emboite s

Applications

Méthodes de régression pour données

qualitatives

MO

LIS

AT

ION

Page 19: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs

Comprendre les enjeux de la prise en compte des effets spatiaux en statistique et en e cono-

me trie, mettre en œuvre les me thodes d’estimation ade quates et interpre ter les parame tres

associe s aux variables spatiales.

Contenu Il s’agit L’analyse de donne es spatiales exige la mise en œuvre d’outils statistiques spe ci-

fiques. L’un des plus classiques est la mesure de l’autocorre lation spatiale. Les me thodes

de l’e conome trie spatiale ont e te de veloppe es pour tenir compte de cette de pendance spa-

tiale dans les analyses statistiques classiques et e viter que celle-ci n’introduise des biais

dans l’estimation des parame tres.

La formation pre sente les outils de base de la statistique spatiale qui vont comple ter et

enrichir l’approche strictement cartographique. Elle s’attache ensuite a pre senter les ma-

nie res de formaliser les effets spatiaux (effet de de bordement et de de pendance spatiale,

he te roge ne ite ) et les diffe rentes spe cifications e conome triques spatiales ainsi que leur

estimation par diffe rentes me thodes. Les tests de spe cifications les plus courants seront

e galement expose s. La formation est illustre e par des exemples issus de la litte rature re -

cente dans ce domaine et des applications a partir des logiciels R ou Stata.

Analyse Introduction : nécessité de la prise en compte de la di-

mension spatiale

Introduction à la statistique spatiale

La boî te a outils d’analyse des donne es spatiales

Analyse exploratoire des donne es spatiales et tests

L’étude de l’autocorrélation spatiale en économétrie

Une typologie des mode les spatiaux

Effet multiplicateur et effet de diffusion spatial

Mode le spatialement autore gressif

Mode le a erreur spatialement autocorre le e

Mode le de Durbin spatial

Les tests de spe cification

L’étude de l’hétérogénéité spatiale en économétrie

Instabilite des parame tres et infe rence statistique

La re gression ge ographique ponde re e

Dure e 5 jours ou 35 heures

Niveau

Avancé

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 19

Prérequis Connaissances en e conome trie (formations Économétrie 1 et Économétrie 2 indis-

pensables ; formation Au-delà de la corre lation: l’e conome trie pour estimer une rela-

tion causale souhaitable)

Statistique et méthodes de régression pour

données spatiales

MO

LIS

AT

ION

Logiciels utilise s

R, Stata

Repe res bibliographiques

BDroesbeje, J.J., Lejeune, M. et

Saporta, G. (2006), Analyse sta-

tistique des donne es spatiales,

ed. Technip

Dubé, J. et Legros, D. (2014),

Econome trie spatiale applique e

des microdonne es, ISTE Editions

Page 20: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

20

Dure e 5 jours ou 35 heures

Niveau

Expert

Déjeuner

offert

Logiciels utilise s

SAS, Stata, R

Objectifs Face a des donne es de panels, savoir choisir la mode lisation la plus pertinente en fonction de

ses besoins, connaitre les avantages et limites des diffe rents mode les statistiques classiquement

utilise s.

Prérequis Tre s bonnes connaissances en e conome trie (formation Econométrie 2).

Contenu Les donne es de panel se caracte risent par l’existence d’observations re pe te es pour un me me

individu. Cette configuration de donne es – tre s courante aujourd’hui - offre des possibilite s

spe cifiques d’exploitations statistiques, notamment en matie re d’e valuation de politiques pu-

bliques. Elles permettent par exemple de prendre en compte l’impact e ventuel de caracte ris-

tiques individuelles inobservables et de se rapprocher de l’impact causal de la variable d’inte -

re t.

Cette formation initiera aux me thodes classiques de l’e conome trie sur donne es de panel (a la

fois lorsque la variable explique e est continue ou qualitative) et sensibilisera les participants

a deux enjeux importants en pre sence de ce type de donne es : la prise en compte de l’he te ro-

ge ne ite individuelle inobserve e et l’identification de la de pendance d’e tat.

Les modèles à variables qualitatives binaires : probit et logit

Introduction : des exemples, formalisation Estimation et interpre tation des parame tres

Économétrie des données de panels

MO

LIS

AT

ION

Modèles de panels avec variable expliquée

continue

Rappel sur les moindres carre s ordinaires Pre sentation du mode le a effet fixe, proprie te s, me thodes d’estimation Exercices d’estimation sur ordinateur Pre sentation du mode le a effet ale atoire, proprie te s, me -thodes d’estimation Exercice de programmation et d’estimation sur ordina-teur Spe cification a la Mundlak ou a la Chamberlain (effets corre le s) Exercice sur ordinateur Modèles dynamiques

Notion d’exoge ne ite / exoge ne ite faible Me thodes des variables instrumentales Me thodes moments ge ne ralise s Rappel sur le maximum de vraisemblance et me thode de

Wooldridge dans le cas du mode le line aire gaussien Exercices de programmation sur ordinateur

Modèles à variable dépendante binaire

Rappel sur l’e conome trie des mode les a variables qualita-tives en coupe, le cas des e tats absorbants, pre sentation du proble me des parame tres incidents, mode le logit-conditionnel (sans de pendance d’e tat) binaire et multino-mial, mode les logit et probit a effet ale atoire. Exercice de programmation des diffe rents mode les sur ordinateur Les mode les de se lection : rappel sur le mode le de se lec-tion en coupe, discussion des mode les de se lection avec effets fixes ou a effets corre le s

Ouverture sur les modèles dynamiques avec

variables expliquées binaires

Page 21: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Comprendre la logique de la statistique non parame trique et mettre en œuvre des

tests et des me thodes d’estimation non parame triques.

Contenu La statistique parame trique est le cadre standard de la statistique. Les mode les

statistiques sont alors de crits par un nombre fini de parame tres. En statistique

non parame trique, aucune hypothe se n’est faite a priori sur la loi sous-jacente.

Nous pouvons par exemple faire un test statistique sans spe cifier de loi a priori

sur la ou les variable(s) utilise e(s). Il en est de me me si on veut examiner une liai-

son entre variables sans hypothe se sur les lois de celles-ci. Les copules mode lisent

la de pendance. Le bootstrap permet d’e valuer la sensibilite de ces estimateurs par

re e chantillonnage.

Nous finirons par une bre ve description de l’estimation non parame trique pour

grands e chantillons.

Tests non paramétriques :

Petits e chantillons, lois non gaussiennes

Mesures de liaisons non paramétriques

Bootstrap et applications :

Estimation ponctuelle et calcul d’intervalles de confiances sur petits e chantillons

Estimation non paramétrique :

Histogramme, me thodes a noyau

Dure e 5 jours ou 35 heures

Niveau

Expert

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 21

Prérequis Connaissances Comprendre la logique de la statistique non parame trique et mettre

en œuvre des tests et des me thodes d’estimation non parame triques.

Statistique non paramétrique

MO

LIS

AT

ION

Logiciels utilise s

R

Repe res bibliographiques

Capéraà, P. et Van Cutsem, B.

(1988), Méthodes et modèles en

statistique non paramétrique,

presse de l’Universite de Laval,

Dunod

Efron, B. (2011) An introduction

to bootstrap methods with appli-

cations to R, John Wiley & Sons

Page 22: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENQUÊTES ET SONDAGES

Conception d'enque te, e laboration de questionnaire

Le secret statistique : principes et pratiques

Panorama des me thodes de sondages

1

2

4

4

5

EN

QU

ÊT

ES

ET

SO

ND

AG

ES

Me thodes de redressement 5

Correction de la non-re ponse dans les enque tes 6

Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-

tion des connaissances, cette formation alterne expose s the oriques et applications

pratiques / cas concrets / travaux sur ordinateur.

5 Sondages avec R 7

5 E chantillonnage 3

Page 23: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Savoir mettre en place une enque te et re diger un questionnaire.

Contenu Cette formation propose d’analyser les diffe rentes phases de mise en place d’une

enque te statistique (hormis l’e chantillonnage et le redressement qui font l’objet

des formations Sondages 1 et 2). La phase de re daction du questionnaire est de -

taille e; les sources d’erreurs possibles sont aborde es ainsi que les outils ou me -

thodes permettant de re duire ces erreurs. Une participation active des stagiaires

est sollicite e.

La conception d’enquête

L’enque te, une me thode particulie re de recueil de l’information

Objectifs, champ, unite s

Les e tapes de la conception d’enque te

Les me thodes de collecte : en face a face, par te le phone, par internet, postale

Repre sentativite et non-re ponse

Le questionnaire

La conception de questionnaire

Les diffe rents types de questions

La re daction des questions (importance de la formulation et de l’ordre)

Les erreurs de mesure

Le lien questionnaire, base de donne es et traitement

Applications

Examen de questionnaires de ja conçus et utilise s

Les proce dures de test

Ce qu’il faut savoir d’une enque te pour juger du questionnaire

Travaux pratiques a partir de projets de questionnaires expose s par les partici-

pants.

Dure e 2 jours ou 14 heures

Niveau

Initiation

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 23

Conception d'enquête, élaboration de

questionnaire

EN

QU

ÊT

ES

ET

SO

ND

AG

ES

Repe res bibliographiques

Singly F. de (1992), L’enque te et

ses me thodes : le question-

naire, collection sociologie,

E ditions Nathan

Statistique Canada (2010), Me -

thodes et pratiques d’en-

que tes

Page 24: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

24

Dure e 1 jour ou 7 heures

Niveau

Tout public

Déjeuner

offert

Logiciels utilise s

SAS, Stata, R

Repe res bibliographiques

Willenborg, L. et T. de Waal

(2000), Elements of Statistical

Disclosure Control, Lecture

Notes in Statistics, vol 155 ,

Springer-Verlag

Nicolas, J. (2012), Traitement

de la confidentialité statistique

dans les tableaux : expérience de

la Direction des Statistiques

d’Entreprises, Journe es de Me -

thodologie Statistique 2012

Objectifs Comprendre Avoir les connaissances le gales en matie re de gestion du secret statis-

tique.

Savoir prendre en compte le secret statistique lors de l’e laboration et lors de la diffu-

sion de toutes les informations statistiques mises a disposition sous forme de tableaux

de donne es agre ge es.

Contenu La gestion du secret en matie re de statistique est un souci de plus en plus pre sent ces der-

nie res anne es. D’un co te , les organismes producteurs de statistiques sont pousse s a publier

des donne es toujours plus de taille es ; de l’autre, ces me mes organismes ont l’obligation le gale

et morale de garantir la confidentialite des informations qui leur ont e te confie es par les per-

sonnes ou entreprises. Cette confidentialite est vitale pour obtenir une bonne coope ration

des re pondants et maintenir la meilleure qualite possible des informations collecte es.

Par application de la loi de 1951 sur l’obligation, la coordination et le secret en matie re de

statistiques, les organismes du Syste me Statistique Public français ont notamment l’obliga-

tion de contro ler la divulgation statistique dans les informations qu’ils mettent a disposition,

en minimisant le risque que des informations sensibles sur des individus ou des entreprises

puissent e tre divulgue es a partir des donne es diffuse es.

La loi du 7 juin 1951 :

donne es sur les me nages et individus ; donne es sur les entreprises

Problèmes et critères dans …

Les tableaux de fre quence, aussi appele s tableaux de comptage

Les tableaux de volume : ventilation d’une variable telle que le chiffre d’affaires

ou le revenu

Les tableaux issus d’enque te : prise en compte des poids

Les tableaux lie s par une des variables de ventilation

Les tableaux hie rarchise s : exemple de la NAF, variable posse dant une structure

emboî te e.

Les méthodes de gestion du secret statistique

La restructuration des tableaux

La suppressions des cases sous secret

Gestion du secret statistique via le logiciel ?-Argus

Le secret statistique : principes et pratiques

EN

QU

ÊT

ES

ET

SO

ND

AG

ES

Page 25: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Acque rir les notions the oriques ne cessaires a la mise en œuvre des principales me -

thodes d’e chantillonnage.

Contenu L’accent de la formation est mis sur les me thodes probabilistes de tirage d’e chan-

tillon, mais la me thode des quotas est e galement aborde e. Chaque me thode fait

l’objet d’une pre sentation the orique et des exemples tire s de la pratique des son-

dages a l’Insee ou dans d’autres organismes permettent d’illustrer les proprie te s

de la me thode.

Généralités sur les enquêtes par sondage

Les composantes d’une enque te par sondage, les bases de sondage, la notion d’es-

timation et de pre cision, les diffe rents types d’erreur

Les sondages empiriques

La me thode des quotas

Le sondage aléatoire simple

Estimation d’une moyenne, d’une proportion, pre cision, algorithmes de tirage,

cas des panels

Le sondage à probabilités inégales

Estimation, pre cision, choix des probabilite s de tirage, tirage a probabilite s pro-

portionnelles a la taille, algorithmes de tirage, tirage en deux phases

Le sondage stratifié

Estimation, pre cision, constitution des strates, allocation de l’e chantillon dans les

strates

Les sondages à plusieurs degrés (sondage en grappes, sondage à

deux degrés)

Diffe rentes me thodes de tirage au premier degre , estimation, pre cision, effet de

grappe

Échantillonnage équilibré, notion de sondages indirects

Dure e 3 jours ou 21 heures

Niveau

Initiation

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 25

Prérequis Bonnes connaissances en statistique descriptive et notions de probabilite s et de

the orie de l’estimation.

Échantillonnage

EN

QU

ÊT

ES

ET

SO

ND

AG

ES

Logiciels utilise s

Excel, R

Repe res bibliographiques

Ardilly, P. (2006), Les tech-

niques de sondage, Technip

(2e me e dition)

Tillé, Y. (2001), The orie des

sondages, Dunod

Page 26: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

26

Dure e 2 jours ou 14 heures

Niveau

Tout public

Déjeuner

offert

Repe res bibliographiques

Ardilly, P. (2006), Les tech-

niques de sondage, Technip

(2e me e dition)

Tillé, Y. (2001), The orie des

sondages, Dunod

Objectifs Connaî tre l’ensemble des concepts et me thodes intervenant lors des diffe rentes

phases d’une enque te par sondage : vocabulaire de la the orie des sondages, princi-

pales me thodes d’e chantillonnage, de redressement et de traitement de la non-

re ponse.

Prérequis Bonnes connaissances en statistique descriptive, maî trise du formalisme mathe ma-

tique.

Contenu La formation pre sente un panorama de la me thodologie utilise e dans les diffe rentes

phases de la re alisation d’une enque te par sondage. L’accent est mis sur les principes

ge ne raux des concepts et me thodes, et sur leur utilisation dans la pratique des en-

que tes. De nombreux exemples illustrent cette formation.

Généralités sur les enquêtes par sondage

Population de re fe rence, bases de sondage

Les composantes d’une enque te par sondage

La notion d’estimation et de pre cision: qualite s d’un estimateur

Les diffe rents types d’erreur

Les méthodes d’échantillonnage

Le sondage ale atoire simple

Le sondage a probabilite s ine gales

Aperçu sur les algorithmes de tirage d’e chantillon

Le sondage stratifie

Les sondages a plusieurs degre s (sondage en grappes, sondage a deux degre s)

Echantillonnage en deux phases

Le sondage e quilibre

Les méthodes de redressement

Post-stratification

Estimateur par le ratio

Me thode du raking ratio

Calage sur marges

Les méthodes de correction de la non-réponse

Analyse des facteurs influençant la non-re ponse

Me thodes de reponde ration (correction de la non-re ponse totale)

Me thodes d’imputation (correction de la non-re ponse partielle)

Panorama des méthodes de sondages

EN

QU

ÊT

ES

ET

SO

ND

AG

ES

Page 27: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Comprendre les enjeux d’une correction de la non re ponse et du redressement, sa-

voir manipuler CALMAR et e tre capable de re aliser le redressement d’une enque te.

Contenu La formation apporte aux participants les notions the oriques et les re ponses pra-

tiques indispensables a la mise en œuvre de me thodes intervenant apre s la collecte

des donne es d’une enque te: les techniques de redressement d’e chantillon et de trai-

tement de la non-re ponse.

Chaque me thode fait l’objet d’une pre sentation the orique, d’une mise en œuvre pra-

tique des concepts the oriques, permettant d’illustrer les proprie te s de la me thode, et

d’exemples tire s de la pratique des sondages a l’Insee ou dans d’autres organismes.

Le logiciel SAS est utilise , mais la connaissance pre alable de ce logiciel n’est pas ne -

cessaire.

Régression simple

Aspects descriptifs : me thode des moindres carre s

Aspects statistiques : validation du mode le, tests concernant les coefficients,

e tude des re sidus et des points influents

Utilisation du mode le en pre vision

Bref rappel sur les méthodes d’échantillonnage

Les méthodes de redressement

Estimateur par le ratio

Estimateur par la re gression

Post-stratification sur un ou deux crite res

Calage sur marges, calage ge ne ralise

Les méthodes de correction de la non-réponse

Analyse des facteurs influençant la non-re ponse

Me thodes de reponde ration (correction de la non-re ponse totale)

Me thodes d’imputation (correction de la non-re ponse partielle et correction de la

non-re ponse totale)

Dure e 3 jours ou 21 heures

Niveau

Avancé

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 27

Prérequis Connaissances sur les me thodes d’e chantillonnage (formation Sondages 1).

Méthodes de redressement

EN

QU

ÊT

ES

ET

SO

ND

AG

ES

Logiciels utilise s

SAS, R; Excel

Repe res bibliographiques

BArdilly, P. (2006), Les tech-

niques de sondage, Technip

(2e me e dition)

Caron,N. (2005), La correction

de la non-re ponse par repon-

de ration et par imputation,

Insee Document de travail M0502

Page 28: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

28

Dure e 3 jours ou 21 heures

Niveau

Expert

Déjeuner

offert

Repe res bibliographiques

Ardilly, P. (2006), Les tech-

niques de sondage, Technip

(2e me e dition)

Objectifs Comprendre les me canismes de correction de la non-re ponse les plus utilise s, e tre en

mesure d’appre cier la qualite des estimations en contexte de non-re ponse.

Prérequis Connaissances des me thodes ge ne rales d’e chantillonnage et d’estimation (avoir acquis

les e le ments the oriques du niveau des formations Sondages 5 et Sondages 6).

Contenu La Cette formation propose des comple ments aux techniques pre sente es dans Son-

dages 1 et Sondages 2. Elle est adapte e au contexte de l’estimation en pre sence de

non-re ponse dans les enque tes par sondage.

Elle propose en premier lieu d’e clairer les fondements des me thodes de reponde ra-

tion les plus fre quemment mises en œuvre pour corriger la non-re ponse totale. On

insiste en particulier sur les techniques de calage, qui dans certaines circonstances

permettent de traiter le cas des me canismes de re ponse dits ‘non-ignorables’, pour

lesquels le comportement de re ponse est directement de pendant de la question

pose e.

On aborde e galement les principales me thodes d’imputation, utilise es pluto t pour

corriger la non-re ponse partielle, soit dans une approche classique ou les ale as res-

tent de la nature d’un e chantillonnage, soit en utilisant des mode les de comporte-

ment qui conside rent les variables d’inte re t comme ale atoires.

Généralités sur le traitement de la non-réponse

Les méthodes de repondération

La non-re ponse totale : conse quences en matie re de biais et de variance

Me canisme de re ponse ignorable

Les principaux mode les d’estimation de la probabilite de re ponse

Calcul d’erreur en pre sence de non-re ponse totale

Les techniques de calage applique es a la correction de la non-re ponse ; calage dit «

en une e tape » ; macro Calmar2 (traitement de la non-re ponse non-ignorable)

Méthode d‘imputation

Les principales me thodes d’imputation (imputation par la moyenne, par le ratio,

par la re gression, hot-deck, me thode du plus proche voisin)

Conse quences sur l’estimation des parame tres de dispersion ou d’association

Calcul d’erreur lorsque l’ale a est un ale a d’e chantillonnage en population finie

Calcul d’erreur lorsque la variable d’inte re t est mode lise e ; me canisme de re ponse

ignorable

Correction de la non-réponse dans

les enquêtes

EN

QU

ÊT

ES

ET

SO

ND

AG

ES

Page 29: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Savoir mettre en œuvre avec le logiciel R des me thodes classiques d’e chantillonnage,

d’estimation, de calcul de pre cision, de redressement et de traitement de la non re -

ponse.

Contenu La formation est axe e sur l’utilisation des fonctions du module “Sampling”, de velop-

pe par Yves Tille et Alina Matei pour le logiciel R. Ce module permet de se lectionner

des e chantillons selon plusieurs me thodes, de traiter les proble mes de non-re ponse,

d’ajuster des donne es d’enque tes sur des donne es de recensement, et d’e valuer la

pre cision des estimations ainsi obtenues.

La formation met l’accent sur la mise en pratique et de ce fait, une connaissance,

me me sommaire, du logiciel R serait pre fe rable. Par ailleurs, les notions the oriques

seront rappele es brie vement.

Régression simple

Aspects descriptifs : me thode des moindres carre s

Aspects statistiques : validation du mode le, tests concernant les coefficients,

Courte Introduction sur le logiciel R

Prise en main de R

Chargement du module “Sampling”

Fonctions de base

Importation de donne es dans R

Dure e 5 jours ou 35 heures

Niveau

Avancé

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 29

Prérequis Connaissances Connaissance des me thodes d’e chantillonnage et d’estimation en son-

dage. Quelques notions sur le logiciel R sont pre fe rables (formation R Initiation).

Sondages avec R

EN

QU

ÊT

ES

ET

SO

ND

AG

ES

Logiciels utilise s

R

Les fonctions d’échantillonnage

Me thode du Cube

Sondage ale atoire simple

Sondage syste matique

Sondage a probabilite s ine gales

Sondage stratifie

Sondage a deux degre s

Les fonctions d’estimation et de redressement

Estimateur de Horvitz-Thompson

Estimateur post-stratifie

Estimateur par le ratio

Estimateur par la re gression et estimateur par le calage

Les fonctions de calcul de précision

Page 30: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

SÉRIES TEMPORELLES

Analyse des se ries temporelles avec Excel

Analyse des se ries temporelles avec R

De saisonnaliser une se rie temporelle

1

2

3

4

5

RIE

S T

EM

PO

RE

LL

ES

Mode les ARMA, ARMAX et ARCH-GARCH 4

Mode les VAR et VECM 5

Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-

tion des connaissances, cette formation alterne expose s the oriques et applications

pratiques / cas concrets / travaux sur ordinateur.

Page 31: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Etre en mesure de mettre en œuvre les me thodes de base de l’analyse des se ries tem-

porelles avec Excel.

Contenu La formation propose d’approfondir la connaissance d’ Excel pour mettre en ap-

plication les me thodes d’analyse des se ries temporelles. Les stagiaires seront

amene s a mettre en œuvre ces me thodes au moyen de nombreux exercices pra-

tiques.

Rappel sur l’environnement de travail d’Excel

Rappel des étapes et des objectifs de l’analyse des séries tempo-

relles

Les structures de séries temporelles dans Excel

Lecture et différentes représentations graphiques d’une série tem-

porelle

Décomposition d’une série temporelle

Prévision avec les méthodes de lissage exponentiel

La modélisation ARIMA

Quelques prolongements

Dure e 3 jours ou 21 heures

Niveau

Avancé

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 31

Prérequis Connaissance de base en analyse des se ries temporelles. Quelques notions sur Excel

sont pre fe rables

Analyse des séries temporelles avec Excel SÉ

RIE

S T

EM

PO

RE

LL

ES

Logiciels utilise s

Excel

Page 32: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

32

Dure e 3 jours ou 21 heures

Niveau

Avance

Déjeuner

offert

Logiciels utilise s

R

Repe res bibliographiques

Aragon, Y. (2011), Séries tem-

porelles avec R. Méthodes et cas,

Springer

Objectifs Etre en mesure de mettre en œuvre les me thodes de base de l’analyse des se ries tempo-

relles avec le logiciel R.

Prérequis Connaissances de base en analyse des se ries temporelles. Quelques notions sur le logi-

ciel R sont pre fe rables

Contenu La formation propose d’approfondir la connaissance du logiciel R pour mettre en ap-

plication les me thodes d’analyse des se ries temporelles. Les stagiaires seront amene s

a mettre en œuvre ces me thodes au moyen de nombreux exercices pratiques.

Les modèles à variables qualitatives binaires : probit et logit

Rappel sur l’environnement de travail de R

Rappel des étapes et des objectifs de l’analyse des séries temporelles

Les structures de séries temporelles dans R : les objets ts

Lecture et différentes représentations graphiques d’une série

temporelle

Décomposition d’une série temporelle

Prévision avec les méthodes de lissage exponentiel

La modélisation ARIMA

Quelques prolongements

Analyse des séries temporelles avec R

RIE

S T

EM

PO

RE

LL

ES

Page 33: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Cette formation permet d’aborder un aspect essentiel pour toute publication de

donne es a posteriori : la de saisonnalisation d’une se rie temporelle.

Contenu L’analyse d’une se rie temporelle, comme toute e tude statistique, ne peut e chapper

a une phase exploratoire permettant de comprendre et d’appre cier les phe no-

me nes temporels influant sur la grandeur e tudie e : saisonnalite , effets calendaires,

points extre mes, conditions climatiques… Leur prise en compte est ne cessaire

pour une bonne analyse de la conjoncture. Les me thodes statistiques permettant

de de composer une se rie temporelle sont nombreuses, varie es et parfois com-

plexes. Les cas pratiques seront ide alement traite s sous le logiciel (libre) JDE-

METRA+, des comple ments pouvant e tre donne s sous R et SAS. Des applications

de la de saisonnalisation pourront e tre effectue es sur les propres jeux de donne es

des stagiaires.

Composantes d’une série temporelle et modèles associés

Stationnarité et autocorrélogrammes (simple et partiel)

Eléments d’analyse spectrale

Moyennes mobiles

Principes de désaisonnalisation d’une série temporelle et diagnos-

tics de qualité

La correction des effets de calendrier

Utilisation de la méthode TRAMO-SEATS

Utilisation de la méthode X-12-ARIMA

Dure e 3 jours ou 21 heures

Niveau

Avancé

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 33

Prérequis Une connaissance des mode les ARMA peut s’ave rer utile.

Désaisonnaliser une série temporelle

RIE

S T

EM

PO

RE

LL

ES

Logiciels utilise s

JDemetra+, R, SAS

Page 34: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

34

Dure e 5 jours ou 35 heures

Niveau

Expert

Déjeuner

offert

Logiciels utilise s

Eviews, R

Objectifs Cette formation propose de mode liser et pre voir une se rie temporelle a l’aide des mo-

de les e labore s par Box et Jenkins : la famille ARMA.

Prérequis Bonnes connaissances en statistique infe rentielle.

Contenu Les mode les ARMA permettent de mode liser des se ries temporelles pour lesquelles

la seule dynamique passe e permet de les appre hender. Ces mode les line aires sont

encore tre s utilise s en pratique. En pre sence de variables exoge nes, les mode les AR-

MAX constituent une alternative inte ressante. Un comple ment sur les mode les ARCH-

GARCH, directement issus du monde financier, permettent d’e largir le domaine d’ap-

plicabilite des mode les ARMA, notamment lorsque les re sidus ne peuvent pas e tre

conside re s comme gaussiens. Les cas pratiques seront ide alement traite s sous R,

mais pourront e galement e tre mis en œuvre sous SAS.

Stationnarité et autocorrélogrammes (simples et partiels).

Modèles ARMA : identification, estimation et prévision.

Traitement de la non-stationnarité : modèles ARIMA et SARIMA.

Pratique de la modélisation ARMA.

Compléments sur les modèles ARMAX.

Compléments sur les modèles ARCH-GARCH.

Modèles ARMA, ARMAX et ARCH-GARCH

RIE

S T

EM

PO

RE

LL

ES

Page 35: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Comprendre Cette formation permet de modéliser et prévoir des séries temporelles multiva-

riées, notamment dans le domaine économique.

Contenu La mode lisation vectorielle ou multivarie e permet d’e tudier la dynamique jointe

de plusieurs se ries : Lorsque les se ries sont stationnaires, il s’agit d’une ge ne rali-

sation de l’e tude des processus AR. La popularite des mode les vectoriels autore -

gressifs (VAR) est lie e a leur souplesse d’utilisation et a leur capacite a tester des

hypothe ses e conomiques. Lorsque les se ries ne sont pas stationnaires mais coin-

te gre es, les mode les vectoriels a correction d’erreur (VECM) permettent de spe ci-

fier des relations stables a long terme tout en analysant dans le me me temps la

dynamique de court terme des variables conside re es. Les mode les VAR structu-

rels (SVAR) comple tent cette approche multivarie e. Les cas pratiques seront ide a-

lement traite s sous R, mais pourront e galement e tre mis en œuvre sous SAS.

Généralités sur les séries temporelles multivariées.

Modèles vectoriels autorégressifs (VAR).

Tests de stationnarité.

Analyse de la dynamique des modèles VAR.

Tests de Causalité.

Modèles vectoriels à correction d’erreur (VECM).

Tests de cointégration.

Compléments sur les modèles VAR structurels (SVAR).

Dure e 4 jours ou 28 heures

Niveau

Expert

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 35

Prérequis Bonnes connaissances des mode les ARMA.

Modèles VAR et VECM SÉ

RIE

S T

EM

PO

RE

LL

ES

Logiciels utilise s

Eviews, R, SAS

Page 36: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

LOGICIELS STATISTIQUES

Gams

SPSS

Eviews

Spark

Hadoop

LO

GIC

IEL

S S

TA

TIS

TIQ

UE

S

Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-

tion des connaissances, cette formation alterne expose s the oriques et applications

pratiques / cas concrets / travaux sur ordinateur.

Programmation avec Julia

Stata 12

CsPro / Survey Solution / ODK Collect

Python initiation / Python Interme diaire / Python avance

R initiation / R Interme diaire / R avance 3 / 4 / 5

Cre er un programme personnalise avec Excel et le VBA 2

Excel : construire des tableaux de bord et ge rer vos donne es avec Excel 1

13

14

15

16

17

18

6 / 7 / 8

9/10/11

Page 37: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Maî triser la construction et la maintenance de tableaux de bord avec Excel. Maî tri-

ser la gestion des donne es sous Excel.

Contenu Il Excel est le logiciel le plus utilise pour stocker ou ge rer des donne es. Excel pro-

pose de nombreux outils extre mement puissants pour la gestion des donne es

qu’elles soient stocke es directement dans Excel ou dans des bases de donne es ex-

ternes. Gra ce a Excel, vous pouvez construire des tableaux de bord permettant un

reporting clair et efficace.

Cette formation vous apprend a maî triser les outils de gestion de donne es, a appli-

quer les bonnes pratiques pour la gestion des donne es sous Excel et a construire

des rapports de taille s et automatise s avec Excel.

Les données dans Excel

Principes et organisation

Les outils de gestion (re fe rences, filtres, tri…)

Les relations internes entre les donne es dans Excel

Les données externes

La mise en relations de base de donne es

La re cupe ration de bases de donne es externes

Les outils du reporting

L’utilisation de visualisations adapte es

Introduction a l’utilisation des tableaux croise s dynamiques

Construction de macros pour automatiser les proce dures

Rapide introduction au langage VBA

Application : construction d’un tableau de bord personnalise

Augmenter votre productivité avec Excel

Trucs et astuces pour augmenter votre productivite

Les applications pour Office : de nouvelles fonctionnalite s en constante e volution

Dure e 5 jours ou 35 heures

Niveau

Initiation

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 37

Prérequis Tout public.

Excel : construire des tableaux de bord et

gérer vos données avec Excel

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Logiciel utilise

Excel

Page 38: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

38

Dure e 5 jours ou 35 heures

Niveau

Avance

Déjeuner

offert

Logiciels utilise s

Excel

Objectifs Maî triser l’utilisation de l’e diteur VBE et du langage VBA pour cre er des programmes

personnalise s et ope rationnels.

Prérequis Une maî trise d’Excel est demande e. De plus, une connaissance de base en programma-

tion serait appre cie e.

Contenu Excel est plus qu’un simple tableur, il a son propre langage de programmation : le

VBA (Visual Basic for Applications). Le VBA, langage a la fois simple et tre s complet,

permet d’automatiser un certain nombre de ta ches et me me de cre er des pro-

grammes personnalise s complexes. Cette formation vous apprend a passer du simple

enregistrement de macros Excel a la mise en place de programmes permettant d’ef-

fectuer des calculs re pe te s et complexes. Ces programmes peuvent e tre appele soit

en utilisant des formules spe cifiques soit gra ce a des interfaces cre e es sur mesure.

Les modèles à variables qualitatives binaires : probit et logit

Introduction : des exemples, formalisation

Estimation et interpre tation des parame tres

Introduction au langage VBA

Principes et fonctionnement

Application : e criture d’une premie re fonction de gestion de donne es

L’environnement VBE

Pre sentation de l’e diteur

Principe du de bogage en VBA

La programmation

Trucs et astuces pour e tre plus efficace

La gestion des sources de donne es en VBA

Cre ation d’une interface avec le VBA

Application : e criture d’un programme en VBA pour automatiser une analyse

statistique

Créer un programme personnalisé avec

Excel et le VBA

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Page 39: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Manipuler une session de travail R, distinguer les objets R, mettre en œuvre des fonc-

tions de R pour manipuler un jeu de donne es

Contenu

Le livre Statistique avec R vous sera offert lors de cette formation

La formation est consacre e a la pre sentation des fonctionnalite s de base du logi-

ciel R, accompagne e d’exemples d’utilisations. Les stagiaires mettront en œuvre le

logiciel, sous la forme d’exercices d’application.

Généralités

Pre sentation et installation du logiciel R et de Rstudio

GUIs et IDEs

Prise en main et premiers pas

Fonctions et packages

Utilisation des aides

Les objets de R

Vecteurs, facteurs, matrices, listes, data.frames

Manipulation de données avec R

Importation et exportation de donne es

Cre ation et recodage de variables

Se lection et regroupements de donne es

Initiation aux graphes avec R

Manipulation des fene tres graphiques

Re alisation et personnalisation de graphes de base avec R

Premières analyses de statistique descriptive avec R

Présentation de R markdown pour générer des rapports

Dure e 3 jours ou 21 heures

Niveau

Initiation

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 39

Prérequis Sans e tre obligatoires des notions de base en programmation ainsi que des connais-

sances de base en techniques statistiques sont un plus.

Public visé : toute personne souhaitant acque rir les bases de R

R initiation

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Logiciels utilise s

R

Repe res bibliographiques

P-A. Cornillon et al. (2012), Sta-

tistique avec R, Presses Universi-

taires de Rennes.

Cornillon P.-A. et Éric Matzner-

Løber (2010), Régression avec R,

Springer.

Page 40: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

40

Dure e 2 jours ou 14 heures

Niveau

Expert

Déjeuner

offert

Objectifs Acque rir les outils et techniques permettant d’effectuer des traitements sur les don-

ne es, plus rapidement et plus efficacement.

Connaî tre les principaux packages d’analyse statistique.

Prérequis Connaissance de base du logiciel R

Contenu

Le livre Statistique avec R vous sera offert lors de cette formation

Cette formation s’adresse a des stagiaires ayant de ja manipule le logiciel R, de si-reux d’approfondir leurs connaissances sur ses fonctionnalite s. Une premie re journe e sera consacre e aux fonctionnalite s de base avec un accent mis sur la ma-nipulation de jeux de donne es, le graphe et la programmation. Une deuxie me journe e sera consacre e a la prise en main de packages particuliers pour la re gression line aire, la re gression logistique, les arbres de de cision, l’ana-lyse de donne es. Le logiciel sera mis en œuvre au travers d’exercices concrets d’application..

Manipulation de données dans R

Importation et exportation Cre ation et recodage de variables Se lection et regroupement de variables Manipulation des dates Fusion de tableaux de donne es Premie res analyses descriptives Les fonctions apply

Le graphe avec R

Manipulation des fene tres graphiques Graphes de base Personnalisation de graphes

La programmation avec R

Cre ation de ses propres fonctions R Boucles Structures de contro le

Packages

Focus sur quelques packages en particulier pour des analyses statistiques pous-se es : re gression line aire, re gression logistique, arbres de de cision, analyse de donne es.

R Intermédiaire

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Logiciels utilise s

R

Repe res bibliographiques

P-A. Cornillon et al. (2012), Sta-

tistique avec R, Presses Universi-

taires de Rennes.

Cornillon P.-A. et Éric Matzner-

Løber (2010), Régression avec R,

Springer.

Page 41: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Acque rir des notions avance es de programmation avec R, traiter de larges jeux de

donne es avec R, paralle liser et passer a l’e chelle, Concevoir une application web uti-

lisant R pour effectuer les calculs. R Shiny est un outil particulie rement efficace pour

cre er des applications web interactives avec R.

A la fin de la journe e, les stagiaires pourront de velopper leur propre application.

Contenu R / Programmation avancée

Rappel des structures des objets et fonctionnement interne.

Programmation de base

Programmation objets S3

Comparaison de performances entre structure vectorielle et boucles

Ame lioration du code (Rcpp, paralle lisation)

Cre ation d’un package avec plusieurs objectifs (gestion de projet, diffusion d’ou-

tils…)

Dure e 3 jours ou 21 heures

Niveau

Expert

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 41

Prérequis Une utilisation re gulie re de R et de pre fe rence avoir fait R Interme diaire.

R avancé

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

R / Passage à l’échelle

Traitement de larges jeux de donne es avec R

Pre sentation et utilisation de datatable et de dplyr pour traiter de donne es volu-

mineuses

Pre sentation du calcul paralle le

Passage a l’e chelle

Connexion avec les diffe rentes bases de donne es (SQL, NOSQL)

Pre sentation de l’environnement Hadoop, imple mentations en R

Pre sentation d’Apache Spark et inte gration avec R

R / Créer une application R Shiny

Introduction a R Shiny, structure et the me d’une application Shiny

Interface utilisateur avec des exemples d’inputs courants

Imple mentation co te serveur et dialogue avec l’interface, exemple d’outputs cou-

rants

Interactivite et maî trise de la re activite : expressions re actives, expressions iso-

le es, affichage conditionnel

Logiciels utilise s

R

Repe res bibliographiques

P-A. Cornillon et al. (2012), Sta-

tistique avec R, Presses Universi-

taires de Rennes.

Cornillon P.-A. et Éric Matzner-

Løber (2010), Régression avec R,

Page 42: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

42

Objectifs Manipuler une session de travail Python Distinguer les objets Python Mettre en œuvre des fonctions de Python pour manipuler un jeu de donne es

Python initiation

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Dure e 3 jours ou 21 heures

Niveau

Initiation

Déjeuner

offert

Contenu La formation est consacre e a la pre sentation des fonctionnalite s de base du lan-gage Python, accompagne e d’exemples d’utilisations. Les stagiaires mettront en œuvre le langage, sous la forme d’exercices d’application. Généralités

Pre sentation et installation du langage Python Prise en main et premiers pas de Python Notebook Fonctions et packages Utilisation des aides

Les objets de Python

Vecteurs Facteurs Matrices Listes data.frames

Manipulation de données avec Python

Importation et exportation de donne es Cre ation et recodage de variables Se lection et regroupements de donne es

Initiation au graphe avec Python

Manipulation des fene tres graphiques

Re alisation et personnalisation de graphes de base avec Python

Premières analyses de statistique descriptive avec Python

Logiciels utilise s

Python / Jupyter / Pandas

Page 43: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Acque rir les outils et techniques permettant d’effectuer des traitements sur les

donne es, plus rapidement et plus efficacement.

Connaî tre les principaux packages d’analyse statistique.

Contenu Cette formation s’adresse a des stagiaires ayant de ja manipule des donne es avec

le langage Python, de sireux d’approfondir leurs connaissances sur ses fonction-

nalite s.

Une premie re journe e sera consacre e aux fonctionnalite s de base avec un accent

mis sur la manipulation de jeux de donne es :

Manipulation de donne es avec Pandas

Importation et exportation

Cre ation et recodage de variables

Gestion des formats de donne es structure s (JSON, XML)

Acce s a des donne es en ligne via une API web

Interface avec une base de donne es SQL.

La seconde journe e sera consacre e a la pre sentation de la librairie scikit-learn

pour l’apprentissage statistique (qui contient les mode les usuels de re gression,

re gression logistique et bien plus encore) et au de veloppement de programmes

complets (cre ation de fonctions, chaî ne de traitement comple te de la re cupe ra-

tion des donne es a l’utilisation du mode le).

Dure e 2 jours ou 14 heures

Niveau

Avancé

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 43

Prérequis Connaissance de base du langage Python (un de butant ou un ancien utilisateur

ayant peu de pratique s’orientera pluto t vers la formation Python Initiation).

Python intermédiaire

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Logiciels utilise s

Python, Pandas, Scikit Learn

Repe res bibliographiques

Wes McKinney, Python for Da-

ta Analysis, e ditions O’Reilly

Jake Vanderplas, Python Data

Science Handbook: Essential

Tools for working with Data,

e ditons O’Reilly

Page 44: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

44

Dure e 3 jours ou 21 heures

Niveau

Expert

Déjeuner

offert

Logiciels utilise s

Python

Repe res bibliographiques

G. Swinnen, Apprendre a pro-

grammer avec Python, e d.

Eyrolles

E. Biernat, M. Lutz, Data

Science : fondamentaux et

e tudes de cas, e d. Eyrolles

S. Bird, E. Klein, E. Loper, Natu-

ral Language Processing

with Python, e d. O’Reilly

Objectifs Permettre a l’utilisateur maî trisant l’informatique de cisionnelle sous Python de de se

perfectionner sur une the matique spe cifique, permettre a l’utilisateur maî trisant

l’informatique de cisionnelle sous Python de de se perfectionner sur une the matique

spe cifique et permettre a l’utilisateur maî trisant l’informatique de cisionnelle sous Py-

thon de de se perfectionner sur une the matique spe cifique.

Prérequis Utilisation re gulie re de Python.

Contenu Python pour la data science et le machine learning

Apprentissage et analyse statistique avec sci-kit learn & xgboost : revue des tech-

niques, gestion des ensembles d’apprentissage et de test, e valuation des mode les.

Python avancé

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Python pour le text mining

Mise en œuvre des me thodes d’analyse textuelle en utilisant la librairie NLTK.

Développement d’interfaces graphiques et dataviz avancée

Utilisation de la librairie de visualisation Plotly.

Cre ation d’interfaces graphiques avec Bokeh.

Dash pour cre er des applications web, Principes et extensions via du javascript.

Comparaison avec R Shiny

Introduction a la de finition d’APIs (Application Programming Interface) et mise en

place avec Flask

Page 45: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Acque rir des connaissances et techniques permettant de concevoir des applica-

tions de collectes et des masques de saisie robustes gra ce a Cspro.

Contenu

Manipulation des dictionnaires de donne es

Cre ation des formulaires

Contro les de base

Contro les avance s et utilisation des dictionnaires externes

Remonte e des donne es et synchronisation

Dure e 5 jours ou 35 heures

Niveau

Tout public

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 45

Prérequis Bonne connaissance en logique, en algorithme et en programmation

Cspro

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Logiciels utilise s

Cspro

Cspro

Page 46: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

46

Dure e 5 jours ou 35 heures

Déjeuner

offert

Logiciels utilise s

Survey solution

Objectifs Acque rir des connaissances et techniques permettant de concevoir les supports de col-

lecte de donne es.

Contenu Elaboration des formulaires a partir du questionnaire sur la plateforme

Mise en place des contro les de cohe rence de base

Maitrise du flux des e changes d’informations entre les diffe rents acteurs in-

tervenant dans le processus de collecte

Gestion des donne es

Survey solution

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Niveau

Tout public

Page 47: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Acque rir des connaissances et techniques permettant de concevoir les supports

de collecte de donne es.

Contenu Concepts de base

Pre paration des feuilles Excel pour la conception du questionnaire.

Imple mentation d’un questionnaire (cas pratique)

Etude de quelques fonctions utiles d’ODK Collect

Pre sentation de quelques plateformes pour la synchronisation et la re-

monte e des donne es

Dure e 5 jours ou 35 heures

Niveau

Tout public

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 47

Prérequis La bonne connaissance d'Excel sera tre s utile

ODK Collect

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Logiciels utilise s

Excel, ODK

Page 48: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

48

Dure e 5 jours ou 35 heures

Niveau

Initiation

Déjeuner

offert

Logiciels utilise s

Stata

Objectifs Connaî tre les outils permettant d’effectuer les ta ches essentielles avec le logiciel

(manipulation de donne es, graphiques, estimations).

Contenu La formation est consacre e a la pre sentation des fonctionnalite s du logiciel Stata ac-

compagne e d’exemples d’utilisations. Les principales fonctions de statistiques des-

criptives (moyenne, variance, quartiles, corre lation entre deux variables) seront pas-

se es en revue. Cette formation abordera en de tail la confection des graphiques sur

Stata. La dernie re partie du module sera consacre e a une initiation a la programma-

tion sur Stata. Les stagiaires mettront en œuvre le logiciel, sous forme d’exercices

d’application.

Prise en main du logiciel

Familiarisation avec l’environnement Utiliser des donne es Regarder les donne es

Manipulation des données logi-

ciel

Gestion des bases de donne es : tri, fu-sion, concate nation Cre er/supprimer des donne es Manipuler les formats des variable

Faire des statistiques descriptives

Utiliser les statistiques descriptives pour la cre ation de variables Statistiques descriptives

Faire des graphiques

Diffe rents types de graphiques Edition des graphiques Sauvegarde, etc.

Méthodes de régression simples

Mode le line aire Mode le logistique

Tests e le mentaires

Introduction à la programma-

tion : une petite introduction à la

pratique de la programmation

avec Stata

Stata

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Page 49: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Acque rir les outils et techniques permettant d’effectuer des traitements sur les

donne es, plus rapidement et plus efficacement.

Connaî tre les principales fonctions d’analyse statistique.

Contenu Cette formation s’adresse a des stagiaires ayant de ja manipule des donne es avec

Gams, de sireux d’approfondir leurs connaissances sur ses fonctionnalite s.

Une premie re journe e sera consacre e aux fonctionnalite s de base avec un accent

mis sur la manipulation de jeux de donne es :

Manipulation de donne es avec Gams

Importation et exportation

Cre ation et recodage de variables

La seconde journe e sera consacre e a la pre sentation des fonctions pour l’appren-

tissage statistique (qui contient les mode les usuels de re gression, re gression lo-

gistique et bien plus encore) et au de veloppement de programmes (cre ation de

fonctions, chaî ne de traitement comple te de la re cupe ration des donne es a l’utili-

sation du mode le).

Dure e 5 jours ou 35 heures

Niveau

Avancé

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 49

Prérequis Connaissance de base en programmation et en algorithme sera d’une tre s grande

utilite

Gams

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Logiciels utilise s

Gams

Page 50: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

50

Dure e 5 jours ou 35 heures

Niveau

Tout public

Déjeuner

offert

Logiciels utilise s

SPSS

Objectifs Acque rir les outils et techniques permettant d’effectuer des analyses de donne es de

manie re efficace, performante et cohe rente.

Contenu Cette formation s’adresse a des personnes ayant de ja manipule des donne es avec

SPSS, de sireux d’approfondir leurs connaissances sur ses fonctionnalite s.

Une premie re journe e sera consacre e aux fonctionnalite s de base avec un accent

mis sur la prise en main du logiciel

Prise en main du logiciel

Manipulation de donne es avec SPSS

Importation et exportation

Cre ation et recodage de variables

Statistiques uni et multi-dimensionnelles

Analyses e conome triques fondamentales

Bonnes pratiques et points forts du logiciel

SPSS

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Page 51: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Acque rir les outils et techniques permettant d’effectuer des traitements sur les

donne es, plus rapidement et plus efficacement.

Contenu Cette formation s’adresse a des stagiaires ayant de ja manipule des donne es avec

Eviews, de sireux d’approfondir leurs connaissances sur ses fonctionnalite s.

Une premie re journe e sera consacre e aux fonctionnalite s de base avec un accent

mis sur la prise en main du logiciel et la manipulation de jeux de donne es :

Prise en main du logiciel

Manipulation de donne es avec Eviews

Importation et exportation

Cre ation et recodage de variables

Statistiques uni et multi-dimensionnelles

Analyses e conome triques fondamentales

Bonnes pratiques et points forts du logiciel

Dure e 5 jours ou 35 heures

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 51

Prérequis Connaissance de base en programmation et en algorithme sera d’une tre s grande

utilite

Eviews

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Logiciels utilise s

Eviews

Niveau

Tout public

Page 52: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

52

Dure e 5 jours ou 35 heures

Niveau

Avance

Déjeuner

offert

Logiciels utilise s

Hadoop

Objectifs Manipuler une session de travail Hadoop

Cre er et manipuler les e le ments de programmation distribue e sur la plateforme Ha-doop

Mettre en oeuvre des composantes Hadoop pour l’analyse de donne es

Contenu La formation est consacre e a la pre sentation des fonctionnalite s de base de la plate-

forme Hadoop et sa programmation distribue e, accompagne e d’exemples d’utilisa-

tions. Les stagiaires mettront en œuvre le logiciel, sous la forme d’exercices d’appli-

cation.

Généralités

Pre sentation et installation de la plate-

forme Hadoop

Introduction au langage Scala de Hadoop

Les concepts de base de Hadoop

Les composants d’une exe cution re par-

tie. Exe cution interactive et cre ation

d’applications autonomes

L’unite de distribution : l’ensemble de

donne es re silient distribue .

Programmation avec Rdds élé-

mentaires

Cre ation de RDDs e le mentaires

Ope rations : transformations, actions,

e valuations faibles.

Passage de fonctions vers Spark.

Persistance d’un RDD.

Manipulation de Rdds clé/valeur

Cre ation de RDDs cle /valeur

Transformations : agre gations, regrou-

pement, jointures et ordonnancements

Actions sur RDDs cle /valeur

Charge et sauvegarde de données

Fichiers : texte, documents (JSON), va-

leurs se pare es par virgules et par se pa-

rateurs tabulaires.

Hadoop

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Page 53: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Objectifs Manipuler une session de travail Spark

Cre er et manipuler les e le ments de programmation distribue e sur la plateforme Spark

Mettre en oeuvre des composantes Spark pour l’analyse de donne es

Contenu La formation est consacre e a la pre sentation des fonctionnalite s de base de la pla-

teforme Spark et sa programmation distribue e,accompagne e d’exemples d’utilisa-

tions. Les stagiaires mettront en oeuvre le logiciel, sous la forme d’exercices d’ap-

plication.

Généralités

Pre sentation et installation de la plate-

forme Spark

Introduction au langage Scala de Spark

Les concepts de base de Spark

Les composants d’une exe cution re par-

tie. Exe cution interactive et cre ation

d’applications autonomes

L’unite de distribution : l’ensemble de

donne es re silient distribue (Resilient

Distributed Datasets- RDDs).

Programmation avec Rdds élé-

mentaires

Cre ation de RDDs e le mentaires

Ope rations : transformations, actions,

e valuations faibles.

Passage de fonctions vers Spark.

Persistance d’un RDD.

Manipulation de Rdds clé/

valeur

Cre ation de RDDs cle /valeur

Transformations : agre gations, regrou-

pement, jointures et ordonnancements

Actions sur RDDs cle /valeur

Charge et sauvegarde de don-

nées

Fichiers : texte, documents (JSON), va-

leurs se pare es par virgules et par se pa-

rateurs tabulaires.

Dure e 5 jours ou 35 heures

Niveau

Initiation

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 53

Spark

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Logiciels utilise s

Spark, Scala

Repe res bibliographiques

Holden Karau, Andy Konwinski,

Patrick Wendell et Matei Zharia

(2015), Learning Spark,

O’Reilly Media Inc.

Page 54: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

54

Dure e 5 jours ou 35 heures

Niveau

Avance

Déjeuner

offert

Objectifs Etre Manipuler une session de travail Julia

Distinguer les diffe rents types de Julia

Mettre en œuvre des fonctions de Julia pour manipuler un jeu de donne es

Contenu Sans e tre obligatoires des notions de base en programmation ainsi que des connais-

sances de base en techniques statistiques sont un plus.

Généralités

Pre sentation et installation de Julia

Prise en main et premiers pas de Julia

(en mode console ou jupyter)

Gestionnaire des packages

Les types en Julia

Introduction ge ne rale des types en Julia

Arborescence des types

Types concrets et abstraits

Les types de base

Arbre des types nume riques

Chaî nes de caracte res

Types multidimensionnels (Array, Vec-

tor, Matrix)

Tuples (nomme es ou pas)

Les structures mutables ou pas (struct,

mutable struct)

Package DataFrames.jl

Matrice de donne es (DataFrame)

Donne es qualitatives ou cate go-

rielles (CategoricalArray)

Utilisation des outils développés

en Julia

Fonctions

Cre ation minimale d’une fonction

(sans contrainte de rapidite )

Appels de fonction

De couverte du paradigme tout en UN

langage

Boucle “for” pour du code rapide

Introduction a la notion d’ite rateur

(via les UnitRange, StepRange, …)

Optimiser une fonction en spe ci-

fiant les types des arguments

Manipulation de données avec

Julia

Importation et exportation de donne es

Cre ation et recodage de variables

Se lection et regroupements de donne es

Initiation au graphique avec Julia

Manipulation des fene tres graphiques

Re alisation et personnalisation de graphes de base

Premières analyses de statistique

descriptive avec Julia

Programmation avec Julia

LO

GIC

IEL

S

ST

AT

IST

IQU

ES

Page 55: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

DATA SCIENCE

Panorama du Big Data

Panorama des me thodes de Data Mining

Machine Learning

Deep Learning

Text mining

1

2

4

5

6

DA

TA

SC

IEN

CE

Web-scraping (extaction de donne es sur le web) 7

Techniques de scoring 8

Me thodes avance es de Data Mining 3

Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-

tion des connaissances, cette formation alterne expose s the oriques et applications

pratiques / cas concrets / travaux sur ordinateur.

Page 56: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Panorama du Big Data

Objectif Avoir une vision des diffe rents aspects des Big Data.

Contenu La formation pre sente les diffe rents aspects des Big Data : les usages, les technolo-

gies et les impacts dans l’entreprise et la socie te , en pre sentant son origine, ses

dernie res applications, les technologies spe cifiques mais aussi l’organisation des

projets et des e quipes de data science, et les sources d’informations pour suivre le

sujet au-dela de la journe e.

DA

TA

SC

IEN

CE

Qu’est-ce que les Big Data ? Qu’est-ce que les Big Data ? Comment caracte riser les Big Data et expliquer leur essor Origines et bre ve histoire Implication technologique Illustrations d’applications des Big Data Nouveaux mode les e conomiques Nouvelles sources de donne es Data Lake et entrepo t de donne es

Technologies et outils propres aux Big Data

Enjeux technologiques, data centers, clusters Pre sentation des principes de MapReduce (calcul distribue ) Acteurs des technologies Big Data Zoom sur Hadoop et ses outils Outils et environnement de mode lisation

Impacts, organisation, compétence des équipes

Risques des Big Data Equipe Big Data & data lab Conduite des projets Big Data Me tiers & compe tences S’informer et se former

Dure e 2 jours ou 14 heures

Niveau

Tout public

Déjeuner

offert

Repe res bibliographiques

Martin Kleppman (2016). De-

signing Data-Intensive Applica-

tions, O’Reilly

Tom White (2014). Hadoop,

the definite guide, O’Reilly

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 56

Prérequis La formation sera « grand public » mais sera plus facile a suivre si l’on a une cer-

taine sensibilite a la question du traitement des donne es, avec quelques notions

de base en statistique.

Page 57: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Panorama des méthodes de Data Mining

Objectifs Comprendre la de marche du Data Mining et quand elle peut s’appliquer ou non.

Connaî tre le fonctionnement et les re sultats a attendre des principales techniques statistiques employe es (scoring, typologies).

Contenu La formation pre sente sans formalisme mathe matique les principales techniques

de la statistique de cisionnelle utilise es sous le terme de « Data Mining ». Des de -

monstrations pratiques sur des cas concrets seront re alise es par l’intervenant. Les

me thodes seront plus de crites dans leur intuition et sur leurs conse quences pra-

tiques, logiciel, temps de calcul, performances, donne es ne cessaires, outils gra-

phiques, etc.

DA

TA

SC

IEN

CE

Présentation du data mining

De finition, positionnement par rapport a la statistique Principales applications Panorama des techniques employe es Pre sentation de l’offre logicielle Cycle d’un projet

Analyse descriptive

Typologies et segmentation

Modélisation de phénomènes binaires

Re gression moindres carre s Re gression logistique

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 57

Prérequis Notions statistiques de base (moyenne, comptage).

Dure e 3 jours ou 21 heures

Niveau

Tout public

Déjeuner

offert

Page 58: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Méthodes avancées de Data Mining

Objectif Faire le lien entre les me thodes de Data Mining usuelles et les me thodes issues de

la recherche re cente en apprentissage statistique, comme les me thodes a noyaux

(SVM et SVR entre autres) et les me thodes d’agre gation (boosting, bagging, fore ts

ale atoires).

Savoir mettre en œuvre ces me thodes sur des cas pratiques et juger de leur perti-

Contenu La formation de crit les principales me thodes de data mining issues de la re-

cherche actuelle en apprentissage statistique, cible leurs difficulte s et leurs avan-

tages et e value leurs performances.

Des applications sur des jeux de donne es simule es et re elles seront mises en

œuvre a l’aide du logiciel libre R.

DA

TA

SC

IEN

CE

Statistique, apprentissage et data mining De finitions, positionnement Principales applications Panorama des me thodes et de l’offre logicielle Choix d’une me thode et ajustement des parame tres

Méthodes à noyaux, SVM et SVR

Support Vector Machines pour la discrimination binaire ou multi-classes Support Vector Regression pour la re gression Ajustement des parame tres

Méthodes d’agrégation et bootstrap

Agre gation de re gles de pre diction : inte re t Principe du bootstrap Me thodes de boosting (Adaboost et logitboost)

Dure e 3 jours ou 21 heures

Niveau

Avance

Déjeuner

offert

Logiciel utilise

R

Repe res bibliographiques

N. Cristianini et J. Shawe-

Taylor(2000), An introduction

to support vector machines,

Cambridge University Press

T. Hastie, J. Friedman et R.

Tibshirani(2009), The ele-

ments of Statistical Learning:

Data Mining, Inference and Pre-

diction, Springer-Verlag New

York Inc

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 58

Prérequis Notions statistiques de base, me thodes de discrimination usuelles (re gression

logistique, arbres de de cision), re gression line aire.

Page 59: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Machine Learning

Objectifs Comprendre ce qu’est le Machine Learning, la nature des proble mes qu’il permet de re soudre. Apprendre a mettre en œuvre les principaux algorithmes sur des don-ne es re elles, a analyser leurs re sultats, et comparer leurs performances.

Contenu

DA

TA

SC

IEN

CE

Introduction

Méthodes d’agrégation ou méthodes d’ensemble

Bagging et fore ts ale atoires : re duction de variance; Mesures d’importance des variables Agre gation d’arbres de de cision Boosting : re duction de biais

Support Vector Machines (SVM), et méthodes à noyaux

Support Vector Machines line aires Support Vector Machines non line aires Astuce du noyau et ge ne ralisation

Réseaux de neurones

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 59

Prérequis De bonnes bases en statistique infe rentielle, en particulier en analyse discrimi-

nante par arbres de de cision et en re gression line aire. De bonnes notions de pro-

grammation avec R. Niveau correspondant a la formation Mode lisation et initia-

tion au machine learning.

Dure e 2 jours ou 14 heures

Logiciel utilise

R

Niveau

Tout public

Déjeuner

offert

Page 60: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Deep Learning

Objectif De couvrir le deep learning et ses applications, dont le transfer learning

Mettre en œuvre les principaux environnements de deep learning

Contenu

DA

TA

SC

IEN

CE

Découvrir l’approche deep learning et ses applications

Comprendre la différence avec les approches de machine lear-

ning Rappel des principes du machine learning Apprentissage supervise et non supervise L’optimisation

Comprendre le transfer learning

Découvrir les principaux environnements de deep learning

Tensorflow Keras

Utiliser les ressources du cloud et les GPU

Choix Installation

Découvrir les différents types de réseaux

Re seaux convolutionnels Re seaux re currents

Mettre en œuvre : atelier sur les réseaux convolutionnels (1 jour)

Pre parer et traiter les images pour le deep learning (en Python) Utiliser le transfer learning

Dure e 2 jours ou 14 heures

Niveau

Avance

Déjeuner

offert

Logiciel utilise

Python

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 60

Prérequis Premie re pratique de Python, connaissance du shell script, familiarite avec les

statistiques et l’analyse

Page 61: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Text Mining

Objectifs Mettre en œuvre les me thodes de la statistique textuelle sur des corpus de nature diffe rente (questions ouvertes, entretiens, mots associe s, articles de presse, pages Web, etc.) a l’aide de logiciels spe cifiques (IraMuTeQ, SpadT, R.TeMiS) Interpre ter, pre senter et valoriser les re sultats.

Contenu

DA

TA

SC

IEN

CE

Situer le Text Mining par rapport aux méthodes de la statistique

textuelle et au développement des méthodes.

Identifier les apports de la statistique textuelle et inte re t par rapport a l’analyse qualitative et l’utilisation de logiciels d’aide a la lecture de textes (NVivo, Sonal).

Collecter des données textuelles non structurées et des métadon-

nées associés et les préparer en corpus analysables.

Mettre en œuvre le traitement d’un corpus par les méthodes de

statistique textuelle

Construire un lexique associe , lemmatiser (ou pas), pre parer des tableaux lexicaux, et produire des statistiques uni ou multivarie es associe s.

Interpréter les résultats

Mots du lexique, concordances, mots spe cifiques, plans factoriels et arbres de

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 61

Prérequis Connaissance de base en statistique descriptive (formations Statistique 1

et Statistique 2)

Dure e 2 jours ou 14 heures

Logiciel utilise

Packages spe cifiques de R,

IraMuTeQ (me thode Alceste)

Repe res bibliographiques

Lebart, L. et Salem, A.

(1994), Statistique tex-

tuelle Paris, Dunod, 342 p.

Garnier B., Guérin-Pace F.

2010 Appliquer les me thodes

de la statistique textuelle Paris,

CEPED, 86 p. (Les Clefs pour

(Te le chargeable a partir du site

du Ceped : http://

www.ceped.org/?Appliquerles-

methodes-de-la)

Niveau

Tout public

Déjeuner

offert

Page 62: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Web-scraping (extaction de données sur le web)

Objectif Acque rir les notions the oriques et pratiques ne cessaires a la mise en œuvre des

techniques d’acquisition automatise es de donne es sur le web.

Contenu La formation se concentre sur les me thodes d’extraction de donne es structure es

ou semi-structure es depuis une page web (“web scraping”) ou une interface de

programmation. Chaque me thode fait l’objet d’une pre sentation the orique et

d’exemples pratiques de programmation. La formation ne cessite une connaisse de

base en programmation.

DA

TA

SC

IEN

CE

Les droits d’utilisation des données disponibles sur le web Pre sentation des concepts de licences sur les donne es, du mouvement OpenData et des principales licences.

Récupérer des données fournies par une interface de program-mation (API) De finition d’une API, reque tage, exemples pratiques avec Python et R.

Récupérer des données d’un site web

De finition du web scraping, parcours de pages web, exemples pratiques avec Python et R, utilisation des Apis Web (Google, Twitter…)

Exemples d’outils pour faciliter le web scraping

Outils pour extraire depuis des sites statiques ou sites fortement dynamiques (ajax): Scrapy, PhantomJS, etc.

Problèmes avancés d’extractions de données

Dure e 2 jours ou 14 heures

Niveau

Avance

Déjeuner

offert

Logiciels utilise s

R, Python, Google Chrome

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 62

Prérequis Connaissances de base en traitement de donne es, programmation (ide alement

en python), formation Les donne es structure es sur le web ou connaissances de

HTTP, HTML, CSS, XML, JSON, XPath, CSS selectors, regex.

Page 63: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Techniques de scoring

Objectifs Savoir construire un score pour la pre diction d’un phe nome ne binaire, depuis la phase d’e chantillonnage jusqu’aux restitutions finales.

Contenu La formation propose une pre sentation du concept de Data Mining et un panorama des me thodes

statistiques regroupe es sous ce terme – me thodes classiques de la statistique (analyse discrimi-

nante, re gression logistique) et me thodes plus ” informatiques ” (arbres de de cision, re seaux de neu-

rones). De nombreux exemples issus de diffe rents secteurs d’activite illustreront ces me thodes. Le

but est de pre senter les techniques et les pie ges de l’e tude de donne es volumineuses, avec un objec-

tif d’aide a la de cision. Cette formation ne recourt que peu au formalisme mathe matique. Les forma-

tions Analyse discriminante et segmentation et Me thodes de re gression pour donne es qualita-

tives permettront aux statisticiens d’approfondir la the orie et la mise en œuvre des me thodes pre -

dictives classiques.

DA

TA

SC

IEN

CE

Présentation du data mining De finition, positionnement par rapport a la statistique Principales applications Panorama des techniques pre dictives et descriptives employe es Pre sentation de l’offre logicielle Cycle d’un projet de scoring

Analyse descriptive liminaire Graphiques utiles Caracte risation par des tests statistiques Se lection de variables par des tests (e galite de moyennes, de me dianes, de distributions, khi-2) Gestion des donne es manquantes

Arbres de décision Construction d’un arbre Trois algorithmes : CHAID, CART, C4.5 – diffe rences et similitudes Exploration statistique avec des arbres Mode lisation avec des arbres

Analyse discriminante Principe de l’analyse discriminante line aire Me thode DISQUAL et fonction de score Forces et faiblesses

Régression logistique Principe de la re gression logistique binaire Commentaire d’un mode le Forces et faiblesses

Comparaison des méthodes de scoring E valuer la qualite d’un mode le : courbe ROC, courbe de lift Mise en oeuvre : transformer une probabilite en de cision Performance et robustesse : l’importance du jeu de test

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 63

Prérequis Connaissances de base en calcul des probabilite s et en statistique (test, re gression li-

ne aire).

Dure e 5 jours ou 35 heures

Logiciel utilise

R

Repe res bibliographiques

Tuffery S. (2017), Data Mining

et Statistique De cisionnelle,

Technip (5e me e dition)

Tuffery S. (2010), E tude de cas

en statistique De cisionnelle,

Technip (2e me e dition)

Tuffery S. (2017), Mode lisation

pre dictive et apprentissage sta-

tistique avec R, Technip (2e me

e dition)

Niveau

Tout public

Déjeuner

offert

Page 64: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

CARTOGRAPHIE

THEMATIQUE

Ge ne ralite s sur la cartographie the matique

La pre paration d’un fond de carte (PHILDIGIT)

La re alisation de cartes the matiques

1

2

3

CA

RT

OG

RA

PH

IE T

HE

MA

TIQ

UE

Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-

tion des connaissances, cette formation alterne expose s the oriques et applications

pratiques / cas concrets / travaux sur ordinateur.

Page 65: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Généralités sur la cartographie Thématique

Objectifs

Comprendre l’inte re t des repre sentations the matiques et connaitre les

types de repre sentations graphiques

Contenu

CA

RT

OG

RA

PH

IE

TH

EM

AT

IQU

E

La cartographie thématique

Le cartogramme

Les logiciels de cartographie automatique

Eléments nécessaires pour une cartographie thématique

La sémiologie graphique

Les règles de la conception cartographique

La nature et le type de la mesure pour les types de carte

Les méthodes de discrétisation

Dure e 2 jours ou 14 heures

Niveau

Initiation

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 65

Page 66: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

La préparation d’un fond de carte (PHILDIGIT)

Objectifs

Etre en mesure de re aliser tout le ne cessaire a l’e laboration d’une carte the -

matique., en particulier le fond de carte

Contenu

CA

RT

OG

RA

PH

IE

TH

EM

AT

IQU

E

Installation et présentation du logiciel

Etapes de la digitalisation

Préparation du tableau des données (fichier Excel)

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30

Prérequis

Avoir des notions de base sur la cartographie the matique. Dure e

2 jours ou 14 heures

Niveau

Initiation

Déjeuner

offert

Logiciels utilise s

PHILDIGIT

66

Page 67: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

La réalisation de cartes thématiques

Objectifs

E tre capable de repre senter sur une carte, des indicateurs avec un logiciel

de cartographie open source.

Contenu

CA

RT

OG

RA

PH

IE

TH

EM

AT

IQU

E

Sous PHILCARTO

Installation et présentation du logiciel

Les cartes en surfaces colorées ou choroplèthes

Les méthodes de discrétisation

Les cartes en semis de points

Les cartes en cercles proportionnels sur surfaces colorées

Les cartes en cercles proportionnels colorés

Les cartes en demi-cercles affrontés

Les cartes en secteurs

Sous QGIS

Installation et pre sentation du logiciel

Re alisation de cartes et manipulations

Dure e 5 jours ou 35 heures

Niveau

Initiation

Déjeuner

offert

Logiciels utilise s

PHILCARTO et QGIS

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 67

Prérequis

Connaitre les notions de base en cartographie the matique et e tre en me-

sure de re aliser un fond de carte.

Page 68: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

MODELISATION

ECONOMIQUE

Mode lisation en e quilibre Ge ne ral Calculable

Me thodes micro e conome triques d’e valuation d’impact

1

2

MO

DE

LIS

AT

ION

EC

ON

OM

IQU

E

Afin de mobiliser les participants, de multiplier les e changes et de faciliter l’assimila-

tion des connaissances, cette formation alterne expose s the oriques et applications

pratiques / cas concrets / travaux sur ordinateur.

Programmation financie re 3

Page 69: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Modélisation en équilibre Général Calculable

Objectifs Maî triser la mode lisation en e quilibre ge ne ral calculable.

Contenu Tout comme les mode les macro-e conome triques, les mode les d’e quilibre ge ne ral

calculable sont couramment utilise s pour l’e valuation des conse quences macro-

e conomiques de mesures de politique e conomique. Leur horizon de simulation

rele ve cependant du long terme et leurs spe cifications s’appuient strictement sur

la micro-e conomie du consommateur et du producteur.

La formation comporte tant des aspects the oriques qu’applique s. Les travaux diri-

ge s se de roulent dans l’environnement logiciel GAMS, principal outil de mode lisa-

tion en e quilibre ge ne ral calculable sur le plan international.

MO

DE

LIS

AT

ION

EC

ON

OM

IQU

E

Introduction Pre sentation des familles de mode les d’e quilibre ge ne ral calculable – mise en perspective historique

Techniques de modélisation Construction d’un mode le statique d’e quilibre ge ne ral calculable : approche the orique. Nous aborderons ici la notion de loi de Walras, de matrice de comptabilite sociale, de calibrage. Les formes fonctionnelles usuelles (ces, Cobb-Douglas, Leontief) et leurs proprie te s seront pre sente es rapidement.

Construction d’un modèle Construction, pas a pas, de deux mode les statiques simples (en autarcie, sans et avec de penses publiques), dans l’environnement gams. Plusieurs simulations seront effectue es et commente es. Pre sentation d’un mode le dynamique : un document de travail de taille pre sentera un mode le d’e quilibre ge ne ral calculable dynamique a anticipations parfaites, dont le code gams et les re sultats de simulations seront ensuite commente s en de tail

Dure e 5 jours ou 35 heures

Niveau

Avance

Déjeuner

offert

Logiciels utilise s

Gams

Repe res bibliographiques

Brillet, J.-L. (1994), Mode lisa-

tion e conome trique, Economica

Épaulard, A. (1997), Les mo-

de les applique s de la macroe co-

nomie, Topos, Dunod

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 69

Prérequis Connaissances de base en macroe conomie et en e conome trie.

Page 70: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Méthodes micro économétriques d’évaluation d’impact

Objectifs L’objectif du cours est de fournir aux participants les outils ne cessaires a l’e va-

luation d’impact de politiques ou de projets mene s. Le cours se tourne vers les

me thodes micro e conome trique d’e valuation. Les diffe rences entre les me thodes

seront pre sente es afin de ressortir les cas ide aux d’application de chacune des

me thodes.

Contenu

MO

DE

LIS

AT

ION

EC

ON

OM

IQU

E

Les différences de différence

Les variables instrumentales

Les régressions sur discontinuité

Contrôler des observables: le matching

Au-delà de la moyenne : les régressions de quantile

De l’estimation à l’interprétation

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 70

Dure e 5 jours ou 35 heures

Niveau

Avance

Déjeuner

offert

Logiciels utilise s

Stata, R

Repe res bibliographiques

Brillet, J.-L. (1994), Mode lisa-

tion e conome trique, Economica

Épaulard, A. (1997), Les mo-

de les applique s de la macroe co-

nomie, Topos, Dunod

Page 71: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Programmation financière

Objectifs L’objectif du cours est de permettre aux e le ves de comprendre les me canismes

d’e laboration et de mise en œuvre des politiques macroe conomique et financie re

dans le cadre des programmes d’ajustement structurels conduit par le FMI et la

Banque Mondiale. Ce se minaire doit permettre aux inge nieurs statisticiens e co-

nomistes de s’inte grer efficacement dans la haute administration e conomique et

financie re.

Contenu

MO

DE

LIS

AT

ION

EC

ON

OM

IQU

E

Introduction générale

Définition de la programmation financière

Introduction a partir d’une e tude de cas

Ro le du FMI

Analyse sectorielle

Le secteur re el

L’administration publique

La balance des paiements

Le secteur mone taire

Les interrelations

Méthode de projection

Elaboration d’un scénario de référence

Dure e 5 jours ou 35 heures

Niveau

Avance

Déjeuner

offert

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30 71

Prérequis Connaissances de base en macroe conomie et en e conome trie.

Page 72: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

RENSEIGNEMENTS

PRATIQUES

RE

NS

EIG

NE

ME

NT

S P

RA

TIQ

UE

S

Page 73: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Les formations sur mesure sont organisées pour répondre

aux besoins spécifiques d’entreprises ou d’administration.

Une équipe professionnelle à votre disposition

L’unité de formation continue de l’ENSAE de Dakar offre des

formations adaptées aux enjeux actuels et donc aux attentes

des entreprises et organisations.

Un membre de l’e quipe pe dagogique de l’ENSAE est le premier responsable

dans le traitement de chaque demande. Il est le contact privile gie , garant de

la continuite des e changes, pour accompagner l’organisme dans cette de -

marche. Il analyse la proble matique , assure l’inge nierie pe dagogique adap-

te e aux futurs participants et organise la formation. Il identifie les interve-

nants qui sont les plus indique s pour la mise en œuvre de la formation. Il su-

pervise e galement les aspects administratifs et logistiques de la formation.

Ces formations permettent une plus grande flexibilite en termes de dates, de

lieu et de contenu.

Le contenu des formations sur mesure peut e tre une adaptation d’une fiche

pre sente e dans ce catalogue ou peut traiter un autre domaine d’expertise de

l’ENSAE.

Notre devoir est de vous apporter quelle que soit votre de-

mande la réponse la plus conforme, assurant votre entière

satisfaction.

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30

Ils nous ont fait confiance

Au Sénégal: ANSD, Observatoire National de la Parite (ONP), Ministe re de la sante et de l’action sociale, Ministe re de la formation professionnelle, de l’apprentissage et de l’artisanat (MFPAA), Ministe re de l’Edu-cation Nationale (MEN), Ministe re de l’Agriculture et de l’Equipement Rural (MAER), UCAD, Campus franco se ne galais, etc.

Organismes étrangers ou internationaux: USAID, Abt Associate, INSTAT Mali, PNUD, World Vision, Coo-pe ration Canadienne, Coope ration Espagnole, Universite Paris Dauphine, IRD, PSL, etc.

Des activités consacrées essentiellement à des formations sur mesure pour répondre à des besoins spécifiques

Page 74: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

La formation continue a l’ENSAE n’est pas as-

sujettie a la TVA. Les prix indique s sont nets.

Afin de faciliter l’acce s aux doctorants et e tu-

diants aux formations, l’ENSAE leur propose

des tarifs pre fe rentiels. Ils peuvent se rappro-

cher de l’e quipe de formation continue pour

plus d’informations.

Pour les formations sur mesure se tenant des

journe es comple tes dans les locaux de

l’ENSAE, les de jeuners et les pauses cafe du

matin et du soir sont aussi offertes. Un trai-

teur est contracte pour assurer le service de

restauration.

Un kit compose d’une cle USB avec le contenu

du cours, un port document et du mate riel

didactique est distribue lors de chaque ses-

sion.

L’e quipe de l’unite de formation continue est

charge de proposer un tarif sur mesure cor-

respondant aux formation demande es.

N’he sitez pas a prendre contact avec les

membres de l’administration de l’ENSAE pour

des renseignements supple mentaires concer-

nant les tarifs des formations.

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30

Les tarifs Modalités

d’inscriptions

Chacune des formations concerne un public

spe cifique et clairement identifie . Veuillez

vous re fe rer a la fiche de pre sentation des for-

mations pour ve rifier que vous respectez les

pre requis de finis.

La validation des crite res/profils de finis pour

chacune des formations est l’impe ratif pour

l’inscription aux dites formations.

Pour les entreprises et administrations, la si-

gnature d’une convocation avec l’ANSD ou

l’ENSAE sera ne cessaire pour l’effectivite des

formations.

A l’issue de chaque session de formation, une

attestation de participation sera de livre e aux

participants.

Page 75: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30

Annulation

Toute annulation doit e tre signale e par e crit

(par courrier ou courrier e lectronique) a

l’ENSAE au moins deux semaines avant le de -

but de la formation.

Pour toute annulation parvenant moins de

deux semaines avant le de but de la formation,

l’ENSAE se re serve le droit de facturer 50%

des droits d’inscription.

En cas d’absence ou d’annulation reçue apre s

le de but de la formation, la totalite des droits

d’inscription sera exigible.

Horaires de

formations

Contact

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30 Email : [email protected] www.ensae.edu.sn

09h00 - 17h00

Sauf exception, nos

journe es de formation

durent 7 heures

Page 76: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Nos partenaires qui nous accompagnent dans nos formations

ENSAE Formation Continue Rocade Fann Cerf-volant BP:116 RP, Dakar

Tel: 33 859 43 30

Campus franco-sénégalais Université Paris Dauphine UCAD Uni-

versité Paris-Saclay USAID Canada (LAVAL Montréal) IRD ABT

Associates Ministère de la santé et de l’action sociale MAER World

Vision ONP INSTAT Coopération espagnole PNUD ANSD Minis-

tère de l’éducation nationale Ministère de la formation profession-

nelle de l’apprentissage et de l’artisanat.

Page 77: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Bulletin d’inscription Valable pour toutes les formations de l’ENSAE

Chaque participant recevra un courrier lui donnant toutes les informations sur l’organisation

de la session, trois semaines avant son déroulement

INTITULE ET DATES DE LA FORMATION :

> ORGANISME : Adresse :

Nom du responsable de formation :

Téléphone : Fax :

Mél (pour l’envoi de la convention et de la convocation) :

Adresse de facturation (Si différente) :

> PERSONNE A INSCRIRE Nom :

Niveau de formation :

Téléphone : Fax :

Mél (pour l’envoi de la convocation) :

Formation(s) déjà suivie(s) à l’ENSAE :

Mme M Prénom :

Fonction actuelle :

Motivations et attentes vis-à-vis de cette formation :

Signature et Date :

Il est également possible de s’inscrire par le web :

http://www.ensae.sn/

ENSAE Formation Continue

Rocade Fann Cerf-volant BP:116 RP, Dakar Tel: 33 859 43 30

Page 78: ENSAE Ecole Nationale de la Statistique et de … de formation continue...Hadoop tiques a e Techniques de scoring e tique tion ue Panorama du Big Data Panorama des méthodes de Data

Plan d’accès à l’ENSAE

Départ : Marche de Colobane, Dakar

12 minutes de marche sur une distance de 900m

Rocade Fann Cerf-volant.

BP 116 RP,, Dakar

Tel: 33 859 43 30

Email : [email protected]

http://www.ensae.edu.sn/