1FBR. ISG. 2018
Advanced data warehouse
Mastère Professionnel Data science for business
FBR. ISG. 2018
Fahmi Ben Rejab
CHAPITRE 0
GÉNÉRALITÉS
Année universitaire 2018/2019
Le cours Entrepôt de données avancés est destiné
aux administrateurs des bases de données ou futurs
data scientist,
ou tout autre acteur mené à structurer
et/ou
analyser , jouer avec les données volumineuses
2FBR. ISG. 2018
OBJECTIF Gestion de projet Informatique
Mastère Pro. DSB
3FBR. ISG. 2018
SOURCE Gestion de projet Informatique
Mastère Pro. DSB
http://fahmi-benrejab.e-monsite.com/
En janvier dernier, le site de recherche d’emploi Glassdoor a élu le travail de
Data Scientist en première position de son top 25 des meilleurs métiers
du monde.
Selon l’étude menée par Glassdoor, le salaire annuel moyen d’un Data
Scientist s’élève à 116 840 dollars.
De 45K€ pour un profil junior, jusqu’à 120K €/an,
Le Chief Data Scientist peut gagner jusqu’à 180K €/an.
Les opportunités d’embauche sont nombreuses et largement supérieures
à la quantité de profils qualifiés. Fin, janvier Glassdoor dénombrait
ainsi 1736 offres d’emploi.
4
« PORTRAIT » D’UN DATA SCIENTIST
FBR. ISG. 2018
Gestion de projet Informatique
Mastère Pro. DSB
5FBR. ISG. 2018
il s’agit également d’un poste à haute responsabilité, qui nécessite des
prédispositions naturelles et une éducation de haut niveau.
Gla
ssd
oo
r,
Jan
vie
r 2018
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
6FBR. ISG. 2018
Multidisciplinaire
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
7FBR. ISG. 2018
Une formation d’analyste
88% des Data Scientists sont diplômés au minimum d’un master
46% d’entre eux sont titulaires d’un doctorat
32% sont issus d’une formation dans le domaine des mathématiques et des statistiques
30% ont étudié les sciences informatiques
16% proviennent d’écoles d’ingénieurs.
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
8FBR. ISG. 2018
Le Data Scientist doit avoir des connaissances en statistiques
Avoir au minimum des notions de calculs statistiques.
Ces connaissances lui permettront de déterminer la bonne technique d’approche et
d’analyse pour chaque donnée.
Capacité à réaliser des analyses prédictives et statistiques à partir des différentes bases de
données,
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
9FBR. ISG. 2018
Le Data Scientist doit maîtriser des outils analytiques
Une connaissance approfondie d’au moins un outil analytique tel que SAS, R,
est en général exigée.
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
10FBR. ISG. 2018
Le Data Scientist doit maîtriser Les langages de programmation
Les postes de Data Scientist requièrent la maîtrise d’au moins un langage de programmation.
Le plus couramment employé est Python, mais il peut être remplacé par Java, Perl ou
C/C++.
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
11FBR. ISG. 2018
Savoir des notions de Machine Learning
Connaitre quelques méthodes de Machine Learning peut être un réel atout pour la création
d’un produit dirigée par les données.
Les différentes techniques peuvent être directement implémentées à l’aide des librairies R ou
Python, il n’est pas indispensable de savoir comment fonctionnent leurs algorithmes.
L’important est de comprendre leur fonctionnement dans les grandes lignes et de savoir quelle
méthode est la plus pertinente selon la situation.
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
12FBR. ISG. 2018
La programmation en SQL
Hadoop et les bases de données NoSQL se sont largement imposés dans le domaine du Big
Data.
La plupart des recruteurs exigent des candidats la maîtrise de la programmation en SQL pour
pouvoir formuler et exécuter des requêtes.
Le SQL tend à redevenir le langage prédominant dans le Big Data en 2020
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
13FBR. ISG. 2018
La gestion de données non structurées
Savoir gérer des données non structurées. Ces données sont le principal challenge du Big Data.
Savoir traiter les données comportant des imperfections, telles que des valeurs manquantes ou
des chaînes de format incohérentes.
Cette compétence est particulièrement importante au sein des entreprises n’étant pas
habituées à l’analyse de données.
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
14FBR. ISG. 2018
Des compétences en ingénierie logicielle
Permettront notamment de prendre en charge le développement d’un produit dirigé par les
données
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
15FBR. ISG. 2018
La curiosité intellectuelle
La curiosité intellectuelle est indispensable
pour détecter les données les plus intéressantes et exploitables au sein d’un gigantesque
volume de data.
Pour mener à bien le travail de Data Scientist, il est nécessaire d’être créatif et de poser ses
propres questions plutôt que de simplement répondre à celles qui se posent.
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
16FBR. ISG. 2018
Le Data Scientist doit avoir le sens de la communication
Communiquer ses découvertes techniques aux autres intervenants,
Son rôle est d’aider les décideurs à prendre les bonnes décisions, en leur fournissant les
informations nécessaires.
Comprendre les problèmes des autres équipes
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
17FBR. ISG. 2018
18FBR. ISG. 2018
Etude des données en possession de l’entreprise qui permettront de définir
• les données qui seront extraites
• La manière de traiter les données
en accord avec les exigences de la direction
Récupération et analyse des données pertinentes liées au processus de
production de l’entreprise, à la vente ou encore liées aux données client…
Construction d’algorithmes permettant d’améliorer les résultats de recherches et
de ciblage,
Élaboration de modèles prédictifs afin d’anticiper l’évolution des données et
tendances relatives à l’activité de l’entreprise,
Modélisation des résultats d’analyse des données pour les rendre lisibles et
exploitables par les managers,
Principales missions du data scientist
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
19FBR. ISG. 2018
Recommandations business auprès de la direction générale afin d’améliorer la
prise de décision.
Ce travail d’interprétation des données pourra également se faire au travers de la
création d’un tableau de bord spécifique et/ou logiciel sur mesure analysant les
données traitées. La création de métriques d’aide à la décision pourra avoir une
influence conséquente sur la stratégie de l’entreprise.
Principales missions du data scientist
« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique
Mastère Pro. DSB
Thank You
Top Related