Valtech - Big Data en action

45

Transcript of Valtech - Big Data en action

Page 1: Valtech - Big Data en action
Page 2: Valtech - Big Data en action

2

Sommaire!

•  Qu’est-ce que l’« Open Data Scientist »?!•  Cas d’étude « eReputation »!•  Cas d’étude « Recommandation »!•  Cas d’étude « Molécules »!•  Cas d’étude « Velib » !•  Conclusion!!

Open!Data Scientist!

Géraud Dugé De Bernonville!‎Architecte Big Data!‎Valtech Toulouse!

Pierre Yves Koenig!‎Data Scientist!‎Valtech Toulouse!

Page 3: Valtech - Big Data en action

3

Big!Buzz!

Page 4: Valtech - Big Data en action

4

Big Data!Buzz!

«  Big  data  is  like  teenage  sex:    everyone  talks  about  it,    

nobody  really  knows  how  to  do  it,    everyone  thinks  everyone  else  is  doing  it,    so  everyone  claims  they  are  doing  it.  »  

Dan  Ariely  

Page 5: Valtech - Big Data en action

10,2 M€ Reste

du Monde !

36 M€ USA !

36,3 M€ EUROPE DU SUD !

5

Big Data!Quelles solutions?!

Page 6: Valtech - Big Data en action

6

Nouveaux outils pour l’organisation des données!•  « Schema-less »!•  Tolérants aux pannes!•  Disponibles!•  Distribués!!

Big Data!NoSQL!

Page 7: Valtech - Big Data en action

7

Temps réel!!Vs.!!Batch!!!

Big Data!Architectures!

Page 8: Valtech - Big Data en action

8

•  Liste non exhaustive !!!!

•  Chaque jour de nouveaux acteurs !

Big Data!En perpétuelle évolution!

Page 9: Valtech - Big Data en action

9

Répondre!à une problématique!

Page 10: Valtech - Big Data en action

10

Pour cela Valtech propose une démarche itérative!! •  Data Architecte / Architecte SI!

•  Rôle prédominant du « Data Scientist »!

Big Data!Démarche Valtech!

Page 11: Valtech - Big Data en action

10,2 M€ Reste

du Monde !

36 M€ USA !

36,3 M€ EUROPE DU SUD !

65,1 M€ EUROPE DU NORD!

11

“Data Scientist: The Sexiest Job of the 21st”!

Open!Data Scientist!

“Data  Scien@st’s  Salary:  $150,000  –  $250,000  a  year”  

fortune.com  

Page 12: Valtech - Big Data en action

12

Un domaine pluri-disciplinaire!

Data!Science!

Page 13: Valtech - Big Data en action

13

Data Science!Dangers !!

Page 14: Valtech - Big Data en action

14

Utilisation de KNIME pour le prototypage, la fouille de données!!Déclinaison vers des implémentations Big Data adaptées!

Big Data!Du POC à la mise en œuvre!

Page 15: Valtech - Big Data en action

10,2 M€ Reste

du Monde !

36 M€ USA !

36,3 M€ EUROPE DU SUD !

65,1 M€ EUROPE DU NORD!

15

« Elle est diffusée de manière structurée selon une  méthodologie et une licence ouverte garantissant son libre accès et sa réutilisation par tous, sans restriction technique, juridique ou financière. »!

Cas d’utilisation!Open Data!

Page 16: Valtech - Big Data en action

16

•  Source d’innovation!

•  Tranquilien (SNCF)!•  Paris’Moov!•  …!

•  Concours!

Enjeux!Open Data!

Page 17: Valtech - Big Data en action

17

Data Scientist!ToolBox!

Page 18: Valtech - Big Data en action

18

Description!

ToolBox!KNIME!

Page 19: Valtech - Big Data en action

19

Description!

ToolBox!Tulip!

Page 20: Valtech - Big Data en action

20

Démarche!Data Scientist!

Page 21: Valtech - Big Data en action

21

• Collecte de l’information!• Pré-traitement!• Traitement!• Regroupement!• Présentation!!

Démarche!Case Study!

Case Study :!•  eReputation!•  Recommandation!•  Molecules!•  Velib!

Page 22: Valtech - Big Data en action

22

Case study eReputation!

Page 23: Valtech - Big Data en action

65,1 M€ EUROPE DU NORD!

23

• Problématique!• Collecte d’information!• Pré-traitement!• Traitement!• Regroupement!• Présentation!!

Case study!eReputation!

Page 24: Valtech - Big Data en action

24

Du POC au Big Data!eReputation!

•  Cloud Amazon!•  Elastic MapReduce!•  DynamoDB!•  Hadoop et Mahout!!!

Page 25: Valtech - Big Data en action

25

Du POC au Big Data!eReputation!

Page 26: Valtech - Big Data en action

26

Case study Recommandation!

Page 27: Valtech - Big Data en action

27

Case study!Recommandation!

• Problématique!• Collecte d’information!• Pré-traitement!• Traitement!• Regroupement!• Présentation!!

Page 28: Valtech - Big Data en action

28

Case study Molécules!

Page 29: Valtech - Big Data en action

29

Case study!Molécules!

• Problématique!• Collecte d’information!• Pré-traitement!• Traitement!• Regroupement!• Présentation / Exploration!!

Page 30: Valtech - Big Data en action

30

Contexte!Problématique!

Page 31: Valtech - Big Data en action

31

Analyse et Structure de la donnée!Pré traitement des données !

Page 32: Valtech - Big Data en action

32

Case study!Molécules!

Phase de traitement!!Choix du type de distance :!•  euclidienne!•  cosinus !•  Tanimoto!•  …!!

Page 33: Valtech - Big Data en action

33

Réseau de molécules!Filtres !

Page 34: Valtech - Big Data en action

34

Visualisation du réseau!Exploration !

Page 35: Valtech - Big Data en action

35

Case study!Molécules!

Dessin de graphe : !Algrithme force-resort!

Page 36: Valtech - Big Data en action

36

Case study!Molécules!

Dessin de graphe : !Treemap circulaire!

Page 37: Valtech - Big Data en action

37

Exploration!Par voisinage !

Page 38: Valtech - Big Data en action

38

Case study!Molécules!

Demo!!

Page 39: Valtech - Big Data en action

39

Case study !Velib!

Page 40: Valtech - Big Data en action

40

Case study!Velib’!

•  Problématique!•  Collecte d’information!•  Pré-traitement!•  Traitement!•  Regroupement!•  Présentation!•  Définition d’un modèle !

prédictif!

Page 41: Valtech - Big Data en action

41

Case study!Velib’!

Défini4on  d’un  model  prédic4f  •  Ajout  des  informa4ons  sur  la  météo  •  Evalua4on    

Page 42: Valtech - Big Data en action

42

Pour conclure!

Page 43: Valtech - Big Data en action

43

Positionnement de Valtech :!

•  Brainstormings pour identifier les cas d’utilisations!

•  Conseil en Architecture Big Data / Lambda !

•  Expertise NoSQL, Hadoop, Storm, Spark!

•  Analyse de données / Data Mining!

•  Formations Big Data, NoSQL, Hadoop!

Pour aller plus loin!Positionnement Valtech!

Page 44: Valtech - Big Data en action

44

Petit-Déjeuner Bug Data et NoSQL le mardi 28 avril :!

Valtech et Basho vous présenteront les différents modèles de base de donnée ainsi qu’un retour d’expérience sur la gestion en NoSQL des patients du système de santé anglais!

!Ce séminaire permettra d’aborder les points suivants :!•  Présentation des offres Big Data Valtech!•  Présentation des différentes modèles de bases de

données NoSQL!•  Le cas National Health System!•  Présentation de Riak!

Pour aller plus loin!Prochainement Valtech!

Page 45: Valtech - Big Data en action

45

Picto  sec)on  

Merci!de votre attention!