001 Big Data Vs

Post on 23-Jan-2018

594 views 0 download

Transcript of 001 Big Data Vs

Copyright © 2012, Splunk Inc. Listen to yourdata.

Big DataV’s

Jean-Philippe CunnietFormateur Big Data

V de...

V O L U M E

Volume…

250 milliards

d’images sur

Facebook, par exemple, stocke des photos. Cette déclaration n'a rien d'impressionnant... jusqu'à ce que vous réalisiez que Facebook compte plus d'utilisateurs que la Chine n'a d'habitants. Chacun de ces utilisateurs y stocke de nombreuses photos. Facebook stocke ainsi environ 250 milliards d'images. Vous imaginez ? Non, mais vraiment. Faites-le. Essayez d'imaginer ce que représentent 250 milliards d'images.

LE VOLUME DES DONNEESCombien y-a-t-il d’octets dans un kilo-octet ?

LE VOLUME DES DONNÉES

1 Ko = 2 = 1024 octets 10

Une douzaine d’œufs, c’est pas 10 œufs !

1 Ko = 2 = 1024 octets 10

LE VOLUME DES DONNEES

1 Kilooctet = 2 octets 1 Megaoctet = 2 octets1 Gigaoctet = 2 octets1 Teraoctet = 2 octets1 Petaoctet = 2 octets1 Exaoctet = 2 octets1 Zettaoctet = 2 octets1 Yottaoctet = 2 octets1 Brontooctet = 2 octets

10

20

30

40

50

60

70

80

90

Combien d’exaoctets de données le LHC (grand collisionneur de hadrons) peut-il produire par jour ?

5 Eo 50 Eo 500 Eo

Combien d’exaoctets de données le LHC (grand collisionneur de hadrons) peut-il produire par jour ?

500 Eo500 exaoctets = 500 x 2 octets

60

Une fois terminé, le flux de données généré par le radiotélescope SKA (Square Kilometre Array) sera équivalent à…

Un dixième du trafic Internet globalDeux fois le trafic Internet globalDix fois le trafic Internet global

Une fois terminé, le flux de données généré par le radiotélescope SKA (Square Kilometre Array) sera équivalent à…

Un dixième du trafic Internet globalDeux fois le trafic Internet globalDix fois le trafic Internet global

skatelescope.org

Une fois terminé, le flux de données généré par le radiotélescope SKA (Square Kilometre Array) sera équivalent à…

Un dixième du trafic Internet globalDeux fois le trafic Internet globalDix fois le trafic Internet global

V de...

VELOCITÉ

Data velocitéLes données diffusées sur internet

toutes les 60 secondes.

Internet of cars

The driveless cars requires a huge & veloce data analysiscity & cars infrastructure

Data velocitéLes données captées par une voiture autonome

sont analysées en temps réel pour la conduite.

V de...

VARIÉTÉ

Relational Data/ Social Network Geological Data

Product Recommendation

Climate Change

Text & Language

Gene expressionImage & Video Speech & Audio

VARIÉTÉ des données

LA STRUCTURE des données

18

DONNEES STRUCTURÉES et NON-STRUCTURÉESLes technologies Big Data permettent de gérer des données :

- Structurées- Non structurées- Un mix des deux types de données

DONNÉES STRUCTURÉES

DONNÉES STRUCTURÉES et NON-STRUCTURÉES

DONNÉES NON STRUCTURÉES

VALEURdes données

Hot Data Cold Data

VARIABILITÉdes données

PRÉCISIONdes données “VAGUENESS”

Copyright © 2012, Splunk Inc. Listen to yourdata.

hypermnesie/ˌhʌɪpəmˈniːzɪə/

Notre environnement est devenu hypermnésique :il stocke les données en permanence