001 Big Data Vs
-
Upload
jean-philippe-cunniet -
Category
Business
-
view
594 -
download
0
Transcript of 001 Big Data Vs
Copyright © 2012, Splunk Inc. Listen to yourdata.
Big DataV’s
Jean-Philippe CunnietFormateur Big Data
V de...
V O L U M E
Volume…
250 milliards
d’images sur
Facebook, par exemple, stocke des photos. Cette déclaration n'a rien d'impressionnant... jusqu'à ce que vous réalisiez que Facebook compte plus d'utilisateurs que la Chine n'a d'habitants. Chacun de ces utilisateurs y stocke de nombreuses photos. Facebook stocke ainsi environ 250 milliards d'images. Vous imaginez ? Non, mais vraiment. Faites-le. Essayez d'imaginer ce que représentent 250 milliards d'images.
LE VOLUME DES DONNEESCombien y-a-t-il d’octets dans un kilo-octet ?
LE VOLUME DES DONNÉES
1 Ko = 2 = 1024 octets 10
Une douzaine d’œufs, c’est pas 10 œufs !
1 Ko = 2 = 1024 octets 10
LE VOLUME DES DONNEES
1 Kilooctet = 2 octets 1 Megaoctet = 2 octets1 Gigaoctet = 2 octets1 Teraoctet = 2 octets1 Petaoctet = 2 octets1 Exaoctet = 2 octets1 Zettaoctet = 2 octets1 Yottaoctet = 2 octets1 Brontooctet = 2 octets
10
20
30
40
50
60
70
80
90
Combien d’exaoctets de données le LHC (grand collisionneur de hadrons) peut-il produire par jour ?
5 Eo 50 Eo 500 Eo
Combien d’exaoctets de données le LHC (grand collisionneur de hadrons) peut-il produire par jour ?
500 Eo500 exaoctets = 500 x 2 octets
60
Une fois terminé, le flux de données généré par le radiotélescope SKA (Square Kilometre Array) sera équivalent à…
Un dixième du trafic Internet globalDeux fois le trafic Internet globalDix fois le trafic Internet global
Une fois terminé, le flux de données généré par le radiotélescope SKA (Square Kilometre Array) sera équivalent à…
Un dixième du trafic Internet globalDeux fois le trafic Internet globalDix fois le trafic Internet global
skatelescope.org
Une fois terminé, le flux de données généré par le radiotélescope SKA (Square Kilometre Array) sera équivalent à…
Un dixième du trafic Internet globalDeux fois le trafic Internet globalDix fois le trafic Internet global
V de...
VELOCITÉ
Data velocitéLes données diffusées sur internet
toutes les 60 secondes.
Internet of cars
The driveless cars requires a huge & veloce data analysiscity & cars infrastructure
Data velocitéLes données captées par une voiture autonome
sont analysées en temps réel pour la conduite.
V de...
VARIÉTÉ
VARIÉTÉ des données
Relational Data/ Social Network Geological Data
Product Recommendation
Climate Change
Text & Language
Gene expressionImage & Video Speech & Audio
VARIÉTÉ des données
LA STRUCTURE des données
18
DONNEES STRUCTURÉES et NON-STRUCTURÉESLes technologies Big Data permettent de gérer des données :
- Structurées- Non structurées- Un mix des deux types de données
DONNÉES STRUCTURÉES
DONNÉES STRUCTURÉES et NON-STRUCTURÉES
DONNÉES NON STRUCTURÉES
VÉRACITÉdes données
DirtyClean vsDATA DATA
VALEURdes données
Hot Data Cold Data
VARIABILITÉdes données
PRÉCISIONdes données “VAGUENESS”
Copyright © 2012, Splunk Inc. Listen to yourdata.
hypermnesie/ˌhʌɪpəmˈniːzɪə/
Notre environnement est devenu hypermnésique :il stocke les données en permanence