Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie...

12
Big Data et Data Lake Le duo gagnant de la transformation digitale des entreprises Livre Blanc Septembre 2016

Transcript of Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie...

Page 1: Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie marketing Considérés depuis longtemps comme un centre de coût, les services

Big Data et Data Lake

Le duo gagnant de la transformation digitale des entreprises

Livre Blanc Septembre 2016

Page 2: Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie marketing Considérés depuis longtemps comme un centre de coût, les services

www.itelligencegroup.com 2

Big Data et Data Lake

SOMMAIRE

1 | Une logique Data Centric ...................................................................................................3

2 | Des solutions au service de la stratégie data des entreprises..................................................4

3 | Des technologies adaptées ...........................................................................................5

4 | Les usages du Big Data et du Data Lake ...........................6

5 | L’intelligence appliquée aux données ..................................................8

6 | La protection des données ...........................................................................................9

7 | À retenir ..................................................................................................................................................................10

8 | À propos d’itelligence ..........................................................................................................11

Page 3: Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie marketing Considérés depuis longtemps comme un centre de coût, les services

www.itelligencegroup.com 3

1 | Une logique Data CentricChaque jour, les internautes et les entreprises produisent environ 2,5 trillions de données soit 1 milliard de milliards de données (10 puissance 18). Selon ces chiffres extraits d’une étude commandée par IBM, 90 % des informations disponibles aujourd’hui ont été créées au cours des deux dernières années seulement !

Et cette avalanche n’est pas prête à s’arrêter. Selon le cabinet d’études IDC, le volume gé-néré par les objets connectés atteindra 40 zet-taoctets (40 000 milliards de Go) en 2020.

Au-delà de ces chiffres impressionnants, il y a trois constats majeurs :

■■ Les données sont devenues l’or noir du mo-teur économique de toutes les entreprises ;

■■ Leur analyse revêt une importance capitale pour anticiper les besoins de ses clients, re-pérer les produits qui seront à la mode, do-per sa croissance et résister aux concurrents en saisissant des opportunités ;

■■ Leur traitement façonnera les services, les industries et les organisations de demain.

Digne d’intérêt, la donnée n’est cependant pas toujours étudiée de manière stratégique. Pour les entreprises, il est donc essentiel d’en-granger un maximum d’informations hétéro-gènes pour les analyser en cas de besoin. Avec différents outils comme ceux du Big Data, il est possible d’utiliser une donnée pour des finalités différentes.

La création de valeurs passe par l’exploitation de la data.

› Avis d’expert

« Le potentiel du Big Data dans la transformation digitale est quasi illimi-té. On crée de la valeur en détournant des données. Cela est vrai dans tous les domaines  : le marketing, la sup-ply chain, la finance… Les gisements de productivité et les marges sont très importants ».

Gilles Badinet, digital champion de la France auprès de la Commission européenne.

La transformation digitale impose de passer de l’ère du Data Warehousing à celle de la Data Intelligence combinée au Data Lake. Engranger des données identifiées au sein de l’organisation (ce que l’on peut définir par des « data blanches ») dans d’énormes entrepôts n’est plus adapté. Cette solution ne permet pas en effet de découvrir de la valeur dans des « data grises » (externes) et des « data noires » (informations présentes en masse dans les entreprises, mais non exploitées).

41 % Pourcentage de décideurs qui prévoient d’exploiter leurs données non structu-rées d’ici à fin 2017.

Source : étude « Big Data et Analytique »

du cabinet Markess. 2015.

La solution passe par l’exploitation d’un Data Lake, c’est-à-dire un espace de stockage et d’analyse global de toutes les informations, qu’elles soient brutes ou affinées, issues des sources internes ou en provenance de flux externes.

Intégrées dans les processus métiers, les ap-plications du Big Data Analytics permettent d’optimiser l’analyse comportementale des clients et les mécanismes industriels, mais aussi d’améliorer les prises de décision et la traçabilité, voire la détection de fraudes.

Page 4: Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie marketing Considérés depuis longtemps comme un centre de coût, les services

www.itelligencegroup.com 4

2 | Des solutions au service de la stratégie data des entreprises

L’un des enjeux du traitement des données par les marques est l’amélioration de la connais-sance client. Ce défi peut être relevé par toutes les entreprises, quelles que soient leur taille et leur activité, grâce aux solutions Big Data combinées à un Data Lake.

Différentes offres dans le Cloud facilitent cette nouvelle démarche stratégique. Une PME peut par exemple exploiter les ressources de son Data Lake en appliquant des outils d’ex-ploration de données et d’analytique « à la demande ».

L’objectif est de répondre à la règle des 3 P imposée au Big Data :

■■ Personnalisation : être capable de proposer une offre spécifique et actualisée (recom-mandation en temps réel) aux clients ;

■■ Prédiction : anticiper les ventes en magasin et en ligne (omnicanal) ;

■■ Processus maximisé : réduire les coûts et notamment ceux liés aux stocks.

De nombreux projets Big Data, au sein de de secteurs d’activité très variés (loisirs, banques/assurances, retail ou encore transports/indus-trie) peuvent bénéficier de cette opportunité technologique dont les champs d’application sont très divers : expérience client, marketing, optimisation industrielle, innovation produit/service…

Mais la collecte et l’analyse des données issues de leurs clients doivent rester en cohérence avec l’ADN de leur marque.

› Avis d’expert

« Si la confiance est de mise, le client va être enclin à transmettre des informa-tions sur lui, car il sait que le contenu qu’il recevra en échange sera plus per-tinent, explique-t-elle. La contrepartie explicite est qu’il faut que le bénéfice client soit à la hauteur de ce qui lui est demandé. »

Béatrice Lhopitallier, directrice data et marketing régie

du groupe Les Échos.

■ FOCUSBig Data et… Data Lake »

Le terme « Data Lake » est apparu au début des années 2000 dans un ouvrage de Dorian Pyle (McKinsey) « Data Préparation for Data Mining ». Un Data Lake stocke toutes les don-nées, quelles que soient leur nature et leur origine.

Quant au « Big Data », il s’agit des énormes volumes d’informations plus ou moins struc-turées. De par leur définition, ces quantités impressionnantes ne peuvent pas être étudiées de façon pertinente par des outils classiques de gestion de base de données.

652 millions d’eurosEn 2018, le marché français du Big Data devrait atteindre les 652 millions d’euros.

Source IDC.

Page 5: Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie marketing Considérés depuis longtemps comme un centre de coût, les services

www.itelligencegroup.com 5

3 | Des technologies adaptéesLes systèmes de base de données relation-nelle et les outils d’aide à la décision n’ont pas été créés afin de manipuler et d’analyser d’importants volumes de données disparates.

Cette problématique est abordée aujourd’hui par des systèmes de gestion de base de don-nées appelés « NoSQL » (Not Only SQL). Dépouillées de certaines fonctionnalités classiques, elles sont plus simples à manier, plus performantes et capables d’encaisser une montée en charge d’un volume à traiter.

Depuis, tout un écosystème est apparu autour du recueil et de l’analyse de ces informations :

■■ Des frameworks ont également été déve-loppés, Hadoop (de la Fondation Apache) étant le plus connu. Il s’agit de composants Open Source et d’outils associés pour cap-turer, traiter et analyser des données ;

■■ Des fournisseurs (Hortonworks, Clou-dera, MapR…) commercialisent des dis-tributions d’Hadoop qui simplifient son déploiement et son administration par de petites structures ;

■■ Des solutions Big Data hébergées dans le cloud ;

■■ Des éditeurs connus (Pentaho, Jaspersoft, Talend, Elastic) proposent des solutions Big Data et d’exploitation décisionnelle des données. Elles permettent d’accéder no-tamment à des rapports et des tableaux de bord ergonomiques (requêtage en langage naturel par exemple) par différents métiers.

La baisse des coûts de stockage et la maturité des outils open source ont également favorisé la multiplication des Data Lake.

85 % Pourcentage des professionnels décla-rant qu’il est difficile d’identifier les meil-leurs partenaires techniques pour gérer les données. Le « bon » partenaire data pour les dirigeants doit disposer d’une approche opérationnelle, être orienté sur les résultats business et intégrer la dimension organisationnelle.

Source : étude « Enjeux data des Décideurs

Français », iProspect et Les Echosmédias.

› Avis d’expert

« Le Big Data est un monde très mou-vant. Il faut être capable de s’adapter aux changements qui apparaissent ré-gulièrement sur les systèmes et sur les logiciels que l’on a choisis ».

Jean-Christophe Brun, Directeur du Centre de Solutions BI &

Big Data de Carrefour.

■ FOCUSDes profils recherchés

- Le Data Architect : il définit et met en place l’infrastructure Big Data.

- Le Data Engineer : il gère la fluidité des données dans le système d’information et vérifie leur qualité. Il connecte notamment le Data Lake à toutes les sources.

- Le Data Scientist : il maîtrise les différents rouages du Big Data afin d’optimiser la stratégie digitale de l’entreprise en créant de la valeur à partir d’énormes volumes de données. Il détermine les grandes tendances business et les opportunités que la direction devra saisir.

137 000 Le Big Data pourrait générer en France la création de 137 000 nouveaux postes d’ici à 2020.

Source : Gartner.

Page 6: Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie marketing Considérés depuis longtemps comme un centre de coût, les services

www.itelligencegroup.com 6

4 | Les usages du Big Data et du Data Lake

Fidéliser ses clients, saisir des occasions pour distancer ses concurrents, optimiser sa supply chain ou même détecter des risques avant qu’ils ne se concrétisent… Les domaines d’ap-plication des solutions Big Data alliées à un Data Lake sont multiples.

La maîtrise de ces deux axes, essentiels dans une stratégie data centric, permet de disposer d’une visibilité plus fine de son activité et d’être ainsi plus réactif. Une meilleure uti-lisation des données dont toutes les sources sont centralisées en un seul point accélère les cycles d’innovation. Les entreprises béné-ficient aussi de l’agilité d’un Data Lake pour extraire des informations non altérées (afin de conserver tout leur potentiel) et automatiser rapidement la création de valeurs métier à partir des Big Data.

Les principaux atouts d’un Data Lake :

■■ Le stockage, à moindre coût, d’importants volumes de données de toute nature, struc-turées ou non ;

■■ La suppression des silos au sein de l’entre-prise ;

■■ Un historique des informations afin d’éta-blir des études comparatives ou de ten-dance ;

■■ Une analyse plus rapide des données en fonction des besoins immédiats ;

■■ L’identification des opportunités de ventes croisées ;

■■ Une infrastructure à l’architecture scalable, évolutive et pérenne.

Les principaux usages du Big Data pour les distributeurs :

■■ L’analyse des comportements des clients dans un contexte omnicanal ;

■■ La détection des appétences des consom-mateurs pour un canal (boutique ou web) ;

■■ Les recommandations personnalisées lors des commandes en ligne et en magasin ;

■■ L’optimisation de la chaîne d’approvision-nement en combinant différents facteurs de qualité (délais, défauts...) et économiques (prix d’achat, coût de possession et de stoc-kage…).

Schématiquement, il y a deux usages princi-paux. Premièrement, l’amélioration des cas d’usages existants et deuxièmement l’innova-tion par la donnée. Le déploiement d’une solu-tion Big Data doit avoir qu’une seule finalité : le développement de l’activité économique.

› Avis d’expert

« L’une des priorités de Marks & Spencer est d’utiliser intelligemment et effica-cement ses données, afin d’obtenir au final une meilleure connaissance client, un meilleur engagement et des niveaux supérieurs de fidélité. »

Jagpal Jheeta, head of Business Information and Customer

Insight chez Marks & Spencer.

Page 7: Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie marketing Considérés depuis longtemps comme un centre de coût, les services

www.itelligencegroup.com 7

■ FOCUSUn nouvel outil de stratégie marketing

Considérés depuis longtemps comme un centre de coût, les services marketing peuvent maximiser le retour sur investissement grâce au Data Lake. Ce dernier devient un outil supplémentaire qui ne doit pas être confondu avec la DMP (Data Management Platform).

Connectée en temps réel à l’écosystème digital externe de l’entreprise, une DMP a une voca-tion opérationnelle. Elle est chargée d’identi-fier, de segmenter les audiences et les clients, en temps réel, pour leur appliquer des scénarii d’activation.

Un Data Lake va permettre une analyse en profondeur, dans la durée, pour tirer des ensei-gnements sur les comportements que la DMP a pu capter. Il n’a pas vocation à être connecté en temps réel à l’écosystème digital externe. Il réduit le temps nécessaire à la corrélation des informations sur les consommateurs et leur intégration au parcours client de bout en bout.

› Avis d’expert

« En un an, on a complètement changé la donne. On ne parle plus d’archivage de données. On parle maintenant de conservation de données. Notre objec-tif est d’être plus pertinent dans nos propositions de valeur aux clients pro-fessionnels, qui paient l’insertion de leurs petites annonces, contrairement au grand public qui ne paie rien. »

Aissa Belaid, directeur data chez Le Bon Coin.

Page 8: Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie marketing Considérés depuis longtemps comme un centre de coût, les services

www.itelligencegroup.com 8

5 | L’intelligence appliquée aux données

Aujourd’hui, l’extraction de données est à la portée de nombreuses entreprises. Le stockage de volumes de plus en plus importants n’est pas non plus un obstacle majeur.

Mais les informations récupérées par de mul-tiples « capteurs » physiques ou virtuels ne présentent aucune valeur. Orienté connais-sance et intelligence, un Data Lake ne produit également aucune valeur en soi.

C’est l’exploitation par des algorithmes et l’ex-périence « métier » de professionnels aguerris qui permettent aux entreprises de franchir un « gap » : être compétitives.

Seule l’intelligence appliquée aux données permet de créer de la valeur et de proposer ainsi une meilleure offre.

Pour réussir leur transformation digitale, les entreprises doivent donc franchir une nou-velle étape, celle de la Data Intelligence. Il est indispensable de recourir à des applications du Big Data Analytics qui sont capables de faire des regroupements, des corrélations, des combinaisons et des prévisions.

Ces différents mécanismes favorisent entre autres la détection de fraudes (aux assurances par exemple), l’analyse comportementale des clients et des prospects, l’optimisation des processus (mais aussi des mailings) et la maintenance prédictive.

Mais pour profiter de ces avantages, un projet de Data Lake doit être réalisé selon une métho-dologie Agile et être déployé progressivement. L’identification des cas d’usage pertinents, mais aussi de l’existant à rapatrier (sources et flux à connecter) reste deux préalables indispensables.

82 % La très grande majorité des décideurs estiment que les fonctions analytiques peuvent fortement ou très fortement améliorer leurs processus métier.

Source : étude « Big Data et Analytique »

du cabinet Markess. 2015.

› Avis d’expert

«  J’associe la data à un tableau im-pressionniste. Collés au tableau des nymphéas de Monet, par exemple, nous ne voyons que des points de couleurs. Mais si nous faisons deux trois pas en arrière, c’est la beauté des nymphéas que nous apprécions »

Wanessa Dali, directrice du planning stratégique du

groupe ZenithOptimedia.

Page 9: Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie marketing Considérés depuis longtemps comme un centre de coût, les services

www.itelligencegroup.com 9

6 | La protection des donnéesLes données ont toujours été le nerf de la guerre en matière de marketing et de publi-cité. Mais la multiplication des techniques permettant de recueillir de nombreuses in-formations (des renseignements personnels jusqu’au parcours d’un client dans une bou-tique) peut entraîner des dérives.

Les principes mêmes du Data Lake peuvent également se heurter à la législation sur la collecte et le traitement de données. Ainsi, l’article 34 de la Loi n° 78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés précise : « Le responsable du traitement met en œuvre toutes mesures adé-quates, au regard de la nature des données et des risques présentés par le traitement, pour assurer la sécurité des données et en particulier protéger les données à caractère personnel traitées contre toute violation entraînant ac-cidentellement ou de manière illicite la des-truction, la perte, l’altération, la divulgation, la diffusion, le stockage, le traitement ou l’accès non autorisés ou illicites. »

› Avis d’expert

«  Il y a de nombreux domaines où l’on peut créer de la valeur, mais au détriment du bien commun. Cette li-mite implique de mettre en place des régulations. »

Gilles Badinet, digital champion de la France auprès de la Commission européenne.

La situation évoluera peut-être vers un contrôle plus strict de la gestion des don-nées en mai 2018. Le nouveau règlement (UE) 2016/679 sur la protection des données per-sonnelles sera applicable dans tous les pays de l’Union européenne. Cette législation ré-affirme la responsabilité de la manipulation des informations incombant aux entreprises lorsqu’il s’agira de contrôler les fichiers. Elle consacre aussi de nouvelles dispositions sur le profilage des personnes. Ainsi, le consente-ment ne pourra plus être présumé (principe de l’opt-out), mais bien exigé de manière positive et au préalable (principe de l’opt-in).

Par anticipation, les entreprises peuvent prendre des mesures significatives :

■■ Répertorier les différents lieux de stockage au sein de l’organisation dans lesquels fi-gurent les données clients à sécuriser selon la réglementation ;

■■ Identifier qui est autorisé à accéder à ces fi-chiers ;

■■ Prévoir des contrôles de gouvernance des identités pour protéger l’accès aux données.

Le correspondant CNIL (Commission na-tionale de l’informatique et des libertés) de l’entreprise, ou le responsable informatique d’une PME, doit donc être très vigilant quant à l’usage et à la gestion de toutes les infor-mations recueillies. Il convient également d’impliquer les responsables sécurité (RSSI) très en amont dans les projets.

Page 10: Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie marketing Considérés depuis longtemps comme un centre de coût, les services

www.itelligencegroup.com 10

7 | À retenir« Rien ne sert de stocker  ; il faut analyser à point.  », cette version digitale de la célèbre citation de La Fontaine résume bien la situa-tion actuelle.

Selon l’étude de l’Economist Intelligence Unit, publiée en 2015, près des trois quarts des décideurs interrogés (73 %) indiquent en effet recueillir de façon systématique des informations sur le comportement actuel de leurs clients. Mais un tiers seulement (37 %) ajoutent qu’elles sont utilisées à des fins marketing.

Ces données clients sont encore trop souvent éparpillées à travers des systèmes d’informa-tion disparates et cloisonnés.

La majorité des entreprises engrangent de nombreuses informations sans les exploiter. Elles n’en tirent aucun bénéfice alors que la satisfaction client permet un retour sur inves-tissement ! L’utilité finale pour l’utilisateur détermine pourtant la valeur créée par l’en-semble du projet digital. Il est donc important d’impliquer les experts métier qui connaissent la problématique et les besoins des clients lors des choix technologiques.

L’analyse précise des informations est es-sentielle pour accroître ses parts de marché et être plus efficace que la concurrence. Les systèmes d’information doivent s’adapter en devenant plus ouverts, plus souples. L’ère des silos a vécu.

Un Data Lake et des technologies Big Data représentent le duo gagnant de la transfor-mation digitale des entreprises. La « mémoire universelle » d’un Data Lake permet de mieux comprendre son environnement en croisant un nombre considérable de données qui sans ce type d’organisation n’auraient pas pu se mélanger.

Mais le Big Data est encore une science ré-cente avec son lot d’erreurs dans de nombreux programmes qui ne sont pas pertinents, faute de compétences. La définition de métriques quantitatives de succès permet de prioriser les projets, d’identifier les axes majeurs d’amélio-ration et de valider la réussite d’une initiative.

Page 11: Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie marketing Considérés depuis longtemps comme un centre de coût, les services

www.itelligencegroup.com 11

8 | À propos d’itelligenceEn tant que SAP Platinum, itelligence accom-pagne PME et grandes entreprises dans la mise en place de solutions SAP performantes et adaptées à leurs besoins métiers.

Nous sommes présents dans 24 pays avec près de 5 000 collaborateurs, pour un chiffre d’affaires de 696,2 M€ en 2015. En France, itelligence est localisé à Paris, Lyon et Toulouse. itelligence est une filiale du groupe japonais NTT DATA, l’un des plus importants fournis-seurs de services IT au monde.

L’offre de services itelligence comprend : conseil et intégration, vente de solutions pac-kagées et de licences SAP, tierce maintenance applicative et infogérance. Le groupe possède 10 data-centers dans le monde, dans lesquels sont hébergés 1 000 systèmes et 45 000 uti-lisateurs SAP.

Page 12: Big Data et Data Lake Le duo gagnant de la transformation ...€¦ · Un nouvel outil de stratégie marketing Considérés depuis longtemps comme un centre de coût, les services

12www.itelligencegroup.com

Contactitelligence

69 rue de Monceau75008 Paris

Tél. : +33 1 40 86 22 31