La Business Intelligence by Zeggar.net

11
Badrou Zeggar | IT Student Site: www.zeggar.net Email: [email protected] La Business Intelligence (BI) «La bonne information au bon moment au bon endroit avec le bon outil…pour prendre la bonne décision ! Zeggar» badrou zeggar 22/11/2010 La BI c’est l'ensemble des technologies permettant de traiter, valoriser et présenter les données à des fins de compréhension, d’analyse et de décision… GARTNER Group

description

La BI c’est l'ensemble des technologies permettant de traiter, valoriser et présenter les données à des fins de compréhension, d’analyse et de décision…

Transcript of La Business Intelligence by Zeggar.net

Page 1: La Business Intelligence by Zeggar.net

Badrou Zeggar | IT Student Site: www.zeggar.net Email: [email protected]

La Business Intelligence (BI)

«La bonne information au bon moment au bon endroit avec le bon outil…pour prendre la bonne

décision ! Zeggar»

badrou zeggar

22/11/2010

La BI c’est l'ensemble des technologies permettant de traiter, valoriser et présenter les données à des fins de compréhension, d’analyse et de décision… GARTNER Group

Page 2: La Business Intelligence by Zeggar.net

Table des matières 1. INTRODUCTION ..................................................................................................................................... 2

2. DEFINITION DE LA BI (BUSINESS INTELLIGENCE) .................................................................................. 2

3. LES AVANTAGES D’UN SYSTEME D'INFORMATION DECISIONNEL ........................................................ 4

3.1. Efficacité et convivialité ................................................................................................................ 4

3.2. Réduction des coûts ...................................................................................................................... 4

3.3. Qualité et pertinence de l'information ......................................................................................... 4

3.4. Réactivité ...................................................................................................................................... 4

4. COMPOSITION D’UN SYSTEME DE BUSINESS INTELLIGENCE : .............................................................. 5

4.1. ETL (Extract-Transform-Load ) ...................................................................................................... 5

4.2. Data Warehouse ........................................................................................................................... 5

4.3. Data Mart ...................................................................................................................................... 6

4.4. OLAP : On Line Analytical Processing ............................................................................................ 7

4.4.1. Définition............................................................................................................................... 7

4.4.2. Les 12 règles d’OLAP (7) : ...................................................................................................... 7

4.4.3. Les différents Modèles d'OLAP (8) ........................................................................................ 8

4.5. Reporting....................................................................................................................................... 9

Bibliographie ............................................................................................................................................... 10

Page 3: La Business Intelligence by Zeggar.net

1. INTRODUCTION Les sources d'information aujourd’hui sont éclatées, il y a un vrai besoin d'analyser ces informations

pour avoir une vision globale sur le patrimoine informationnel de l'entreprise. Cependant, « trop

d'information tue l'information »...l’informatique décisionnelle a pour objectif de créer, à partir des

données de l'entreprise ou externe à celle-ci de l’information, et aider les membres de l'entreprise dans

leur pilotage.

Les études récentes montrent que la BI1 est l'une des préoccupations principales au sein des DSI de

grandes entreprises. En effet dans un monde concurrentiel la BI représente une opportunité pour les

entreprises d'optimiser le pilotage de leurs activités, et d'anticiper sur les évolutions du marché

Les domaines d'utilisation de la BI touchent la plupart des Métiers de l'entreprise:

Finance, avec les reportings financiers et budgétaires.

Vente et commercial, avec l'analyse des points de ventes, l'analyse de la profitabilité et de

l'impact des promotions.

Marketing, avec la segmentation clients, les analyses comportementales.

Logistique, avec l'optimisation de la gestion des stocks, le suivi des livraisons.

Ressources humaines, avec l'optimisation de l'allocation des ressources.

Etc.

2. DEFINITION DE LA BI (BUSINESS INTELLIGENCE)

La BI, dite aussi informatique décisionnelle se définit comme l'ensemble des technologies permettant de

traiter, valoriser et présenter les données à des fins de compréhension, d’analyse et de décision.

La Business Intelligence vise à récupérer des données brutes qui se trouvent dans des outils type ERP,

CRM, ou des sources externes provenant des clients, fournisseurs, données de marchés, ...), puis à les

transformer en information et à les diffuser sous forme de tableaux de bord ou reporting.

1 Dans la suite de ce document, nous utiliserons l’acronyme BI pour décrire le concept d’Informatique

Décisionnelle.

Page 4: La Business Intelligence by Zeggar.net

On peut schématiser le processus de la BI comme suit :

Figure 1 Pyramide modélisant le processus de BI (Piloter.org)

Le cheminement du flux d’information à partir des données brutes arrivant des sources : ERP, CRM ou

sources externes pour les exploiter dans le reportings et autres tableaux de bord de la manière

suivante :

Nous pouvons également modéliser le flux informationnel, c'est-à-dire le cheminement depuis la

donnée brute arrivant des sources (ERP, CRM...), à la production de reportings et autres tableaux de

bord de la manière suivante :

Page 5: La Business Intelligence by Zeggar.net

Figure 2 Flux informationnel lié aux processus BI (Piloter.org)

3. LES AVANTAGES D’UN SYSTEME D'INFORMATION DECISIONNEL Un système d'information décisionnel procure de nombreux avantages, on cite ci-dessous quelques-

uns :

3.1. Efficacité et convivialité Accessible de la BI à toute entreprise, quel que soit sa taille, et à tout utilisateur, quelles que soient ses

compétences techniques.

3.2. Réduction des coûts Avec le SID2, les coûts d'exploitation des données sont fortement réduits. En effet, l'alimentation, la

manipulation et l'extraction des données sont automatiques.

Il n'est plus nécessaire de faire appel à un spécialiste ou un informaticien. Chaque décideur peut avoir

accès à l'information de son bureau à travers un portail.

3.3. Qualité et pertinence de l'information L'accès facile à l'information permet de prendre des décisions fondées sur des données précises et non

bâties sur de simples hypothèses.

3.4. Réactivité Les données importantes étant regroupées et pré-analysées, les temps d'accès aux données pertinentes

sont quasiment immédiats et permettent une meilleure réactivité.

N'étant plus tributaires du service informatique, les décideurs ont accès, immédiatement, depuis leur

poste de travail, aux informations nécessaires.

2 Systèmes d’Information Décisionnels

Page 6: La Business Intelligence by Zeggar.net

4. COMPOSITION D’UN SYSTEME DE BUSINESS INTELLIGENCE :

4.1. ETL (Extract-Transform-Load ) Avant d'être utilisables, les données de l'entreprise doivent être mises en forme, nettoyées et

consolidées. Les outils ETL (Extract Transform Load) permettent d'automatiser ces traitements et de

gérer les flux de données qui alimentent le (ou les) entrepôt(s)3.

Les outils ETL font référence à plusieurs opérations qui s'articulent autour de trois axes majeurs:

Extraction : des données primaires (issues par exemple des systèmes de production) ;

Transport : Transformation des données ;

Intégration : Transformation des données ;

Ces trois étapes décrivent une mécanique cyclique qui a pour but de garantir l’alimentation du Data

Warehouse en données homogènes, propres et fiables.

Les traitements étant très gourmands en calcul, l’alimentation s’exécute souvent la nuit, pour ne pas

impacter les ressources machine et réseau pendant les heures de bureau.

Transformation

(ETL)

Aut

re

Bas

e de

donn

ées

ERP

Données non

conformes

Données nettoyées

Fournisseurs

Facture

Client

Fich

iers

Don

nées

Exte

rnes

Sa

isie

man

uelle

Figure 3 Extraction, Transformation, Chargement. (CHETTA, 2006)

4.2. Data Warehouse Selon Bill INMON “L’entrepôt de données est une collection de données orientées sujet, intégrées, non

volatiles, et historiées, organisées pour le support d’un processus d’aide à la décision.”

Cette définition est considérée comme référence dans le monde des Data Warehouses, essayons de la

détailler dans le paragraphe suivant :

3 Les entrepôts de données ou Data Warehouse

Page 7: La Business Intelligence by Zeggar.net

Orienté sujet: signifie que les données collectées sont organisées par sujet (vendeur ;

article…etc.), et qu'elles contiennent l'information utile à la prise de décision.

Données intégrées: c'est-à-dire qu'un nettoyage préalable des données est nécessaire, car ces

données proviennent de sources différentes.

Non volatiles: ce qui signifie qu'une donnée entrée dans l'entrepôt l'est pour de bon et ne sera

pas supprimée.

Historiées: un entrepôt contient des données anciennes, datant de plusieurs années, utilisées

pour des comparaisons, des prévisions...etc.

Organisées pour le support d’un processus d’aide à la décision : Les données sont organisées

de manière à permettre l’exécution des processus d’aide à la décision (Reporting, Data

Mining…).

La figure suivante schématise l’emplacement du Data Warehouse et son environnement.

Figure 4 Composants d'un Data Warehouse (Jane Lauden: Management des SI)

4.3. Data Mart En général les Data Warehouses sont très volumineux et très complexes à concevoir, c’est pour cela on

a besoin de les diviser en bouchées plus faciles à créer et entretenir. Les résultats de cette division sont

les Data Marts. On peut faire des divisions par fonction, un Datamart pour les ventes, pour les

commandes, pour les ressources humaines.

Page 8: La Business Intelligence by Zeggar.net

Figure 5 Le Data Mart

A noter que Le Data Warehouse ou Data Mart représente tous deux des lieux de stockage de

l'information; ils ne produisent pas d'informations, ils stockent les données extraites des systèmes de

production.

4.4. OLAP : On Line Analytical Processing

4.4.1. Définition

C’est une technique d'analyse, élaborée par un des créateurs des bases de données relationnelles en

1993 : E.F. Codd, à la demande de la firme Arbor Software4.

La technologie OLAP est basée sur des cubes de données multidimensionnels, aussi appelées base de

données multidimensionnelles, ou chaque dimension du cube représente une dimension d’analyse.

Le modèle OLAP est utilisé au sein des Data Warehouses, il permet de sélectionner et de croiser

plusieurs données provenant des sources diverses

4.4.2. Les 12 règles d’OLAP:

Vue multidimensionnelle

L’utilisateur peut avoir des vus multidimensionnelles : analyser les ventes par produit mais aussi par

région ou par période.

Transparence du serveur OLAP à différents types de logiciels

La transparence du serveur OLAP s'appuie sur une architecture ouverte permettant à l'utilisateur

d'implanter le système OLAP sans affecter les fonctionnalités du système central.

4 Était une société qui propose des logiciels permettant d'accroître les performances des entreprises. Elle a été achetée par Oracle en 2007.

Page 9: La Business Intelligence by Zeggar.net

Accessibilité à de nombreuses sources de données

Le système OLAP doit garantir l’accès aux données nécessaires aux analyses demandées.

Performance du système de Reporting

L'augmentation du nombre de dimensions ou du volume de la base de données ne doit pas entraîner de

dégradation visible par l'utilisateur.

Architecture Client/Serveur

Il est nécessaire que les produits OLAP soient capables de travailler dans un environnement

Client/Serveur.

Dimensions Génériques

Il ne doit exister qu'une seule structure logique pour toutes les dimensions. C'est-à-dire ; toute fonction

qui s'applique à une dimension doit être aussi capable de s'appliquer à une autre dimension.

Gestion dynamique des matrices creuses

Le schéma physique des outils OLAP doit s'adapter au modèle d'analyse spécifique créé pour optimiser

la gestion des matrices creuses5.

Support multi-utilisateurs

Les OLAP doivent garantir l'intégrité et la sécurité des données afin que plusieurs utilisateurs accèdent

au même modèle d'analyse.

Calculs à travers les dimensions

Les opérations doivent pouvoir s'effectuer sur toutes les dimensions et ne doivent pas faire intervenir

l'utilisateur pour définir un calcul hiérarchique.

Manipulation intuitive des données

Garantir que toute manipulation doit être accomplie via une action directe sur les cellules du modèle

sans utiliser des chemins multiples à travers l'interface utilisateur.

Souplesse et facilité de constitution des rapports

Permettre aux utilisateurs de présenter des données synthétiques ou des résultats en fonction de

l'orientation du modèle.

Nombre illimité de niveaux d'agrégation et de dimensions

Tout outil OLAP doit gérer au moins 15 à 20 dimensions.

4.4.3. Les différents Modèles d'OLAP

Le modèle OLAP peut être stocké de différentes manières :

4.4.3.1. MOLAP (Multidimensional OLAP): MOLAP est une base de données Multi

dimensionnelle avec un serveur de traitement OLAP.

5 Sont des matrices contenant de nombreuses valeurs nulles

Page 10: La Business Intelligence by Zeggar.net

4.4.3.2. ROLAP (Relational OLAP) : ROLAP est une base de données relationnelle avec

du SQL avancé

4.4.3.3. HOLAP (Hybrid OLAP): Ce modèle est du MOLAP pour les données sommaires

et du ROLAP pour les données détaillées.

4.5. Reporting Les outils de reporting proposent la réalisation de rapports selon un format prédéterminé. On peut

interroger les bases de données selon les requêtes SQL préparées lors de l'élaboration du modèle.

Le rapport peut ensuite être diffusé sur l'Intranet, périodiquement en automatique ou ponctuellement

à la demande.

L'outil d'élaboration du modèle du rapport offre bien entendu des fonctions spécifiques de calcul et de

présentation (graphiques) afin de concevoir des comptes rendus particulièrement favorables et

pertinents.

Page 11: La Business Intelligence by Zeggar.net

Bibliographie 1. Cigref. Business Intelligence,Place de la BI et pilotage des projets decisionnels dans les grandes

organisations. s.l. : CIGREF, Octobre 2009.

2. Consulting, BSL. L'informatique décisionnelle. www.bsl-consulting.com. [En ligne] [Citation : 30 11

2010.] http://www.bsl-consulting.com/.

3. NOIRAULT, Claire. Business Intelligence avec Oracle. s.l. : ENI EDITIONS, 2006.

4. Inmon, Bill. Building the Data Warehouse, Third Edition. s.l. : Wiley Computer Publishing 2002, 2002.

5. Grim, Yazid. Conception d'un entrepôt de données (Data Warehouse). s.l. :

http://grim.developpez.com/cours/businessintelligence/concepts/conception-datawarehouse/, 2006.

6. GRIMAUD, MATTHIEU. Comment assurer l’intégration des données structurées dans l’entrepôt de

données. s.l. : Memoire de fin d'etude pour obtenir le Diplôme de L’INSTITUT SUPERIEUR DU

COMMERCE DE PARIS, juillet 2007.

7. E.F.Codd. "Providing OLAP (on-line analytical processing) to user-analysts:an IT mandate", Technical

Report . s.l. : E.F. Codd & Associates, 1993.

8. Larissa T. Moss, Shaku Atre. Business Intelligence Roadmap: The Complete Project Lifecycle for

Decision-Support Applications. s.l. : Addison Wesley, Fevrier, 2003.

9. FERNANDEZ, Alain. Qu'est-ce que le Reporting ? http://www.piloter.org. [En ligne] piloter.org.

[Citation : 28 novembre 2010.] http://www.piloter.org/business-intelligence/reporting.htm.