INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER...

434
BUSINESS INTELLIGENCE AVEC SQL SERVER 2005 Bertrand Burquier APPLICATIONS & MÉTIERS Mise en œuvre d'un projet décisionnel

Transcript of INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER...

Page 1: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

B.

BU

RQ

UIE

R

BUSINESSINTELLIGENCE

AVECSQL SERVER 2005

Bertrand Burquier

Ce livre s’adresse aux directeurs informatiques, administratifs,financiers et opérationnels, ainsi qu’à tout responsable informatiqueayant à mettre en œuvre des systèmes décisionnels. Il intéresseraaussi les consultants et les architectes en systèmes d’information.On assiste aujourd'hui à une démocratisation de l'informatiquedécisionnelle. Chaque décideur qui le souhaite peut désormaisdisposer de puissants outils d'analyse, de reporting ou de datamining.Cet ouvrage donne un cadre méthodologique à la mise en œuvred’un projet décisionnel complet, en s’appuyant sur les nouvellesfonctions de Business Intelligence offertes par SQL Server 2005.Après avoir passé en revue les principes fondamentaux qui présidentà la réalisation d’un projet décisionnel, il identifie les pièges àéviter et les facteurs clés de succès. Il montre ensuite commentune solution de Business Intelligence peut analyser lesrenseignements stratégiques de l'entreprise, quels sont les différentsindicateurs disponibles, et comment les interpréter pour définirdes cibles, des prévisions ou des tendances. Des cas concrets expliquent comment mettre en œuvre la BusinessIntelligence dans l’entreprise avec SQL Server 2005.De nombreuses ressources complémentaires sont disponibles surle site www.buroformatic.com.

BUSINESS INTELLIGENCE AVEC SQL SERVER 2005 Mise en œuvre d'un projet décisionnel

Bertrand Burquier

BUSI

NES

S IN

TELL

IGEN

CE

INFOPRO

MANAGEMENT DES SYSTÈMESD'INFORMATION

APPLICATIONS MÉTIERS

ÉTUDES, DÉVELOPPEMENT,INTÉGRATION

EXPLOITATION ET ADMINISTRATION

RÉSEAUX & TÉLÉCOMS

L'ESSENTIEL

TYPE D’OUVRAGE

RETOURS D'EXPÉRIENCESE FORMER

AP

PLIC

ATIO

NS &

TIE

RS

Mise en œuvre d'un projet décisionnel

BERTRAND BURQUIER

est consultant et ingénieuren systèmes d’information,spécialisé dans la BusinessIntelligence. Il dirige depuis1985 le cabinet de conseilBuroFormatic. Il estégalement formateur enentreprise et enseigne laBusiness Intelligence àl’Institut de management del’université de Savoie.

6639389ISBN 978-2-10-050536-4 www.dunod.com

Page 2: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

BUSINESSINTELLIGENCE

AVEC

SQL SERVER 2005

Mise en œuvred’un projet décisionnel

Bertrand Burquier

Consultant et ingénieur en systèmes d’information

burquier_prelims.fm Page I Vendredi, 8. décembre 2006 2:01 14

Page 3: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Toutes les marques citées dans cet ouvrage sont des marques déposées par leurs propriétaires respectifs.

Photographie de couverture : Bertrand BurquierLac d’Annecy

© Dunod, Paris, 2007ISBN 978-2-10-050536-4

burquier_prelims.fm Page II Vendredi, 8. décembre 2006 2:01 14

Page 4: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Table des matières

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

Chapitre 1 – La business intelligence . . . . . . . . . . . . . . . . . . . . . . 5

1.1 La business intelligence pour qui, pour quoi ? . . . . . . . . . . . . . . . 5

1.2 Objectifs et enjeux du décisionnel . . . . . . . . . . . . . . . . . . . . . 7

1.3 Le processus de décision ou le facteur humain dans la prise de décision . 7

1.3.1 Comprendre les besoins d’aide à la décision . . . . . . . . . . . . . . . 8

1.3.2 Agir, analyser, décider, agir… . . . . . . . . . . . . . . . . . . . . . 9

1.3.3 Tableau de bord et business intelligence . . . . . . . . . . . . . . . . . 11

1.3.4 En quoi la BI est-elle utile à l’entreprise ? . . . . . . . . . . . . . . . . 14

1.4 Les modèles d’accès à l’information . . . . . . . . . . . . . . . . . . . . . 25

1.4.1 La dictature de l’information . . . . . . . . . . . . . . . . . . . . . . 25

1.4.2 L’anarchie de l’information . . . . . . . . . . . . . . . . . . . . . . . 26

1.4.3 La démocratie de l’information . . . . . . . . . . . . . . . . . . . . . 26

Chapitre 2 – L’approche méthodologique . . . . . . . . . . . . . . . . . . . . 29

2.1 Les étapes d’un projet informatique . . . . . . . . . . . . . . . . . . . . . 30

2.1.1 Le cycle en V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.1.2 La méthode agile . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.1.3 L’étude de faisabilité . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.1.4 Le cycle de vie du projet BI selon Ralph Kimball . . . . . . . . . . . . 33

Page 5: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————————— Business Intelligence avec SQL Server 2005IV

2.2 Pourquoi un tableau de bord ? . . . . . . . . . . . . . . . . . . . . . . . . 34

2.3 Les différents types d’indicateurs . . . . . . . . . . . . . . . . . . . . . . . 35

2.3.1 Fonction Commerciale . . . . . . . . . . . . . . . . . . . . . . . . . . 362.3.2 Fonction Direction générale . . . . . . . . . . . . . . . . . . . . . . . 372.3.3 Fonction Ressources humaines . . . . . . . . . . . . . . . . . . . . . . 382.3.4 Fonction Production et recherche – développement . . . . . . . . . . . . 392.3.5 Fonction Logistique et approvisionnements . . . . . . . . . . . . . . . . 412.3.6 Fonction Achats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422.3.7 Fonction Informatique – Études – Exploitation . . . . . . . . . . . . . 43

2.4 Deux mondes différents : OLTP et DW . . . . . . . . . . . . . . . . . . . 45

2.4.1 Qu’est-ce qu’une transaction ? . . . . . . . . . . . . . . . . . . . . . . 462.4.2 Les utilisateurs et les gestionnaires . . . . . . . . . . . . . . . . . . . . 462.4.3 La dimension temporelle . . . . . . . . . . . . . . . . . . . . . . . . . 472.4.4 Le modèle de données entité-relation pour les développeurs . . . . . . . . 492.4.5 Le modèle dimensionnel pour les analystes . . . . . . . . . . . . . . . . 49

2.5 Comparatif des deux modèles de stockage des données . . . . . . . . . . . 53

2.5.1 Le modèle transactionnel (OLTP) . . . . . . . . . . . . . . . . . . . . 532.5.2 Le modèle multidimensionnel (OLAP) . . . . . . . . . . . . . . . . . . 552.5.3 Synthèse OLTP et OLAP . . . . . . . . . . . . . . . . . . . . . . . . 562.5.4 Modèle simplifié FASMI . . . . . . . . . . . . . . . . . . . . . . . . . 56

2.6 OLAP ou reporting ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

2.7 Le processus décisionnel avec SQL server 2005 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

2.8 Les erreurs à éviter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

2.8.1 Le facteur Humain . . . . . . . . . . . . . . . . . . . . . . . . . . . 622.8.2 Le facteur Technique . . . . . . . . . . . . . . . . . . . . . . . . . . 65

2.9 Les règles du succès . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

2.9.1 Règle 1 – Comprendre les utilisateurs . . . . . . . . . . . . . . . . . . 672.9.2 Règle 2 – Distinguer les décisions stratégiques ou tactiques . . . . . . . . 68

2.10 Construire le tableau matriciel des besoins . . . . . . . . . . . . . . . . . 69

Chapitre 3 – Comment représenter les données ? . . . . . . . . . . . . . . . . 73

3.1 Concepts généraux et pratiques . . . . . . . . . . . . . . . . . . . . . . . 74

3.1.1 Tableaux ou graphiques ? . . . . . . . . . . . . . . . . . . . . . . . . 743.1.2 Données quantitatives ou catégorielles ? . . . . . . . . . . . . . . . . . 75

Page 6: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Table des matières ——————————————————————————————————————————————————————————————————————— V

3.2 Les nouveaux outils offerts par le complément Proclarity . . . . . . . . . 84

3.2.1 L’arbre de décomposition . . . . . . . . . . . . . . . . . . . . . . . . 843.2.2 La carte de performance . . . . . . . . . . . . . . . . . . . . . . . . 853.2.3 La vue en perspective . . . . . . . . . . . . . . . . . . . . . . . . . . 86

Chapitre 4 – Entrepôt de données et analyse décisionnelle . . . . . . . . . . 89

4.1 Architecture de la plate-forme décisionnelle . . . . . . . . . . . . . . . . 92

4.2 Les améliorations de SQL Server 2005 par rapport à la version 2000 . . . 94

4.2.1 Actuellement, comment développons-nous un projet BI ? . . . . . . . . 944.2.2 Quels sont les défis à relever ? . . . . . . . . . . . . . . . . . . . . . 94

4.3 Les nouveaux composants dans SQL Server 2005 . . . . . . . . . . . . . 96

4.3.1 Les vues des sources de données (Data Source Views, DSV) . . . . . . 964.3.2 Les cubes et UDM . . . . . . . . . . . . . . . . . . . . . . . . . . . 974.3.3 Les perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 974.3.4 Le cache proactif . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

4.4 Les améliorations apportées avec SQL Server 2005 SP1 . . . . . . . . . 98

4.4.1 La mise en miroir des bases de données . . . . . . . . . . . . . . . . . 984.4.2 Une création facilitée de rapports

sous SAP NetWeaver business intelligence . . . . . . . . . . . . . . . 99

4.5 Les services de notification . . . . . . . . . . . . . . . . . . . . . . . . . 99

Chapitre 5 – Introduction à Integration Services . . . . . . . . . . . . . . . . 101

5.1 Présentation de SQL Server Integration Services (SSIS) . . . . . . . . . 101

5.2 Migrer un package DTS 2000 . . . . . . . . . . . . . . . . . . . . . . . . 112

5.3 Migrer une base SQL Server 2000 vers SQL Server 2005 . . . . . . . . . 113

5.4 Tâches d’intégration services . . . . . . . . . . . . . . . . . . . . . . . . 114

5.5 Composants des flux de données . . . . . . . . . . . . . . . . . . . . . . 129

Chapitre 6 – Règles d’ETL et assistants . . . . . . . . . . . . . . . . . . . . 145

6.1 Utiliser l’assistant pour générer un lot import . . . . . . . . . . . . . . . 146

6.1.1 Créer le projet d’importation . . . . . . . . . . . . . . . . . . . . . . 1466.1.2 Exécuter le lot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1546.1.3 Modifier le lot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1556.1.4 Migration de lots DTS de la version 2000 vers 2005 . . . . . . . . . . 1636.1.5 Déploiement de packages SSIS . . . . . . . . . . . . . . . . . . . . . 1676.1.6 Automatisation de l’exécution des packages . . . . . . . . . . . . . . . 169

Page 7: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————————— Business Intelligence avec SQL Server 2005VI

6.2 Concept de packages dynamiques . . . . . . . . . . . . . . . . . . . . . . 171

6.2.1 Les expressions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1716.2.2 Les variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1726.2.3 Les configurations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1746.2.4 La gestion des événements . . . . . . . . . . . . . . . . . . . . . . . . 176

6.3 Planification du projet ETL . . . . . . . . . . . . . . . . . . . . . . . . . 176

6.3.1 La carte de haut niveau . . . . . . . . . . . . . . . . . . . . . . . . . 176

6.4 Les 38 règles qui régissent l’ETL . . . . . . . . . . . . . . . . . . . . . . . 177

Chapitre 7 – Analysis Services . . . . . . . . . . . . . . . . . . . . . . . . . . 179

7.1 OLAP et le data mining . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

7.2 Points d’amélioration entre Analysis 2000 et SSAS 2005 . . . . . . . . . 183

7.3 Méthodologie de création d’une base de données depuis une source existante . . . . . . . . . . . . . . . . . . . . . . . . . 192

7.4 Création de notre premier cube . . . . . . . . . . . . . . . . . . . . . . . 194

7.4.1 Mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1977.4.2 Dimensions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1977.4.3 Le schéma en flocons . . . . . . . . . . . . . . . . . . . . . . . . . . 1987.4.4 Créer le projet « Mon Premier Cube » à l’aide

de l’environnement UDM d’Analysis Services . . . . . . . . . . . . . . 199

7.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

Chapitre 8 – Méthode de conception des cubes avec SSAS . . . . . . . . . . . 229

8.1 Organisation logique des cubes . . . . . . . . . . . . . . . . . . . . . . . 230

8.1.1 Définition de la structure OLAP . . . . . . . . . . . . . . . . . . . . . 2308.1.2 Définir les dimensions . . . . . . . . . . . . . . . . . . . . . . . . . . 2328.1.3 Modification du cube . . . . . . . . . . . . . . . . . . . . . . . . . . 2398.1.4 L’utilisation des dimensions . . . . . . . . . . . . . . . . . . . . . . . 2428.1.5 Les calculs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2448.1.6 Ajouter de la business intelligence . . . . . . . . . . . . . . . . . . . . 2458.1.7 Les indicateurs clé de performance (KPI) . . . . . . . . . . . . . . . . 2468.1.8 Les actions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2498.1.9 Les perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2498.1.10 Les traductions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2508.1.11 Le navigateur de données . . . . . . . . . . . . . . . . . . . . . . . . 250

Page 8: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Table des matières ——————————————————————————————————————————————————————————————————————— VII

8.2 L’organisation physique du cube . . . . . . . . . . . . . . . . . . . . . . 250

8.2.1 Les groupes de mesures et les partitions . . . . . . . . . . . . . . . . . 2508.2.2 Les différents modes de stockage . . . . . . . . . . . . . . . . . . . . 2528.2.3 Comment SSAS rafraîchit-il les données du cube ? . . . . . . . . . . . 2538.2.4 Paramétrer les agrégations . . . . . . . . . . . . . . . . . . . . . . . 2568.2.5 Processus de mise à jour des cubes . . . . . . . . . . . . . . . . . . . 257

8.3 Recommandations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258

Chapitre 9 – Le data mining . . . . . . . . . . . . . . . . . . . . . . . . . . . 259

9.1 Méthodologie de création du modèle de data mining . . . . . . . . . . . 260

9.1.1 Définition du problème à résoudre . . . . . . . . . . . . . . . . . . . 2609.1.2 Préparation des données . . . . . . . . . . . . . . . . . . . . . . . . 2619.1.3 Construction du schéma de données . . . . . . . . . . . . . . . . . . 2619.1.4 Création du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . 2619.1.5 Exploration du modèle . . . . . . . . . . . . . . . . . . . . . . . . . 2619.1.6 Validation du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . 2629.1.7 Déploiement du modèle . . . . . . . . . . . . . . . . . . . . . . . . . 262

9.2 Quelles sont les tâches du data mining ? . . . . . . . . . . . . . . . . . . 262

9.3 Créer le modèle d’une campagne ciblée . . . . . . . . . . . . . . . . . . 264

9.3.1 Créer la source des données . . . . . . . . . . . . . . . . . . . . . . . 2659.3.2 Créer la vue de source des données . . . . . . . . . . . . . . . . . . . 2659.3.3 Créer le modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270

9.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287

Chapitre 10 – Reporting Services . . . . . . . . . . . . . . . . . . . . . . . . 289

10.1 Qu’est-ce que Reporting Services ? . . . . . . . . . . . . . . . . . . . . . 289

10.1.1 À quoi sert Reporting Services ? . . . . . . . . . . . . . . . . . . . . . 29010.1.2 Fonctionnalités de Reporting Services . . . . . . . . . . . . . . . . . . 291

10.2 La création de rapport . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294

10.3 La gestion des rapports . . . . . . . . . . . . . . . . . . . . . . . . . . . 308

10.3.1 La sécurité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30910.3.2 Les rapports liés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31810.3.3 L’exécution de rapports . . . . . . . . . . . . . . . . . . . . . . . . . 31810.3.4 L’historisation des rapports . . . . . . . . . . . . . . . . . . . . . . . 32110.3.5 Abonnements aux rapports . . . . . . . . . . . . . . . . . . . . . . . 323

10.4 Reporting à la demande avec Report Builder . . . . . . . . . . . . . . . 324

Page 9: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————————— Business Intelligence avec SQL Server 2005VIII

10.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329

Chapitre 11 – L’analyse de données avec Excel . . . . . . . . . . . . . . . . . 331

11.1 L’analyse ad hoc grâce aux tableaux croisés dynamiques . . . . . . . . . . 332

11.2 Complément Microsoft Office Excel pour SQL Server Analysis Services . . . . . . . . . . . . . . . . . . . . . 340

11.3 Reporting interactif sur le web avec OWC . . . . . . . . . . . . . . . . . 344

11.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345

Chapitre 12 – L’analyse de données sur le Web . . . . . . . . . . . . . . . . . 347

12.1 Proclarity for Business Scorecard Manager . . . . . . . . . . . . . . . . . . 348

12.1.1 L’arbre de décomposition . . . . . . . . . . . . . . . . . . . . . . . . 34812.1.2 La carte de performance . . . . . . . . . . . . . . . . . . . . . . . . . 35012.1.3 La vue en perspective . . . . . . . . . . . . . . . . . . . . . . . . . . 351

12.2 Proclarity Analytics Server (PAS) . . . . . . . . . . . . . . . . . . . . . . . 351

12.3 Dashboard Server . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358

12.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359

Chapitre 13 – Passez à l’action ! . . . . . . . . . . . . . . . . . . . . . . . . . 361

13.1 Les caractéristiques du chef de projet décisionnel . . . . . . . . . . . . . 362

13.2 Quel est le retour sur investissement ? . . . . . . . . . . . . . . . . . . . . 365

13.3 Faire une offre de solution décisionnelle . . . . . . . . . . . . . . . . . . 368

13.3.1 Un ETL d’entreprise, Integration Services . . . . . . . . . . . . . . . . 36913.3.2 Un SGBD pour la gestion des gros volumes de données . . . . . . . . . 37013.3.3 Une architecture qui garantit la disponibilité des données . . . . . . . . . 37113.3.4 Compatibilité, ouverture . . . . . . . . . . . . . . . . . . . . . . . . . 37113.3.5 Productivité dans le développement d’applications

liées à SQL Server 2005 . . . . . . . . . . . . . . . . . . . . . . . . . 37113.3.6 Administration renforcée . . . . . . . . . . . . . . . . . . . . . . . . . 37213.3.7 Sécurité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37213.3.8 Analysis Services . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37213.3.9 Reporting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37213.3.10 Donner un véritable cockpit de pilotage de l’activité

adapté aux différents niveaux de l’organisation . . . . . . . . . . . . . 373

13.4 Comment mettre en place un projet décisionnel ? . . . . . . . . . . . . . 374

13.4.1 Objectifs de la preuve de faisabilité . . . . . . . . . . . . . . . . . . . . 37513.4.2 Faisabilité sur site . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375

Page 10: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Table des matières ——————————————————————————————————————————————————————————————————————— IX

13.4.3 Livrables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37513.4.4 Planning pour le déploiement de la solution . . . . . . . . . . . . . . . 37513.4.5 Prototype/pilote . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37613.4.6 Opérations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376

13.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376

Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377

Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379

A – Petit historique de la BI . . . . . . . . . . . . . . . . . . . . . . . . . . . 383

B – Le marché mondial de la BI aujourd’hui . . . . . . . . . . . . . . . . . . 386

C – Les différentes versions de SQL Server 2005 . . . . . . . . . . . . . . . 391

D – Les profils d’apprentissage des différents acteurs de la BI . . . . . . . . 395

E – Glossaire de la BI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405

Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417

Page 11: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server
Page 12: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Introduction

« Voudriez-vous me dire, s’il vous plaît,quel chemin je dois prendre pour m’en aller d’ici ?

– Cela dépend beaucoup de l’endroit où tu veux aller, répondit le chat.– Peu m’importe l’endroit… dit Alice.

– En ce cas, peu importe la route que tu prendras, répliqua-t-il.– … pourvu que j’arrive quelque part, ajouta Alice en guise d’explication.

Oh, tu ne manqueras pas d’arriver quelque part,si tu marches assez longtemps. »

Alice au Pays des Merveilles – Lewis Carroll

Bien longtemps, l’informatique décisionnelle a été réservée à des secteurs d’acti-vité friands de reporting financiers et d’analyse marketing, tels que les banques,les assurances et plus généralement les grands comptes. Ces organisations étaientles seules à tirer parti d’investissements lourds aussi bien en termes d’équipesprojet qu’en termes d’infrastructures matérielles et logicielles. Le coût d’un projetdécisionnel n’était jamais inférieur à 0,5 m€ et dépassait fréquemment 1,5 m€.

Dès le début des années quatre-vingt-dix, partant du constat que les ERP (ouprogrammes de gestion intégrés, PGI) étaient dans l’incapacité de fournir deséditions et rapports synthétiques personnalisés, de nouveaux acteurs tels queHyperion, Business Objects et Cognos, ont apporté une réponse en matière derestitution de l’information.

Un nouveau type d’organisation des données appelées hypercubes OLAP, etde nouvelles interfaces ont permis aux managers d’accéder à leurs données.

Page 13: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————————————— Introduction 2

Cependant, la complexité de mise en œuvre du datawarehouse et la création descubes multidimensionnels demeurait forte. Si bien qu’un certain nombre degrands éditeurs ont tenté de développer des applications analytiques « métier ».Celles-ci ont eu tendance, comme les ERP quelques années plus tôt, à faire entrerl’entreprise dans un schéma analytique standard tout en faisant de nouveauexploser la facture finale.

Le véritable lifting de l’informatique décisionnelle a eu lieu en 2000, lorsqueMicrosoft, qui n’était alors que challenger, rendit disponible la version SQL Ser-ver 2000. Outre le fait que l’éditeur cherchait à s’imposer sur le marché desSGBD face à Oracle et IBM, le leader mondial des logiciels introduisait le germede la business intelligence par l’ajout d’un composant décisionnel appelé AnalysisServices.

L’organe d’observation indépendant OlapReport a mesuré la progression ful-gurante de Microsoft en termes de parts de marché OLAP. Dès 2002, l’éditeurde Redmond a pris la place de leader mondial pour ne jamais plus la quitter.

L’arrivée de SQL Server 2005, disponible depuis le 8 novembre 2005, a euun grand retentissement. Cette nouvelle version intègre les développements lesplus récents en matière de business intelligence. Les développeurs et adminis-trateurs de bases de données ont été entendus et disposent désormais d’outilscomplets à tous les niveaux de la fabrication de la chaîne de valeur de l’infor-mation.

Malgré ces avancées technologiques, le constat est affligeant. Aujourd’hui, laplupart des entreprises, y compris les PME/PMI, disposent d´une masse d´infor-mations de plus en plus importante sur leurs clients, leurs ventes, leurs produits,leurs fournisseurs leurs concurrents… dont elles ne font rien ! Croisées, analy-sées, filtrées, ces informations pourraient pourtant devenir un formidable trem-plin pour se différencier de la concurrence, améliorer les résultats de l’entreprise,suivre avec précision ses activités ou fidéliser les clients. Les entrepreneurs aviséssont pourtant demandeurs de synthèses rapides, de tableaux de bord clairs pourne plus piloter leur entreprise à l’intuition.

Il est pourtant évident que les informations stockées dans les nombreux silosde données répartis dans l’entreprise ne peuvent plus être traitées de manièreartisanale. Il n’est pas rare de constater que certains cadres passent leur temps àressaisir dans Excel des données puisées dans des documents fournis par les sys-tèmes opérationnels (ERP, comptabilité, stocks, production, ventes, RH, etc.).L’objectif est cependant louable : il s’agit de créer son tableau de bord personnel.

Naturellement chaque division procède de la même manière pour élaborerson propre tableau de synthèse. Par conséquence, lorsque les cadres se réunissent encomité interdépartementaux, il n’est pas rare d’observer des synthèses incohérentes

Page 14: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Introduction ————————————————————————————————————————————————————————————————————————————— 3

ou contradictoires. Au-delà du fait que l’informatique est une fois de plus mon-trée du doigt et discréditée, les décisions qui devraient naturellement découlerde ces réunions sont reportées sine die.

En revanche, les entreprises concurrentes qui ont déployé des outils de busi-ness intelligence perdent moins de temps en réunion et en discussion stériles, carles indicateurs sont en permanence connus de tous, chaque cadre opérationnel dis-posant des leviers permettant d’agir avec intelligence dans des délais très courts.

Que signifie le terme « intelligence » ?

Le Petit Larousse donne la définition suivante : « faculté de connaître, de com-prendre ».

Et l’expression « business intelligence » ?

Wikipedia (encyclopédie libre sur le net) donne la définition suivante de labusiness intelligence (ou informatique décisionnelle) :

« L’informatique décisionnelle (DSS, Decision Support System ou encore BI,business intelligence) désigne les moyens, les outils et les méthodes qui permettentde collecter, consolider, modéliser et restituer les données d’une entreprise envue d’offrir une aide à la décision et de permettre aux responsables de la stratégied’une entreprise d’avoir une vue d’ensemble de l’activité traitée. »

Cet ouvrage a pour ambition d’offrir une vision méthodologique de la fabri-cation de la chaîne décisionnelle, un état de l’art des outils disponibles, ainsi qu’unmode opératoire permettant de réaliser vous-même le déploiement de fonctionsde business intelligence au service du métier de votre entreprise.

Public concerné

La business intelligence en tant qu’outil de pilotage s’adresse essentiellement auxdécideurs confrontés chaque jour à des choix stratégiques et tactiques dans leurentreprise. Il est donc bien naturel que les dirigeants (direction générale et direc-tions opérationnelles) disposent d’un langage commun partagé avec les techniciensde l’information. Cet ouvrage leur est particulièrement destiné car il présente uneméthodologie de valorisation de l’information à des fins stratégiques.

Les contrôleurs de gestion, directions financières, commerciales, marketing, res-sources humaines, production verront les aides que peut apporter la business intel-ligence à leurs tâches quotidiennes.

Les directeurs informatiques, responsables informatiques et bureautiques, dis-poseront d’une méthode de mise en œuvre de la chaîne décisionnelle au servicedes acteurs opérationnels de l’entreprise.

Page 15: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————————————— Introduction 4

Les consultants, architectes et urbanistes en systèmes d’information, assistants àmaîtrise d’ouvrage, chef de projet informatique, étudiants en informatique de gestiondisposeront d’un outil méthodologique basé sur des cas concrets d’entreprise. Ilsdisposeront d’une panoplie d’outils leur permettant de réaliser rapidement desprojets décisionnels.

Les SSII soucieuses d’apporter des prestations nouvelles à leurs clients, lesorganismes de formation, les sociétés de VPC, les hébergeurs d’applications surInternet, les banques et assurances, les sociétés de service, les sociétés fiduciaires,les sociétés industrielles quelle que soit leur taille découvriront avec intérêt lepotentiel de la business intelligence.

Objectifs à atteindre

L’objectif de cet ouvrage est de fournir aux dirigeants la culture nécessaire à lacompréhension des méthodes et outils nécessaires à la mise en œuvre du tableaude bord de l’entreprise. Il permet également de comprendre les mécanismes sous-jacents qui participent à la fabrication de la chaîne décisionnelle. L’informatiquedécisionnelle se fonde sur des concepts spécifiques et un vocabulaire appropriédétaillés en annexe.

Il a également pour objectif d’aider à définir les étapes clés d’un projet déci-sionnel, identifier les processus métier, modéliser les données métier, identifierles outils qui participent à la conception du datawarehouse, comprendre les outilsd’analyse et de restitution. Communiquer avec ses partenaires grâce à un portaildécisionnel.

Quelles sont les qualités et compétences requises pour être un bon chef deprojet décisionnel ? Calculer le retour sur investissement et faire une offre concrètesont souvent évoqués dans la littérature décisionnelle mais rarement explicités.

L’auteur de cet ouvrage espère participer au mouvement de la démocratisa-tion du décisionnel dans les petites et moyennes entreprises. Les séminaires deformation qu’il anime sur le sujet montrent bien l’intérêt croissant que tous lesacteurs de l’entreprise portent à ce domaine. L’auteur espère qu’à travers cetouvrage, un dialogue constructif s’établira entre les deux mondes, parfois éloi-gnés, qu’il rencontre dans ses consultations : les informaticiens et les managersd’entreprise.

Page 16: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

1La business intelligence

1.1 LA BUSINESS INTELLIGENCE POUR QUI, POUR QUOI ?

Aide à la décision, datawarehouses, entrepôts de données, ETL, EIS, SIAD, struc-tures multidimensionnelles OLAP, business intelligence, extranets, portails décision-nels, datamarts… les acronymes et termes relatifs à la business intelligence sontparticulièrement riches. Mais ces termes abondants, parfois abscons, qui revien-nent de manière récurrente dans la bouche des spécialistes, ne permettent pasd’offrir aux acteurs de l’entreprise une vision claire sur le sujet.

D’un côté, les discours marketing centrés sur la BI s’adressent à la populationparfaitement identifiée des dirigeants opérationnels des entreprises. Il s’agitd’offrir des solutions particulièrement innovantes autour du métier du dirigeant.Nous verrons dans le chapitre suivant le large éventail des domaines dans les-quels la BI offre des réponses concrètes.

De l’autre côté les éditeurs de logiciels de BI s’adressent aux informaticiensdans le but bien naturel de réaliser des volumes importants de licences. Le dis-cours est dans ce cas très technique et s’attache à mettre en avant les performan-ces, la simplification et la richesse des fonctionnalités des produits.

Entre ces deux mondes, il réside un fossé d’incompréhension. Pourquoi ? Lesdirigeants opérationnels (finance, marketing, commercial, RH…) ont un besoincrucial d’informations concernant le déroulement de leur activité. Ils réclamentrégulièrement des rapports nouveaux auprès des informaticiens dans le but de satis-faire des besoins d’analyse de l’activité immédiate de l’entreprise. Dans le

Page 17: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————— 1. La business intelligence 6

meilleur des cas, un délai de quelques jours sera nécessaire aux programmeurspour délivrer lesdits rapports. Dans le pire des cas ces développements ne verrontjamais le jour soit de par la « complexité apparente » de la demande, soit toutsimplement par la non-disponibilité des développeurs, très chargés par ailleurs.

En réalité, on s’aperçoit que les métiers de l’informatique évoluent vers destâches d’administration de systèmes d’information de plus en plus complexes,qui nécessitent tous les jours davantage de soins et d’attention, sans parler de lasécurité omniprésente. Paradoxalement, l’informaticien est de plus en plus auservice de la machine et de moins en moins au service du métier de l’entreprise.

Malgré des réussites évidentes, le déploiement des ERP (progiciels de gestionintégrée) a nécessité des ressources importantes dans les entreprises qui les ontmis en place. Des équipes de projet se sont bien souvent épuisées à faire entrerle métier de l’entreprise dans des standards. Tout naturellement, les entreprisesont donc « standardisé » leur métier. Elles cherchent aujourd’hui, à juste titre,des facteurs de différenciation.

La business intelligence est un système permettant aux dirigeants d’analyseret d’interpréter, à l’aide d’outils simples, les données complexes de l’entrepriseet de son environnement économique.

Les données brutes sont transformées et restituées dans des entrepôts structurés,afin de permettre d’analyser et de suivre les indicateurs stratégiques de l’entreprise.

Ces outils doivent permettre de découvrir et de partager la stratégie à tous lesniveaux de l’entreprise. Grâce à ses outils « multidimensionnels » la BI est par-ticulièrement adaptée à l’analyse immédiate. Elle offre la capacité de suivre auquotidien les indicateurs métiers et de les comparer aux objectifs opérationnelsdéfinis par la direction.

Bien sûr, le discours marketing ambiant tente de démontrer qu’il suffitd’acquérir tel ou tel produit décisionnel pour que la magie opère. Comme on ditcommunément, « si c’était aussi simple ça se saurait ». À quoi serviraient alorsles SSII, les intégrateurs et les consultants spécialisés en systèmes décisionnels ?Seraient-ils devenus inutiles parce que les éditeurs ont mis en place des assistantsvisant à simplifier le processus de création de la chaîne décisionnelle ? Rien n’estmoins sûr.

Nous verrons au fil de cet ouvrage les pièges qu’il est nécessaire de connaîtreavant d’entreprendre un projet BI. Nous découvrirons que la phase la plus déli-cate de la chaîne décisionnelle ne réside ni dans la conception du cube, ni dansla restitution. Nous verrons également qu’un cadre méthodologique est néces-saire à la création de l’entrepôt de données, centre névralgique des applicationsdécisionnelles.

Page 18: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

1.2 Objectifs et enjeux du décisionnel ——————————————————————————————————————————————————————— 7

Toute interrogation métier, selon qu’elle est stratégique ou tactique, nécessitedes outils appropriés qu’il faut identifier dans la panoplie offerte par les éditeursde logiciels. Nous verrons quels processus se mettent en place lors de la prise dedécision. Nous montrerons comment, grâce à des outils appropriés, être tantôtl’architecte du projet, tantôt le « consommateur » de l’information. Chaque rôle,très complémentaire, revêt une importance capitale dans la mise en œuvre dela BI en entreprise.

1.2 OBJECTIFS ET ENJEUX DU DÉCISIONNEL

L’objectif d’un système décisionnel est de :

• connaître;

• mesurer;

• prévoir;

• agir.

Les moyens pour y parvenir sont :

• une information riche, pertinente, détaillée, historisée, fiable;

• des outils d’analyse et de restitution puissants et adaptés;

• des indicateurs qui favorisent le pilotage et favorisent l’action.

Le cycle du projet comprend plusieurs étapes :

• Sélectionner les axes de progrès.

• Sélectionner le ou les processus à analyser.

• Définir les objectifs.

• Définir les indicateurs.

• Bâtir le portail décisionnel.

1.3 LE PROCESSUS DE DÉCISION OU LE FACTEUR HUMAIN DANS LA PRISE DE DÉCISION

Dans un contexte d’inflation des données d’entreprises, plusieurs technologiesrécentes arrivent à point nommé pour répondre concrètement à l’augmentationdes besoins d’analyse et de prise de décisions émis par les dirigeants opérationnels.

Page 19: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————— 1. La business intelligence 8

Parmi ces innovations, il en est une qui offre la plus grande avancée enmatière d’aide à la décision. La technologie OLAP (On Line Analytic Processing)qui pendant quelques années a servi de niche technologique à certains éditeursbien connus, vient de faire une avancée remarquable du fait de l’améliorationdes performances des ordinateurs et de la découverte de nouveaux algorithmes.OLAP représente l’avancée la plus spectaculaire en matière de business intelli-gence depuis la découverte des bases de données relationnelles, dont les fonde-ments ont été établis par Chris Date et Edgar Codd en 1993.

Bien que de nombreux articles aient été publiés décrivant le fonctionnementdes technologies OLAP, très peu ont mis en avant « quand » et « comment »utiliser ces technologies dans le cadre de l’aide à la décision.

Dans ce chapitre, nous mettrons en évidence les deux volets de la prise dedécision : le volet quelque peu mécaniste de la création d’information à partirdes données de base et le volet humain, qui permettra de découvrir LA bonneinformation.

Divers outils de reporting basés sur les bases de données relationnelles exis-tent et sont largement utilisés dans les entreprises. Les tableurs sont égalementdes outils désormais banalisés. Bien que demeurant déconnectés des systèmes cen-traux, ils sont devenus indispensables aux financiers et contrôleurs de gestiondans des tâches quotidiennes de collecte d’informations et de consolidation.

Mais quel que soit le soin apporté à la gestion de ces données, leur restitutionne représente qu’une partie de la prise de décision. L’autre partie, à nos yeux laplus importante, est de savoir comment les décisionnaires « consomment » lesinformations, les comprennent et agissent enfin.

1.3.1 Comprendre les besoins d’aide à la décision

Une étude récente du Forester Research montre que 66 % des utilisateurs derapports sont insatisfaits. Les programmeurs qui développent ces rapports expri-ment également leurs frustrations en ces termes :

• « Nous apportons aux utilisateurs ce qu’ils demandent mais ces derniers nesont toujours pas satisfaits. »

• « Les utilisateurs ne savent pas ce qu’ils veulent. Ils changent souvent d’avis. »

• « Nos données posent problème mais nous n’y pouvons rien. »

• « Nous avons construit l’entrepôt de données, mais il ne semble pas queles utilisateurs s’en servent. »

• « Nous avons beaucoup investi dans le stockage des données, cependantchacun semble encore disposer de ses propres chiffres et de sa propre vérité. »

Page 20: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

1.3 Le processus de décision ou le facteur humain dans la prise de décision ————————————————————— 9

Ces commentaires suggèrent que les technologies actuelles sont inadéquatesdans le cadre de l’aide à la décision. Cependant, ces réflexions nous aident àcomprendre la complexité et la nature des attentes des utilisateurs.

1.3.2 Agir, analyser, décider, agir…

Utiliser des données dans le but de prendre des décisions pertinentes représentela part humaine du processus de décision. Ce processus débute lors de la mise àdisposition des données auprès du décisionnaire jusqu’à la décision finale.

Toute action dans l’entreprise implique d’en conserver la trace. Les systèmes ERP(PGI) enregistrent chaque seconde les opérations élémentaires (factures, achats,commandes, clients…). Une action dont la trace est conservée dans des journaux(log) ressort du domaine transactionnel.

Les décideurs observent comment vont les choses afin confronter leur stra-tégie à la réalité. Ils cherchent à découvrir les faits qui expliquent la marche del’entreprise. Ils élaborent une modélisation de causes à effets. Ils en déduisentles décisions à prendre. Le domaine analytique permet de passer de l’analyse àla décision.

Figure 1.1 — Le cycle décisionnel dans l’entreprise

Page 21: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————— 1. La business intelligence 10

La compréhension du mode de consommation des informations et de la façondont les acteurs de l’entreprise prennent leur décision est la clé nécessaire à lamise en place de solutions d’aide à la décision.

Généralement, le processus de prise de décision requiert les compétencesd’une personne ayant une vision claire des données afin d’en tirer pleinementdu sens, d’en comprendre les causes, et de prendre les décisions et les actions quis’imposent. Par ailleurs, on peut identifier trois concepts fondamentaux quiinfluent sur la prise de décision : le référentiel métier, le niveau d’abstraction et leprocessus d’apprentissage.

La mise en place du référentiel métier

Le référentiel métier apporte la signification et la pertinence des données. Il trans-forme des données brutes en informations utiles aux décisionnaires, par l’ajoutde calculs, de sélections complémentaires, de regroupements et de présentation.Un fichier rempli de nombres est sans intérêt tant qu’il n’a pas été transforméen tendances, ratios financiers ou taux de pénétration de marché.

Le référentiel d’une organisation représente le composant essentiel de sa pro-priété intellectuelle et de son avantage compétitif. La compréhension et l’inter-prétation sont basées non seulement sur les données mais aussi sur la manièredont les données sont transformées en une information porteuse de sens. Par exem-ple, une tendance à la baisse du taux de pénétration peut conduire à un change-ment dans la distribution des produits ou de nouvelles campagnes promotionnellesdans les différents canaux de vente.

La manière dont le référentiel métier est géré dans un système d’aide à ladécision détermine sa mise en valeur auprès des décisionnaires et est déterminantpour leur productivité. En effet, dans l’entreprise, le référentiel métier est-il faci-lement accessible ? Est-il centralisé sur un serveur partagé ou bien stocké loca-lement dans des tableaux Excel ? Est-il correctement géré et maintenu à jour ?Un puissant référentiel métier largement accessible et facile à utiliser offre uneforte valeur ajoutée aux décisionnaires.

Les niveaux d’abstraction

Le niveau d’abstraction permet aux utilisateurs de résoudre des problèmes dansun contexte propre au métier pratiqué. Par exemple, un administrateur de basesde données manipule des objets à fort niveau d’abstraction que sont les tables,les colonnes les jointures et les index. Parallèlement, dans la même organisation,les dirigeant traitent des allocations de ressources, de productivité, de satisfactionclients, de lignes de produits ou de périodes fiscales. Bien que la matière brutereprésentée par les données soit naturellement la même pour ces deux acteurs,celles-ci sont manipulées et interprétées de façon différente.

Page 22: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

1.3 Le processus de décision ou le facteur humain dans la prise de décision ————————————————————— 11

Le bon niveau d’abstraction de manipulation des données est fondamentalpour la prise de décision. La réflexion des cadres dans le domaine des ventes seconcentrera autour des régions, des quotas, des commissions et de la productivitéde l’équipe. Les cadres financiers vont manipuler des notions telles que comman-des, chiffre d’affaire, marge et retour sur investissement. Aucun de ces acteursne s’attend à devoir manipuler des requêtes, des colonnes ou des agrégats.

Le processus d’apprentissage

Lorsque les données sont organisées en référentiel métier et présentés au niveaud’abstraction adéquat, les décisionnaires peuvent alors les utiliser et les compren-dre. Le processus d’apprentissage implique des réflexions itératives de la part dudécisionnaire. Celles-ci se matérialisent par des requêtes successives dont lesréponses engendrent naturellement de nouvelles questions.

De manière similaire, nous pouvons attribuer le succès sans précédent duWeb par l’application de ces trois principes : organisation, navigation et visualisation.Pour trouver une information sur un DVD, nous tapons ces deux mots « DVDNomDuChanteur » dans un moteur de recherche. Ce dernier propose plusieurssites commerciaux. Nous pouvons facilement comparer, naviguer, approfondir notrerecherche en cliquant sur des hyperliens.

Le second point repose sur le fait que le processus d’apprentissage est rarementlinéaire. Le Web est particulièrement adapté à ce mode de fonctionnement. Leshyperliens nous permettent de passer d’un sujet à un autre. Les boutons de retouren arrière du navigateur permettent de revoir toutes les étapes du cheminement.Cette approche est particulièrement efficace lors d’une découverte non structurée.

Enfin, la visualisation enrichie du Web présente une information dans saforme la plus compréhensible. Des images animées, des graphiques pour exprimerdes tendances, des tableaux pour comparer, etc. Tous ces modes de représenta-tion, exprimés selon une organisation intuitive et flexible, font du Web une desinventions les plus efficaces qui soit dans le domaine de l’information.

1.3.3 Tableau de bord et business intelligence

Le cockpit

Si vous vous êtes déjà trouvé sur un vol long courrier, vous n’avez pas pu échapperà ces écrans qui vous permettent de suivre en temps réel votre parcours, repro-duisant de manière fidèle la position de votre avion et du chemin déjà parcouru.

De quoi s’agit-il ? L’écran qui servira plus tard à divertir le voyageur, afficheà chaque instant la position de l’avion par rapport aux villes survolées, laissantune trace du chemin déjà réalisé. Au fur et à mesure de la progression du vol,

Page 23: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————— 1. La business intelligence 12

des vues différentes permettent d’observer le chemin parcouru, le chemin qui resteà parcourir et l’orientation que prend l’avion.

Lorsque nous observons ces images, nous n’avons pas idée de la masse de don-nées qu’il est nécessaire de collecter dans le but de restituer sur l’écran une vuecompréhensible par le voyageur. Et lorsque l’écran s’éteint, nous nous trouvonssubitement plongé dans l’inconnu. On ne peut alors que faire des suppositionssur l’identification de la région survolée.

Maintenant, le commandant de bord vous invite à pénétrer dans le cockpitde l’avion afin de vous faire découvrir le tableau de bord de pilotage mis à sadisposition. Après quelques explications simples des écrans d’affichage, vous décou-vrez la signification des différentes jauges et autres voyants lumineux.

Progressivement, vous vous familiarisez avec les indicateurs tels que position(latitude, longitude), altitude, vitesse, consommation de kérosène, températureextérieure, etc. Les cadrans donnent un ensemble d’informations qui situent pré-cisément l’aéronef dans son environnement géographique en trois dimensions.

Concentré sur son tableau de bord, le copilote actionne un levier qui permet àl’avion de corriger imperceptiblement sa trajectoire puis de se stabiliser à nouveau.

Figure 1.2 — Dans le cockpit : suivre le plan de vol

Page 24: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

1.3 Le processus de décision ou le facteur humain dans la prise de décision ————————————————————— 13

Les voyants affichent immédiatement de nouvelles données reflétant la nou-velle orientation de l’avion. La trace est immédiatement perceptible dans la cabinepour l’ensemble des passagers.

Quel parallèle avec la business intelligence ?

Le plan de vol (départ Roissy, arrivée Los Angeles 11 heures plus tard) représentele plan de vol à suivre afin de mener l’avion à bon port dans le délai convenud’avance.

En business intelligence, nous parlerons de la stratégie de l’entreprise.

La trace que laisse l’avion sur l’écran matérialise la collecte de données depositionnement et de progression de l’avion. Ces données sont naturellement stoc-kées dans la boîte noire de l’appareil. La mémoire du vol est ainsi historisée dansce dispositif ultra-sécurisé, pouvant résister aux chocs les plus violents. L’ensembledes voyageurs visualise en cabine ces informations de positionnement grâce àl’écran GPS.

En business intelligence, nous parlerons de processus ETL (Extract, Transfor-ming, Loading) qui représente le mécanisme d’alimentation et de stockage desdonnées de l’entreprise dans un entrepôt centralisé (datawarehouse). L’entreprisestructure ses données éparses, les rend homogènes, les stocke et les délivre.

Les indicateurs de vol fournis au copilote grâce aux différents cadrans mis àsa disposition forment son espace d’analyse, qui vise à suivre la progression del’avion.

En business intelligence, nous disposerons de manière similaire d’outils devisualisation des indicateurs de performance sous forme de reporting, d’analysemultidimensionnelle et de data mining (découverte des causes et des effets) syn-thétisé dans un tableau de bord. Il s’agit de focaliser les collaborateurs sur ce quiest important et d’attirer leur attention en permanence.

Tour écart de trajectoire est corrigé par le pilote.

En business intelligence, nous parlerons d’écarts sur objectifs prévisionnels,d’optimisation, de planning, de prévu/réalisé.

Toute décision de correction de trajectoire entraîne une action dans le postede pilotage.

En business intelligence d’entreprise, les écarts entre le prévu et le réalisévont engendrer des actions correctives.

Des indicateurs externes à l’avion (radar détectant la présence d’un autreavion à proximité, perturbations atmosphériques prévisibles sur carte météo, for-tes turbulences en vue), vont amener le pilote à changer de trajectoire…

Page 25: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————— 1. La business intelligence 14

L’atterrissage est maintenant proche, le pilote s’apprête à agir sur la trajectoireet l’altitude.

En business intelligence, la direction générale s’apprêtera à agir par la mise enplace d’actions opérationnelles. Dans l’entreprise, cela peut entraîner des chan-gements de comportements pour atteindre les objectifs.

Voici synthétisé le modèle du processus de prise de décision transposé à l’entre-prise.

1.3.4 En quoi la BI est-elle utile à l’entreprise ?

De la donnée brute à l’information

Selon l’enquête de PricewaterhouseCoopers réalisée en 2001, « les sociétés quiutilisent leurs données en tant que ressource stratégique et investissent dans leurqualité, en tirent déjà un avantage en terme de réputation et de profitabilité ».Selon une vision traditionnelle, les données sont le « carburant » qui pilote lesprocessus, étant entendu que l’entreprise utilise l’ordinateur pour l’aider à réaliserson business. La connaissance stratégique est déduite de la vision prospective, elle-même basée sur les données de l’entreprise.

Figure 1.3 — Les étapes de la prise de décision dans l’entreprise

Page 26: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

1.3 Le processus de décision ou le facteur humain dans la prise de décision ————————————————————— 15

Interrogeons-nous un instant : Une chaîne de supermarché a-t-elle pour objetde vendre de la nourriture ou bien son activité ne consiste-t-elle pas à exploiterla connaissance des préférences du client, de son positionnement géographique,de la logistique et des coûts d’approvisionnement ? Le cycle de vie des produits,des informations sur la concurrence, le niveau d’inventaire, le prix proposé et ladisposition du produit en rayon ne doivent-ils pas être considérés comme autantd’informations pour accroître la marge réalisée sur chaque article vendu ?

À l’ère de l’Information, la réponse que vous ferez à ces questions déterminerala viabilité à long terme de votre entreprise.

Très bien me direz-vous ! Mais comment transformer les données en ressourcestratégique ? Une partie de la réponse réside dans l’application adéquate des nou-velles technologies sur vos données. Mais la plus grande part de la réponse consisteà comprendre et de manière subséquente à construire son business autour de lavaleur de l’information. On le voit bien, cet exercice d’abstraction est particu-lièrement délicat, aussi nous observerons dans ce chapitre la différence fonda-mentale qui réside entre une approche traditionnelle basée sur une technologietransactionnelle à des fins de reporting et une vision moderne de l’utilisation desdonnées à des fins d’analyse prospective.

Nous introduirons la notion du dirigeant « sachant ». En effet, celui-ci baseson observation sur les faits, c’est-à-dire les données stockées dans l’entreprise.Nous aborderons les aspects de l’information qui révèlent de la valeur et quelssont les processus à mettre en place afin d’extraire cette valeur des données.Nous présenterons également quelques applications de business intelligence afind’illustrer la méthodologie proposée dans cet ouvrage.

Les atouts de l’information et l’évaluation des donnéesLes données peuvent-elles être considérées comme un actif ?

Bien que personne n’ait jamais observé dans un bilan de société la moindreligne concernant les données de l’entreprise, ni du côté de l’actif, ni du passif,il convient de considérer cependant que certains coûts associés à la gestion desdonnées – le coût de stockage, la maintenance, la surface utilisée, l’équipe, etc. –apparaissent bien au compte d’exploitation comme des charges réelles.

En contrepartie, les données doivent être considérées comme de l’actif, parceque celles-ci sont employées à générer des bénéfices, sont contrôlées par l’orga-nisation, et sont le résultat de transactions liées à l’activité de l’entreprise (soit parcequ’elles sont générées en interne, soit parce qu’elles ont été acquises à l’extérieur).

Traiter des données comme un actif représente un intérêt pour l’entreprisecar cela peut être de nature à justifier un investissement en business intelligence.

Page 27: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————— 1. La business intelligence 16

L’entreprise sera en mesure de montrer comment la valeur d’actif des donnéess’est enrichie.

Cela implique naturellement de pouvoir mesurer la valeur des données, et c’estbien là que nous bloquons dans notre réflexion.

Il existe cependant des cas concrets où nous pouvons attribuer précisémentune valeur à l’information. Prenons par exemple le cas d’une demande au servicedes renseignements téléphoniques dont le coût est, par exemple, de 1 euro alorsque l’information demandée peut être obtenue gratuitement grâce à un annuairetéléphonique sur internet. Le coût de la transaction accepté par le client estcependant justifié par un service immédiat. Quel que soit l’endroit où il setrouve, et le moment de son choix, le demandeur obtient l’information capitale.

D’une manière générale, la valeur de l’information dépend d’un certain nom-bre de facteurs que nous évoquerons. Il est intéressant de constater que plus nouspouvons préciser ces facteurs et plus nous sommes en mesure d’élaborer le modèled’évaluation de l’information.

La valeur « temps » des donnéesAfin d’illustrer la contrepartie monétaire de la valeur « temps », prenons un exem-ple simple. Nous sommes le 1er mars et je rencontre un « gourou » de la financequi m’informe que suite à un accord entre la société Alcatel et un Consortiumchinois, l’action de l’équipementier clôturera demain 2 mars, en hausse probablede 5 euros. Je m’empresse de passer mes ordres d’achat auprès de mon broker enligne. L’exécution de l’ordre est immédiate. Le 2 mars peu avant la clôture, jerevends mes actions et prends mon bénéfice. Si au lieu de recevoir cette infor-mation le 1er j’en prends connaissance le 3 mars, inutile de dire que l’action àmener serait tout autre.

Cet exemple montre bien que la valeur de l’information se dégrade dans letemps. Parce que les données stockées représentent un instantané de la situation,il paraît évident qu’en l’absence de toute réactualisation, et parce que le mondechange à tout instant, notre « photographie » tend à devenir obsolète très rapide-ment.

L’information en tant que ressource partageableContrairement à toute autre ressource matérielle utilisée dans le processus defabrication, les données sont des ressources qui non seulement ne s’altèrent pasmais dont la valeur informationnelle s’accroît par l’usage d’un plus grand nombred’utilisateurs. La connaissance d’un tel processus s’illustre par exemple dans lecas d’un vendeur, alerté du moment le plus opportun pour contacter un prospect.Cette connaissance peut rationaliser le travail des vendeurs. Et même si plusieursvendeurs partagent la même connaissance avec d’autres membres de l’équipe,

Page 28: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

1.3 Le processus de décision ou le facteur humain dans la prise de décision ————————————————————— 17

cette connaissance transmise aux autres ne subit aucune dégradation. Cela veutdire que grâce à son partage, la valeur de l’information est proportionnelle aunombre de personnes qui la possèdent.

Dans le contexte de la business intelligence, cela se traduit par le stockagedes données dans le datawarehouse. Cet entrepôt centralisé offre de nombreuxaccès aux utilisateurs qui observent tous la même information. Et puisqu’elle estutilisée par des observateurs distincts, sa valeur est multipliée par le nombre depersonnes qui l’utilisent.

Bernard Liautaud, président et PDG de Business Objects a écrit dans unouvrage remarquable, que « la valeur d’une information augmente avec le carrédu nombre d’utilisateurs pouvant accéder à l’information, multiplié par le nom-bre de services dans lesquels ces utilisateurs travaillent ». (e-business intelligence,Éditions Maxima).

Valeur de l’information =(Nombre d’utilisateurs)² × (Nombre de départements de l’entreprise)

Cette formule est empruntée à une réflexion de Bob Metcalfe, l’inventeur del’Internet, qui avait formulé la loi qui porte son nom comme suit : « la valeurd’un réseau varie en fonction du carré du nombre d’unités interconnectées ».

Il ne fait pas de doute que plus le nombre de personnes disposant de la mêmeinformation augmente, mieux elles communiquent et plus elles prennent desdécisions collectives et pertinentes.

La transversalité de l’information peut s’illustrer de la manière suivante : sije fournis à une équipe commerciale les outils pour analyser ses ventes par pro-duit, par clients, par mois, par vendeur, cela constitue une arme qui sera utiliséedans la démarche commerciale face aux clients. Cette même information trans-mise au contrôleur de gestion, qui ajoutera l’indicateur du plan prévisionnel, luifournira immédiatement une vue complémentaire utile au pilotage.

L’accroissement de la valeur proportionnellement à son usagePour la plupart des actifs immobilisés, plus leur usage est fréquent, plus leurvaleur diminue. Par exemple, chaque kilomètre parcouru par une automobilediminue sa valeur. A contrario, la valeur des données ne décroît pas lors de leurusage, car elles ne subissent aucune dégradation lorsqu’elles sont utilisées.

Si dans l’organisation, chacun sait comment accéder à l’information et com-ment l’exploiter, la valeur de cette information croît rapidement. Si les donnéesstockées ne sont jamais utilisées, elles n’apportent aucune valeur ajoutée et devien-nent rapidement une charge.

Page 29: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————— 1. La business intelligence 18

L’accroissement de la valeur au travers de la qualitéSi l’on reprend l’exemple de notre gourou qui, au lieu de nous prédire une haussede l’action, envisage au contraire une baisse probable du cours Alcatel de 5 euros,la probabilité de réaliser une perte plutôt qu’un bénéfice devient forte.

Ceci met en évidence la valeur liée à l’exactitude de l’information et la néces-sité d’obtenir une information de haute qualité mais aussi de mettre en place lesmoyens de la mesurer. Ainsi, grâce à l’interprétation de cette mesure de qualité,il sera plus aisé de déterminer le risque associé à la prise de décision.

L’accroissement de la valeur grâce à la fusionLa combinaison des éléments de la connaissance fournit un levier puissant aufur et mesure de l’accroissement de la valeur. Si je dispose d’informations surmes canaux de vente, je possède une certaine valeur. Si je possède une informa-tion sur le processus d’approvisionnement, je dispose également d’une valeurinformationnelle. Mais si je combine ces deux informations entre elles, j’obtiensune connaissance précise sur le mouvement des produits depuis le fournisseurjusqu’au consommateur.

Il est aisé de comprendre que la valeur de l’information s’accroît lorsqu’ellepeut être combinée avec d’autres sources d’information. Le processus de BI con-cerne la capacité à collecter, agréger, et plus important encore de rapprocherplusieurs sources entre elles. En d’autres termes, si nous pouvons rapprocher deuxinformations, les lier entre elles, et en déduire quelque chose de nouveau quin’aurait pu être découvert autrement, nous pouvons exploiter cette découvertepour en tirer un avantage concurrentiel.

La valeur face au volumeContrairement au comportement de certains actifs, nous n’obtenons pas néces-sairement plus de valeur par l’accroissement d’information. La quantité phéno-ménale d’information produite chaque année est stupéfiante. La complexité del’intégration des données croît proportionnellement au nombre de sources dedonnées.

Toute la difficulté réside dans le fait de mesurer l’apport d’une source nouvellede données eu égard à la complexité à être intégrée dans le référentiel existant.Il faut comprendre que chaque ajout d’une nouvelle source de données induitun mode d’accès nouveau (connecteur). Tout nouveau connecteur implique unsoin particulier pour la mise à jour des données dans le référentiel centralisateur.

Il faut également considérer une différence importante en matière de qualitéentre l’acquisition de données provenant de sources disparates de celles qui sontpuisées à la même source. Par exemple, conserver une grande quantité de don-

Page 30: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

1.3 Le processus de décision ou le facteur humain dans la prise de décision ————————————————————— 19

nées sur les ventes réalisées depuis plusieurs années peut apporter plus de valeurs’il s’agit d’analyser des tendances.

La mesure de la valeur de l’informationLe coût historique : cette méthode consiste à évaluer la valeur basée sur le coûtd’acquisition de l’information ou le coût de remplacement.

La valeur marché : cette méthode évalue la valeur en fonction de ce qu’un opé-rateur est susceptible de payer pour l’acquérir.

La valeur utile : cette méthode consiste à estimer la valeur en fonction du bénéficeattendu.

Les applications de la business intelligence

L’analyse ClientLes termes CRM (Customer Relationship Management) et en français GRC (ges-tion de la relation clients) ont été utilisés abondamment. Ils sont devenus enquelque sorte des mots « tarte à la crème » souvent vidés de leur sens initial pardes vendeurs plus prompts à vendre des licences en grand nombre plutôt qued’écouter le besoin du client et d’apporter une réponse adaptée.

Pour améliorer la relation client, point n’est besoin de monter une « usine àgaz ». Le challenge consiste à mieux comprendre le client afin de lui apporter leproduit ou le service qu’il désire. On le comprend bien, il s’agit de satisfaire unclient grâce à son profil parfaitement identifié.

Les rubriques énumérées ci-dessous ont pour but d’augmenter la visibilité desservices ventes, marketing et d’une manière générale tout département qui inte-ragit avec le client final.

Profil Client

La plus grande partie des actions marketing consiste à « ratisser large » et à espérercapturer le plus grand nombre de clients possibles. Après les études très détailléesde Martha Rodgers consacrées au « marketing one to one », les entreprises pren-nent de plus en plus conscience que les prospects sont différents les uns des autreset que leur approche doit être adaptée en fonction du profil du prospect. Desinformations comportementales, préférentielles, géographiques et sociologiquesconcernant le prospect permettent d’adapter individuellement le discours.

Le ciblage marketing

La connaissance des ressemblances et dissemblances permet de constituer desensembles de prospects ayant des comportements similaires afin d’élaborer unecommunication adéquate.

Page 31: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————— 1. La business intelligence 20

La personnalisation

L’analyse fine du caddie, que ce soit au supermarché ou sur un site marchand enligne, permet en temps réel de connaître les produits achetés en magasin ou surle site et d’en déduire immédiatement des analyses fines et d’effectuer les actionsqui s’imposent. À cet égard, le navigateur web est un formidable outil de décou-verte de l’internaute, tant les traces numériques laissées lors de ses recherches ethésitations sont révélatrices du comportement de ce dernier. Le serveur web ala capacité d’interagir avec l’internaute afin de l’aider dans sa recherche ou mêmede suggérer des achats complémentaires.

Les « cookies » permettent l’identification d’un individu sur un site. Lors d’unaccès ultérieur il devient possible de dialoguer intelligemment avec l’internauteet d’agir en tant que conseil auprès de celui-ci.

Le filtrage collaboratif

Si vous êtes déjà allé sur des sites de ventes en ligne tels qu’Amazon.com ouFnac.com, cette notion de filtrage collaboratif ne vous a sans doute pas échappé.Lors du choix d’un CD ou d’un livre, le site vous suggère des achats alternatifsou complémentaires basés sur les préférences d’autres clients. L’information affi-chée sur la page web est très suggestive : « Les gens qui ont acheté le produit Xont également acheté le produit Y. » Les processus de filtrage collaboratif évaluentla similitude des préférences entre des groupes de consommateurs. Ces recom-mandations créent en général des opportunités de cross-sell (ventes croisées) et deup-sell (ventes additionnelles).

La satisfaction du client

Un des avantages induits par le profilage est de connaître la satisfaction d’unclient par rapport à des produits ou services. Un rapide sondage permet de col-lecter le niveau de satisfaction d’un client, de comparer par rapport à l’ensembledes clients. L’historisation des données permet de connaître la tendance de lasatisfaction générale de la cible et naturellement de réagir avant qu’il ne soittrop tard.

La durée de vie d’un client

Comment les entreprises déterminent quels sont leurs meilleurs clients ? Quandon connaît le coût induit par la recherche et l’acquisition d’un nouveau client,la durée de vie d’un client devient naturellement une mesure de profitabilité.L’analyse Client permet de mettre en place des indicateurs afin de mesurer ladurée de vie d’un client.

La fidélité du client

On a coutume de dire que les meilleurs nouveaux clients d’une entreprise sontles clients actuels. Cela veut dire que les plus belles opportunités de réaliser de

Page 32: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

1.3 Le processus de décision ou le facteur humain dans la prise de décision ————————————————————— 21

nouvelles ventes se font auprès des clients de l’entreprise qui sont heureux detravailler avec vous et satisfaits de vos produits et services.

L’analyse des clients en portefeuille est une aide efficace.

L’analyse de la productivité du capital humainL’utilisation et l’optimisation du centre d’appels

Si vous avez déjà fait l’expérience des longues minutes d’attente passées au télé-phone avant d’obtenir le service souhaité et l’irritation naturelle qui en découle,vous comprendrez sans difficulté la valeur qui résulte de l’analyse du tempsd’attente du client au sein de votre entreprise. Lorsqu’on sait par ailleurs que lesappels entrants proviennent en grande partie de clients non satisfaits, la duréed’attente aura un effet déplorable sur la qualité du dialogue qui suivra.

La rentabilité effective

Cette notion regroupe la performance, le coût du travail et le rendement de laproduction; autant de facteurs qui montrent comment les membres du personneltravaillent. Cette information peut être intégrée dans le référentiel et apporterune valeur supplémentaire à l’analyse globale.

L’analyse de la productivitéCe domaine d’analyse très répandu génère un grand nombre d’indicateurs etd’analyses.

L’analyse des produits défectueux

Alors que les entreprises se battent quotidiennement afin d’améliorer la qualitédes produits qu’elles fabriquent, des facteurs affectent le nombre de produitsdéfectueux, dont les causes sont les matières premières utilisées ou les personnelsqui les fabriquent. Il est aisé de suivre ces facteurs grâce aux indicateurs de pro-ductivité.

Le suivi du planning et l’optimisation des ressources

La compréhension de l’utilisation des ressources qui composent l’actif d’uneusine (machines, personnel, rendements attendus, matières premières, entrepôts,production en flux tendus, etc.) peut être grandement facilitée par l’usage de labusiness intelligence.

Le reporting financier

Les contraintes sévères liées à l’industrie obligent les entreprises et maintenantles administrations (LOLF, loi organique relative aux lois de finances promul-guée le 1er août 2001) à fournir de nombreux rapports financiers afin de présenterleurs résultats. Ces contraintes se sont encore alourdies suite aux scandales finan-ciers qui ont défrayé récemment la chronique. Indépendamment de leur carac-

Page 33: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————— 1. La business intelligence 22

tère obligatoire, les analyses qui en résultent sont un excellent moyen de prendrele pouls de l’entreprise et de repérer des secteurs nécessitant une surveillanceparticulière.

Dans cet esprit, le Congrès américain a fait adopter en juillet 2002 la loiSarbane-Oxley contraignant ainsi les entreprises cotées à communiquer rapide-ment leurs résultats financiers.

L’article 404 de la loi vise à renforcer la fiabilité de l’information financièredélivrée et rend obligatoire l’utilisation d’un cadre d’analyse reconnu en matièrede contrôle interne et cite en substance le référentiel COSO (Committee of Spon-soring Organizations, association américaine ayant pour objectif d’établir des règlesde contrôle financier interne et d’améliorer la qualité des reporting financiers).

La gestion du risque

C’est la capacité à trouver des solutions pour minimiser les conséquences desévénements associés à une situation.

La précision de l’observation dans le suivi de l’activité et de la productivitéoffre aux gestionnaires la capacité de prendre de meilleures décisions, par exem-ple sur l’allocation de ressources dans le but de réduire le risque de l’organisation.De plus l’analyse du risque peut apporter des réponses dans le cadre de la négo-ciation de contrats avec les fournisseurs et les partenaires en général.

La mise en place du nouveau règlement Bâle 2 vise à améliorer la qualité dusystème bancaire grâce à la transparence dans la gestion des risques opérationnels.

Le juste à temps

Le concept de production en juste à temps doit aboutir à une diminution desrisques liés à la volatilité des prix des produits. Il est fortement recommandé depouvoir corréler les informations reçues au travers du canal de ventes afin deréagir le plus rapidement en termes d’approvisionnement et de production.

L’analyse des canaux de venteLe marketing

La capacité de régler finement un programme de marketing ainsi que la mesurede l’efficacité dudit programme, découlent en partie de l’analyse du canal deventes. Le processus itératif classique consiste à identifier des profils de groupesde clients et de régler sa stratégie sur ces observations. L’efficacité de la stratégiesera fortement dépendante des données recueillies par le canal de vente. Lesrésultats seront naturellement comparés avec les objectifs attendus. La conver-gence ou la divergence des résultats par rapport aux objectifs précisera demanière itérative de nouvelles stratégies.

Page 34: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

1.3 Le processus de décision ou le facteur humain dans la prise de décision ————————————————————— 23

L’analyse de la performance des ventes

Les résultats de l’équipe de vente permettent d’identifier des variables qui agis-sent sur le cycle des ventes, tels que les vendeurs, les régions, le type d’industrie,la qualité des contacts, la récurrence et la fréquence des contacts.

L’analyse de la chaîne d’approvisionnementL’analyse de la chaîne d’approvisionnement permet de caractériser les fournis-seurs afin de mieux les comparer.

La gestion des vendeurs des fournisseurs

Un grand nombre d’organisations sont dans l’incapacité d’identifier précisémentqui sont les vendeurs qui leur fournissent biens et services. L’analyse de la chaîned’approvisionnement permet aux gestionnaires de tracer la performance et lafiabilité des fournisseurs, d’évaluer et de classer la qualité des produits fournis etainsi d’optimiser la relation avec le fournisseur en ce qui concerne les dépenses,les délais de livraison et les risques.

L’expédition

Il existe différentes méthodes pour livrer des marchandises auprès des clients,chacune générant des coûts différents. Par exemple, il sera plus coûteux de livrerdes produits par avion plutôt que par transport routier, mais les produits arrive-ront à destination plus rapidement. Ce délai plus court peut être exploité pourrépondre à une demande dont il faut mesurer la justification.

L’analyse du comportementIl est utile de repérer des modèles de comportement qui sont le présage d’évé-nements significatifs. Ce type d’analyse fait un usage abondant des données afinde repérer des modèles susceptibles de générer tel ou tel événement. Le but del’analyse consistera donc à repérer la mise en place de tels modèles dans le butde prédire l’apparition des phénomènes attendus. Ces études sont fortement uti-lisées en analyse technique boursière. L’analyse d’une action sur une durée signi-ficative permet de mettre en évidence des modèles susceptibles de prédire deschangements de tendance. L’analyse chartiste est basée sur ces phénomènes.

Les tendances d’achats

Bien qu’il soit possible de connaître avec précision le cycle de vie des produits,il existe des tendances qui échappent à ce schéma. Les cas les plus parlants sontles produits à effet de mode. L’approche des fêtes de Noël rend parfois difficiletoute prévision, faisant flamber tel article de jouet ou s’effondrer tel autre pro-duit. Dans le domaine de la mode, il est fréquent d’observer une corrélation entrela tenue vestimentaire d’une star invitée à une émission grand public et le décol-lage soudain des ventes du même article en magasins.

Page 35: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————— 1. La business intelligence 24

L’activité du Web

Nous l’avons déjà signalé précédemment, l’analyse du comportement d’achat surun site de commerce électronique est relativement aisée. Elle donne de surcroîtdes indications d’achat et de tendance en temps réel. Cette détection des modè-les de comportement d’achat peut être à l’origine d’un modelage du site afin demieux prendre en compte les attentes des internautes.

La détection des fraudes

Les comportements abusifs ou frauduleux sont fréquemment modélisables. Parexemple dans le domaine de la santé, il est aisé de constater que certains prati-ciens ont tendance à prescrire des médicaments onéreux ou en surnombre. Unefois ces comportements modélisés, zoomer sur les auteurs de tels actes devientun jeu d’enfant.

L’attrition du client

Un problème récurrent pour un grand nombre d’organisations est l’attrition duclient ou la capacité de ce dernier à quitter son fournisseur habituel. Dans lesindustries à caractère compétitif, il est bien plus profitable de convaincre unclient de rester fidèle à un fournisseur avant qu’il n’ait pris la décision de lequitter plutôt qu’après. On constate cela fréquemment dans la lutte effrénée quese livrent les opérateurs téléphoniques pour conquérir de nouveaux clients. Lescoûts de séduction de ces nouveaux clients sont proprement exorbitants. Le repé-rage des clients susceptibles de quitter l’entreprise par une observation fine desmodèles de comportements (historiques des appels et des plaintes) permettraitde proposer des offres personnalisées susceptibles de retarder le départ voiremême de l’éviter.

Le tableau de bord de l’intelligenceUn indicateur clé de performance (KPI, Key Performance Indicator) est une mesureobjective d’un aspect de l’activité qui est critique pour le succès de l’entreprise.De tels indicateurs sont les composants du tableau de bord représentatif de l’acti-vité de l’entreprise. Il synthétise les différentes activités et mesures de cette der-nière telles que la satisfaction du client, la productivité, la performance du canald’approvisionnement et la profitabilité. Il synthétise également la qualité deshommes et des femmes de l’entreprise, la qualité des outils qui leur sont mis àdisposition.

Le tableau de bord de l’intelligence d’entreprise reflète les résultats des ana-lyses sous forme d’indicateurs, dans une représentation synthétique et compré-hensible. Des alerteurs visuels, de différentes couleurs, attirent le regard pour unecompréhension plus rapide. Ce tableau de bord dynamique permet en outre dezoomer sur tel ou tel indicateur et d’approfondir l’analyse jusqu’à remonter à lacause première des phénomènes.

Page 36: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

1.4 Les modèles d’accès à l’information ————————————————————————————————————————————————————— 25

Voici quelques-uns de ces indicateurs :

• graphe des ventes régionales par ville;

• statistiques du personnel;

• rapport d’approvisionnement par fournisseur;

• mesure de la satisfaction client;

• mesure de la productivité de l’usine, d’un département, d’un atelier, etc.;

• moyenne de la profitabilité client.

La valeur ajoutée de la business intelligenceAu cours de nos réalisations, et au vu des avantages instantanés que nos clientsont obtenus, nous avons acquis la ferme conviction que la business intelligencepermet d’insuffler un niveau de connaissance jusqu’alors inégalé dans l’entre-prise. La qualité du dialogue des dirigeants par le partage de la connaissanceobjective s’en trouve améliorée. La connaissance transversale, par la suppressiondes cloisonnements départementaux dans l’entreprise, sont autant de facteursgénérateurs d’observations nouvelles.

1.4 LES MODÈLES D’ACCÈS À L’INFORMATION

Bernard Liautaud, dans l’ouvrage déjà mentionné, fait une analyse sans complai-sance de la situation des trois modèles qui gouvernent l’accès à l’informationdans l’entreprise. Il cite :

• La dictature de l’information, où seuls quelques initiés ont accès aux données.

• L’anarchie de l’information, où chacun recrée son propre système d’informationprovoquant un véritable chaos de données.

• La démocratie de l’information, où l’information bien gérée circule librement.

1.4.1 La dictature de l’information

Le premier cas met en évidence une attitude dictatoriale vis-à-vis du partage etde la diffusion de l’information dans l’entreprise. Dans les années quatre-vingt,les données étaient stockées sur des serveurs centraux hautement protégés. Ladiffusion de l’information se faisait au travers de listings volumineux, dupliqués,et regorgeant souvent de données inexploitables. Les analyses étaient confiées àdes équipes d’experts qui grâce à des logiciels spécifiques, parvenaient à extrairedes analyses qu’ils diffusaient ensuite auprès des personnels concernés. C’était lerègne des infocentres dotés parfois de tableaux de bord centralisés appelés EIS(Executive Information System).

Page 37: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————— 1. La business intelligence 26

1.4.2 L’anarchie de l’information

Dans les années quatre-vingt-dix, grâce à la diffusion massive de la micro-infor-matique, silos de données et applicatifs personnels vont progressivement se met-tre en place, faisant apparaître un nouveau comportement anarchique. En effet,pour se libérer du carcan imposé par les structures centralisées, les directeurs desdépartements opérationnels vont rapidement comprendre que les outils bureau-tiques peuvent répondre à de nombreux besoins restés jusque-là sans réponse.Les managers vont se doter massivement d’outils tels qu’Excel et Access dans lebut de répondre quasi instantanément à leur demande de tableaux de bord et dereporting. C’est le début de la multiplication des organismes de formation enbureautique. Les personnels opérationnels rapidement formés vont s’approprierdes données qui jusque-là leur étaient inaccessibles.

De la généralisation des bases de données et tableurs va naître un autrephénomène : la multiplication des silos de données. De nouvelles plates-formesmatérielles et logicielles hétérogènes fleurissent alors dans les entreprises. Lacommunication entre ces matériels parfois incompatibles rend difficile la cen-tralisation des données. Chaque département tend à garder jalousement les infor-mations qui lui sont propres, rendant difficile une consolidation de l’ensembledes données stratégiques et opérationnelles de l’entreprise. L’incohérence desinformations se manifeste lors de réunions regroupant plusieurs départements oùles managers finissent par s’interroger sur la validité des tableaux d’indicateurssouvent montés à la hâte peu de temps avant la réunion.

On comprend aisément que la diversité des applicatifs entraîne une com-plexité croissante des structures de données. De plus, ces données sont stockéesdans des fichiers de types différents tels que tableur, base de données, ERP, comp-tabilité, GPAO, CRM, ventes, etc.

Les approches traditionnelles ont très vite montré leurs limites. Le dévelop-pement de l’Internet et la mondialisation ont ouvert les frontières de l’entrepriseà l’ensemble de ses partenaires. Le partage de l’information stratégique et la capa-cité d’effectuer tous types d’analyse sont devenus une demande pressante desacteurs de l’entreprise.

Dans ce contexte anarchique, l’informatique décisionnelle va donc rapide-ment s’imposer.

1.4.3 La démocratie de l’information

De par sa démarche structurante, la business intelligence offre un nouveau para-digme :

• Partager le métier de l’entreprise et la transparence de l’information à tousles échelons de la hiérarchie.

Page 38: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

1.4 Les modèles d’accès à l’information ————————————————————————————————————————————————————— 27

• Disposer d’outils d’analyse conviviaux et accessibles en tous lieux (y com-pris sur Internet) sans l’aide d’un spécialiste.

• Réduire les coûts de mise à disposition des informations stratégiques del’entreprise.

• Libérer les ressources humaines des contraintes fortes des systèmes infor-matiques au profit du métier de l’entreprise.

• Sécuriser l’information selon le profil des utilisateurs.

• Assurer la qualité et la pertinence de l’information.

• Augmenter la réactivité des personnels et la souplesse de l’entreprise grâceà la connaissance.

• Permettre de découvrir des informations enfouies dans les données, quel’être humain ne pourrait extraire seul.

• Faciliter la prise de décision grâce à la cohérence des données.

• Partager la vérité de l’information.

• Accéder sans délai à l’information.

Page 39: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server
Page 40: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2L’approche

méthodologique

Lorsqu’un projet décisionnel est décidé dans l’entreprise plusieurs composantesvont interagir :

• La composante humaine est le moteur du projet et il est important de dis-poser d’un sponsor de poids dans l’entreprise (la direction générale dansune PME ou une direction fonctionnelle dans un grand compte).

• La composante technique est l’arbre de transmission qui garantira auxrouages un fonctionnement harmonieux.

• La composante financière résulte des deux composantes précédentes. Toutprojet BI nécessite une demande d’autorisation d’investissement (DAI).Cet engagement de dépense fait suite à une estimation fine des élémentséconomiques du projet (nombre de jours/homme d’étude, de développe-ment, d’intégration, d’exploitation, coûts des licences, coûts des plates-formes matérielles, etc.).

En général il faut assortir cette démarche d’une analyse de la valeur permet-tant de calculer le retour sur investissement (ROI). Cette étude est présentée endétail dans le chapitre 13. Dès maintenant nous pouvons mettre en avant desavantages tels que :

• l’augmentation de la productivité grâce à une information disponible plusrapidement;

Page 41: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 30

• une information plus fiable;

• un gain de temps mesurable pour rassembler les informations utiles;

• un travail plus facile pour les collaborateurs itinérants;

• une diffusion automatisée et économique des informations opérationnelles.

Autant que faire se peut, on cherchera à identifier les facteurs de différentiationpar rapport aux concurrents et à mettre en place des indicateurs permettant demesurer les gains réels.

2.1 LES ÉTAPES D’UN PROJET INFORMATIQUE

2.1.1 Le cycle en V

Les projets informatiques traditionnels avaient coutume de présenter un enchaî-nement linéaire des sept étapes. Les voici résumées :

• Expression des besoins et faisabilité.

• Analyse et spécifications.

• Conception.

• Programmation.

• Tests.

• Intégration.

• Recette et mise en production.

Lorsque l’on constate un problème technique ou fonctionnel dans une étapede la partie montante du cycle dit en V, le retour ne s’effectue pas à l’étapeprécédente mais au niveau de l’étape conceptuelle correspondante (identifiéepar les flèches horizontales de la figure 2.1).

2.1.2 La méthode agile

L’équipe

La méthode du cycle en V a pour but de présenter les processus et les outils maisne fait pas suffisamment apparaître les interactions entre les acteurs du projet.La composante humaine est primordiale pour la réussite d’un projet BI. Il est deloin préférable qu’une équipe soit soudée et animée par la volonté partagée deréussir plutôt que composée d’individualités brillantes ayant peu le sens de lacommunication.

Page 42: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.1 Les étapes d’un projet informatique ————————————————————————————————————————————————————— 31

Priorité à l’application

Il est vital que l’application fonctionne selon les spécifications demandées. Il nesert à rien de documenter à l’excès des procédures techniques. On le sait, lesprogrammes ont tendance à être modifiés régulièrement mais pas la documen-tation associée rendant cette dernière suspecte. Il est préférable de commenterabondamment les programmes et de mettre à jour les lignes de commentaireslors de l’apport de modifications. Il est infiniment plus utile d’obtenir en ligneun commentaire sur l’origine d’une information (clic droit ou aide) plutôt qued’en chercher le sens dans un cahier généralement introuvable au momentopportun. La documentation fonctionnelle doit être accessible en ligne.

Il est également important de définir un binôme technique (deux personnesayant une bonne compréhension des processus informatiques, une forte complé-mentarité et pouvant assurer un dépannage en cas d’absence de l’autre).

La collaboration avec l’utilisateur

Le client ou utilisateur final doit être impliqué à chaque étape du développe-ment. Le périmètre du projet doit être défini avec soin lors du contrat initial(cahier des charges). Mais le client doit pouvoir intervenir très tôt et collaboreravec l’équipe réalisatrice afin d’apporter un feed-back continu. Il s’agit d’éviterl’effet tunnel trop souvent observé dans les projets d’envergure. Le client cher-chant à se rassurer doit pouvoir se projeter dans son application future aussi bien

Expression des

besoins

Et faisabilité

Analyse et

spécifications

Conception

Développements

Et

programmation

Tests

Intégration

Recette et Mise

en production

Figure 2.1 — Les sept étapes d’un projet informatique

Page 43: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 32

sur le fond, en termes de contenu, que sur la forme (ergonomie de l’outil). Lacommunication lors d’une conversation en face à face est le meilleur vecteur decompréhension.

L’acceptation du changement

Il n’est jamais agréable au cours du développement de revenir sur des spécifica-tions ou des procédures codées. Cependant, afin d’éviter la frustration du client,il est impératif d’accepter des modificatifs mineurs. La planification du projetdoit rester flexible afin d’en tenir compte. Le choix de l’outil de développementest à cet égard très important.

2.1.3 L’étude de faisabilité

Lorsqu’un projet décisionnel n’est pas totalement formalisé, il peut être judicieuxde mettre en œuvre une étude de faisabilité. Cette démarche a pour but de ras-surer les deux parties (fournisseur et client) en apportant au fournisseur une connais-sance suffisante sur le métier du client et au client une bonne perception sur lacapacité d’écoute et de compréhension du prestataire. Cette étude de faisabilitéa pour objectifs de permettre, dans un délai très court (5 à 10 jours) :

• de formaliser les attentes du client;

• de les matérialiser au travers d’un prototype personnalisé à l’aide de don-nées réelles;

• de cerner les capacités de la solution;

• d’acquérir les connaissances de base;

• d’être une base de travail et de discussion avec les utilisateurs.

Cette étude permet d’effectuer une sorte de « carottage » dans les strates fonc-tionnelles (découverte d’un domaine parmi finances, achats, commercial, com-munication, RH) et techniques (découverte des systèmes utilisés : systèmed’information, SGBD, système d’exploitation, etc.).

Les livrables sont :

• un document de synthèse;

• un prototype de l’application cible;

• une licence à durée limitée du produit utilisé.

La démarche projet présentée plus haut est naturellement appliquée lors decette étude de faisabilité.

À l’issue de cette étude, le prestataire dispose d’éléments concrets lui permet-tant de chiffrer avec plus de précision le développement et le déploiement de lasolution globale.

Page 44: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.1 Les étapes d’un projet informatique ————————————————————————————————————————————————————— 33

Après un temps de réflexion, le client dispose de la faculté de stopper sonexpérience ou au contraire de mettre en œuvre tout ou partie du projet.

Le chapitre 13 présente les composants de l’étude de faisabilité.

2.1.4 Le cycle de vie du projet BI selon Ralph Kimball

Ralph Kimball, qui est considéré par beaucoup comme l’expert mondial de labusiness intelligence, a défini très précisément les modules méthodologiques par-ticipant au cycle de vie d’un projet BI :

• L’analyse des besoins.• Les données :

– Modélisation dimensionnelle des données.– Modèle physique des données.– Définition des étapes de chargement du datawarehouse.

• La technologie :– Définir l’architecture technique.– Choix et installation des outils.

• L’application :– Spécification de l’application.– Développement de l’application utilisateur.

• Le déploiement.• La maintenance.• L’évolution.

En voici un schéma synthétique (figure 2.2).

Planificationdu projet

Analyse des

besoins métiers

Définir l’architecture

technique

Sélection et installation des outils

Modélisation dimensionnelle

des données

Modélisation physique

des données

Étapes du chargement du datawarhouse

Spécification de

l’application

Développement de l’application

Déploiement

Croissanceet

évolution

Maintenance

Technologie

Données

Application

Figure 2.2 — Gestion du cycle de vie dimensionnel (selon Ralph Kimball)

Page 45: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 34

2.2 POURQUOI UN TABLEAU DE BORD ?

Lorsque l’on aborde un projet BI, il faut résister à la tentation de mettre en avantl’outil plutôt que la démarche qui consiste à découvrir le métier du client et lanature de ses besoins. Pourquoi me mettrais-je au volant de mon véhicule si jene sais où aller ? Nous avons vu au paragraphe précédent que le projet BI consistaità bien appréhender le métier du client et de délimiter le périmètre fonctionnelavant de procéder à toute étape de développement. Les éditeurs de logiciels ontune tendance naturelle à mettre en avant la palette des fonctionnalités de leurproduit. Ils offrent rarement une réponse à l’attente métier du client.

Lors de nos consultations en entreprise nous rencontrons généralement deuxprofils : le chef d’entreprise qui intuitivement souhaite disposer du meilleur tableaude bord de pilotage et le DSI qui a tendance à mettre l’accent sur les aspectstechniques de l’offre BI. Pour des raisons historiques voire culturelles ou sécuri-taires, le DSI sera attiré par les solutions proposées par un éditeur déjà installédans les lieux. Cependant, un comparatif réalisé auprès de plusieurs éditeurs peutparfois aboutir à des conclusions inattendues. Vous trouverez dans les référencesbibliographiques disponibles à la fin de cet ouvrage un lien proposant des critèresde comparaison des fonctionnalités et de l’ergonomie des outils de BI.

Nous déconseillons toujours de mettre en œuvre un projet BI s’il n’est pas« sponsorisé » par une direction fonctionnelle ou opérationnelle. En matière de BI,il existe un facteur déterminant de succès : la recherche de l’amélioration de lavaleur. Ce facteur servira de fil conducteur tout au long de la réalisation du projet.

En 1992, Robert Kaplan et David Norton ont avancé pour la première foisl’expression balanced scorecard (BSC) dans un article de la Harvard BusinessReview. En 1996, les mêmes auteurs publient un livre sur ce sujet, traduit enfrançais sous le titre Le tableau de bord prospectif, pilotage stratégique : les quatreaxes du succès (Éditions d’Organisation, 1998). Les auteurs proposent de sortirdu traditionnel tableau de bord financier tout en faisant apparaître une visionmultidimensionnelle de la performance. Ils définissent quatre axes privilégiés dela performance, chaque axe étant motivé par le même moteur : la stratégie del’entreprise (figure 2.3).

On distingue clairement les quatre axes ou perspectives stratégiques :

• la perspective financière;

• la satisfaction des clients;

• les processus internes;

• l’apprentissage organisationnel.

Page 46: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.3 Les différents types d’indicateurs ———————————————————————————————————————————————————————— 35

Dans les années quatre-vingt, les entreprises privilégiaient la mesure de leurentreprise aux résultats financiers. Aujourd’hui les organisations ne se contententplus de mesurer leur efficacité par une approche comptable. Norton et Kaplanont montré comment des activités immatérielles dans l’entreprise ont une inci-dence forte sur le résultat. Ils ont démontré à quel point la satisfaction de l’action-naire (axe finance) résulte fortement de la satisfaction du client (axe clients), elle-même très liée aux processus de l’entreprise (axe processus internes). Les processusde l’entreprise sont eux-mêmes servis par des hommes dont il est indispensablede connaître le niveau d’implication (axe apprentissage organisationnel).

La grande force du BSC fut de montrer qu’il existait d’autres composantesqui participent à la valeur ajoutée. Norton et Kaplan ont nommé ces composan-tes intangible value drivers et ont tenté de définir des indicateurs de performancederrière chacun des axes.

2.3 LES DIFFÉRENTS TYPES D’INDICATEURS

Les étapes à suivre lors de la construction du tableau de bord sont les suivantes :

• Définir les objectifs.

• Identifier les variables d’action.

Mon personnel est-il heureux ?Comment améliorer la compétence des hommes et développer les outils performants ?

Mon personnel est-il heureux ?Comment améliorer la compétence des hommes et développer les outils performants ?

Mon personnel est-il heureux ?Comment améliorer la compétence des hommes et développer les outils performants ?

Quels processus améliorer pour satisfaire et conserver

mes clients ?

Quels processus améliorer pour satisfaire et conserver

mes clients ?

Quels processus améliorer pour satisfaire et conserver

mes clients ?

Mes actionnaires, qu’attendent-ils de moi ?

Mes actionnaires, qu’attendent-ils de moi ?

Mes actionnaires, qu’attendent-ils de moi ?

Que dois-je apporter à mes clients ?

Que font mes concurrents ?

Que dois-je apporter à mes clients ?

Que font mes concurrents ?

Que dois-je apporter à mes clients ?

Que font mes concurrents ?

Quelle est ma stratégie

de développement ?

Figure 2.3 — Le balanced scorecard et les axes privilégiés d’analyse de la performance

Page 47: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 36

• Choisir les indicateurs.

• Mettre en place les clignotants.

Il ne rentre pas dans la mission de cet ouvrage de développer dans le détailla méthodologie participant à l’élaboration des tableaux de bord ou balanced sco-recard, sujet sur lequel il existe une littérature abondante (se référer à la biblio-graphie en fin d’ouvrage). En revanche, nous donnerons à titre d’exemplequelques indicateurs qui nous paraissent essentiels au bon pilotage de l’entre-prise. Nous distinguerons plusieurs fonctions dans l’entreprise et pour chacuned’elles nous répartirons les indicateurs selon quatre orientations :

• indicateur d’activité;

• indicateur qualité;

• indicateur de coût;

• indicateur d’éclairage.

2.3.1 Fonction Commerciale

Activité

Quantités vendues par secteur, par produit, par client

Par secteur, par produit, par client

Nouveaux clients

Nombre de commandes

Clients n’ayant pas commandé depuis x temps

Nombre de prospects visités

Nombre de devis émis

Taux de transformation sur devis

Qualité

Nombre de réclamations reçues et traitées

Délai de livraison client

Taux de renouvellement des contrats d’entretien

Taux de rupture

CoûtFrais commerciaux Par nature, par secteur

Contribution/coût Par agence

Page 48: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.3 Les différents types d’indicateurs ———————————————————————————————————————————————————————— 37

2.3.2 Fonction Direction générale

Coût

Promotions

Engagements publicitaires Par famille de produit

Frais de voyage et déplacement Par secteur

Coût des stocks obsolètes

Observation

Indices d’évolution d’achat de vente

Suivi de la compétitivité

Concurrence

Humains

Effectifs

Embauches

Démissions

Primes versées

Nouveaux projets

Activité

CA net, Quantités nettes Par secteur, par produit, par client

Marge brute

Part de marché

Croissance du marché

Rentabilité des capitaux investis

Fonds de roulement

Taux de rotation des clients, fournisseurs, stocks

Carnet de commandes

Qualité

Indice de qualité selon métier de l’entreprise

Délai de livraison

Nombre de réclamations

Page 49: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 38

2.3.3 Fonction Ressources humaines

Coût

Main d’œuvre de production

Coût de revient des produits

Frais généraux Par nature

Frais commerciaux Par secteur

Sous-traitance

Observation

Indices d’évolution d’achat de vente

Suivi de la compétitivité

Concurrence

Grands projets d’investissements

Nouveaux projets

Humains

Effectifs (internes/externes), embauches, démissions

Taux d’absentéisme

Moral des troupes

Fréquence des accidents du travail

Activité

Niveau de salaire en % du CA, en % des coûts Par département

Nombre d’augmentations de salaires Par catégorie

Nombre de personnes recrutées

Budget formation

Nombre de candidatures pour pourvoir un poste

Nombre de candidatures spontanées

Effectif Par catégorie, par sexe, par âge

Effectif interne/externe

Page 50: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.3 Les différents types d’indicateurs ———————————————————————————————————————————————————————— 39

2.3.4 Fonction Production et recherche – développement

Activité Productifs/Improductifs

Qualité

Nombre de départs en période d’essai

Délai moyen d’un recrutement

Âge moyen Par catégorie

% de postes pourvus en interne

% de postes en binôme

Nombre d’annonces nécessaires pour pourvoir un poste

Nombre de licenciements

Turnover

Coût

Coût moyen d’un recrutement

Salaires Par département, catégorie

Observation

Prévisions des départs en retraite

Prévision de création de postes

Nouvelles formations

Humains

Heures supplémentaires

Taux d’absentéisme

M3oral des troupes

Mobilité du personnel

Activité

Capacité de production

Coût de revient des produits Standard/réel

Valeur ajoutée Par atelier

Quantités produites/heures productives

Quantités produites/effectif total

Page 51: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 40

Activité

Quantités produites/heures machines

Consommation de matières premières/quantités produites

Quantités produites Tonnes, unités

Maintenance préventive

Niveau des stocks/activité par nature matières premières, produits semi-finis, produits finis

Qualité

Taux de retouches, taux de déchets, taux d’arrêts techniques

Nombre de réclamations, retours clients, retours fournisseurs

Nombre de ruptures de stock

Respect du délai clients, suivi du délai fournisseurs

Délai de fabrication

Retard moyen des projets et études

Coût

Consommation d’heures Par atelier et par produit

Coût de main d’œuvre de R&D

Sous-traitance

Énergie

Observation

Planning de production

Carnet de commandes

Évolution du prix des matières premières

Humains

Effectif interne/externe

Embauches démissions

Absentéisme/ turnover

Qualification du personnel

Taux d’improductifs

Page 52: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.3 Les différents types d’indicateurs ———————————————————————————————————————————————————————— 41

2.3.5 Fonction Logistique et approvisionnements

Activité

Produits expédiés (tonnes, unités et valeur)

Valeur totale des stocks Standard/réel

Analyse ABC des stocks

Taux de rotation des stocks

Écarts sur inventaire

% de stock mort

Surface de stockage utilisée

Nombre de transporteurs

Nombre de références gérées en stock

Qualité

Taux de retouches, taux de déchets, taux d’arrêts techniques

Délai moyen de livraison au client

Délai moyen d’approvisionnement/fournisseur

Temps moyen et changement de véhicules

Retards de livraison En jours et en valeur

Nombre de ruptures de stock Matières premières et produits semi-finis

Nombre de litiges transport, de livraison

Nombre d’avoirs

Taux de remplissage

Coût

Coût total du transport

Coût transport Par transposteur/m3 transporté

Coût moyen d’acheminement Par fournisseur

Coût des stocks Par m3, total

Observation Carnet de commandes

Page 53: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 42

2.3.6 Fonction Achats

Humains

Effectif interne/externe

Embauches démissions

Absentéisme/turnover

Qualification du personnel

Activité

Montant annuel des achats

Montant moyen d’achat Par commande, par personne

Nombre de commandes traitées par personne

Taux de remise obtenu par personne

Conditions de paiement négociées

Nombre de références

Nombre de demandes d’achat

Nombre d’appels d’offre

Nombre de négociations

Nombre de commandes Par tranches de valeur

Nombre de comptes fournisseurs

Nombre de fournisseurs en activité

Nouveaux fournisseurs

Turnover fournisseurs

Part des importations

Qualité

Délai moyen de traitement d’une commande fournisseur

Nombre de relances

Page 54: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.3 Les différents types d’indicateurs ———————————————————————————————————————————————————————— 43

2.3.7 Fonction Informatique – Études – Exploitation

Qualité

Nombre d’avoirs, de litiges

Performance des fournisseurs

Qualité des négociations

Taux de couverture des besoins

Coût

Salaires

Dépenses de fonctionnement

Coût moyen de traitement d’une commande Total/par fournisseur

Coût moyen de recherche de fournisseur

Observation

Études de marché fournisseurs

Évolution du marché

Carnets de demandes d’achats

Humains

Effectif interne/externe

Embauches démissions

Absentéisme/ turnover

Qualification du personnel

Activité

Rentabilité des investissements

Marge de contribution d’une nouvelle application

Analyse des temps d’étude

Développement Planifié non planifié

Nombre d’heures de test

Nombre d’heures sous-traitées

Nombre d’heures ingénieur Par projet

Page 55: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 44

Activité

Heures d’études

Lignes produites Par programmeur/période

Nombre de transactions Par heures

Nombre de programmes en exploitation

Nombre d’heures machines

Nombre de pages éditées

Qualité

Respect du budget

Retard moyen

% heures de tests/heures d’études

% maintenance/études nouvelles

Délai de réponse aux demandes

Délai moyen d’une demande

Nombre d’incidents par période

Nombre d’erreurs de manipulation

Nombre d’incidents matériels

Nombre d’heures indisponibles

Coût

Dépenses globales

Ventilation des dépenses Par logiciel/personnel, études/exploitation

Salaires Ingénieurs, techniciens, développeurs

Heures machines de tests/Production

Heures ingénieur

Coût moyen par transaction

Page 56: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.4 Deux mondes différents : OLTP et DW ——————————————————————————————————————————————————— 45

2.4 DEUX MONDES DIFFÉRENTS : OLTP ET DW

Avant de développer les techniques nécessaires à la définition de l’entrepôt dedonnées, nous devons avoir conscience des différents niveaux de stockage desdonnées, chacun d’entre eux étant destiné à des tâches différentes pour des uti-lisateurs différents. Le processus transactionnel (OLTP, Online Transaction Pro-cessing) est totalement orienté vers l’utilisateur qui alimente au quotidien lesbases de production. En revanche, le modèle dimensionnel du datawarehouse(DW) est destiné aux analystes métier.

Le premier joue le rôle de récepteur des données originelles quels qu’en soientles supports et les outils (saisie sur Internet, alimentation de l’ERP, comptabilitéd’entreprise, saisie dans des tableaux Excel, etc.). Le second joue le rôle de concen-trateur des données afin de leur conférer une cohérence globale et partagée parl’ensemble des acteurs de l’entreprise. Le DW peut prendre une forme particu-lière de stockage, OLAP, qui n’est qu’une représentation optimisée du dataware-house. OLAP présente en effet l’avantage de fournir une information « prédigérée »selon les différents points de vue des gestionnaires de l’entreprise.

Les utilisateurs de chaque niveau ne sont pas les mêmes, les structures de donnéessont différentes, l’administration est différente ainsi que la gestion quotidienne.

Observation

Carnet de commandes

Nouvelles applications

Planning prévisionnel de charge

Hausse des volumes traités Par rapport aux années précédentes

Hausse des heures-machine Idem

Remplacement de matériel/amortissement

Nouvelles versions des logiciels/utilité

Humains

Effectif interne/externe

Embauches/démissions

% de sous-traitance

Qualification du personnel

Page 57: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 46

2.4.1 Qu’est-ce qu’une transaction ?

Un système OLTP tel qu’un ERP ou un PGI traite des centaines voire des milliersde transactions par jour. Chaque transaction est le reflet soit d’une mise à jour,soit d’une suppression ou encore d’un ajout de données nouvelles. A contrario ledatawarehouse ne fera l’objet que d’une seule transaction dont la fréquence estgénéralement quotidienne. En revanche cette transaction représente des centai-nes de milliers d’enregistrements. De plus, elle s’effectue exclusivement en moded’ajout de données sans aucune modification ni suppression des données exis-tantes. L’historique des mouvements est donc intégralement conservé. Ce méca-nisme participe à la sacro-sainte traçabilité de l’information en entreprise(loi SOX). Ce processus porte le nom d’ETL : extraction, transformation, char-gement (load).

Un soin particulier sera apporté lors du processus d’ETL à la consistance desbases avant et après le chargement. En effet, le processus de chargement peutfaire l’objet d’une interruption intempestive laissant le système dans un étatd’inconsistance. Bien qu’un processus de rollback puisse être mis en place, il serasouvent préférable de procéder à une restauration de la base DW dans l’état oùelle était avant le début du chargement. On verra que les ETL proposent dessolutions de reprise intermédiaire basées sur des points de contrôle (checkpoint)à certaines étapes du processus.

2.4.2 Les utilisateurs et les gestionnaires

Les utilisateurs des systèmes OLTP sont des acteurs qui alimentent en perma-nence les bases de données opérationnelles des organisations. Ils prennent descommandes, enregistrent des paiements, procèdent à des règlements, saisissentde nouveaux clients, enregistrent des réclamations, font des réservations, entrentde nouvelles données et en corrigent d’anciennes. L’organisation des systèmesOLTP doit permettre la mise à jour instantanée de toutes ces données.

Les gestionnaires (DBA, DataBase Administrator) de systèmes OLTP sont obsé-dés par la performance, la fiabilité et la sécurité des SGBD dont ils ont la res-ponsabilité. Si le système OLTP s’arrête, c’est toute l’entreprise qui est bloquée.Il n’est donc pas question d’effondrer les performances des systèmes par desrequêtes ou des rapports de synthèse qui seraient exécutées par les analystesmétier dans l’entreprise.

Ces analystes sont les observateurs de l’organisation. Ils sont naturellement degros consommateurs des datawarehouses. Leur métier consiste à comptabiliserles nouvelles commandes, chercher à comprendre les motifs qui poussent lesclients à partir, analyser les réclamations, comparer l’activité d’une année sur

Page 58: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.4 Deux mondes différents : OLTP et DW ——————————————————————————————————————————————————— 47

l’autre, observer des tendances. Ils détectent parfois des anomalies dans les sys-tèmes sous-jacents.

Ces gestionnaires observent les données à un niveau élevé de synthèse. Ilséprouvent rarement le besoin d’accéder à des informations détaillées. Ils s’inter-rogent sans cesse sur la manière dont les affaires se déroulent, passent rapidementde rapports en analyse, de requêtes en nouvelles interrogations dans le but dedéceler du sens dans la marche de l’entreprise. Les réponses à leurs interrogationsdoivent être immédiates, quelques secondes tout au plus et ceci quelle que soitla complexité de la requête.

Le reporting est souvent l’objet principal du datawarehouse (80 % des cas).Aujourd’hui il n’est plus question d’imprimer des listings volumineux dans les-quels bien souvent une seule ligne (en général la dernière) est utile pour l’ana-lyse. Il s’agit au contraire de mettre en place un reporting utile et personnaliséen fonction du besoin du lecteur. Dans les chapitres qui suivent, nous verronscomment un utilisateur peut souscrire un abonnement à tel ou tel rapport, lerecevoir dans sa messagerie quotidiennement ou mettre en place des alertes afind’être prévenu lors de telle ou telle transaction ou franchissement de seuil.

L’exemple de la figure 2.4 montre les nouvelles fonctionnalités du traitementdes indicateurs clés (KPI) proposés par le logiciel de requêtage de cubes OLAPProclarity 6. Ce tableau synthétique, relativement complexe à développer enprogrammation pure, est un jeu d’enfant à créer avec les assistants mis à la dis-position de l’utilisateur final (l’analyste métier).

2.4.3 La dimension temporelle

Les systèmes OLTP et les datawarehouses traitent le temps de façon très diffé-rente. Le meilleur des systèmes OLTP est en perpétuel changement, du fait destraitements de mise à jour constants. Ralph Kimball, dans son ouvrage de réfé-

Figure 2.4 — Voici un tableau qui doit pouvoir être fourni par un système basé sur un datawarehouse

Page 59: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 48

rence The data warehouse toolkit, Practical techniques for building dimensional datawarehouses, Editions Wiley, parle alors de base de données scintillante. On com-prend bien que des changements constants dans la base ou des ré-écritures surdes données anciennes sont de nature à perturber les analyses. Un système OLTPen perpétuel mouvement ne produira pas deux analyses identiques à desmoments différents dans une même journée.

Ces problèmes de changements permanents sont définitivement résolus parla mise en œuvre de l’entrepôt de données dont l’objet est de stocker une suc-cession d’instantanés en provenance du système opérationnel et selon une fré-quence régulière. Un peu comme des géologues capables d’expliquer la formationdes montagnes en observant les couches successives de sédiments, le dataware-house permet de reconstituer l’évolution de l’activité d’une organisation grâce àdes photographies instantanées prises à des périodes régulières. De la même façonque les géologues creusent les couches sédimentaires afin d’analyser les évolu-tions dans le temps, le manager utilise la technique de forage (drill down) afinde mesurer et de comprendre les actions qui se sont succédées dans la réalisationdes affaires.

Nous introduirons également la notion de « dimensions à variation lente »(slowly changing dimensions). Cette technique est fondamentale pour représentercorrectement les variations qui se sont succédées dans le passé. En effet, il estfréquent que des modifications surviennent dans les gammes de produits, chezles clients et fournisseurs. Bien souvent, le manager souhaitera conserver la tracede ces variations.

La technique des instantanés statiques qui alimentent régulièrement ledatawarehouse règle deux problèmes connus dans les bases transactionnelles :

• À la différence de l’OLTP, le datawarehouse est au repos lorsque les uti-lisateurs lancent leurs requêtes car le « scintillement » n’est pas permis.

• Le soin apporté lors du stockage des informations dans le datawarehouseautorise une représentation temporelle des données qui n’est pas nativedans les systèmes OLTP. Avec le datawarehouse, il est en effet possible derapprocher des informations de ventes ou de production sur des périodesde temps comparables. Il est naturel d’analyser les données sur plusieursannées en year to date (cumul depuis le début de l’année). Il est égalementaisé de connaître les nouveaux clients depuis telle date ou au contraireceux qui ont quitté l’entreprise.

Nous verrons dans le chapitre 5 comment l’ETL (Integration Services dansSQL Server 2005) permet de mettre en œuvre le processus de stockage des ins-tantanés dans le datawarehouse.

Page 60: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.4 Deux mondes différents : OLTP et DW ——————————————————————————————————————————————————— 49

2.4.4 Le modèle de données entité-relation pour les développeurs

Une autre différence majeure entre les systèmes transactionnels et les dataware-houses réside dans le modèle relationnel. La modélisation d’un système OLTPvise essentiellement à réduire la redondance des données de telle sorte que lestransactions modifient les données à un endroit unique. Le modèle entité-rela-tion sur lequel sont basés les systèmes OLTP met en œuvre une organisation trèscomplexe avec de nombreuses tables reliées entre elles selon des jointures précisesgarantissant par ailleurs l’intégrité de la base. Il en résulte une grande difficultéde compréhension du schéma relationnel. Il n’est pas facile de comprendre aupremier coup d’œil quelles sont les tables importantes et celles qui le sont moins,quelles tables contiennent des données dynamiques et celles qui sont plutôt sta-tiques, quelles tables présentent des mesures de performance, quelles tables sontplutôt descriptives.

Voici quelques conséquences liées à cette organisation :

• Le modèle entité-relation, compte tenu de la complexité de son organisa-tion, présente des temps de réponse excellents lors d’ajout ou de mise àjour mais catastrophiques lorsqu’il s’agit d’effectuer des requêtes à des finsd’analyse.

• Il résulte du point précédent que seules quelques requêtes peuvent êtreenvisagées dans une journée.

• Compte tenu de la complexité du schéma des tables, le département infor-matique est contraint d’écrire des requêtes pour les utilisateurs métier.

• Dans les bases de données relationnelles normalisées, les requêtes qui sontde simples questions en termes métier, sont très complexes à écrire en lan-gage SQL et ne peuvent donc être élaborées que par des spécialistes.

• Les utilisateurs sont frustrés de ne pouvoir eux-mêmes effectuer leursrequêtes et analyses.

2.4.5 Le modèle dimensionnel pour les analystes

Le modèle qui est le plus proche des utilisateurs et qui décrit le mieux l’activitéde l’entreprise est le modèle dimensionnel appelé également « schéma en étoile ».

Ce schéma a été initialement mis en évidence par des fournisseurs de donnéestels que A.C. Nielsen, IRI, IMS et Walsh America. Ce schéma résulte d’unedemande légitime d’amélioration des temps de réponse lors de l’accès à de trèsgrosses bases de données et également d’une volonté de simplification de lavision qu’un utilisateur peut avoir lors de l’analyse des données métier.

Page 61: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 50

Le modèle dimensionnel est composé d’une table centrale entourée d’un cer-tain nombre de tables. À la différence d’un modèle entité-relation, la table cen-trale est la seule qui présente des jointures avec les autres tables. La table centraleest appelée table de faits, et les autres tables, tables de dimensions.

Dans le schéma en étoile de la figure 2.5, la table de faits centrale est Inter-netSales. Cette table historise l’ensemble des ventes effectuées sur Internet. Lestables dimensionnelles caractérisent les clients, les produits et le temps.

Le schéma en flocon présente les mêmes caractéristiques que le schéma enétoile avec cependant des branches dimensionnelles normalisées (plusieurstables en cascade). Dans la figure 2.6, les branches Customer et Geography sontnormalisées.

La table de faits renferme les données qui mesurent la performance ou l’activitéde l’entreprise; par exemple les ventes quotidiennes, les quantités fabriquées, lesheures travaillées. Les mesures stockées dans ces tables sont exclusivement numé-riques et additives, c’est-à-dire qu’elles pourront être agrégées dans le temps.

Figure 2.5 — Un modèle dimensionnel type. Le schéma en étoile

Page 62: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.4 Deux mondes différents : OLTP et DW ——————————————————————————————————————————————————— 51

Exemple : le cumul des ventes quotidiennes, mensuelles, annuelles. Ces mesuresrépondent à la question « Combien ? ».

Les tables de dimensions présentent souvent des descriptions textuelles. Parexemple, on effectuera des requêtes par produit ou par client. Dans ce cas, lesproduits ou les clients sont des axes d’observation métier. Ces axes d’analyserépondent souvent aux questions « Quoi ? » (quel produit), « Où ? » (chez quelclient), « Comment ? » (quel canal de vente), « Qui ? » (quel vendeur).

Tableau 2.1 — Le croisement des dimensions permet d’analyser les indicateurs selon de nombreuses perspectives

Quand ? Qui ? Quoi ? Où ? Indicateurs (Combien ?)

Année (historique sur 10 ans)

Mois

Jour

Cumul à ce jour

Équipes

Repré-sentants

Éditeur

Catég. Prod.

Collection

Titre de l’ouvrage

Enseigne

Libraire

CA & Qté vendues

CA & Qté retournées

Remise en % et valeur

Retours en % et valeur

Figure 2.6 — Schéma en flocon

Page 63: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 52

Tableau 2.2 — L’analyse dimensionnelle offre des combinaisons multiples et quasi illimitées. Chaque dimension peut comporter

des niveaux hiérarchiques permettant d’affiner les analyses

Dans la figure 2.7, les flèches représentant les arêtes du cube symbolisent lesaxes d’observation (Géographie, Produits et Temps). Les cellules du cube maté-rialisent les mesures ou indicateurs (nombre d’unités, CA, marge, etc.).

Dimensions Indicateurs

Temps

Géographie

Usine

Canaux de ventes

Organisation

Temps (calendaire/fiscal)

De résultat

Nombre d’unités vendues

Part de marché

Nombre de clients traités

Commandes prises

Taux de produit défectueux

Pièces produites

Pièces en rebut

Coût

Budget/réalisé

Contribution/marges

Ratios

De moyens

Matière consommée/unité produite

Heures de main d’ouvre

D’avancement et plan d’action

% personnel formé

Nombre de cercles de qualité

D’environnement

Cours des matières premières

Taux de change

Taux financier

Page 64: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.5 Comparatif des deux modèles de stockage des données ——————————————————————————————————— 53

2.5 COMPARATIF DES DEUX MODÈLES DE STOCKAGE DES DONNÉES

En guise de synthèse, nous proposons un comparatif entre les modèles de stoc-kage dit transactionnels et multidimensionnels. Ces règles ont été définies pardeux théoriciens américains, E.F. Codd et C.J. Date.

2.5.1 Le modèle transactionnel (OLTP)

Les douze règles du relationnel (définies par Codd et Date)

Règle 1 : Toute information d’une base de données relationnelle est représentéepar des valeurs insérées dans des tables composées de lignes et de colonnes.

Règle 2 : Toute donnée ou toute valeur atomique dans une base de donnéesrelationnelle doit être accessible grâce à la connaissance d’un nom de table, dela valeur d’une clé primaire et d’un nom d’attribut (colonne).

Règle 3 : Les valeurs nulles (distinctes d’une chaîne de caractères vide ou d’unechaîne de caractères « blancs » ou de zéro ou tout autre nombre) sont supportéespar un SGBD relationnel en tant que représentation d’information manquante.

Règle 4 : La description de la base de données est représentée au niveau logiquede la même manière que des données ordinaires, de sorte que des utilisateursprivilégiés (bénéficiant des bonnes autorisations) peuvent utiliser le même lan-

Axe d’analyse : Le temps(Année, trimestre, mois, jour)

Axe d’analyse : La géographie(Pays - région - ville)

Axe d’analyse : Les produits(Éditeur, Collect, titre)

Nb unités, CA, marge...Indicateurs :

Figure 2.7 — Représentation habituelle du modèle multidimensionnel sous forme de cube

Page 65: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 54

gage (SQL) afin d’accéder aux données utilisateurs ou aux métadonnées (struc-ture des tables).

Règle 5 : Un système de gestion de données relationnel peut accepter plusieurslangages et plusieurs interfaces utilisateurs. Cependant, il doit y avoir au moinsun langage dont les commandes sont exprimables grâce à une syntaxe bien spé-cifiée exprimée sous forme de chaînes de caractères. Ces commandes sont :

• la définition des données;

• la définition des vues;

• la manipulation des données (interactive et à l’aide de programmes);

• les contraintes d’intégrité;

• les autorisations;

• les limites de transaction (début, fin, commit).

Règle 6 : Toutes les vues que l’on peut théoriquement mettre à jour peuvent aussiêtre mises à jour par le système (ce qui inclut insertion, modification, suppression).

Règle 7 : La possibilité de manipuler une relation de la base ou relation dérivéecomme un opérande unique s’applique non seulement à la recherche de donnéesmais aussi à l’insertion, à la modification et à la destruction.

Règle 8 : Les programmes d’application et les interfaces écran demeurent logique-ment inchangés si on modifie les méthodes de stockage ou les méthodes d’accès.

Règle 9 : Les programmes d’application et les interfaces écran demeurent logi-quement inchangés si des modifications sont effectuées dans les tables.

Règle 10 : Les contraintes d’intégrité spécifiques pour une base de données rela-tionnelle doivent être définissables dans le langage de manipulation de la baseet stockables dans le catalogue, et non dans les programmes d’application :

• Intégrité de l’entité : aucun composant de la clé primaire n’est autorisé àêtre nul.

• Intégrité référentielle : pour chaque clé étrangère distincte non nulle d’unebase de données relationnelle, il doit exister une clé primaire correspon-dante du même domaine (dans une autre table).

Règle 11 : Une base de données relationnelles est indépendante vis-à-vis de larépartition. Autrement dit, les programmes d’application et les interfaces écrandemeurent logiquement inchangés :

• si on introduit un nouveau modèle de répartition des données,

• si les données sont distribuées sur plusieurs serveurs (dans le cas où leSGBD gère la répartition).

Page 66: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.5 Comparatif des deux modèles de stockage des données ——————————————————————————————————— 55

Règle 12 : Si un système relationnel est interfacé avec un langage de bas niveau,ce langage ne peut pas enfreindre ou contourner les règles d’intégrité expriméespar le langage de haut niveau (de type ensembliste).

Ces règles ont été définies par C.J. Codd en 1985. Depuis, elles ont fait l’objetd’amélioration.

2.5.2 Le modèle multidimensionnel (OLAP)

Voici les douze règles caractérisant le modèle multidimensionnel (C.J. Codd).

Règle 1 : Offre une vue permettant des manipulations simples sur les données :rotation, pivot ou vue par tranche, permutation d’axes (slice and dice) ou en cas-cade (drill anywhere).

Règle 2 : Offre une transparence du serveur OLAP à différents types de logiciels.Permet d’implanter le système OLAP sans affecter les fonctionnalités du systèmecentral.

Règle 3 : Doit être accessible à de nombreuses sources de données. Les outilsOLAP ont leur propre schéma logique de stockage de données physiques maisdoivent accéder aux données et réaliser n’importe quelle conversion pour pré-senter une vue simple et cohérente des données. Ils doivent savoir d’où provien-nent les données.

Règle 4 : L’augmentation du nombre de dimensions ou du volume de la base dedonnées ne doit pas entraîner de dégradation de performance visible par l’utili-sateur.

Règle 5 : La plupart des données OLAP sont stockées sur des systèmes puissantset sont accessibles via des postes individuels. Il est donc nécessaire que les pro-duits OLAP travaillent en environnement client/serveur.

Règle 6 : Toutes les dimensions doivent être équivalentes en structures et encalcul. Il ne doit exister qu’une seule structure logique pour toutes les dimensions.

Règle 7 : L’optimisation des matrices creuses est nécessaire afin de tenir comptedes combinaisons vides (dans une analyse à la fois sur les produits et les clients,tous les produits ne sont pas vendus chez tous les clients).

Règle 8 : Le système doit offrir des accès concurrents, garantir l’intégrité et la sécu-rité afin que plusieurs utilisateurs puissent accéder au même modèle d’analyse.

Règle 9 : Tout outil OLAP doit gérer au moins 15 à 20 dimensions.

Règle 10 : Les opérations doivent s’effectuer sur toutes les dimensions (agrégats)et ne pas demander à l’utilisateur d’intervenir pour définir un calcul hiérarchique.

Page 67: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 56

Règle 11 : Toute manipulation de données doit être intuitive. Elle doit êtreaccomplie via une action directe sur les cellules du modèle sans utiliser de menusou des chemins multiples à travers l’interface utilisateur.

Règle 12 : Doit offrir une souplesse et une grande facilité de constitution desrapports. Doit permettre de présenter les résultats sous forme de données synthé-tiques ou en fonction de l’orientation du modèle.

2.5.3 Synthèse OLTP et OLAP

Tableau 2.3 — Comparaison des deux modèles de stockages des données

2.5.4 Modèle simplifié FASMI

Les douze règles de Codd ont été simplifiées, complétées et synthétisées par l’acro-nyme FASMI (Fast Analysis Shared Multidimensional Information) :

• Fast. Le système est conçu afin de délivrer aux utilisateurs la plupart desréponses en moins de 5 secondes.

OLTP (bases transactionnelles de production)

OLAP (cubes analytiques)

Utilisateur Collaborateur, cadre opérationnel

Cadre fonctionnel, décideur

Fonction Saisie journalière Aide à la décision

Base de données Orientée application (ERP) Orientée métier

Données Dynamique Historique

Usage Répété À la demande (ad hoc)

Accès Lecture/écriture Lecture seule (écriture de simulation possible)

Unité de travailTransaction (insertion/suppression, mise à jour). Langage SQL

Requête complexe hiérarchique. Langage MDX

Nb enregistre-ments utilisés

Quelques enregistrements Millions d’enregistrements

Nb utilisateurs Centaines Dizaines

Volume de la Base GB TB

Page 68: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.6 OLAP ou reporting ? —————————————————————————————————————————————————————————————————— 57

• Analysis. Le système doit pouvoir répondre à toute problématique métier,tout type d’analyse et toute statistique appropriée à l’application. L’accèsà l’information doit être aisé et répondre rapidement aux besoins de l’uti-lisateur.

• Shared. Les données sont centralisées et partagées avec tous les niveaux desécurité et confidentialité nécessaires. Le système doit être capable de tenircompte des accès multiples en écriture des cubes OLAP. (Microsoft Ana-lysis Services est un exemple d’outil sécurisé de mise à jour de cubes à desfins de simulation.)

• Multidimensional. Cette notion est la clé de la définition de l’OLAP. Lesystème doit être en mesure de fournir à l’utilisateur une vue multidimen-sionnelle et hiérarchique, offrant une vision proche de celle de la structurede l’organisation de l’entreprise.

• Information. Toute l’information pertinente de l’entreprise doit pouvoir êtrestockée sans considération de limitation de taille ou du nombre de com-posants.

2.6 OLAP OU REPORTING ?

Le propos est de mettre en avant les avantages et les inconvénients des deuxsystèmes (OLAP et reporting) afin de choisir l’outil le mieux adapté pour répon-dre à un besoin « utilisateur » spécifique.

Approche du problème

Les techniques d’aide à la décision font appel à deux approches complémentaires.L’une est centrée sur les données à produire, l’autre sur l’utilisateur. Dans le casde l’approche centrée sur les données, on examine les caractéristiques des don-nées à produire et on choisit la technologie la mieux adaptée pour cela.

Dans le cas de l’approche centrée sur l’utilisateur, la réflexion est menéeautour des besoins exprimés par le demandeur. En effet, vous cherchez à connaî-tre qui sont les consommateurs d’information et quelles sont leurs attentes :s’agit-il de prendre des décisions, de suivre la performance d’une unité opéra-tionnelle, ou de partager l’information avec d’autres collaborateurs. Lorsque lebesoin sera défini, il s’agira de déterminer la meilleure technologie susceptibled’aider les utilisateurs à accomplir leurs tâches.

Les critères de décision

L’information doit-elle être délivrée telle quelle ou doit-elle faire l’objet d’uneinterprétation ? Un grand nombre de projets BI a seulement pour but de délivrer

Page 69: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 58

un ensemble de rapports à une population d’individus déterminée. Certains pro-jets ont pour but de comprendre le sens des données sous-jacentes et de produiredes informations utiles à destination des décisionnaires soucieux de la perfor-mance de leur organisation.

Par exemple, dans le cas d’une relation de partenariat entre deux acteurs, lafourniture d’information sur un état de compte ou des factures en cours est unschéma de type centré sur les données. Le but étant de fournir aux utilisateurs unaccès aisé et rapide à des enregistrements spécifiques pour un compte donné.Dans un tel projet, on ne recherche pas à connaître l’usage qui sera fait de tellesdonnées par l’utilisateur. Le seul objectif est de fournir des données sans se sou-cier de leur interprétation.

D’un autre côté, la mise à disposition d’information dans le but de permettreà un décisionnaire de mieux contrôler le niveau d’inventaire ou de suivre lesventes au quotidien d’un produit afin d’optimiser le circuit de livraison et leniveau de stock, est un projet BI orienté compréhension. Parce qu’une réponse àune question induit naturellement toute une série d’autres questions/réponses,dont le cheminement n’est pas connu par avance, l’outil qui permettra d’apporterune aide à ce schéma sera basé sur un modèle Multidimensionnel.

Quel est le pourcentage de données pour lesquelles la lecture est connued’avance, et quel est le pourcentage des informations connues dynamiquement ?Dans le premier cas les rapports traditionnels sont bien adaptés. Les données etcalculs associés, vues et filtres divers sont prédéfinis. Ces rapports statiques dansleur forme, sont disposés sur des serveurs de rapports et délivrés tels quels auprèsdes managers opérationnels.

Si au contraire, votre projet nécessite de réaliser des requêtes dynamiques etnon prédéfinies, les outils analytiques OLAP sont les plus judicieux. Ils le sontà double titre.

• Les utilisateurs peuvent naviguer verticalement dans une unité fonction-nelle et transversalement à travers les départements de l’entreprise.

• Les informaticiens disposent d’outils très sophistiqués permettant de laisserà la machine le soin de répondre à des interrogations complexes qui néces-siteraient des jours de programmation dans des environnements de déve-loppement traditionnels.

Voici deux exemples de requêtes qu’il est aisé de traiter au travers d’un sys-tème OLAP et très complexe avec le langage SQL de base :

• Quels sont les clients dont la part cumulée progresse le plus vite depuis ledébut de l’année ?

Page 70: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.6 OLAP ou reporting ? —————————————————————————————————————————————————————————————————— 59

• Quelle est la variation des ventes cumulées et comparées sur trois ans pourmes cinquante plus gros clients ?

Comment les données sont-elles fournies ?

Les outils de reporting ont tendance à produire des rapports avec des présen-tations formatées. Les technologies OLAP sont optimisées pour des analysestemps réel (navigation non prévisible, calculs à la volée, et scénarios de type« what if » permettant de réaliser des simulations sur les données opérationnel-les). Ces technologies permettent des restitutions dynamiques au travers de navi-gateurs Internet ou peuvent être « encapsulés » dans des tableurs.

Quels sont les types d’interrogation et de temps de réponse attendus par les utilisateurs ?

D’un côté, les rapports prédéfinis sont envoyés à l’imprimante qui par défini-tion est un périphérique lent. Cette tâche est le plus souvent planifiée et peutdurer des heures. D’un autre côté, un utilisateur « analyste » navigue sur des Gigaoctets de données réalisant des requêtes complexes avec des temps de réponseinférieurs à la seconde.

L’état de l’art en matière de technologie OLAP, utilise des algorithmes d’agré-gation et de compression de données dans le but de garantir toutes les combi-naisons utiles au sein du cube. Cette organisation permet de disposer de requêtesdont les temps de réponse sont quasi immédiats. Pour offrir des temps d’accèsaussi rapides, il est impératif d’agréger les données et de ne pas conserver leniveau « atomique » généralement stocké dans les bases de production. Par exem-ple, si des centaines de transactions sont stockées pour le même client dans lamême journée, il suffira de stocker dans le cube une seule ligne représentant lecumul journalier pour le client. Le niveau de granularité du cube est souvent unagrégat des données de production.

En effet si cette condition n’est pas respectée, on constate une « hypertrophie »du cube pouvant amener à une « explosion » de la structure.

On l’a compris, si l’on doit analyser les données au niveau de la transaction,la structure relationnelle est naturellement mieux adaptée.

Quelles sont les tailles acceptables ?

Historiquement, les technologies OLAP ont montré certaines limitationsréduisant le champ des problèmes qu’elles étaient censées résoudre. Les techno-logies OLAP récentes ont considérablement repoussé les limites de taille. Il n’estpas rare de rencontrer des cubes de quelques giga-octets avec des performancestout à fait acceptables.

Si les données sont volumineuses et utilisées à leur niveau le plus bas, le stoc-kage relationnel est probablement le meilleur choix. En revanche, si les données

Page 71: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 60

sont volumineuses, mais que l’analyse s’effectue à un niveau agrégé des données,la structure OLAP est le meilleur choix.

Pourquoi un référentiel métier unique ?

SQL, le langage des bases de données relationnelles, n’a pas été défini pourdes calculs et filtrages complexes. Pour détourner ces limitations, les utilisateurss’orientent souvent vers le tableur afin de réaliser des calculs complexes. Aumieux, l’utilisation de ces outils représente un risque à cause de la technique du« copier-coller ». Au pire ces techniques à base de tableurs mènent à l’anarchiedes rapports où chaque collaborateur dispose de « sa » propre version de la vérité.On observe trop fréquemment dans les organisations des cadres passant unebonne partie de leur temps à consolider des tableaux répartis dans un grand nom-bre de stations de travail. Nous verrons au chapitre 11 que le tableur Excel estparticulièrement adapté à l’analyse pour autant qu’il puise des données directe-ment sur le serveur de DW.

La centralisation du référentiel métier, utilisé par les décisionnaires pour l’éla-boration des indicateurs clés de performance (KPI), apporte une compréhensiondes affaires grâce à une standardisation des concepts et au partage collaboratif.La vue synthétique des objets métiers répertoriés dans le dictionnaire global del’entreprise, améliore la compréhension, et la productivité lors de l’extractiondes données et de la construction des tableaux.

Les données ont-elles besoin d’être agrégées ou bien traitées au niveau le plus bas ?

Nous l’avons vu, le but des bases multidimensionnelles est d’analyser et demanipuler de grandes quantités de données. Le type même de structure « cubique »permet la création de nouveaux algorithmes d’agrégation et de synthèse. L’inté-rêt d’une telle structure est que les calculs d’agrégation et de totalisation desindicateurs sont stockés dans un référentiel unique, partagé par tous. La restitu-tion de l’information est ainsi considérablement fiabilisée réduisant le risqued’erreur d’interprétation.

Par ailleurs le type de structure résultant de l’organisation des cubes induitnaturellement une vision commune et un partage naturel et complémentaire desobservations de chacun dans l’entreprise.

Quel est le besoin de la modélisation de la décision ?

De nouvelles recherches se sont développées autour de la structure multidi-mensionnelle de données. De nouvelles possibilités sont alors apparues en par-ticulier dans le domaine de l’analyse prédictive et de la segmentation.

Un type d’analyse assez fréquent est basé sur la question suivante « que sepasserait-il si ? ». En effet il peut être intéressant dans un modèle économique

Page 72: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.7 Le processus décisionnel avec SQL server 2005 ——————————————————————————————————————————— 61

de faire varier tel ou tel facteur sur les données réelles de l’entreprise et d’enmesurer l’impact. Une autre démarche consiste à ajouter ou retirer une variabledans un contexte prévisionnel et d’en mesurer l’impact immédiatement. Lesstructures multidimensionnelles dites en écriture permettent de stocker tempo-rairement ces données de simulation et d’en mesurer les conséquences surl’ensemble du modèle.

Un autre volet consiste à réaliser des analyses prédictives. Certains algorithmesstatistiques permettent de se projeter dans le futur et ainsi de prévoir des résultatsavant même que la réalité ne se produise. Cette analyse est particulièrementutile aux gestionnaires qui basent leurs projections sur les données historiquesde l’entreprise. Aujourd’hui malheureusement, ce type d’analyse est souvent réa-lisé à partir d’outils disparates dans l’entreprise, visant à consolider manuellementles informations puisées dans les divers silos de données. On le comprend bien,ces méthodes « artisanales » même si elles résultent d’un travail commun nonnégligeable, ne permettent pas de profiter des bénéfices liés à la centralisationet au partage de quantités importantes de données de l’entreprise. Les techno-logies OLAP apportent naturellement des réponses à cette problématique.

En conclusion

Les techniques basées sur des structures de données relationnelles sont efficienteslorsqu’elles visent à distribuer des données détaillées aux utilisateurs au traversde rapports préformatés.

Les technologies OLAP sont plus appropriées lorsque les utilisateurs désirentexplorer et comprendre les données agrégées afin de répondre rapidement à desbesoins stratégiques de l’entreprise. L’utilisation partagée d’un référentiel « métier »de l’entreprise favorise le dialogue et le partage naturel de la stratégie entre lesacteurs des différents départements de l’entreprise.

2.7 LE PROCESSUS DÉCISIONNEL AVEC SQL SERVER 2005

Les différentes étapes du processus décisionnel sont maintenant clairement définieset synthétisées dans la figure 2.8.

• Collecte des données depuis les différentes sources opérationnelles (Oracle,DB2, SQL, Sybase, ODBC, OLE DB…).

• Intégration dans un ou plusieurs datamart métier selon un modèle multi-dimensionnel (schéma en étoile relationnel). Cette fonction est rempliepar Integration Services.

Page 73: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 62

• Transformation du modèle multidimensionnel relationnel en modèle hyper-cube OLAP. Élaboration de KPI (Indicateurs clé de performance). Fouille dedonnées visant à découvrir du sens dans les entrepôts. Cette recherche estconfiée à des algorithmes spécialisés de data mining grâce à Analysis Services.

• Restitution de l’information sous forme de rapports ou d’analyses croiséesà la demande. Reporting Services, Report Builder, Proclarity, Excel, parti-cipent à la restitution.

• Présentation synthétique des résultats d’analyse dans un tableau de bord(Business scorecard Manager intégré dans Sharepoint Portal).

Nous développerons chacune des composantes à partir du chapitre 5.

2.8 LES ERREURS À ÉVITER

Plusieurs facteurs sont à prendre en compte dans la création d’un projet BI afind’anticiper les risques d’échec.

2.8.1 Le facteur Humain

La compétence et les motivations des utilisateurs sont mal interprétéesDans l’entreprise, il existe quatre catégories d’utilisateurs de l’information :

• Les utilisateurs non techniques ayant une forte implication métier.

• Les Analystes métier.

• Les Analystes avancés (Key Users) qui ont une connaissance forte du métieret une bonne compétence des techniques de requêtage.

• Les Développeurs ou Administrateurs de base de données (DBA) dont lavocation est de mettre à disposition des utilisateurs métier, les données del’entreprise. Ces techniciens de l’information (voir en annexe les différentsprofils) ont une forte compétence en matière d’infrastructure des systèmesd’information mais peuvent faire montre d’une connaissance relative dumétier de l’entreprise.

Dans la plupart des entreprises, les utilisateurs non techniques représententen moyenne 80 pourcent des utilisateurs de l’information, alors que les analystesavancés et les analystes métier se partagent les 20 % restant. Cette populationd’analystes, souvent proche des directions opérationnelles, a très vite comprisl’intérêt présenté par les outils de restitution sophistiqués (Powerplay, BO, Crys-tal…). Ils ont souvent joué le rôle de facilitateurs lors de l’acquisition d’outilsd’aide à la décision. En arrière-pensée ils visaient à recouvrer une certaine indé-

Page 74: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.8 Les erreurs à éviter ———————————————————————————————————————————————————————————————————— 63

Processus décisionnel avec SQL server 2005S

ourc

es d

e

do

nn

ée

s m

ultip

les

En

trep

ôts

de d

on

née

s

Inte

gra

tio

n S

erv

ice

s

Str

uctu

res d

e d

on

es

Mu

ltid

ime

nsio

nn

elle

s

An

aly

sis

Se

rvic

es

Re

stitu

tio

n e

t a

na

lyse

s

Exce

l, P

rocla

rity

Ta

ble

au d

e b

ord

BS

M

CUBE OLAP

à perspectivesmultiples

SGBD (Oracle/

DB2, SQL, Ole

DB)

ERP

Prog. Gestion

intégrée Comptabilité,

RH,

Production

Datamart

Finance

Datamart

Clients

Datamart

Processus

internes

Datamart

Apprentissage

Extr

aire,

Nettoyer,

Tra

nsfo

rmer,

rafr

aic

hir

Modeliser

Restitu

er

100 % 90

%80

%70

%60

%50

%40

%30

%

40

%

50

%

60

%

70

%

Analyses, Reporting, Data Mining

Pilote

r

Figure 2.8 — Les différentes composantes du processus décisionnel avec SQL Server 2005

Page 75: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 64

pendance à l’égard des informaticiens qui jusque-là étaient les seuls concepteursde leurs requêtes.

Nous le verrons plus loin, SQL Server 2005 apporte des réponses à cette caté-gorie d’utilisateurs grâce à Report Builder. (outil de création de requêtes et rap-ports à usage des non-techniciens). Excel offre une réponse grâce aux tableauxcroisés dynamiques connectés directement sur les Cubes OLAP.

Le partage de l’information reste encore tabou dans les entreprisesUn piège classique dans le cycle de la BI est de penser que seuls les développeurset Administrateurs des bases de données peuvent accéder et manipuler l’infor-mation des bases de données. Cette croyance est directement liée au fait qu’iln’est pas concevable de fournir à un utilisateur l’accès direct au SGBD sur lequelest basé l’ERP. De nombreuses raisons, souvent justifiées, sont mises en avant.La sacro-sainte sécurité dans les entreprises a contribué à éloigner les utilisateursdes sources de données. Les risques de dégradation des performances et la noncompréhension du modèle de données ont longtemps été un frein à la mise àdisposition d’outils de requêtage à destination des utilisateurs finals.

Une réponse est la mise à disposition d’un datawarehouse déconnecté del’ERP. Microsoft SQL Server 2005 propose la mise en place d’UDM permettantde s’affranchir de la complexité du modèle de données sous-jacent. L’UDM, sou-vent créé par l’administrateur des bases (DBA) est une interface visant à per-mettre à l’analyste d’accéder aux données de l’entreprise en toute sécurité. Deplus l’UDM offre une vision claire des données au travers du référentiel métier.

La culture de la mesure n’est pas intégrée par le personnelSi les dirigeants sont les seuls à prendre le plus grand soin à mesurer l’activité etles revenus qui en découlent, on observe que parmi les utilisateurs de l’informa-tion susceptibles d’apporter du changement dans l’entreprise, peu nombreux sontceux qui en tirent un avantage au quotidien.

Cependant lorsque l’on offre à chacun la possibilité d’observer sa propre effi-cacité en la comparant à d’autres employés de l’entreprise, le comportementchange radicalement. La mise en œuvre de tableaux de bord présentant des indi-cateurs de performance des Business Units, sous forme très visuelle telle que« feux tricolores » vert/jaune/rouge, représente un aiguillon redoutable. Pourautant il convient de fournir à l’employé la règle qui permet d’influer sur l’indi-cateur et les moyens d’action pour parvenir au résultat attendu.

La difficulté dans un grand nombre de sociétés réside dans le fait que lesemployés sont peu informés de la stratégie menée par la direction générale. Dansces conditions comment l’employé s’améliorer ? L’apport du Balanced Scorecardest de ce point de vue fondamental.

Page 76: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.8 Les erreurs à éviter ———————————————————————————————————————————————————————————————————— 65

2.8.2 Le facteur Technique

Les facteurs humains, sont naturellement fondamentaux dans la réussite du pro-jet BI mais il ne faut pas négliger les aspects techniques qui, s’ils ne sont pasmaîtrisés, peuvent être à l’origine de naufrages (Le Titanic a sombré à cause d’uneerreur de positionnement).

Vous ne devrez jamais perdre de vue que la plus grande partie de votre atten-tion doit être focalisée sur l’alimentation de l’entrepôt de données, sorte de boîtenoire de l’activité de l’entreprise sur laquelle sont basées toutes les hypothèsesdes analystes et le reporting d’entreprise.

Voici une liste des erreurs et des pièges les plus communément observés dansle déploiement de projet BI.

Les données sources sont :

Incomplètes

• Enregistrements manquants.

• Champs manquants conduisant à des cellules vides.

• Description d’enregistrements erronés.

Incorrectes

• Mauvaise codification (altération des codes dans le temps).

• Agrégations déjà réalisées dans les sources de données.

• Calculs erronés. (champs numériques résultant de calculs imprécis ou erronés).

• Enregistrements doublonnés impactant les tables de faits.

• Double exécution du processus de chargement. Cette erreur peut se pro-duire lors du déclenchement du processus sur la présence d’un fichier séma-phore mal maîtrisé.

• Mauvaise information entrée dans le système source telle qu’une inversionde date 12/01/2006 ou 01/12/2006.

Incompréhensibles

• Données en provenance d’un champ unique devant être « éclaté en plu-sieurs champs dans le datawarehouse. Ex. : “John F. Kennedy” ».

• Codifications inconnues du système. (Fuzzy lookup).

• Données non structurées en provenance de traitement de texte (nombresformatés avec des espaces en tant que séparateurs de milliers).

• Jointures de tables avec des relations plusieurs à plusieurs non identifiées.

Page 77: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 66

Incohérentes

• Codifications versatiles (« M » et « F » ou 1 et 2).

• Codifications changeantes liées à des réorganisations dans l’entreprise.(Dimensions à variation lente). Risque de perdre l’antériorité de l’historique.

• Multiplication de codes différents pour une même entité (ex. : client ouproduit ayant changé plusieurs fois de codification dans le temps).

• Plusieurs codes distincts représentant la même entité.

• Noms et adresses légèrement différentes mais identifiant la même entité.

• Calculs d’agrégations erronés dans les sources de données (la somme des %de deux nombres n’est pas égale au % de la somme de ces deux nombres).

• Le niveau de granularité des données doit être comparable (ex. : les dépen-ses sont connues au niveau poste de charge, les budgets sont établis auniveau du regroupement de charges).

• Les données agrégées concernent des périodes différentes (ex. : fourniturede données en provenance d’organismes extérieurs sur la base de la semaine,alors que le traitement d’alimentation est quotidien).

• Les champs Null, espace ou vides ne possèdent pas la même codificationinterne.

• Manque d’intégrité référentielle dans les données sources (chiffre d’affaireréalisé sur le produit A alors que le client n’est pas référencé).

• La mise à jour de la table de faits dans le datawarehouse est quotidiennealors que la table de dimension associée est mensuelle (risque de non cor-respondance des données).

• Des lignes de données peuvent intégrer les lignes détail ainsi que les totaux(risque de doubler les valeurs).

La phase de préparation du chargement des données dans le datawarehouse(ETL) est longue, fastidieuse, et coûteuse en temps. Elle nécessite de multiplescontrôles afin d’assurer une totale cohérence des données. Les journaux de char-gement devront être étudiés avec attention. Des procédures d’alertes en cas de« plantage » devront être mises en œuvre (envoi de mail ou SMS). Des procé-dures de reprises doivent être définies.

Il est aisé de comprendre que la complexité d’un entrepôt de données croîtde manière exponentielle avec le nombre de sources de données en entrée.

Il ne faut pas non plus négliger le fait que la connaissance des pièges et deleur identification peut disparaître avec les personnes.

Le poste d’ETL devra faire l’objet d’une documentation extrêmement préciseet complète.

Page 78: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.9 Les règles du succès ——————————————————————————————————————————————————————————————————— 67

2.9 LES RÈGLES DU SUCCÈS

2.9.1 Règle 1 – Comprendre les utilisateurs

Les utilisateurs métiers non techniques

Cette population nous l’avons vu représente 80 % des utilisateurs. Leur tâcheau quotidien est de servir les processus de l’entreprise et ils n’ont par consé-quent ni le temps ni le loisir d’analyser sans cesse les données. Ils demandentun accès sans effort aux données. Ils s’abonnent une fois pour toutes afin derecevoir par mail chaque jour le compte-rendu de l’activité, les objectifs définiset les écarts.

En regard de cette population nous mettrons en action un outil tel que repor-ting services. L’administrateur (DBA) effectuera pour eux un abonnement. Ilsrecevront les documents au format qu’ils jugeront utile (mail, ou support papier).Ils définiront également la fréquence de réception.

Les dirigeants qui ont besoin d’une vision synthétique, consulteront les infor-mations au travers de scorecard (Business Scorecard Management ou Office 2007)ou des tableaux de bord via une interface Web (Sharepoint Portal, Panoramasoftware, Proclarity).

Les Analystes métier

Ils ont une connaissance plus approfondie de l’outil informatique et en particu-lier maîtrisent bien Excel. Ils sont tout à fait capables de trier, filtrer les données.Ils utilisent les tableaux croisés dynamiques en accès direct sur les cubes Olap.Les données sont naturellement extraites du datawarehouse et ne souffrent d’aucunesaisie manuelle par l’utilisateur.

Les Analystes qui recherchent l’origine des causes et l’analyse de croissanceont besoin d’outils puissants (Report Builder, Excel for Olap, ou Proclarity).

Les Analystes métier, techniciens de l’information (Key Users)

Ces utilisateurs ont la capacité de créer eux-mêmes leurs requêtes et rapports.Ils maîtrisent Reporting services. Ils peuvent élaborer des tableaux de bordsophistiqués et sont en général de véritables référents pour l’ensemble des utili-sateurs métiers. Ils communiquent avec les techniciens de l’information et peu-vent apporter leur contribution dans l’élaboration du datawarehouse et de l’UDM.

Les statisticiens

Les statisticiens disposeront d’outils puissants leur permettant d’analyser les cor-rélations, ou d’effectuer des analyses prédictives. Ils se spécialiseront dans l’usagedes outils de data mining (fournis dans la version SQL Server S005 standard et

Page 79: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 68

Enterprise). Ils pourront également se livrer à des scénarios afin d’en mesurer lesimpacts (Les cubes en écriture associés à des outils tels que Desktop Professionnalde Proclarity, permettront aisément de répondre à ce type d’analyse). Rappelonsqu’Excel dispose en standard de fonctions de simulations (Scénario) ou de réso-lution de problème (Solver). Ces outils nécessitant une petite formation sontmalheureusement peu utilisés.

En conclusion nous pouvons affirmer que plus de 80 % des utilisateurs métierne désirent pas passer leur temps à créer des rapports, ou manipuler de l’infor-mation. En revanche ils désirent des rapports ciblés, concis, avec des graphiquesclairs. Ils veulent passer le moins de temps possible à déchiffrer et prendre rapi-dement les décisions nécessaires à l’action. Les 20 % restant représentent les ana-lystes. Ils font le plus grand usage d’outils dynamiques et interactifs.

2.9.2 Règle 2 – Distinguer les décisions stratégiques ou tactiques

Chaque jour des centaines voire des milliers de décisions tactiques sont prisesdans les organisations. Ces décisions sont prises à tous les niveaux de la hiérarchie.

Exemples de décisions tactiques :

• Y a-t-il suffisamment de produits en stock pour honorer cette commande ?

• Quelles sont nos meilleures offres de services ou nos produits les plus ven-dus ce trimestre ?

• Quelle est notre meilleure offre en termes de mix-produit, de coût, et depricing qui préserve nos marges et accroît notre résultat ?

Les décisions stratégiques sont la plupart du temps prises au sommet de lahiérarchie dans l’organisation. Du fait qu’elles impactent en profondeur l’orga-nisation, elles sont moins fréquentes que les décisions tactiques.

Exemple de décisions stratégiques :

• devons-nous entrer sur le marché avec une nouvelle ligne de produits ?

• Quels canaux de distribution devons-nous privilégier ?

• Devons-nous augmenter nos parts de marché ou plutôt accroître nos marges ?

• Devons-nous augmenter notre budget marketing, ou être plus efficient enmatière de production ou développer un nouveau produit ?

Selon que l’utilisateur manipulera des informations tactiques, stratégiques oules deux, les outils mis à sa disposition ne seront pas les mêmes.

Page 80: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.10 Construire le tableau matriciel des besoins —————————————————————————————————————————————— 69

2.10 CONSTRUIRE LE TABLEAU MATRICIEL DES BESOINS

Dans un souci d’amélioration du dialogue avec les utilisateurs et afin de permet-tre aux chefs de projets de disposer d’un outil de réflexion on sera bien inspiréde mettre en place quelques tableaux synthétiques définissant les besoins desutilisateurs.

Un tableau général permettra de définir le périmètre du projet en recensantles différents thèmes analytiques à développer ainsi que les axes d’observation.

Les projets d’entreprise recensent les besoins suivants :

Tableau 2.4 — Définir la matrice des besoins métiers

L’étape suivante consiste à sélectionner un processus métier puis à décompo-ser les axes dimensionnels et introduire les indicateurs.

Prenons le processus métier « Analyse des ventes ». Celui-ci se décomposeselon le tableau 2.5.

Afin de communiquer de façon très visuelle avec l’utilisateur il est recom-mandé de présenter une ébauche du résultat final. Excel ou ACCESS permet-tront de maquetter l’application finale et de simuler rapidement le résultatattendu.

Dans l’exemple présenté à la figure 2.9, Excel permet à l’utilisateur de sedéterminer rapidement sur le résultat attendu par l’utilisateur.

Processus Métier

Axes d’observation ou Dimensions

Tem

ps

Prod

uits

Reve

ndeu

r

Ate

liers

Clie

nts

Org

anis

atio

n

Com

ptes

Analyse des ventes X X X X X

Profitabilité par clients/produits X X X X

Finance. Balance X X X

ProductionGestion de la capacité X X X X

Page 81: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————— 2. L’approche méthodologique 70

Le tableau 2.5 est un outil incontournable favorisant la représentation desbesoins exprimés par l’utilisateur.

Tableau 2.5 — Tableau des dimensions et indicateurs de la fonction « Analyse des ventes »

On peut également définir un jeu de test et présenter une ébauche au traversd’un tableau croisé dynamique.

Toutes les versions d’Excel (depuis 97) permettent de présenter des résultatssous forme de tableaux croisés dynamiques. Voici à titre d’exemple l’interfaced’Excel 2007 permettant de construire des tableaux croisés dynamiques. Rappe-lons que les sources des tableaux croisés peuvent être indifféremment des tables,des listes ou des cubes OLAP.

Dimensions Indica-teursTemps Produits Revendeur Clients Organisation

– Année

– Trimestre

– Mois

– Jour

– YTD (cumul)

– Croissance par période

– Ligne de produit

– Marques

– Catégorie de produits

– Collection

– Produit

Grossiste

Distributeur

VAR

Enseigne

Groupement

Magasins

Point de vente

Équipe de vente

Vendeur

Qtés cdées

Qté vendues

Marge

Remises

% remise

Prix moyen

0

50 000

100 000

150 000

Roman Sciences

humaines

Informatique

Analyse des ventes année 2005

Qtés cdées

Qtéesvendues

Retours

Figure 2.9 — Une représentation visuelle est toujours plus parlante pour l’utilisateur

Page 82: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

2.10 Construire le tableau matriciel des besoins —————————————————————————————————————————————— 71

Figure 2.10 — Tableau croisé dynamique avec Excel (Ici version 2007)

Page 83: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server
Page 84: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

3Comment représenter

les données ?

L’aptitude à représenter graphiquement des données numériques n’est pas intui-tive. Elle requiert certaines compétences qui doivent être acquises. Ce chapitreintroduit les meilleures pratiques en matière de conception graphique.

Dans le monde des affaires, aucune information n’est plus importante qu’uneinformation quantitative. Les nombres mesurent la performance, repèrent lesopportunités et prévoient le futur. L’information quantitative est souvent pré-sentée sous forme de graphique. Malheureusement, la plupart des graphes utilisésdans le monde des affaires sont mal conçus. Pourquoi ? Tout simplement parceque la plupart des auteurs qui les produisent, y compris des spécialistes tels queles financiers et les développeurs de rapports, n’ont pas été formés à la représen-tation graphique efficace.

Ce chapitre est une introduction à la représentation pratique des données,dans le but d’établir une meilleure communication entre le créateur d’un tableauet son lecteur. Heureusement, les compétences nécessaires pour traduire et com-muniquer efficacement la plupart des données d’affaires ne requièrent pas undiplôme spécialisé en statistiques. En fait, ces compétences sont aisées à acquérirmais un apprentissage est néanmoins nécessaire.

Le processus tient dans les six étapes suivantes :

• Préciser le message à communiquer et identifier les données nécessaires àsa communication.

• Déterminer si un tableau de chiffres, un graphe ou une combinaison desdeux est nécessaire à la communication.

Page 85: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————— 3. Comment représenter les données ? 74

Si un graphe est nécessaire, on observe alors les quatre étapes suivantes :

• Déterminer le meilleur moyen pour représenter visuellement les valeursnumériques.

• Déterminer comment afficher chaque variable.

• Déterminer le meilleur rendu graphique.

• Déterminer si des données particulières doivent être mises en évidence. Sioui, comment ?

3.1 CONCEPTS GÉNÉRAUX ET PRATIQUES

Avant d’approfondir le processus de conception des graphes, il y a quelquesconcepts généraux que le lecteur doit connaître et qui s’appliquent en toutescirconstances.

3.1.1 Tableaux ou graphiques ?

En général, lorsque l’on compare les modes de représentation dans le but de pré-senter des données quantitatives, il n’y a pas à préférer a priori entre une repré-sentation sous forme de tableaux de chiffres ou de graphes. Les deux modes dereprésentation sont simplement différents.

Définissons quelques termes.

Les tableaux sont particulièrement utiles lorsqu’il s’agit de montrer desvaleurs précises.

En revanche les graphiques sont préférés lorsque le message à communiquerréside d’avantage dans la forme que la précision des valeurs (c’est-à-dire desmodèles, des tendances ou des exceptions).

Dans le tableau suivant, on observe des taux de change présentés par annéeet par mois.

Tableau Graphique

Les données sont représentées sous forme de nombres.

Les données sont traduites en images.

Les données sont disposées en lignes et colonnes.

Les données sont affichées en relationsur un ou plusieurs axes matérialiséspar une échelle qui donne du sens auxvaleurs.

Page 86: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

3.1 Concepts généraux et pratiques ————————————————————————————————————————————————————————— 75

Si vous désirez connaître une valeur précise telle que le taux de mai 1996, letableau permet d’y répondre de la meilleure façon possible. En revanche, si vousdésirez connaître l’évolution du taux sur l’année 1996 ou de la comparer avecl’année 1997, le graphique sera une bien meilleure représentation (figure 3.2).

3.1.2 Données quantitatives ou catégorielles ?

Les données quantitatives ne renferment pas seulement des nombres, mais aussides données qui identifient le sens des données.

Dans un graphique on distingue les données quantitatives – les nombres –des données catégorielles – les étiquettes qui précisent ce que les nombresmesurent.

Figure 3.1 — Tableau de valeurs

Figure 3.2 — Représentation graphique de données

Page 87: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————— 3. Comment représenter les données ? 76

Le graphe ci-dessous (figure 3.3) met en évidence la distinction entre les don-nées catégorielles représentées par l’étiquette de chaque série de données et lesdonnées quantitatives sur l’axe vertical des ordonnées.

Les trois types d’échelles catégorielles

Les échelles catégorielles se subdivisent en trois types fondamentaux : nominal,ordinal et intervalle (figure 3.4).

L’échelle nominale consiste en des données discrètes qui appartiennent à unecatégorie commune, sans présenter de rapport avec d’autres données. Typique-ment nous retrouvons des notions de régions (Amérique, Asie, Europe, etc.) oudépartements (ventes, marketing, finance, production).

Les données qui relèvent d’une échelle ordinale ont un ordre intrinsèque maisne représentent pas de données numériques. Il s’agit par exemple de classements

Figure 3.3 — Graphe présentant des données catégorielles et quantitatives

Figure 3.4 — Les trois types d’échelles catégorielles

Page 88: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

3.1 Concepts généraux et pratiques ————————————————————————————————————————————————————————— 77

tels que petit, moyen, grand, ou mauvais, médiocre, moyen, bon, excellent ourouge vert, bleu, jaune.

Les données qui qualifient des intervalles non seulement définissent un cer-tain ordre mais représentent également des valeurs. Il s’agit par exemple de sériesde plages de valeurs de taille égale. Exemple : tranche 1 de 0 à 99, tranche 2 de 100à 199, tranche 3 de 200 à 299, tranche 4 de 300 à 399, etc.

Les sept relations en données quantitatives

Un nombre en tant que tel ne présente pas d’intérêt. En revanche, lorsqu’il estcomparé à d’autres nombres il prend tout son sens. 7 500 € de consommationélectrique dans mon immeuble cette année n’est pas très révélateur. En revanchelorsque j’observe que cette valeur est 40 % supérieure à celle de l’année dernièreà pareille époque, cela devient une alerte qui sera probablement suivie d’uneaction (recherche de la cause et mise en place du remède).

La plupart des données quantitatives peuvent être classifiées selon leur mode derelation entre elles. Voici les types de relation les plus fréquemment rencontrés.

1. Relations de séries temporellesLorsque des valeurs quantitatives représentent une série de mesures prises à inter-valles réguliers, ce type de relation est appelé série temporelle (figure 3.5) Il s’agitdu type de graphe le plus répandu. En effet, 75 % des graphiques d’entreprisesconcernent des séries temporelles. Le temps peut être divisé en périodes de duréesvariables telles que années, trimestres, mois, semaines, jours, heures et secondes.

Figure 3.5 — Graphique représentant une série temporelle

Page 89: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————— 3. Comment représenter les données ? 78

Ce type de graphique montre bien les mouvements à la hausse ou à la baisseau fil du temps. Les séries temporelles, révèlent des tendances ou des modèles qu’ilest nécessaire de décrypter afin de prendre les décisions qui s’imposent.

2. Relations de classement avec tri par ordre croissant

Lorsque des données quantitatives sont présentées selon un ordre croissant oudécroissant ce type de relation porte le nom de classement.

On utilise souvent ce mode de représentation pour classer les performancesdes vendeurs ou les dépenses effectives des départements de l’entreprise. Ce typede graphe révèle non seulement l’ordre de classement mais permet également derapprocher et de comparer certains groupes entre eux.

3. Relations de partie d’un tout

Dans ce contexte, les valeurs affichées révèlent le poids de chaque part en rap-port avec la globalité. Ce type de représentation est utile pour représenter lafaçon dont une entité est divisée en parties. Dans l’exemple de la figure 3.7, onobserve la répartition en pourcentage des membres d’une association par type defonction.

Pour montrer la part des différents éléments par rapport à l’ensemble, le meilleurmoyen est d’utiliser un arbre de décomposition (voir la section 3.2.1).

Répartition par fonction

1279

708

643

350

190

107

40

18

10

0 200 400 600 800 1000 1200 1400

P.D

.G. o

u Pré

siden

t

Dire

cteu

r gén

éral

Aut

re d

irect

ion

Gér

ant

Aut

re fo

nctio

n

Dire

cteu

r de

site

D.G

. adjoint

Dire

cteu

r d'act

ivité

Vice-

prés

iden

t

No

mb

re d

e m

emb

res

Fonction

Adhérent actif 1 REGION (Tous)

Nb Adhérents

Type de fonction

Déposer

champs

de séries

ici

Figure 3.6 — Relation de classement décroissant

Page 90: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

3.1 Concepts généraux et pratiques ————————————————————————————————————————————————————————— 79

4. Relations d’écart ou de déviationLorsque des valeurs affichent des écarts entre des objectifs prévisibles et des réa-lisations effectives, on utilise une relation de type écart (figure 3.8).

38,2%

21,2%19,2%

10,5%

5,7%3,2%

1,2% 0,5% 0,3%

0,0%

5,0%

10,0%

15,0%

20,0%

25,0%

30,0%

35,0%

40,0%

P.D

.G. ou P

rési

dent

Directe

ur

généra

l

Autr

e d

irect

ion

Géra

nt

Autr

e fo

nct

ion

Directe

ur

de s

ite

D.G

. adjo

int

Directe

ur

d'a

ctiv

ité

Vic

e-p

résid

ent

Type de membres

Répartition des membres en %

Figure 3.7 — Graphe de relation de type « partie d’un tout »

Production Prévu/Réalisé

10

20

14

17

25

13

2018

0

5

10

15

20

25

30

Janvier février mars Avril

A nnée 2006

en M

€ Prévu

Réalisé

Figure 3.8 — Graphe de type écart

Page 91: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————— 3. Comment représenter les données ? 80

Un exemple courant de ce type de graphe est celui qui rapproche des donnéesactuelles, par exemple des dépenses, par rapport à des données prévues – cellesd’un budget.

L’exemple de la figure 3.9 présente une variante du graphe d’écart. Seull’écart constaté est représenté. Il apparaît soit en positif (au-dessus de l’axe desabscisses) soit en négatif (en dessous de l’axe des abscisses).

Dans le cas présent on créera une mesure calculée écart telle que : écart = Réalisé – Prévu.

Ce type de rapport ne permet cependant pas de mesurer si l’écart est maîtriséou considéré comme normal. La technique du KPI (indicateur clé de perfor-mance) permet de pallier cela par l’ajout d’une composante telle que la tendance.

Exemple des ventes

Supposons que vous désiriez un état et une tendance des ventes et rapprocherla cible de la mesure de prévision.

La figure 3.10 montre le nouvel indicateur clé de performance (KPI) pour lescatégories de produit. La couleur des drapeaux (Vert, rouge ou blanc) permetd’identifier immédiatement le statut de l’indicateur (Bon, Mauvais, Moyen…). Lafigure 3.10 permet d’observer que les ventes des « Business PCs » ont enregistré

Écarts de production

15

3

– 1– 2

– 5

0

5

10

15

20

Janvier février mars Avril

A nnée 2006

en M

Figure 3.9 — Variante du graphe d’écart

Page 92: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

3.1 Concepts généraux et pratiques ————————————————————————————————————————————————————————— 81

une meilleure performance que les prévisions. Nous observons également que lesventes de serveurs ont été bonnes jusqu’au dernier trimestre où elles ont chutéde manière significative par rapport aux prévisions.

Les flèches quant à elles, montrent les évolutions de croissance. Les flèchessont orientées vers le haut lorsque la croissance est supérieure à la période pré-cédente, vers le bas lorsque la croissance est négative.

5. Relation de distributionUn graphe de distribution permet de représenter comment un ensemble de don-nées se répartit au sein d’un spectre unique. Il permet de représenter des phéno-mènes de concentration ou d’absence de données. On peut parfois observer desphénomènes de symétrie (courbe normale, ou courbe en cloche).

L’exemple de la figure 3.11 montre un pic de participation à un club profes-sionnel entre 44 et 55 ans, puis un départ brutal à 60 ans.

Figure 3.10 — Représentation d’un KPI. Avec représentation de la tendance

0

20

40

60

80

100

120

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

72

73

79

Figure 3.11 — Répartition des membres par âge

Page 93: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————— 3. Comment représenter les données ? 82

6. Relation de corrélationUn graphe de corrélation mesure le rapport qui existe ou non entre deux varia-bles. Dans l’exemple ci-dessous il ne semble pas exister de rapport entre la tailled’un employé et son salaire (la répartition des points est disparate).

Lorsqu’une corrélation est observée, les points ont tendance à se superposerà une droite souvent matérialisée par la diagonale du graphe (figure 3.12).

7. Relation de comparaison nominaleDans un graphe de comparaison nominale, il n’existe pas de lien entre les varia-bles portées sur l’axe des X. Dans la figure 3.13, les quatre régions géographiques

Figure 3.12 — Relation de corrélation

Figure 3.13 — Graphe présentant la relation de comparaison nominale

Page 94: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

3.1 Concepts généraux et pratiques ————————————————————————————————————————————————————————— 83

n’ont aucun lien entre elles et leur ordre ne présente pas d’importance. Tout auplus, est-il possible de présenter les variables selon un ordre croissant ou décrois-sant afin d’établir un classement.

Exemple de cheminement d’une analyse des ventes

La figure 3.14 montre que les performances des ventes au troisième trimestreont été particulièrement élevées pour la Californie. Le lecteur peut souhaiterétudier plus en détails ces chiffres. Il peut être amené à se poser des questionscomplémentaires, par exemple : dans quelles villes ces ventes ont-elles étéréalisées ? Quels produits ont contribué à ce résultat et dans quelles proportions ?Nous verrons plus loin que la technique du forage progressif (drill down) permetde répondre quasi instantanément à de nombreuses questions selon un chemi-nement à priori imprévisible.

Déterminer le meilleur moyen pour représenter les valeurs

Tableau 3.1 — Type de relation et méthode de représentation

Type de relation Méthodes privilégiées pour la représentation

Séries temporelles Lignes mettant en exergue l’évolution des données dans le temps

Classement Barres horizontales ou verticalesPoints

Figure 3.14 — Graphe d’analyse des ventes

Page 95: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————— 3. Comment représenter les données ? 84

3.2 LES NOUVEAUX OUTILS OFFERTS PAR LE COMPLÉMENT PROCLARITY1

3.2.1 L’arbre de décomposition

L’arbre de décomposition permet d’analyser des données selon des chemine-ments non déterminés à l’avance. Dans l’exemple ci-dessous, nous désironsapprofondir l’activité de ventes par produits et par ville dans l’État de Californie.

Type de relation Méthodes privilégiées pour la représentation

Tout ou partie BarresBarres empiléesSecteurs dont les parties sont matérialisées par un %

Déviation/Écart/Budget/Réalisé

Histogrammes double par mesureHistogramme représentant l’écart

Fréquence de distribution Barres verticales (histogrammes)Lignes (polygone de fréquence)

Corrélation Nuage de points avec ligne de tendance

Comparaison nominale Barres horizontales ou verticalesPoints

Écart sur objectifs et tendances

KPI (feux tricolores, flèches)

1. Proclarity : société éditrice de logiciels basés sur les technologies OLAP de Microsoft. Cette sociétéa été acquise par Microsoft en avril 2006.

California

State

City

Product

100 %3 M

San Jose

74 %2 304 K

Los Angeles

25 %773 K

San Francisco

1 %46 K

Alpha IIp750

36 %837 K

Alpha IIp1K

19 %435 K

Omega J – 500

18 %404 K

Ml-562

7 %158 K

Omega J – 750 Mx

6 %141 K

Mark Xl/136

3 %65 K

10 derniers

11 %262 K

Figure 3.15 — La représentation en arbre de décomposition permet une analyse non déterministe

Page 96: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

3.2 Les nouveaux outils offerts par le complément Proclarity ——————————————————————————————————— 85

3.2.2 La carte de performance

Vous souhaitez analyser les ventes du troisième trimestre et leur augmentationville par ville en Californie. Les cartes de performances sont un outil idéal pouranalyser les performances et évolutions relatives. Nous commençons avec unegrille représentant les ventes et leur augmentation par rapport à la période pré-cédente pour les villes de Los Angeles, San Francisco et San Jose pour le troisièmetrimestre 2002.

Les villes sont maintenant regroupées par ligne de produits (PC et périphé-riques). Les ventes sont en hausse dans toutes les villes, à l’exception des ventesde PC à Los Angeles. (Los Angeles a subi une baisse de 77,6 % de ses ventes).La croissance la plus élevée a été enregistrée pour les ventes de périphériques àSan Jose, comme l’indique la couleur claire en bas à droite.

Supposons maintenant que vous souhaitiez connaître le profil des clients àl’origine de cette hausse des ventes de périphériques à San Jose. Il faut afficheruniquement les données relatives aux périphériques et décomposer les ventes depériphériques réalisées à San Jose par type de client (figure 3.17).

Figure 3.16 La carte de performance

Page 97: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————— 3. Comment représenter les données ? 86

3.2.3 La vue en perspective

Supposons maintenant que vous souhaitiez modifier votre analyse pour connaîtrele rapport entre le volume des ventes et celui de la facturation pour chaque ville.Pour comparer un vaste volume de données entre deux mesures, vous utiliserezune vue en perspective.

Figure 3.17 — Autre représentation de la carte de performance

Figure 3.18 — Vue en perspective

Page 98: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

3.2 Les nouveaux outils offerts par le complément Proclarity ——————————————————————————————————— 87

Les vues en perspective sont un outil très utile pour détecter les écarts etidentifier ainsi les représentations de données qui sortent nettement de la norme.Par exemple, la ville de New York (représentation de données en haut à droite)se distingue clairement puisqu’elle présente à la fois le volume de ventes et levolume de factures le plus élevé.

Cette vue en perspective fait ressortir d’autres informations :

• par rapport à New York, Chicago (représentation de données compriseentre 6 et 8 millions de dollars de ventes) a enregistré pratiquement autantde factures, mais nettement moins de ventes;

• aucune ville ne présente un ratio très déséquilibré Volume de factures faible/Volume de ventes élevé;

• dans la zone représentant moins de 2 millions de dollars de ventes, uneville présente un volume de factures élevé pour des ventes médiocres (Cle-veland).

Page 99: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server
Page 100: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

4Entrepôt de données

et analyse décisionnelle

Ce chapitre présente succinctement les outils ainsi que les nouvelles méthodesde développement de processus décisionnels qui en découlent.

Lors des consultations de business intelligence et de tableaux de bord quenous donnons en entreprise, nous sommes souvent confrontés à deux types deréaction de la part des managers et responsables informatiques.

D’un côté, les managers qui réfléchissent en termes de métier comprennentaisément le concept d’entrepôt de données centralisateur de toutes les informa-tions de l’entreprise et de leur historisation. Ils adhèrent volontiers à la notionde tableau de bord de pilotage et comprennent spontanément le concept d’indi-cateurs et d’axes d’analyse de leur métier. Les responsables opérationnels s’inter-rogent même sur le fait que de telles solutions n’ont pas déjà été mises en placedans leur organisation. Intuitivement, ils conçoivent que l’informatique devraitles aider dans ce domaine. Et pourtant la technique de collecte des données del’entreprise ressemble souvent au parcours du combattant avec ses innombrablesressaisies manuelles, ses tableaux mensuels déconnectés les uns des autres ne per-mettant aucune consolidation annuelle. L’analyse sur deux années n’est souventpas à l’ordre du jour. La synthèse s’effectue dans un document final souvent réa-lisé grâce à un logiciel de PAO. Les cadres, dont la vocation est de réfléchir àla stratégie de l’entreprise, passent une grande partie de leur temps à collecterl’information. Privés de leur capacité d’analyse, ils s’interrogent sur leur valeurajoutée dans l’organisation. Par manque de temps et surtout d’outils d’aide à ladécision, ils ne peuvent prendre suffisamment de hauteur. Ils restent dépendants

Page 101: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 4. Entrepôt de données et analyse décisionnelle 90

d’un système d’information vis-à-vis duquel ils mesurent leur incapacité à le faireévoluer.

D’un autre côté, les responsables des systèmes d’information passent unegrande partie de leur acticité à maintenir en état de fonctionnement des orga-nisations techniques complexes. Les nombreuses fusions et acquisitions consta-tées ces dernières années ont contraint les responsables IT à faire communiquerdes systèmes qui a priori n’avaient rien de commun tant sur le plan techniqueque fonctionnel. Par ailleurs, les systèmes décisionnels disponibles depuis quel-ques années sur le marché nécessitaient des équipes ultra-spécialisées à tous lesniveaux de la conception, les rendant de ce fait très couteux.

Tableau 4.1 — Répartition des modules SQL Server 2005 par composants

Composant Module SQL Server 2005

Destination dans l’entreprise

Extract, Transform, Load (ETL)

Integration services Administrateur de bases de données

Entrepôt de données relationnel et multidimensionnel

Base de données relationnelle SQL Server 2005

Administrateur et développeur

Base de données multidimensionnelle analytique

Analysis services Développeur et utilisateur ayant des connaissances métier (Key User)

Exploration de données Data Mining intégré à Analysis services

Statisticien et/ou (Key User)

Création de rapports et modèles de base

Reporting Services Développeur et Key User

Requêtes et analyses spécifiques

Report Builder, Excel 200X, Proclarity, Office web component. (Excel 2007 pour la lecture des KPI)

Analystes métier

Développement d’application BI

SQL Server business intelligence Development Studio

Développeur

Outils de gestion de base de données

SQL Server Management Studio

Administrateurs/développeurs

Services de notification SQL Server Notification Services

Alertes envoyées aux managers sur des événements métier (rupture de stock, etc.)

Page 102: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Entrepôt de données et analyse décisionnelle ———————————————————————————————————————————————— 91

Conscient de ces faiblesses et profitant d’une expérience de plus de quinzeannées, Microsoft a tenté de mettre en place une solution susceptible de satisfaireaussi bien les managers soucieux de maitriser leur métier que les techniciensgarants de l’intégrité des systèmes d’information de l’entreprise.

La première tentative de Microsoft dans le domaine de la BI fut réussie grâceà l’introduction de DTS et Analysis Services dans la version de SQL Server 7puis 2000. Fort de cette expérience mais conscient également de certaines lacu-nes de cette première version, Microsoft vient de mettre sur le marché sa toutedernière version : SQL Server 2005, fruit d’une longue réflexion alimentée parles pratiques des meilleurs consultants de la planète en matière de SGBD etd’analyse décisionnelle.

Le tableau 4.1 présente une vue d’ensemble des composants d’un système debusiness intelligence et de leur destination dans l’entreprise.

On peut également répartir les outils selon un axe fonctionnel (tableau 4.2).

Tableau 4.2 — Répartition des modules par tâche fonctionnelle

Fonction Outil disponible Particularité

Conception BIDS (business intelligence Development Studio) construit sur Visual Studio 2005

Le développement de script permet un débogage dans tous les composants BI

Synthèse DTS entièrement réécrit porte le nom d’Integration Services dans la version SQL Server 2005

Présente une vision transparente des données de sources hétérogènes. Le partitionnement simplifie la gestion des données historiques

Stockage UDM (Unified Data Model) permet d’unifier le monde relationnel et multidimensionnel

La mise en cache proactive permet un stockage en temps réel des données transactionnelles

Analyse Les cubes multidimensionnels, les perspectives, les algorithmes de data mining ont été enrichis

Les KPI (indicateurs clés de performance) participent à l’élaboration du tableau de bord

Restitution Reporting Services et Report Builder sont administrés via des services Web.Les formats de restitution sont divers (Excel, PDF, XML, CSV, etc.)

La diffusion est automatisée sous forme d’abonnement auprès des utilisateurs

Gestion SQL Server Management studio intègre la gestion de tous les composants de SQL Server 2005

Administration centralisée et intuitive permettant une mise en œuvre aisée dans les petites et moyennes structures

Alertes SQL Notification Services Transmission de messages de notifications sur la base d’événements programmés

Page 103: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 4. Entrepôt de données et analyse décisionnelle 92

4.1 ARCHITECTURE DE LA PLATE-FORME DÉCISIONNELLE

Lorsque les administrateurs mettent en œuvre SQL Server 2005, les modulessuivants sont installés :

• Moteur de la base de données relationnelle;

• Integration services;

• Analysis Services;

• Reporting Services (nécessite le gestionnaire des services Internet IIS ins-tallé et configuré sur le serveur);

• SQL Server Management Studio pour la gestion des bases de données;

• BIDS (business intelligence Development Studio) pour le développementd’applications BI.

Les informations de métadonnées d’Analysis Services sont stockées sousforme de fichiers XML et totalement gérées par Analysis Services. Cette inno-vation peut cependant dérouter lorsque l’on est habitué au mode de fonction-nement de la console d’Analysis Services 2000. Les fichiers XML, dont lesformats sont documentés par Microsoft, sont observables via un éditeur XML ouun simple bloc-notes.

Dans le module SSIS (SQL Server Integration Services), certains paramétragesnécessitent d’intervenir manuellement dans des fichiers de configuration XML.Cette pratique est pour le moins surprenante de la part de Microsoft qui a misésur une interface très conviviale par ailleurs. Gageons que ces quelques lacunesseront comblées par les prochaines versions.

BIDS est conçu pour développer et déboguer les applications BI tandis queManagement Studio permet d’utiliser et de gérer les objets de bases de données.

Le modèle dimensionnel unifié intègre définitivement les bases de donnéesrelationnelles et la modélisation multidimensionnelle OLAP.

Les défis et les promesses de l’analyse décisionnelle reposent sur la commu-nication aux employés d’informations correctes, au moment opportun. La miseen œuvre de cet objectif requiert une analyse décisionnelle exhaustive, sécurisée,intégrée aux systèmes opérationnels et disponible 24 heures sur 24, 7 jours sur 7.Cet objectif est atteint grâce à la nouvelle architecture de SQL Server 2005.

Les améliorations en termes d’analyse décisionnelle incluent :

• Plate-forme intégrée. SQL Server 2005 constitue une plate-forme d’ana-lyse décisionnelle et analytique de bout en bout qui intègre OLAP (On

Page 104: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

4.1 Architecture de la plate-forme décisionnelle —————————————————————————————————————————————— 93

Line Analytical Processing), l’exploration de données, les outils ETL(Extract, Transform and Load) d’extraction, de transformation et de char-gement de données, les entrepôts de données et des fonctionnalités de rap-ports.

• Prise de décision améliorée. Les améliorations des fonctions décisionnel-les existantes, comme OLAP et l’exploration de données, et l’introductiond’un nouveau serveur de rapports fournissent aux entreprises les moyensd’exploiter les informations pour de meilleures prises de décision, à tousles niveaux.

• Sécurité et disponibilité. Des améliorations en termes de capacité à mon-ter en charge, de disponibilité et de sécurité offrent aux utilisateurs unaccès ininterrompu aux rapports et aux applications décisionnelles.

• Fonctionnalités d’analyse au niveau de l’entreprise. Un outil ETL amé-lioré permet aux organisations d’intégrer et d’analyser plus facilement lesdonnées en provenance de diverses sources d’informations. En analysantles données sur une large gamme de systèmes opérationnels, les organisa-tions pourront obtenir un avantage sur leurs concurrents grâce à unemeilleure compréhension de leurs activités.

Figure 4.1 — Le modèle dimensionnel unifié (Unified Dimensional Model ) se substitue à Analysis Services

Page 105: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 4. Entrepôt de données et analyse décisionnelle 94

4.2 LES AMÉLIORATIONS DE SQL SERVER 2005 PAR RAPPORT À LA VERSION 2000

SQL Server 2005, en plus d’offrir des innovations nombreuses en matière deSGBD, répond à plusieurs défis propres à la business intelligence. De nouveauxcomposants intégrés dans l’interface graphique de Visual Studio permettent undéveloppement et un déploiement aisés de la BI. Au risque d’apparaître moinsacadémique que ses concurrents, Microsoft veut démocratiser la business intel-ligence en la rendant accessible au plus grand nombre.

4.2.1 Actuellement, comment développons-nous un projet BI ?

Avec Ralph Kimball, nous avons appris au chapitre précédent quelles sontles règles fondamentales à observer dans le cadre d’un projet BI. Rappelons-les brièvement : les données sont extraites des systèmes opérationnels (ERP,comptabilité, paie, etc.) en général chaque jour. L’étape suivante consiste àtransformer les données brutes avant de les charger dans un datawarehouserelationnel /multidimensionnel. Une fois le datawarehouse mis à jour, les don-nées sont à nouveau extraites dans un ou plusieurs cubes OLAP hiérarchiques/multidimensionnels afin d’être présentées sous une forme plus « lisible » aux uti-lisateurs. Pendant la journée, les décisionnaires effectuent toutes sortes de requê-tes sur les cubes. La nuit suivante, le cycle est à nouveau répété, et les datamartssont rafraîchis grâce aux nouvelles données de la veille. En général, les adminis-trateurs de systèmes BI préfèrent définir plusieurs datamarts métier plutôt qu’ununique datawarehouse. Nous verrons dans les chapitres suivants que les notionsde datamart et datawarehouse peuvent être désormais confondues dans le nou-veau modèle UDM (Unified Dimensional Model) d’Analysis Services 2005. Cenouveau modèle tente de relever plusieurs défis.

4.2.2 Quels sont les défis à relever ?

Le processus décrit ci-dessus est le plus couramment suivi par les entreprises. Ila le mérite d’être compréhensible et donne souvent satisfaction. Cela ne veutpas dire qu’il est parfait. Loin s’en faut !

Défi n° 1 : Différentes versions de la vérité

Un problème majeur, engendré par l’utilisation de multiples modèles dimension-nels réside dans le rapprochement de plusieurs cubes. Un peu comme une requêteou vue composée de plusieurs tables jointes entre elles par des clés, il est possiblede créer un cube « virtuel » en fusionnant plusieurs cubes, cela si les cubes élé-mentaires partagent les mêmes dimensions.

Page 106: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

4.2 Les améliorations de SQL Server 2005 par rapport à la version 2000 ———————————————————————— 95

Par exemple si nous disposons de trois cubes différents, chacun présente unedimension « Client » propre. Dans le premier cube, la notion de client se définitcomme : « toute personne qui a commandé un article depuis 2 ans ». Dans ledeuxième, un client représente « toute personne qui présente un chiffre d’affairesde plus de 10 k€ ». Dans le troisième cube, le client est « toute personne quidispose d’une adresse complète et valide ». Nous le voyons, ces trois cubes ontété développés pour des départements différents et présentent un sens différent.Maintenant, imaginez que le directeur de chaque département décide de présen-ter dans un tableau de synthèse les dépenses annuelles de publicité réalisées parclient. Les résultats, bien que différents, paraîtront à chacun cohérents. Si lestrois dirigeants tentent maintenant de confronter leurs résultats, des écarts sen-sibles apparaîtront. La raison en est que la dimension Client est interne à chaquecube et non partagée par l’ensemble des trois cubes. Nous montrerons commentUDM fournit une réponse élégante à ce problème.

Défi n° 2 : Recopie multiple des données

Les modèles classiques de BI maintiennent au moins deux copies des donnéesen plus de la donnée originale; une dans le datawarehouse global, une autre dansle datamart métier. Comme les cubes sont indépendants, il n’est pas rare nonplus de constater que les données sont dupliquées entre les datamarts. Non seu-lement cette technique est très coûteuse en espace disque, mais elle met encoreune fois en évidence la notion de « versions différentes de la vérité ».

Défi n° 3 : La localisation des données est difficile

La localisation est le procédé qui permet de présenter l’information aux différentsutilisateurs dans leur propre langue et dans la monnaie de leur pays. Les systèmesactuels ne permettent pas de disposer de traductions des hiérarchies de dimen-sions ainsi que des contenus des membres de dimensions.

Lors d’une interrogation de la base articles, si votre langue naturelle est cellede Molière, laquelle de ces deux réponses préférez-vous recevoir du système ?

Item : Road-550-W Yellow, 40 Same technology as all of our Road series bikes,but the frame is sized for a woman. Perfect all-around bike for road or racing.

OuArticle Vélo de route 550 – W – jaune, 40 Équipé de la même technologie que

tous nos vélos de route, avec un cadre femme. Idéal pour la promenade ou lacourse sur route.

Défi n° 4 : Le schéma en étoile ne permet pas de modéliser la complexité des données

Un modèle dimensionnel traditionnel développé avec Analysis Services de SQLServer 2000 est un schéma en étoile constitué d’une table de fait centrale etd’un certain nombre de dimensions. Il existe des options pour la création de

Page 107: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 4. Entrepôt de données et analyse décisionnelle 96

schéma en flocon, de dimensions de type « parent-enfant » ou la mise à jour de« dimensions à variation lente ». Mais, dans la vie courante, il n’est pas exclude rencontrer des relations plusieurs à plusieurs au niveau des tables de faits(exemple : un compte bancaire est ouvert au nom de plusieurs propriétaires etchaque propriétaire dispose d’un ou plusieurs comptes bancaires. Une commandepeut faire état de plusieurs adresses d’expédition, une adresse peut à son tourfaire l’objet de plusieurs commandes).

Un autre exemple concerne les dimensions à multiples hiérarchies. En effet,la dimension temporelle est-elle basée sur le calendrier classique ou le calendrierfiscal ?

Que penser encore des dimensions composées uniquement d’attributs non hié-rarchiques. Par exemple, les clients ont des attributs tels que le genre, l’âge, lenombre d’enfants, la tranche de revenus etc. À l’évidence, ces attributs appar-tiennent bien au même client mais ne présentent pas de caractère hiérarchiqueentre eux. Dans Analysis Services 2000, ces attributs généraient des dimensionsdifférentes.

Défi n° 5 : Les systèmes BI actuels ne permettent pas le rafraîchissement de données OLAP en temps réel

Les décisionnaires réclament des informations à jour avant de prendre leurs déci-sions. Il existe de plus en plus de situations dans lesquelles l’analyse des donnéesen temps réel est nécessaire (exemple : dans un hypermarché, l’analyse d’unrayon quart d’heure par quart d’heure permet de suivre l’efficacité des messagessonores diffusés dans le magasin. L’analyse du ticket de caisse en quasi temps réelpermet de détecter des corrélations entre la vente de certains produits et la pré-sence d’un commercial sur le terrain).

4.3 LES NOUVEAUX COMPOSANTS DANS SQL SERVER 2005

SQL Server 2005 répond à tous ces défis en offrant plusieurs composants nou-veaux. Les plus largement commentés sont UDM (Unified Dimensional Model)et le cache Proactif. Voici quelques-unes des innovations.

4.3.1 Les vues des sources de données (Data Source Views, DSV)

Les systèmes BI extraient leurs données d’un grand nombre de sources différentes.La nouvelle technologie du DSV permet à l’administrateur du cube de concevoirun accès aux données des ERP ou d’autres systèmes opérationnels. Les adminis-

Page 108: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

4.3 Les nouveaux composants dans SQL Server 2005 ————————————————————————————————————————— 97

trateurs d’ERP, très soucieux de conserver l’intégrité et la sécurité des donnéesdont ils ont la responsabilité, apprécient particulièrement cette technologie quisécurise les accès aux tables tout en offrant aux développeurs de cube une vuesélective des données de base. Les DSV permettent d’accéder à toutes sortes desources différentes tels que fichiers XML, fichiers textes, fichiers Excel, tout enles considérant comme des tables. De plus, les DSV permettent de renommer deschamps de manière plus conviviale, ou de créer des relations virtuelles entre lestables sans jamais toucher à la structure des tables sous-jacentes.

4.3.2 Les cubes et UDM

UDM est un outil de modélisation multidimensionnelle. De ce fait, il ressembleà l’outil Analysis Services 2000. Cependant, l’outil de modélisation a été pro-fondément remanié dans SQL Server 2005. Alors qu’avec Analysis Services 2000il était nécessaire de créer autant de cubes que de types d’analyses (table de faitunique), UDM peut créer un modèle dimensionnel unique applicable à l’ensem-ble de l’entreprise en regroupant dans un schéma synthétique toutes les tablesde faits et de dimensions.

En regard des commentaires que nous faisions plus haut, cette techniqueapporte une sérieuse réponse dans le cadre de la non-redondance d’informationet donc satisfait notre recherche de centralisation de la « vérité ».

On le voit, UDM répond à notre défi n° 1, « les différentes versions de lavérité », tout en offrant une richesse supplémentaire à la construction du modèle.De plus le nouveau modèle permet de construire des dimensions non hiérarchi-ques basées sur les attributs de dimensions et cela sans perte de performance.Cette amélioration répond à notre défi n° 4 « le schéma en étoile ne permet pasde modéliser la complexité des données ».

Alors que les outils du marché privilégient encore la multiplication des data-marts, l’UDM consolide la plate-forme centrale tout en la rendant plus cohérente.Il n’existe plus qu’une seule vue analytique de l’information de l’entreprise. Leterme « unifié » du modèle UDM (Unified Dimensional Model) prend tout son sens.

4.3.3 Les perspectives

La conséquence de ce qui précède entraîne une plus grande complexité du modèlemultidimensionnel. Si tous les indicateurs de l’entreprise se retrouvent mainte-nant dans un unique modèle, il va falloir offrir aux utilisateurs un moyen declarifier leurs recherches. D’où la notion de « perspectives » permettant des obser-vations dans le cube en fonction du métier et du département de l’utilisateur.L’enjeu consiste donc à cacher des mesures qui ne sont pas pertinentes à l’analyse.

Page 109: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 4. Entrepôt de données et analyse décisionnelle 98

4.3.4 Le cache proactif

Maintenant que nous avons maîtrisé le modèle d’analyse, le rendant adapté auxdifférents groupes de travail, il s’agit de maîtriser le processus d’alimentation ducube et en particulier de définir la cadence de rafraîchissement des données enprovenance des sources opérationnelles. Le cache proactif permet de définir lafréquence de mise à jour des données, soit en fonction du temps (plusieurs foispar heure) soit en fonction d’événements notifiés par la base opérationnelle.(exemple : la mise à jour du contrat d’un client entraîne une répercussion immé-diate dans le cube et donc sa mise à jour). Cela répond au défi n° 5 : « les sys-tèmes BI actuels ne permettent pas le rafraîchissement de données OLAP entemps réel ». Dans la pratique les données intermédiaires sont stockées dans unespace mémoire temporaire (cache proactif) grâce à Notification Services puisappliquées définitivement lors du traitement complet du cube.

4.4 LES AMÉLIORATIONS APPORTÉES AVEC SQL SERVER 2005 SP1

Le Service Pack 1 (SP1) de Microsoft SQL Server 2005 intègre de nouvellesfonctionnalités comme la mise en miroir des bases de données (database mirro-ring) ou encore SQL Server Reporting Services (SSRS) ainsi qu’un nouvel outild’administration pour SQL Server Management Studio Express. Le SP1 offreégalement des mises à jour de SQL Server 2005 Express Édition à destinationdes éditeurs de logiciels indépendants qui désirent tirer parti de fonctionnalitésinnovantes.

4.4.1 La mise en miroir des bases de données

Cette nouvelle fonctionnalité complète les fonctions existantes de SQL Server2005 afin d’assurer une disponibilité totale des données, comme le cluster debasculement, les clichés instantanés de bases de données, l’isolation de ces der-niers ou l’envoi de journaux de transactions.

De nouvelles fonctionnalités intégrées à SQL Server 2005 Express Édition

Le SP1 étend les possibilités des petites entreprises et des éditeurs de logicielsindépendants qui utilisent la version gratuite SQL Server 2005 Express Edition.Cette dernière intègre désormais la fonction SQL Server Reporting Services(SSRS), la recherche de texte intégral, et également le nouvel outil, SQL ServerManagement Studio Express.

Page 110: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

4.5 Les services de notification ————————————————————————————————————————————————————————————— 99

4.4.2 Une création facilitée de rapports sous SAP NetWeaver business intelligence

Afin d’offrir une vision complète de l’activité de l’entreprise via la générationde rapports sur SAP NetWeaver business intelligence, le SP1 apporte des com-pléments à l’outil SSRS. Il s’appuie sur deux nouveaux composants : un fournis-seur de données Microsoft.NET pour SAP NetWeaver business intelligence etun nouveau concepteur de requêtes MDX. Cette nouvelle fonctionnalité étendles bénéfices de la génération de rapports d’entreprise sous SQL Server, en per-mettant aux clients SAP de créer et gérer des rapports à partir d’informationsrésidant dans un entrepôt de données SAP BW.

4.5 LES SERVICES DE NOTIFICATION

SQL Server 2005 a introduit le concept de notification d’événements program-més. Le service de notification offre au développeur une plate-forme permettantd’avertir l’utilisateur lorsque des événements particuliers sont repérés dans leSGBD. L’alerte peut être donnée au moyen de dispositifs variés tels que plate-formes mobiles, organiseurs personnels (PDA), téléphones cellulaires ou toutautre dispositif.

Voici quelques exemples qui entrent dans le champ d’action de NotificationServices. :

• alerter lorsque l’ouvrage Harry Potter atteint le seuil de rupture de stocket déclencher une nouvelle commande;

• prévenir lorsque le tableau Excel que je partage avec des collègues a faitl’objet de modification;

• être informé lorsque mon compte bancaire est à découvert;

• être informé lorsqu’une valeur boursière a atteint telle limite;

• avertir le chef de production lorsqu’une pièce fabriquée est défectueuse;

• avertir le client sans délai lorsque tel article est à nouveau disponible enstock.

Notification Services est utile chaque fois qu’un utilisateur désire s’abonnerà un service de réception automatique de documents ou lorsque des événementsse produisent sur tel ou tel critère. On parlera de souscription d’abonnementspilotés par les données.

Page 111: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server
Page 112: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5Introduction

à Integration Services

Quel que soit le projet de business intelligence, le processus d’ETL a pour seul butde fournir de solides fondations au référentiel de données et aux fonctions de repor-ting et d’analyse. Nous pensons que la phase d’ETL doit être menée avec une vigi-lance toute particulière car elle conditionne la qualité de la chaîne décisionnelle.

Ce chapitre a pour objectif de présenter les différents composants d’Integra-tion Services associé à business intelligence Development Studio. Nous intro-duirons différents concepts tels que les flux de contrôle et les flux de données. Nousprésenterons les nombreux outils et assistants dont la vocation est de simplifierle travail de programmation ou d’administration des techniciens de la businessintelligence. Afin d’illustrer SSIS, nous procéderons à la génération automatiqued’un lot visant à alimenter une table de dimension dans l’entrepôt de données.Nous présenterons les différentes tâches qui ont été créées automatiquement etdécouvrirons leur contenu avant de créer un lot de toutes pièces.

Nous donnerons également un aperçu de l’ensemble des tâches inclus dansles flux de contrôle et les flux de données.

5.1 PRÉSENTATION DE SQL SERVER INTEGRATION SERVICES (SSIS)

SSIS met à la disposition de l’administrateur de base de données et du déve-loppeur un ensemble d’outils permettant de résoudre, quasiment sans program-mation, des tâches qui rentrent naturellement dans le développement d’applications

Page 113: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 102

décisionnelles mais également dans tout processus de manipulation de données(figure 5.1). Les administrateurs de base de données et les développeurs avaientl’habitude de coder les tâches d’administration. Au prix d’un nouvel apprentis-sage, ils trouveront dorénavant des outils d’amélioration de leur productivité.

Integration Services (SSIS) est le successeur de DTS (Data TransformationServices) inclus dans la version SQL Server 2000. Integration services a été entiè-rement réécrit. Il reprend bien sûr les fonctionnalités de DTS et apporte un cor-tège de nouveautés fort appréciables des professionnels de la BI. SSIS offre unenouvelle interface graphique dont le but est d’alléger grandement le travail deprogrammation.

En annexe, nous présentons les différents profils IT gravitant autour de SSIS.Rappelons-les brièvement :

• administrateur de base de données;

• administrateur de serveur de rapports (informatique d’entreprise);

• expert en sécurité;

• administrateur d’entrepôts de données.

Bien que la fonction principale d’un ETL réside dans l’alimentation du data-warehouse, SSIS fournit de nombreux outils visant à automatiser un grand nom-

Figure 5.1 — Positionnement de Integration Services dans la chaîne décisionnelle

Page 114: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.1 Présentation de SQL Server Integration Services (SSIS) ————————————————————————————————————— 103

bre de tâches qui participent de près ou de loin à la construction de l’entrepôtde données.

La figure 5.2 montre le regroupement d’un grand nombre de tâches dans unmême et unique module. Cette démarche permet la modularité de tâches com-plexes et en même temps leur centralisation dans un même processus. On peutsynthétiser les améliorations de SSIS par rapport à DTS comme suit :

• l’intégration des données et la création de l’entrepôt sont réalisées aumoyen d’une seule opération;

• la récupération, la préparation et le chargement des données s’effectuentdans un seul processus auditable ;

• la gestion de très gros volumes de données est possible.

Afin d’illustrer concrètement le domaine d’application de SSIS, nous allonspasser en revue quelques-unes des fonctionnalités.

Fusion de données à partir de bases hétérogènes

Nous l’avons déjà dit, les données d’entreprises sont généralement stockées ausein de différents silos répartis sur des plates-formes géographiquement éloignéeset dans des formats disparates (Excel, Access, Oracle, DB2, ERP propriétaire, etc.).SSIS permet d’accéder à un grand nombre de sources de données (.NET, OLEDB, ODBC, XML, fichiers plats) afin de les rendre compatibles entre elles dansleur format physique et homogènes dans leur contenu.

Figure 5.2 — Le cycle Integration Services (source Microsoft)

Page 115: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 104

Ce processus est pris en charge par le mécanisme des flux de données. Cedernier utilise trois types de composants : sources des flux de données, transfor-mation des flux de données, destination des flux de données.

Alimentation des entrepôts de données et datamart

Par nature, un ETL est chargé d’extraire des données, de les transformer et deles charger dans un entrepôt métier également appelé datamart. SSIS n’échappepas à cette règle. Ces tâches répétitives et parfois complexes, doivent être consi-gnées dans un enchaînement de tâches élémentaires. Chacune de ces tâches estdestiné à la manipulation des données. Quel que soit le degré de simplicité oude complexité du traitement de la donnée, celui-ci est pris en charge grâce à demultiples assistants. Ceux-ci sont regroupés au sein d’une interface graphique etrelèguent au rang des oubliettes les antiques lignes de code en C# ou VisualBasic. Rassurons immédiatement les développeurs : ils continueront à manipulerdu code SQL, des procédures stockées et pourquoi pas du code VB ou C# lorsqueles assistants auront atteint leurs limites fonctionnelles.

Les tâches d’intégration sont rassemblées dans un package ou lot. Le flux decontrôle établit l’enchaînement des tâches du package. Certaines tâches ont pourvocation d’assurer la transformation de données. On les appelle tâches de fluxde données.

Les flux de données traitent essentiellement des fonctions de transformationde données. Elles sont au minimum composées d’une source de données, d’unetransformation et d’une destination.

Figure 5.3 — Un package enchaîne différents types de tâches dans le flux de contrôle

Page 116: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.1 Présentation de SQL Server Integration Services (SSIS) ————————————————————————————————————— 105

Les tâches de SSIS peuvent également exécuter des sauvegardes de basescomplètes ou traiter des cubes et des dimensions Analysis Services. Le traitementautomatisé de bout en bout permet de maintenir une parfaite synchronisationentre les données de l’ERP, du datawarehouse et des cubes OLAP associés.

Une des grandes tâches d’un ETL est de procéder à la dénormalisation destables lors du passage du modèle opérationnel (OLTP) au modèle multidimen-sionnel (DW). L’ETL profite également de ces transformations pour introduiredes fonctions d’agrégation telles que SUM, COUNT et AVERAGE dans l’entrepôt de don-nées (DW).

Nettoyage et standardisation des données

Quelle que soit l’origine des données (OLTP, OLAP, Excel, Access, fichiers plats,etc.), elles doivent être préalablement nettoyées et standardisées. En voici quel-ques illustrations :

• Les succursales d’une même organisation utilisent des conventions et desstandards qui leur sont propres.

• Les données peuvent être acquises auprès de loueurs professionnels. Avantd’être exploitées, il est nécessaire de les standardiser et de les rendre com-patibles avec les données déjà existantes dans l’entreprise.

• Certaines données peuvent être spécifiques à des critères régionaux (formatsnumériques, date et heure). Avant de les charger, il est nécessaire de lesconvertir en un même référentiel.

Un lot SSIS peut également substituer des valeurs de champs par recherchede valeurs issues d’une table de référence (fonction lookup). SSIS dispose d’algo-rithmes de recherche exacte ou floue à des fins de substitution et de standardisa-tion. Par exemple, dans les cas d’une récupération d’adresses de prospects, la villepeut être mal orthographiée (Pari au lieu de Paris). L’algorithme de recherchefloue permet de conserver la bonne orthographe et ainsi de standardiser lesvaleurs dans le référentiel de l’entreprise. Ce même type d’algorithme permetégalement de détecter des doublons lors de l’introduction de nouvelles adresseset ainsi d’effectuer un traitement spécifique.

La transformation de données intelligentes

SSIS présente des fonctions de transformation dynamique afin de s’adapter auxdonnées auxquelles il accède. En fonction du contenu de données en entrée, SSISpermet de fusionner plusieurs lignes source en une seule ou au contraire de frac-tionner des lignes en plusieurs destinations. Il est possible également d’appliquerdifférentes fonctions d’agrégation selon les données source.

Page 117: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 106

Les conteneurs permettent de grouper certaines tâches participant à un mêmeobjectif. On attribuera à ces conteneurs des variables partagées par toutes lestâches le constituant. Les conteneurs répétitifs permettent également d’effectuerdes itérations pour chaque élément constitutif du conteneur. Par exemple, unetâche FTP transfère quotidiennement des fichiers en provenance des succursalesdans un répertoire de destination. Lorsque tous les fichiers ont été transférés etsans en connaître le nombre exact, SSIS balaie séquentiellement le contenu durépertoire, traitant les uns après les autres tous les fichiers du répertoire.

Automatisation des fonctions d’administration

SSIS permet d’automatiser des tâches d’administration telles que sauvegardes etrestaurations de bases de données. Il est également possible de copier des basesde données SQL Server ou certains objets qu’elles contiennent vers d’autres ins-tances ou d’autres bases.

Un package SSIS peut exécuter d’autres packages. Cela permet au déve-loppeur ou à l’administrateur de morceler son travail en sous-ensembles cohé-rents, et d’en assurer plus facilement la maintenance ou la réutilisation.

Un package peut utiliser une tâche de bouclage afin de scanner un certainnombre de serveurs et ainsi réaliser des fonctions similaires sur plusieurs serveurs.SSIS dispose d’un énumérateur qui passe en revue les objets SMO (SQL Mana-gement Object).

Les packages SSIS peuvent être planifiés à l’aide de l’agent SQL Server.

Synthèse de l’architecture de SSIS

Nous l’avons vu, SSIS est composé de packages ou lots. Chaque package comprendun ou plusieurs flux de contrôle. Certains flux de contrôles englobent à leur tourdes tâches de flux de données (tâche de transformation).

Le concepteur graphique de SSIS est scindé en quatre modules distincts maté-rialisés par des onglets différents visant à :

• construire le flux de contrôle qui séquence l’ensemble des tâches du package;

• construire le flux de données et les transformations élémentaires entreune source et une destination;

• mettre en œuvre un gestionnaire d’événements permettant de réagir àcertains événements lors du traitement tels que en cas d’erreur, en cas debon fonctionnement, en cas d’arrêt du lot, etc.);

• afficher le contenu et la progression de l’exécution du package, ce quifacilite le débogage.

Page 118: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.1 Présentation de SQL Server Integration Services (SSIS) ————————————————————————————————————— 107

Les enchaînements de tâches ou workflow intègrent des fonctions comme destransferts de fichiers (FTP), l’exécution d’instructions SQL, de procédures stoc-kées, l’envoi de messages par courriel. La prise en compte d’un grand nombre desources de données permet des connexions en provenance de multiples bases dedonnées. Integration Services permet d’automatiser des tâches de transforma-tion, de nettoyage, d’agrégation, de fusion et de copie de données. Des interfacesde programmation sont fournies permettant aux développeurs d’intégrer ces APIdans leurs développements.

Figure 5.4 — Schéma global des composants de SSIS

Page 119: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 108

Dans ce chapitre, vous apprendrez à utiliser SSIS pour créer un lot dont lafinalité sera de récupérer des données en provenance de Access et Excel, puisd’insérer ces données dans une table de dimension de l’entrepôt de données.

Structure d’un package SSIS

Business intelligence Development Studio (BIDS) est une interface convivialevisant à construire des packages Integration Services.

Lorsque nous utilisons BIDS, plusieurs onglets sont à notre disposition.

L’onglet Flux de contrôleIl permet :

• de créer des conteneurs qui définissent des flux de travail répétitifs;

• de subdiviser des tâches en sous-ensembles cohérents;

• de créer des tâches de flux de données;

• de préparer les données;

• de créer des scripts;

• d’ordonner les flux en appliquant des contraintes de précédence.

Figure 5.5 — L’onglet Flux de contrôle et le gestionnaire de connexions

Page 120: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.1 Présentation de SQL Server Integration Services (SSIS) ————————————————————————————————————— 109

La figure 5.9 présente les éléments du flux de contrôle.

L’onglet Flux de donnéesIl permet :

• d’ajouter une ou plusieurs sources de données;

• d’ajouter des gestionnaires de connexion;

• de créer des transformations afin de répondre aux besoins métier;

• d’ajouter une ou plusieurs destinations telles que des tables ou bases dedonnées;

• de détecter des erreurs lors des transformations et de traiter les excep-tions.

L’onglet Gestionnaire d’événementsIl permet :

• traiter les événements qui se déclenchent lors du traitement du package(exemple : envoyer un message électronique lors de l’échec ou à l’achève-ment d’un package);

• traiter les événements pour tous les types de tâches du package.

La figure 5.7 montre l’interception de l’erreur lors de l’exécution du package,et l’envoi d’un courriel d’information.

Figure 5.6 — L’onglet flux de données

Page 121: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 110

L’onglet Explorateur de PackageIl permet :

• de fournir un aperçu du package;

• de lister les exécutables;

Figure 5.7 — Le gestionnaire d’événements permet de déclencher des tâches en cas d’erreur (ou autres événements)

Figure 5.8 — L’onglet présentant l’explorateur des objets contenus dans un package

Page 122: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.1 Présentation de SQL Server Integration Services (SSIS) ————————————————————————————————————— 111

Figure 5.9 — Liste des outils mis à disposition de l’administrateur pour le flux de contrôle

Figure 5.10 — Liste des tâches disponibles

dans DTS 2000

Page 123: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 112

• de lister les contraintes de précédence qui relient les tâches;

• de lister le gestionnaire d’événements;

• de lister le gestionnaire de connexions.

À titre de comparaison, l’interface DTS de SQL Server 2000 présentant lestâches est donnée figure 5.10.

5.2 MIGRER UN PACKAGE DTS 2000

Les packages définis dans SQL Server 2000 peuvent être récupérés dans SSISselon trois stratégies :

• Migrer les packages DTS au format SQL Server 2005. Cette migrationn’est possible que si les lots DTS 2000 n’utilisent que des fonctionnalitésayant un équivalent dans SSIS 2005. Si lors de la migration l’assistantdétecte des erreurs, il convient alors d’utiliser une des deux stratégies sui-vantes.

Figure 5.11 — Liste des connecteurs standard disponibles dans DTS 2000

Page 124: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.3 Migrer une base SQL Server 2000 vers SQL Server 2005 ——————————————————————————————————— 113

• Exécuter les lots DTS en utilisant le runtime DTS de SQL Server 2000.

• Intégrer ou encapsuler les lots DTS dans une solution SSIS 2005.

Ces assistants sont disponibles dans les versions SQL Server 2005 Standard,Enterprise ou Developer.

L’assistant de migration est intégré à SSIS. Projet puis Migrer un packageDTS 2000.

Le site msdn de Microsoft recense les problèmes connus liés à la migration despackages 2000 vers 2005 (http://msdn2.microsoft.com/fr-fr/library/ms143462.aspx).

5.3 MIGRER UNE BASE SQL SERVER 2000 VERS SQL SERVER 2005

Le processus de migration d’une base de données SQL Server 2000 vers 2005 peutêtre réalisé grâce à une sauvegarde de la version 2000 (exemple Northwind.bak).

Dans Management Studio 2005, procéder à la création de la base NorthWind.

La restauration de la base SQL 2000 vers SQL Server 2005 nécessite d’établirla compatibilité descendante vers SQL Server 2000 lors de la création de la basedans SQL Server Management Studio 2005.

Figure 5.12 — Assurer un niveau de compatibilité SQL Server 2000

Page 125: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 114

Le processus de restauration se déroule selon les étapes suivantes :

• Spécifier l’emplacement de la sauvegarde.

• Dans les options, cocher la case Remplacer la base existante.

• La restauration s’effectue normalement.

• Après la restauration, passer le niveau de compatibilité à SQL Server 2005afin de bénéficier des fonctionnalités avancées.

Nous verrons dans le paragraphe suivant que SSIS dispose également d’unefonction permettant d’effectuer le transfert de base du format SQL 2000 versSQL 2005.

5.4 TÂCHES D’INTÉGRATION SERVICES

Tâches des éléments de flux de contrôle

La boîte à outils de flux de contrôle recense l’ensemble des tâches du plan demaintenance et de flux permettant d’enchaîner des processus de traitement dedonnées.

Conteneur de boucle ForeachLe conteneur de boucle Foreach exécute un ensemble de tâches autant de foisqu’il y a d’éléments dans la collection qui les contient.

Plusieurs types de collections peuvent être utilisés :

• fichiers présents dans un répertoire et répondant à un critère particulier;

• chaque ligne d’un recordset ADO ou ADO.NET dataset;

• chaque ligne de toutes les tables d’un dataset ADO.Net;

• chaque table d’un dataset ADO.Net;

• chaque élément d’une variable qui comporte une collection d’objets;

• chaque nœud d’une liste XML;

• chaque objet d’une collection SMO.

Dans la figure 5.13, la tâche « Create tables » est incluse dans la boucle quiporte le nom « Run SQL Statements ». Cette tâche sera donc répétée.

La liste des fichiers dans le conteneur de type répertoire est donnée figure 5.14.

Page 126: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.4 Tâches d’intégration services ——————————————————————————————————————————————————————————— 115

Pour information voici le contenu du fichier portant le nom CreateProspect-TableTerr1.SQL.

/* Creates the Territory table*/IF NOT EXISTS (SELECT * FROM AdventureWorks.sys.tables WHERE type = ‘U’and name = ‘Territory1’)

CREATE TABLE AdventureWorks.dbo.Territory1 ([CustomerKey] [int] IDENTITY (1, 1) NOT NULL,FirstName nvarchar (15),MiddleInitial nchar (1),LastName nvarchar (20),BirthDate datetime,MaritalStatus nchar (5),Gender nchar (1),Salutation nvarchar (10),EmailAddress nvarchar (100),YearlyIncome int,TotalChildren tinyint,NumberOfChildrenAtHome tinyint,Education nvarchar(40),Occupation nvarchar(30),

Figure 5.13 — Boucle exécutant des commandes SQL de création de table

Figure 5.14 — Liste de fichiers dans un conteneur de type répertoire

Page 127: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 116

HomeOwner nchar (3),NumberCars tinyint,AddressLine1 nvarchar (50),City nvarchar (30),State nchar (3),PostalCode nvarchar (10),Phone nvarchar (20),Territory int

)ELSE TRUNCATE TABLE AdventureWorks.dbo.Territory1

La figure 5.15 montre une collection d’une collection d’objets constitués desfichiers contenus dans un répertoire donné. La boucle ForEach balaie le répertoireà la recherche de fichiers dont l’extension est .SQL.

À chaque boucle, le nom de fichier est transmis à la variable utilisateur vFile-Name.

Le gestionnaire de connexion CreateTableSQL transmet le nom de fichier à latâche « Create Tables ».

À chaque boucle, la variable @[User::vFileName] reçoit le nom du fichier etmodifie dynamiquement la connexion.

La tâche d’exécution SQL puise sa requête dans le fichier source grâce augestionnaire de connexion CreateTableSQL.

Figure 5.15 — L’éditeur de boucle Foreach

Page 128: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.4 Tâches d’intégration services ——————————————————————————————————————————————————————————— 117

Figure 5.16 — Variable utilisateur

dans l’éditeur de boucle

Figure 5.17 — Propriété de la connexion CreateTableSQL

Page 129: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 118

Conteneur de boucle ForLe conteneur de boucles For définit un flux de contrôle répétitif dans un package.La mise en œuvre de la boucle est similaire à la structure de bouclage For… Nextdes langages de programmation. Lors de chaque répétition de la boucle, le conte-neur de boucles For évalue une expression et répète son flux de travail jusqu’àce que l’expression renvoie la valeur False.

Conteneur de séquencesLe conteneur de séquences regroupe un sous-ensemble de tâches pour mieuxstructurer le package. Il offre l’avantage de pouvoir être désactivé, ce qui a pourconséquence de désactiver toutes les tâches qui le composent. Cette fonction-nalité est particulièrement intéressante en phase de débogage. Il est possible éga-lement de définir des propriétés sur le conteneur plutôt que sur chacune destâches qui le composent.

Figure 5.18 — L’éditeur de tâche d’exécution d’une commande SQL

Figure 5.19 — boucle For

Page 130: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.4 Tâches d’intégration services ——————————————————————————————————————————————————————————— 119

Tâche DDL d’exécution SQL Server AnalysisLa tâche DDL d’exécution de Analysis Services exécute des instructions qui peu-vent créer, modifier ou supprimer des cubes multidimensionnels et des dimen-sions. La tâche DDL utilise un gestionnaire de connexion Analysis Services.

Tâche de flux de donnéesCette tâche permet de copier des données entre des sources et des destinationstout en offrant la possibilité de transformer, nettoyer et modifier les données. Latâche de flux de données représente le conteneur dont le détail des tâches estfourni dans l’onglet « Flux de données ».

• les sources précisent les connecteurs vers les sources de données (fichiersplats, tables ou vues SQL);

• les transformations modifient les données;

• les destinations chargent les données.

Lors de l’exécution, la tâche crée un plan d’exécution à partir du flux de don-nées. Le moteur de flux de données exécute le plan.

Cette tâche exécute des requêtes basées sur des modèles prédictifs intégrés àAnalysis Services. Par exemple, lors du chargement de données dans une base,une telle requête peut prédire si un nouveau prospect est susceptible d’acheterou non tel ou tel article et d’isoler les cas dans des tables intermédiaires. Larequête est une instruction DMX (Data Mining Extensions).

Source

Transformation

Transformation

Destination

Figure 5.20 – La tâche de flux de données alimente une destination (table SQL Server, fichier plat, etc.) à partir des données sourcesTâche de requête d’exploration de données

Page 131: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 120

Tâche de scriptCette tâche permet au programmeur de réaliser des fonctions non disponiblesdans les tâches intégrées de SSIS.

Le code ci-dessous permet de vérifier la cohérence des données entre unetable de faits (FactFinance) et une table de dimension (DimActivity) sur un ser-veur SQL 2000 (Provider=SQLOLEDB.1).

Const DB_CONNECT_STRING = "Provider=SQLOLEDB.1;Data Source=Monserveur\sql2000; Initial Catalog=Pubs;user id = ‘sa’;password=‘sa’"

Dim OK_or_KO

‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘

‘Name : Function ExecuteSQL‘Auteur B. Burquier‘Objectif : Executes a SQL statement‘Retour ADO Recordset

Function Main()Call Process_Control()If OK_or_KO = "OK" then

Main = DTSTaskExecResult_SuccessElse ‘erreur

Main = DTSTaskExecResult_FAilureEnd if

End Function

Figure 5.21 — La tâche de script ActiveX envoie un message en cas d’erreur (incohérence entre les deux tables)

Page 132: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.4 Tâches d’intégration services ——————————————————————————————————————————————————————————— 121

Sub Process_Control()

Dim rstResult

‘Requete de non correspondance

StrQuery = "SELECT FactFinance.CompanyId, FactFinance.AccountId, FactFinance.ActivityId, FactFinance.CurrencyId, FactFinance.Projec-tId, FactFinance.TimeId, FactFinance.AppealId, FactFinance.Scena-rioId, FactFinance.DataCHF, FactFinance.DataLocalCurr, FactFinance.LineDescription FROM FactFinance LEFT JOIN DimActivity ON FactFinance.ActivityId = DimActivity.ActivityId WHERE DimActi-vity.ActivityId Is Null"

‘Get the ADO RecordsetSet rstResult = ExecuteSQL(strQuery)‘If the Recordset is not empty then proceedIf Not (rstResult.Eof and rstResult.Bof) Then ‘non vide

Msgbox "Non vide = failure"OK_or_KO = "KO"

Else ‘videMsgBox "vide = Success"OK_or_KO = "OK"

End If‘Clean up variables

Set rstResult = NothingEnd Sub

‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘Name : Function ExecuteSQL‘Author : B Burquier‘Purpose : Executes a SQL statement‘Return ADO Recordset

‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘

Function ExecuteSQL(mySQLCmdText)‘ instantiate the ADO objectsDim myConnDim myRecordset

set myConn = CreateObject("ADODB.Connection")set myRecordset = CreateObject("ADODB.Recordset")

‘ set the connection properties to point to the database using the constantmyConn.Open = DB_CONNECT_STRINGmyRecordset.Open mySQLCmdText, myConn

Set ExecuteSQL = myRecordsetEnd Function

Page 133: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 122

Tâche de service WebCette tâche permet d’exécuter une méthode de service web. Elle récupère dansune variable ou un fichier, des valeurs renvoyées par la méthode de service Web.Le gestionnaire de connexions HTTP permet de pointer vers un site web ou unfichier WSDL (Web Service Description Langage). Exemple : http: / /MyServer /MyWebService/MyPage.asmx?WSDL

Tâche de système de fichiersCette tâche effectue des opérations sur les fichiers et les répertoires. Il est possiblede copier un répertoire et son contenu, de déplacer des fichiers, d’en modifierles attributs, etc. Le gestionnaire de connexion permet de choisir le serveur surlequel effectuer les opérations. Les tâches de système sur les fichiers et répertoiressont les suivantes :

• copier un répertoire;

• copier un fichier;

• créer un répertoire;

• supprimer un répertoire;

• supprimer le contenu d’un répertoire;

• supprimer un fichier;

• déplacer un répertoire;

• déplacer un fichier;

• renommer un fichier;

• définir des attributs des fichiers ou des répertoires.

Tâche de traitement Analysis ServicesCette tâche permet de traiter les objets Analysis Services (cubes, dimensions,modèles de data mining).

Tâche de transfert de base de donnéesCette tâche permet de copier des bases SQL entre des instances SQL Server2000 et/ou SQL Server 2005. Toutes les combinaisons sont possibles.

Tâche de transfert de connexionsCette tâche permet de transférer une ou plusieurs connexions entre différentesinstances de SQL Server (figure 5.22).

Tâche de transfert de messages d’erreurElle transfère des messages d’erreur entre plusieurs instances de SQL Server etpermet de gérer les cas de doublons de messages d’erreur.

Page 134: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.4 Tâches d’intégration services ——————————————————————————————————————————————————————————— 123

Tâche de transfert de procédures stockéesLa tâche de transfert de procédures stockées de master transfère une ou plusieursprocédures stockées définies par l’utilisateur entre les bases de données mastersur des instances de SQL Server. Pour transférer une procédure stockée à partirde la base de données master, le propriétaire de la procédure doit être dbo.

Tâche de transfert d’objets SQL ServerLa tâche de transfert d’objets SQL Server transfère un ou plusieurs types d’objetsd’une base de données SQL Server entre des instances de SQL Server. Il estpossible de transférer des tables, des procédures stockées, des fonctions et typesde données définis par les utilisateurs entre des versions 2000 et 2005.

Les rôles de serveur, les rôles et les utilisateurs de la base de données spécifiéepeuvent être copiés, ainsi que les autorisations pour les objets transférés.

Certaines fonctions sont réservées à SQL Server 2005 (partitions, schémas,assemblies, agrégations, schéma XML).

Tâche d’exécution de packageCette tâche étend les fonctionnalités d’entreprise de SSIS en permettant à despackages d’en exécuter d’autres au sein d’un flux de travail. Un package qui enexécute d’autres est généralement appelé « package parent », tandis que les pac-kages exécutés par un flux de travail parent sont appelés « packages enfants ».

Tâche d’exécution de package DTS 2000La tâche d’exécution de package DTS 2000 exécute les lots développés à l’aidede DTS 2000. Cette tâche permet d’exécuter des packages DTS SQL Server 2000dans les solutions de transformation de données SQL Server 2005.

Figure 5.22 — Formulaire de sélection des connexions à transférer entre deux instances de SQL Server

Page 135: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 124

Tâche d’exécution de processusCette tâche exécute une application (Word, Access, Excel, etc.) ou un fichierde commandes dans le cadre d’un flux de travail. Elle permet par exemple dedémarrer une application VisualBasic ou une macro Access chargée de générerquotidiennement un rapport sur les ventes.

Tâche d’exécution de requêtes SQLCette tâche exécute des instructions ou des procédures stockées. La tâche peutcontenir une seule ou plusieurs instructions SQL s’exécutant de façon séquentielle.

Exemple : code SQL de création de clé primaire.

IF NOT EXISTS (SELECT * FROM AdventureWorks.sys.tables WHERE type = ‘U’and name = ‘Lineage_Fact_Table’)CREATE TABLE dbo.Lineage_Fact_Table(

[Column 0] NVARCHAR(50),[Column 1] NVARCHAR(50),[Column 2] NVARCHAR(50),[Column 3] NVARCHAR(50),[Column 4] NVARCHAR(50),[Column 5] NVARCHAR(50),[Column 6] NVARCHAR(50),[Column 7] NVARCHAR(50),[File Name] NVARCHAR(260),[User Name] NVARCHAR(70),[Execution Start Time] DATETIME

)ELSETRUNCATE TABLE AdventureWorks.dbo.Lineage_Fact_Table

Figure 5.23 — Exécution

d’un processus de décompression d’un fichier zippé

(expand.exe)

Page 136: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.4 Tâches d’intégration services ——————————————————————————————————————————————————————————— 125

Tâche d’insertion en blocIl s’agit d’un moyen très rapide de copier de gros volumes de données dans unetable ou une vue SQL Server. Pour des raisons de performance, cette tâche nepermet pas d’effectuer des transformations de données lors du chargement. Latâche d’insertion en bloc ne peut transférer des données que depuis un fichiertexte vers une table ou une vue SQL Server. Si la table ou la vue de destinationcontient déjà des données, les nouvelles données sont ajoutées à la table exis-tante. Si vous souhaitez remplacer les données, utilisez une tâche d’exécution SQLDELETE ou TRUNCATE avant de lancer la tâche d’insertion en bloc.

Tâche Envoyer un message

Figure 5.24 — Formulaire permettant de configurer les propriétés pour l’envoi d’un message électronique

Figure 5.25 — Formulaire de préparation de connexion SMTP

Page 137: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 126

Elle permet à un package d’envoyer des messages en cas de réussite ou d’échecdes tâches du flux de travail, ou d’envoyer des messages en réponse à un événe-ment déclenché par le package au moment de l’exécution. Par exemple, la tâchepeut notifier à un administrateur de base de données la réussite ou l’échec de latâche de sauvegarde de base de données ou de l’import de données.

Tâche FTPCette tâche permet de télécharger des fichiers de données entre serveurs. Par exem-ple, elle peut récupérer quotidiennement tous les fichiers des ventes des succur-sales sur un serveur central exécutant la consolidation dans le datawarehouse.

Tâche Lecteur de données WMIWMI (Windows Management Instrumentation) permet d’occulter la complexitéliée à l’environnement du système. Le schéma CIM (Common Information Model)résulte de la norme DMTF. Il présente une vue cohérente et unifiée des différentstypes d’objets logiques et physiques contenus dans l’environnement tels des com-posants de logiciel, des services, des imprimantes. Les utilisateurs des servicesWMI souscrivent à des événements choisis et reçoivent des alertes lorsque desévénements se réalisent.

La tâche Lecteur de données WMI exécute des requêtes au moyen du langagede requête WMI. Il est possible d’interroger les journaux des événements Win-dows sur un serveur distant puis d’écrire les informations dans un fichier à desfins d’analyse.

Tâche MSMQLa tâche MSMQ (Microsoft Message Queuing) permet d’envoyer et recevoir desmessages entre différents packages Integration Services ou d’envoyer des messa-ges à une file d’attente traitée par une application personnalisée. Par exemple,la tâche peut mettre en file d’attente les messages destinés aux ordinateurs por-tables hors connexion des représentants commerciaux.

Tâche de Transfert de travauxElle transfère un ou plusieurs travaux d’agent SQL Server entre des instances deSQL Server.

Tâche observateur d’événements WMICette tâche permet d’observer les événements WMI (Windows Management Ins-trumentation) à l’aide d’une requête d’événement WQL (Management Instrumen-tation Query Language) pour spécifier les événements dignes d’intérêt.

Il est ainsi possible d’utiliser l’observateur d’événements WMI afin d’attendrela notification signalant que des fichiers sont ajoutés à un dossier lors d’un trans-fert FTP, puis de démarrer le traitement au signal de fin de transfert.

Page 138: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.4 Tâches d’intégration services ——————————————————————————————————————————————————————————— 127

Tâche XMLLa tâche XML est utilisée pour travailler avec des données XML. Il est possiblede remettre en forme un document XML et de lui appliquer une feuille de styleXSLT.

Tâches du plan de maintenance

Exécuter la tâche de l’instruction T-SQLCette tâche est similaire à la tâche d’exécution SQL. Toutefois, elle ne permetpas d’exécuter des requêtes paramétrées, d’enregistrer les résultats des requêtesdans des variables ou d’utiliser des expressions de propriété. Pour cela, vous devezutiliser la tâche d’exécution SQL et non pas la tâche Exécuter l’instruction T-SQL.

Tâche de nettoyage de maintenanceLa tâche de nettoyage de maintenance supprime les fichiers résiduels résultantde l’exécution du plan de maintenance.

Tâche de nettoyage d’historiqueLa tâche de nettoyage d’historique supprime des entrées dans les tables d’histo-rique Backup et Restore de la base de données SQL Server msdb, dans l’historiquedes travaux de SQL Server Agent et du plan de maintenance.

Tâche Exécuter le travail de l’agent SQL ServerCette tâche exécute des travaux d’agent SQL Server. Il est possible d’exécuterdes travaux qui exécutent des instructions T-SQL et des scripts ActiveX, destâches de maintenance, de réplication ou d’exécution de lots SSIS.

Tâche Mettre à jour les statistiquesLa tâche Mettre à jour les statistiques permet à un package de mettre à jour lesstatistiques d’une ou plusieurs bases de données.

Figure 5.26 — Formulaire de tâche de nettoyage d’historique

Page 139: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 128

Tâche Notifier l’opérateurUn opérateur d’agent SQL Server est un alias d’une personne ou d’un groupequi peut recevoir des notifications électroniques. La tâche Notifier l’opérateurenvoie des messages de notification aux opérateurs d’Agent SQL Server. Elleutilise le service SQLiMail. Préalablement à la mise en place d’une telle tâche,un opérateur doit être défini avec une adresse courriel valide.

Figure 5.27 — Formulaire permettant de définir la tâche de mise à jour des statistiques

Figure 5.28 — Flux des processus dans SQLiMail

SQLiMail Configuration

sendmail_sp Stored Procedure

msdb

SQL script

EXECUTE sendmail_sp Service Broker

queue

Service Broker

sqlimail90.exe

mailhost

Email messages

Logs

SMTP Server

Page 140: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.5 Composants des flux de données ———————————————————————————————————————————————————————— 129

Tâche Reconstruire l’indexLa tâche Reconstruire l’index reconstruit les index dans les vues et les tables debase de données SQL Server.

Tâche Sauvegarder la base de donnéesGrâce à cette tâche, il possible d’automatiser des sauvegardes totales ou diffé-rentielles. Une ou plusieurs bases de données peuvent être sauvegardées dans desfichiers ou groupes de fichiers.

Le formulaire écran fourni par SSIS permet de générer la commande SQL quisera exécutée :

BACKUP DATABASE [AdventureWorksDW] TO DISK = N’C :\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\Bac-kup\AdventureWorksDW_backup_200609201344.bak’WITH NOFORMAT, NOINIT, NAME = N’AdventureWorksDW_backup_20060920134425’, SKIP, REWIND, NOUNLOAD, STATS = 10

Tâche Vérifier l’intégrité de la base de donnéesCette tâche contrôle l’allocation et l’intégrité de la structure de tous les objetsde la base de données spécifiée. Il est possible de vérifier plusieurs bases de don-nées et de contrôler les index des bases.

5.5 COMPOSANTS DES FLUX DE DONNÉES

SSIS offre trois types de composants de flux de données. Les sources, les trans-formations et les destinations. Dans le schéma de la figure 5.29, nous observonsque les sources puisent leurs données dans les colonnes externes en provenanced’une base de données ou d’un fichier plat en s’appuyant pour cela sur une connexionpointant vers la source de données. Le mode d’accès précise le type de source(vue, table, fichier, etc).

Les sources comportent des colonnes externes en entrée et des colonnes de sortie.

Il est possible de sélectionner les colonnes externes qui participent à la sélec-tion de sortie normale.

La sortie d’erreur d’une source contient les mêmes colonnes que la sortie nor-male plus deux colonnes supplémentaires : ErrorCode indique le code erreur etErrorColumn indique la colonne contenant l’erreur. Les colonnes de sortie devien-nent à leur tour les colonnes d’entrée du composant de transformation.

Les transformations comportent des colonnes d’entrée et des colonnes de sortie.Certaines transformations permettent de fusionner plusieurs entrées en une seulecolonne de sortie ou d’éclater une entrée en plusieurs colonnes de sortie.

Page 141: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 130

Les destinations comportent des colonnes d’entrée. Une destination écrit direc-tement dans une table de la base de données ou dans un dataset en mémoire.Des colonnes de sortie d’erreur peuvent intercepter des traitements ne pouvantaboutir, par exemple la mise à jour d’un champ de la table avec une valeur nullalors que ce champ n’autorise pas les valeurs nulles.

Sources des flux de données

Source DataReaderLa source DataReader accède à des données d’un fournisseur.NET à l’aide dugestionnaire de connexion ADO.NET. Vous devez saisir une commande SQLtelle que SELECT * FROM sales.customer. Le mappage entre les colonnes externes etles colonnes de sortie se réalise automatiquement, voir figure 5.30.

Figure 5.29 — Un flux de données est composé d’une source, d’une transformation et d’une destination

Page 142: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.5 Composants des flux de données ———————————————————————————————————————————————————————— 131

Source de fichier brutLa source de fichier brut lit des données directement dans un fichier lui-mêmegénéré par SSIS. Cette source n’utilise pas de gestionnaire de connexion.

Source de fichier plat

Figure 5.30 — Mappage

des colonnes dans le cas d’une source

DataReader

Figure 5.31 — Formulaire permettant d’établir

une connexion avec un fichier plat

Page 143: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 132

Un fichier plat peut être de format texte, avec des champs délimités par des carac-tères spéciaux, de largeur fixe, ou les deux.

Dans le formulaire de la figure 5.31, on précisera le type de séparateur de ligneet de colonnes (tabulateur, guillemet, virgule).

Le choix des paramètres régionaux permet de définir le format des donnéesselon la localisation de la source (format date anglo-saxon ou français, formatnumérique, etc.). Dans la figure 5.31, on observe une source de données au for-mat anglais (États-unis).

L’affichage des colonnes après définition des types de colonne est montréfigure 5.32.

Source Excel

La source Excel extrait des données de feuilles de calcul Excel entières ou deplages nommées. Les formats pris en compte sont Excel 3, 4, 5 et les versions 97à 2005.

Source OLE DB

La source OLE DB pointe sur des tables relationnelles. La figure 5.33 présenteles différents fournisseurs OLE DB fournis par le gestionnaire de connexion.

Figure 5.32 — Affichage des colonnes du fichier plat

Page 144: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.5 Composants des flux de données ———————————————————————————————————————————————————————— 133

Transformations du flux de données

AgrégationLa transformation d’agrégation permet de regrouper un certain nombre de lignesdu flux de données. La fonction d’agrégation effectue un regroupement grâce àla clause GROUP BY sur une ou plusieurs colonnes, puis applique une fonction d’agré-gation telle que Moyenne, Comptage, Comptage distinct, Somme, Max, Min.

AuditLa transformation d’audit permet d’ajouter des colonnes au flux de données, afind’obtenir des informations relatives à l’environnement au moment de l’exécu-tion. Les colonnes d’audit concernent l’identifiant GUID, l’identificateur dupackage, le nom ou la version du package, l’heure à laquelle le package a com-mencé, le nom de l’ordinateur et de la tâche exécutée.

Colonne dérivéeUne colonne dérivée résulte de l’application d’une fonction qui s’applique surd’autres colonnes ou variables du package. Par exemple, la colonne dérivée Nom-Complet résulte de l’expression Prénom + " " + Nom. L’expression DATEPART ("year",GETDATE()) renvoie l’année en cours.

Commande OLE DBLa transformation de commande OLE DB exécute une instruction SQL pourchaque ligne d’un flux de données. Il est ainsi possible d’exécuter une instructionSQL qui insère, met à jour ou supprime des lignes d’une table de base de données.

DELETE FROM Dimcustomer WHERE CustomerKey = ?

Figure 5.33 Liste des fournisseurs OLE DB pour les sources et destinations de données

Page 145: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 134

Dans notre exemple, le « ? » remplace la colonne externe Param_0 mappée àla colonne d’entrée CustomerKey.

Composant scriptCe composant permet d’écrire du code de script personnalisé. Le composantscript peut être utilisé en tant que source, transformation ou destination. On utilisele composant script lorsqu’il s’agit de lire un fichier dont le format n’est pas prisen charge par le gestionnaire de connexion de SSIS. Un script peut appliquerplusieurs transformations simultanées. Un script peut naturellement exécuter desfonctions personnalisées qui n’existent pas dans la bibliothèque des fonctionsfournies nativement par SSIS.

La figure 5.35 montre l’environnement de développement en visual basic.net.

Conversion de donnéesCe composant permet de convertir les données d’une colonne d’entrée en untype de données différent. La donnée convertie peut soit remplacer la colonneexistante, soit être ajoutée dans une nouvelle colonne.

Copie de colonnesCela permet de créer de nouvelles colonnes qui sont la copie de colonnes exis-tantes. Les nouvelles colonnes permettent de fournir une plus grande flexibilitédans le cadre de nouveaux calculs, de transformation ou de mapping avec descolonnes de destination.

Figure 5.34 — Sélectionner un des trois types de composant de script

Page 146: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.5 Composants des flux de données ———————————————————————————————————————————————————————— 135

Dimension à variation lenteSSIS présente un mécanisme qui permet de traiter les trois types de variationdimensionnelle. En effet, les axes dimensionnels ont tendance à évoluer dans letemps. Il s’agira par conséquent de se déterminer sur la traçabilité de la variationdes dimensions dans le temps ou bien de ne pas en tenir compte. Un client quichange de pays est toujours client de l’entreprise. Vouloir analyser le chiffred’affaires réalisé dans tel pays ou tel autre peut avoir un sens. Si c’est le cas, onparlera de variation de dimension de type 2. A contrario, la distinction relativeau changement d’adresse peut ne pas être pertinente. Dans ce cas, la nouvelleadresse du client remplacera purement et simplement l’ancienne et nous per-drons toute capacité à suivre l’évolution du client dans le temps. Il s’agit de varia-tion dimensionnelle de type 1.

Chacun de ces types de transformation de dimension à variation lente néces-site de prendre en charge quatre types de modifications :

• modification d’attribut;

• modification d’attribut d’historique;

• modification d’attribut fixe;

• modification de membre inféré.

Les modifications modification d’attribut remplacent les enregistrements exis-tants. Ce type de modification est équivalent à une modification de type 1. La

Figure 5.35 — Visual Studio for Application s’ouvre pour créer le script

Page 147: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 136

transformation de dimension à variation lente dirige ces lignes vers une sortienommée Sortie de mises à jour d’attribut de validation.

Les modifications d’attribut d’historique créent de nouveaux enregistrementsau lieu de mettre à jour les enregistrements existants. La seule modification auto-risée dans un enregistrement existant est une mise à jour d’une colonne qui indi-que si l’enregistrement est actif ou expiré. Ce type de modification qui préservel’historique équivaut à une variation de type 2. La transformation de dimensionà variation lente dirige ces lignes vers deux sorties : Sortie d’insertions d’attributd’historique et Nouvelle sortie.

Les modifications d’attribut fixe indiquent que la valeur de colonne ne doit paschanger. La transformation de dimension à variation lente détecte les modificationset peut diriger les lignes modifiées vers une sortie nommée Sortie d’attribut fixe.

Membre inféré indique que la ligne est un enregistrement de membre déduitdans la table de dimension. Un enregistrement de membre inféré est un membrede dimension inconnu. Un enregistrement de membre inféré minimal est crééen prévision des données de dimension pertinentes, qui sont fournies dans unchargement ultérieur des données de dimension. La transformation de dimensionà variation lente dirige ces lignes vers une sortie nommée Sortie de mises à jourde membre déduit.

Comment fonctionne l’assistant de création de dimension à variation lente

Sélectionnez le gestionnaire de connexions pour accéder à la source de donnéesqui contient la table de dimension à mettre à jour.

Vous pouvez effectuer une sélection dans une liste de gestionnaires deconnexions inclus dans le package.

Sélectionnez la table ou vue de dimension à mettre à jour.

Après avoir choisi le gestionnaire de connexion, vous pouvez sélectionner latable ou la vue à partir de la source de données.

Sélectionnez les attributs clés sur les colonnes et mappez les colonnes d’entréeaux colonnes de la table de dimension.

Vous devez sélectionner au moins une colonne de clé d’entreprise dans la tablede dimension et la mapper à une colonne d’entrée. D’autres colonnes d’entréepeuvent être mappées à des colonnes de la table de dimension en tant que map-pages non-clés.

Sélectionnez le type de modification pour chaque colonne :

• Modification d’attribut remplace les valeurs existantes dans les enregis-trements.

Page 148: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.5 Composants des flux de données ———————————————————————————————————————————————————————— 137

• Attribut d’historique crée des enregistrements au lieu de mettre à jour desenregistrements existants.

• Attribut fixe indique que la valeur de colonne ne doit pas changer.

Si vous configurez des colonnes de façon à utiliser le type de modificationAttribut d’historique, vous devez choisir comment effectuer la distinction entreles enregistrements actifs et expirés. Vous pouvez utiliser une colonne d’indica-teurs de lignes actives ou deux colonnes de date pour identifier les lignes activeset expirées. Si vous utilisez la colonne d’indicateurs de lignes actives, vous pouvez

Figure 5.36 — La Clé d’entreprise présente la clé invariante de la table dimensionnelle

Figure 5.37 — L’assistant présente les trois types d’attribut de dimension

Page 149: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 138

lui affecter les valeurs Current et True pour les lignes actives et Expired et Falsepour les lignes expirées. Vous pouvez également entrer des valeurs personnali-sées. Si vous utilisez deux colonnes de date, une de début et une de fin, vouspouvez spécifier la date à utiliser lors de la définition des valeurs de colonnes dedate en tapant une date ou en sélectionnant une variable système et en utilisantsa valeur.

Dans l’exemple ci-dessus les enregistrements expirés continent une date dedébut et une date de fin. Les enregistrements actifs contiennent uniquement unedate de début. Ci-dessus, la variable système Creationdate sert à alimenter les datesde début et fin.

Spécifiez si nécessaire la prise en charge des membres inférés et sélectionnezles colonnes que l’enregistrement de membre inféré contient.

Lors du chargement de mesures dans une table de faits, vous pouvez créer desenregistrements minimaux pour les membres inférés qui n’existent pas encore.Lorsque, par la suite, des données significatives seront disponibles, les enregis-trements de dimension pourront être mis à jour. Il est possible de créer les typesd’enregistrements minimaux suivants :

• un enregistrement dans lequel toutes les colonnes avec des types de modi-fication sont nulles;

• un enregistrement dans lequel une colonne booléenne indique que l’enre-gistrement est un membre inféré.

Examinez les configurations créées par l’assistant Dimension à variation lente.En fonction des types de modifications pris en charge, différents ensembles decomposants de flux de données sont ajoutés au package.

Figure 5.38 — L’assistant permet de paramétrer les options d’attribut d’historique

Page 150: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.5 Composants des flux de données ———————————————————————————————————————————————————————— 139

La figure 5.40 illustre un exemple de flux de données qui prend en charge lesmodifications d’attributs fixes, d’attributs variables et d’attributs d’historique, etles modifications d’enregistrements correspondants.

1. Dans la cas de la conservation des attributs historiques (branche de droite) :

• la colonne dérivée Sales_Person_SCD_End_Date prend la valeur de ladate de création @[System::CreationDate].

Figure 5.39 — Un enregistrement de membre inféré est un membre de dimension inconnu

Figure 5.40 — SSIS génère automatiquement les tâches nécessaires à la création de dimensions à variation lente par insertion

d’attribut d’historique, par nouvelle sortie

Page 151: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 140

• La Transformation OLE DB permet de mettre à jour la date de finSales_Person_SCD End_Date en fonction de la clé invariante [Sales_Per-son_SCD_Original_ID] selon la commande SQL :

UPDATE [MaxMinSalesDM].[Sales_Person] SET [Sales_Person_SCD_End_Date] = ? WHERE [Sales_Person_SCD_Original_ID] = ? AND [Sales_Person_SCD_End_Date] IS NULL

2. Dans tous les cas :

• la Transformation unir tout permet de fusionner les deux sources (sourcede lignes en ajout pur et simple et lignes en modification + ajout.

• La Transformation colonne dérivée 1 permet d’attribuer la date de créa-tion au champ date de début : Sales_Person_SCD_Start_Date. Ce champprend la valeur de la date de création : @[System::CreationDate].

• La transformation finale permet d’insérer dans la table de destination unnouvel enregistrement composé de la clé invariante Sales_Person_SCD_Ori-ginal_ID de la date de début Sales_Person_SCD_Start_Date et enfin dunom du représentant Sales_Person_Name.

Échantillonnage de ligneIl permet de sélectionner un sous-ensemble des données sources de manière aléa-toire. L’échantillonnage est basé sur un nombre de ligne à extraire.

Échantillonnage du pourcentageIl permet de sélectionner un sous-ensemble des données sources de manière aléa-toire. L’échantillonnage est basé sur un nombre de ligne correspondant à unpourcentage du flux d’origine.

Importation de colonneImporte les données de fichiers vers les lignes d’un dataset. Il est possible despécifier les colonnes de données à extraire puis de sélectionner ligne à ligne lefichier de destination.

Jointure de fusionElle établit une fusion entre des données en provenance de deux flux de données.Cela équivaut à effectuer une jointure entre deux tables. Ainsi, par exemple,une table Produits peut être jointe à une table Catégorie de produit par une cléétrangère (CatProd) permettant d’établir la jointure entre les deux tables. Il estpossible d’établir des jointures FULL, LEFT, INNER. Les colonnes qui établis-sent la jointure doivent être de type compatible. Les deux tables doivent êtretriées préalablement sur le champ permettant la jointure.

Page 152: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.5 Composants des flux de données ———————————————————————————————————————————————————————— 141

MultidiffusionLa transformation de multidiffusion dirige sa sortie vers une ou plusieurs sorties.Chaque ligne d’entrée dirige ses données vers chaque sortie.

Nombre de lignesCette transformation détermine le nombre de lignes dans le flux de données. Lecompteur est ensuite stocké dans une variable du package. La variable peutensuite être récupérée afin de modifier le flux de contrôle ou le flux de données.

RechercheCette transformation exécute une requête dans un ensemble de référence (table,vue). Le paramètre d’extraction est fourni par une colonne du flux d’entrée. Latable de référence renvoie un ou plusieurs champs en retour.

Recherche de termeOn recherche les occurrences d’un ensemble de mots ou de phrases dans un fluxde données comportant du texte libre. Le résultat de cette transformation est unensemble de lignes précisant le comptage d’occurrences trouvées et le terme dela table de référence.

Recherche floueLa transformation de recherche floue permet d’effectuer des tâches de nettoyagedans le but de corriger, puis de standardiser les données. L’algorithme de recher-che floue permet également de fournir des données manquantes. Cette transfor-mation présente un fort intérêt lorsque les données en entrée ont fait l’objetd’une saisie libre et n’ont pas été contrôlées à la source.

Regroupement probableLa transformation de regroupement probable identifie des lignes de données sus-ceptibles d’être des doublons. Une correspondance exacte garantit que seules lescolonnes possédant des valeurs identiques dans cette colonne seront regroupées.Une correspondance approximative regroupe des lignes ayant des donnéesapprochantes. C’est l’utilisateur qui définit le score de similarité basé sur unenotion de distance entre deux chaînes de caractères. Paris et Pari ont une dis-tance de 1 car un seul caractère sépare les deux mots. Idem pour Cathy et Kathy.En revanche Kathy et Kathryn ont une distance de 2.

Requête d’exploration de donnéesUne requête d’exploration de données utilise un modèle de data mining afin deréaliser des prédictions sur chaque ligne du flux de données. C’est ainsi par exem-ple qu’il est possible de prédire si un client sera un bon candidat pour l’achat detel produit. L’algorithme de prédiction se base sur des requêtes DMX (Data MiningExtension).

Page 153: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 142

Supprimer le tableau croisé dynamique (transformation Unpivot)Une fonction Unpivot transforme un flux de données dénormalisé, en un fluxnormalisé.

Figure 5.41 — Exemple de flux dénormalisé

Voici le data set après transformation.

Figure 5.42 — Flux normalisé

Tableau croisé dynamique (transformation Pivot)Une fonction Pivot (à l’inverse de Unpivot) transforme un flux de données nor-malisé en un flux dénormalisé (exemple inverse du précédent).

Table de caractèresLa transformation de table de caractères permet d’effectuer des conversions surdes colonnes de type chaîne de caractères. Il est possible de convertir des chaînesen minuscules ou majuscules, d’inverser l’ordre des caractères.

TriCette fonction trie les données d’entrée dans l’ordre croissant ou décroissant etcopie les données triées dans la sortie. Plusieurs imbrications de tri sont possibleset pour chaque colonne triée, il est possible de préciser l’ordre ascendant ou des-cendant.

ClientID Tél. Domicile Tél. Travail Tél. Mobile Fax

1234 04 50 60 01 02 01 69 30 03 04 06 80 47 13 15

2345 05 06 07 08 09 05 07 08 09 10 05 07 08 09 11

Client ID Type de tel N° de ligne

1234 Domicile 04 50 60 01 02

1234 Travail 01 69 30 03 04

1234 Mobile 06 80 47 13 15

2345 Domicile 05 06 07 08 09

2345 Travail 05 07 08 09 10

2345 Fax 05 07 08 09 11

Page 154: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

5.5 Composants des flux de données ———————————————————————————————————————————————————————— 143

Unir toutLa transformation d’union totale permet de combiner plusieurs entrées en uneseule sortie. On reparle de concaténation des sources de données. La premièreentrée fournit le format qui servira à mapper les colonnes avec le flux de sortie.

Destinations du flux de données

Les données ont maintenant été transformées dans le format attendu, nousdevons maintenant les stocker dans une destination. Voici les options disponi-bles pour le stockage des données (figure 5.43) :

• Apprentissage du modèle d’exploration de données : les données reçuespar la destination sont transmises au modèle d’exploration (algorithme dedata mining) afin d’être exercées. Plusieurs modèles peuvent faire l’objetd’un apprentissage.

• Destination DataReader permet d’utiliser ADO.NET pour le stockage desdonnées de destination.

• Destination de fichier brut permet d’écrire un flux de données dans unfichier au format natif de SSIS. Ce type de fichier est utilisé afin d’obtenirdes performances maximales.

• Destination de fichier plat ou fichier au format TXT.

• Destination de l’ensemble d’enregistrements insère un Recordset dansune variable dont le contenu peut être affiché en dehors du flux de don-nées.

• Destination Excel envoie un flux de données dans une feuille Excel.

Figure 5.43 — Destination du flux de données

Page 155: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 5. Introduction à Integration Services 144

• Destination OLE DB transfert le flux de données vers toute table d’unebase de données compatible OLE DB.

• Destination pour SQL Server envoie le flux de données directement dansune table ou vue SQL Server. Cette fonction est équivalente à la tâchede Bulk Insert. Cette tâche offre de grandes performances.

• Destination de SQL Server Mobile envoie un flux de données vers laversion mobile de SQL Server.

• Traitement de dimension envoie un flux de données visant à ajouter desdonnées nouvelles dans une dimension de Analysis Services.

• Traitement de Partition permet d’alimenter une partition d’un cube dansAnalysis Services.

Page 156: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6Règles d’ETLet assistants

Nous l’avons vu dans le chapitre précédent, la grande force de business intelli-gence Visual Studio est de simplifier en profondeur la tâche des programmeurs,en offrant une large panoplie d’outils d’utilisation simple. L’essentiel des fonc-tions de manipulation des données se retrouve dans les flux de contrôle et lesflux de données. Ces outils de base peuvent cependant dérouter le développeurhabitué à réaliser des tâches identiques en codant des lignes en C++, C# ou VB.En effet, le choc culturel n’est pas neutre, car le développeur habitué à gérer lacomplexité va être fortement concurrencé par la mise à disposition de nouveauoutils simplificateurs. L’entreprise et son personnel devraient cependant y trou-ver un avantage de taille. En effet, la finalité de toute organisation est de restercentrée sur son propre métier et non de gérer la complexité des outils susceptiblesde l’aider dans son activité.

La réponse de SQL Server 2005 et son outil de développement intégré busi-ness intelligence Development Studio consiste à occulter une grande partiede cette complexité et d’amener progressivement l’utilisateur à réfléchir sur sonmétier.

Microsoft a envisagé d’accompagner le DBA dans son évolution vers l’envi-ronnement SQL Server 2005 et SSIS dispose d’un grand nombre d’assistantspermettant d’effectuer ces migrations. Outre le fait qu’ils présentent une réelleutilité, ils ont le mérite d’être formateurs. Voyons dans le détail quelques-unsdes assistants de haut niveau.

Page 157: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 146

6.1 UTILISER L’ASSISTANT POUR GÉNÉRER UN LOT IMPORT

6.1.1 Créer le projet d’importation

L’assistant d’importation et d’exportation permet d’effectuer des transfertsd’objets entre plusieurs bases de données elles-mêmes réparties sur des serveursdifférents. L’assistant permet également de créer un package SSIS qui pourra êtreexécuté ultérieurement. Afin de lancer l’assistant, dans BI Studio vous pouvezexécuter la séquence suivante :

Démarrer le programme : Programmes/SQL server 2005/SQL Server businessintelligence Developpement Studio.

Appeler le menu.

Fichier/Nouveau/Projet/Projet Integration Services.

SSIS détermine un emplacement par défaut pour le projet. Cet emplacementest naturellement modifiable.

La validation du projet entraine la création du projet.

Figure 6.1 — Nommer le projet

Page 158: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.1 Utiliser l’assistant pour générer un lot import ————————————————————————————————————————————— 147

Pour notre exemple, choisissons deux sources de données au format différent.

La source de données Produits sera puisée dans une base Comptoir d’Access.La source de données Clients sera puisée dans un tableau Excel. Ces deux tables

Figure 6.2 — Assistant Projet d’Importation/Exportation SQL Server

Figure 6.3 — La table source Produits stockée dans Microsoft Access

Page 159: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 148

dimensionnelles seront stockées dans l’entrepôt de données grâce à notre pro-cédure d’import. Afin de simplifier, nous faisons l’hypothèse que les tablesClients et Produits sont recréées à chaque transfert.

Voici l’affichage de la table Produits dans Access (figure 6.3).

Choisissons la source de données Access et la base Comptoir.mbd (figure 6.4).

Choisissons la destination SQL Native Client sur le serveur local (figure 6.5).

Voici l’affichage de la table Customers dans Excel.

Choisissons la source de données Excel et le fichier Customers.xls.

L’assistant demande de spécifier les données sources à transférer (tables ouvues/requêtes). Faisons le choix de Copier les données à partir d’une ou plu-sieurs tables ou vues plutôt que d’écrire une requête.

Figure 6.4 — Définition de la source de données

Figure 6.5 — Définition de la base de données destination

Page 160: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.1 Utiliser l’assistant pour générer un lot import ————————————————————————————————————————————— 149

Parmi la liste des sources disponibles dans Access, sélectionnons la table Pro-duits (figure 6.7).

Figure 6.6 — Fichier Customers stocké dans une feuille Excel

Figure 6.7 — Cet écran permet de sélectionner les tables ou requêtes en provenance de la source de données

Page 161: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 150

Par défaut, la table de destination porte le nom de la table en entrée. Celui-ci est naturellement modifiable.

La figure 6.8 montre la mise en correspondance des colonnes source et dedestination. Le nommage des champs de destination et leur type sont déduitsdes attributs des colonnes source.

Le bouton Modifier SQL… permet de contrôler l’action effectuée parl’assistant.

CREATE TABLE [AdventureWorksDW].[dbo].[Produits] ([Réf produit] int NOT NULL,[Nom du produit] nvarchar(40) NOT NULL,[N° fournisseur] int,[Code catégorie] int,[Quantité par unité] nvarchar(30),[Prix unitaire] money,[Unités en stock] smallint,[Unités commandées] smallint,[Niveau de réapprovisionnement] smallint,[Indisponible] bit NOT NULL

)

À ce stade, il est possible d’afficher le contenu de la table source grâce au bou-ton Aperçu.

Figure 6.8 — Cet écran montre la phase de création de la table Produits dans la base de destination

Page 162: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.1 Utiliser l’assistant pour générer un lot import ————————————————————————————————————————————— 151

L’assistant récapitule l’action qu’il va entreprendre.

Cliquez sur Terminer pour effectuer les actions suivantes :

• Copier les lignes de Produits vers [AdventureWorksDW].[dbo].[Produits].La table cible sera supprimée puis recréée.

• Le package sera enregistré dans le fichier de package « C :\Documentsand Settings\Administrateur\Mes documents\Visual Studio 2005\Pro-jects\Projet Import de données\Projet Import de données\Package1.dtsx ».

Le package ne sera pas exécuté immédiatement. L’assistant termine sa tâcheen créant les tâches nécessaires à l’exécution du lot.

Après cette exécution, l’assistant crée le nouvel environnement du projetdans Visual Studio.

Quelles tâches ont été créées par l’assistant ?

• deux connexions (une connexion pour la source des données et une pourleur destination);

• trois tâches de flux de contrôle :

– tâche de suppression de la table Produits :

drop table [AdventureWorksDW].[dbo].[Produits]GO

Figure 6.9 — Le rapport d’exécution de l’assistant Importation et Exportation

Page 163: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 152

– tâche de création de table Produits (nommée Tâche SQL de prépara-tion dans la figure 6.10) :

CREATE TABLE [AdventureWorksDW].[dbo].[Produits] ([Réf produit] int NOT NULL,[Nom du produit] nvarchar(40) NOT NULL,[N° fournisseur] int,[Code catégorie] int,[Quantité par unité] nvarchar(30),[Prix unitaire] money,[Unités en stock] smallint,[Unités commandées] smallint,[Niveau de réapprovisionnement] smallint,[Indisponible] bit NOT NULL

)GO

– tâche de flux de données, elle-même composée d’un ensemble de sous-tâches développées dans l’onglet Flux de données (figure 6.11).

La figure 6.12 détaille la source de données Produits et montre les colonnesexternes constitutives de la source OLE DB (Access). L’opérateur a la capacitéde ne sélectionner que certaines d’entre elles et ou de renommer les champs ensortie.

Figure 6.10 — Un package est automatiquement créé

Page 164: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.1 Utiliser l’assistant pour générer un lot import ————————————————————————————————————————————— 153

Figure 6.11 — L’onglet Flux de données est composé d’une source de données

et d’une destination

Figure 6.12 — L’éditeur de source OLE présente les colonnes sources

Page 165: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 154

La fonction mappage de l’éditeur de destination OLE DB permet de relier leschamps sources avec les champs de la table de destination. Dans la figure 6.13on observe un mappage des champs de la table Produits d’Access avec les champsde la table Produits de AdventureWorksDW.

Les champs qui portent des noms identiques sont mappés automatiquement.Il conviendra au développeur de s’assurer que les types des champs source et des-tination sont compatibles entre eux.

6.1.2 Exécuter le lot

L’exécution du package est lancée à l’aide de la touche F5 ou Déboguer/Démarrerle débogage.

L’exécution du package est lancée. La progression est vérifiée à l’aide de cou-leurs différentes que prend successivement chaque tâche. La couleur jaune indi-que que la tâche est active. La couleur verte indique que la tâche a été réaliséeavec succès. La couleur rouge indique que la tâche a été mise en échec.

Figure 6.13 — Éditeur de destination OLE DB

Page 166: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.1 Utiliser l’assistant pour générer un lot import ————————————————————————————————————————————— 155

Dans notre exemple, lors de la première exécution, la première tâche (tâchede suppression de table) est mise en échec puisque la table n’existe pas dans labase de destination. Les autres tâches sont exécutées avec succès.

L’onglet Résultat d’exécution permet de connaitre le déroulement du lot, le tempspassé pour chacune des tâches et le résultat de leur exécution.

À l’issue du traitement, ne pas oublier de stopper le mode débogage.

6.1.3 Modifier le lot

Nous allons apporter une modification à notre lot en y ajoutant le transfert dedonnées en provenance d’une table Excel. Il s’agit de la table Clients.

La table Clients doit exister dans la base AdventureWorks avant de procéderau transfert depuis Excel.

À ce stade, nous avons la possibilité de coder à la main la procédure de sup-pression de la table Clients suivie de sa création.

Une façon simple de générer un code parfait est de procéder à l’import dufichier Excel dans la base AdventureWorksDW puis d’utiliser l’assistant de géné-ration de scripts de table.

Figure 6.14 — Onglet résultat d’exécution

Page 167: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 156

À l’aide de SQL server Management studio, nous allons effectuer un importdu fichier Excel afin de créer la table dans la base AdventureWorks. À l’aided’un clic droit sur la base AdventureWorks Tâches/Importer les données. Puison utilise l’assistant pour importer les données Excel.

Ensuite nous utilisons l’utilitaire qui permet de générer le code T-SQL decréation de table.

Dans Management Studio, on déplie la liste des tables (clic droit sur la tableClients).

Dans la figure ci-dessus l’assistant de management studio (CREATE to) créeun script SQL de création de la table Clients.

Clic droit sur la table Clients puis Générer un script de la table en tant que/CREATE To/nouvelle fenêtre de l’éditeur de requête.

USE [AdventureWorksDW]GO/****** Objet : Table [dbo].[Clients]SET ANSI_NULLS ONGO

Figure 6.15 — Management studio permet de générer des scripts SQL

Page 168: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.1 Utiliser l’assistant pour générer un lot import ————————————————————————————————————————————— 157

SET QUOTED_IDENTIFIER ONGOCREATE TABLE [dbo].[Clients](

[FirstName] [nvarchar](255) COLLATE SQL_Latin1_General_CP1_CI_AS NULL,

[MiddleInitial] [nvarchar](255) COLLATE SQL_Latin1_General_CP1_CI_AS NULL,

[LastName] [nvarchar](255) COLLATE SQL_Latin1_General_CP1_CI_AS NULL,

[BirthDate] [datetime] NULL,[MaritalStatus] [nvarchar](255) COLLATE

SQL_Latin1_General_CP1_CI_AS NULL,[Gender] [nvarchar](255) COLLATE SQL_Latin1_General_CP1_CI_AS

NULL,[EmailAddress] [nvarchar](255) COLLATE

SQL_Latin1_General_CP1_CI_AS NULL,[YearlyIncome] [float] NULL,[TotalChildren] [float] NULL,[NumberChildrenAtHome] [float] NULL,[Education] [nvarchar](255) COLLATE SQL_Latin1_General_CP1_CI_AS

NULL,[Occupation] [nvarchar](255) COLLATE SQL_Latin1_General_CP1_CI_AS

NULL,[HouseOwnerFlag] [float] NULL,[NumberCarsOwned] [float] NULL,[AddressLine1] [nvarchar](255) COLLATE

SQL_Latin1_General_CP1_CI_AS NULL,[AddressLine2] [nvarchar](255) COLLATE

SQL_Latin1_General_CP1_CI_AS NULL,[City] [nvarchar](255) COLLATE SQL_Latin1_General_CP1_CI_AS NULL,[State] [nvarchar](255) COLLATE SQL_Latin1_General_CP1_CI_AS NULL,[ZIP] [float] NULL,[Phone] [nvarchar](255) COLLATE SQL_Latin1_General_CP1_CI_AS NULL

) ON [PRIMARY]

Nous avons également besoin de supprimer la table avant sa création. Voicile code généré par l’assistant :

USE [AdventureWorksDW]GO/****** Objet : Table [dbo].[Clients]Date de génération du script : 05/27/2006 20:59:59 ******/IF EXISTS (SELECT * FROM sys.objects WHERE object_id = OBJECT_ID(N’[dbo].[Clients]’) AND type in (N’U’))DROP TABLE [dbo].[Clients]

Revenons dans notre projet d’import des données dans Visual Studio.

Dans l’onglet Flux de données, glissons à deux reprises une tâche d’exécutionde requête SQL. La première consiste à effectuer un DROP de la table Clients.

Page 169: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 158

Figure 6.16 — Ajouter la connexion puis le code qui permet de supprimer la table Clients

Figure 6.17 — Ajouter la connexion puis la requête SQL

générée dans SQL Server Management Studio

Page 170: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.1 Utiliser l’assistant pour générer un lot import ————————————————————————————————————————————— 159

Compléter la connexion puis le code SQL par un copier-coller en provenancedu résultat du query de SQL Server Management Studio.

Reliez les tâches entre elles à l’aide des flèches comme précisé dans la figure 6.18.

Depuis les sources de flux de données, faire glisser la source Excel sur l’ongletFlux de données, puis double-cliquez sur la tâche Source Excel.

Figure 6.18 — Se positionner dans l’onglet Flux de données et faire apparaître la boîte d’outils à gauche (Affichage/Boîte d’outils)

Figure 6.19 — La source Excel est créée. Le signe « stop » à droite indique que le fichier source n’est pas précisé.

Le gestionnaire de connexion Excel s’ouvre. Une nouvelle connexion doit être créée vers le fichier source Excel

Figure 6.20 — Le gestionnaire

de connexion Excel permet d’établir

un lien avec le fichier Customers.xls

Page 171: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 160

Dans le gestionnaire de connexion OLE DB, choisir Gestionnaire de con-nexions Excel.

Dans le champ mode d’accès aux données, choisir Table ou Vue.

Dans le champ nom de la feuille Excel, choisir Customers$.

Le gestionnaire de connexion fait immédiatement apparaître la nouvelleconnexion Excel.

Par un glisser-déplacer depuis la barre d’outils, créons maintenant la destina-tion OLE DB. Compléter le gestionnaire de connexion OLE DB puis indiquerle nom de la table réceptrice [dbo].[Clients].

Nous relions maintenant les deux tâches à l’aide de la flèche verte. Le map-page des champs se réalise automatiquement.

Renommez les tâches afin de les rendre plus compréhensibles.

L’onglet Flux de données doit ressembler à l’écran de la figure 6.21.

Sauvegardez tous les fichiers puis exécutez le lot par la touche F5.

Les tâches se déroulent en parallèle.

Stoppez le débogage après exécution.

Prenez la précaution de contrôler le contenu des deux tables Clients et Pro-duits à l’aide de Management Studio. Faire un clic droit sur le nom de la tablepuis ouvrir la table. Observez le contenu de la table et le nombre d’enregistre-ments situé en bas de page.

Ajoutons à présent une tâche d’envoi de courriel à l’administrateur afin d’êtreprévenu en cas d’achèvement sans échec ou en cas d’échec.

Dans l’onglet Flux de contrôle, ajoutons deux tâches « Envoyer un message ».

Créez une connexion SMTP pour l’envoi de courriel (figure 6.22).

Figure 6.21 — Onglet Flux de données

Page 172: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.1 Utiliser l’assistant pour générer un lot import ————————————————————————————————————————————— 161

Configurez les propriétés pour le message électronique (figure 6.23).

L’éditeur de tâche d’envoi de message électronique permet de préciser le ser-veur SMTP d’envoi de mail. Il permet de préciser le ou les destinataires du mail.Les pièces jointes peuvent être des fichiers d’anomalies générés lors de l’exécutiondu package ou tout autre fichier. Les variables systèmes ou utilisateurs peuventêtre introduites dans le corps du texte rendant ainsi les messages dynamiques.

Figure 6.22 — Éditeur du gestionnaire de connexion FTP

Figure 6.23 — Éditeur de tâche d’envoi de mail

Page 173: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 162

Relier les tâches entre elles à l’aide des flèches vertes.

Double-cliquez sur la flèche afin de paramétrer des contraintes en cas d’échecde l’opération ou en cas de succès.

Il est possible de traiter le lot complet.

Figure 6.24 — L’envoi de message est fonction de l’exécution avec ou sans échec de la tâche de flux de données

Figure 6.25 — L’onglet gestionnaire d’événements permet d’effectuer des tâches en fonction d’événements lors de l’exécution du lot

Page 174: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.1 Utiliser l’assistant pour générer un lot import ————————————————————————————————————————————— 163

6.1.4 Migration de lots DTS de la version 2000 vers 2005

Nous l’avons vu, SSIS comprend toutes les fonctionnalités de DTS 2000 et bienplus. Cependant, la migration de certaines fonctionnalités en provenance deDTS 2000 ne se fait pas. C’est les cas notamment des paramètres gérés par DTSet de façon totalement différente avec SSIS.

C’est pour cette raison que SSIS permet d’exécuter des lots DTS 2000 sansaucune migration. Lorsque SSIS doit exécuter DTS 2000, il est nécessaire qu’uneinstance de SQL Server 2000 soit disponible sur un serveur ou que SQL server2000 DTS Run-time soit installé sur la machine exécutant SSIS. Si les lots doi-vent être modifiés, il est nécessaire que SQL Server 2000 Enterprise Managersoit installé. SSIS permet d’instancier DTS 2000 comme une tâche exécutable.

SSIS dispose d’un assistant de migration pour la conversion des lots DTS enlots SSIS 2005. Les éléments de DTS sont convertis en tâches SSIS. Chaqueélément qui ne peut être converti est placé dans un nouveau package DTS puisappelé par SSIS.

La migration des lots DTS se fait grâce à un assistant de SQL Server BI Stu-dio. Ouvrez ou créez un projet de type Integration services. L’assistant va vouspermettre de migrer un package DTS 2000 au travers des étapes qui suivent.

Projet/Migrer un package DTS 2000/

Figure 6.26 — Assistant migration de package

Page 175: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 164

Préciser le nom du Serveur SQL 2000 renfermant le lot DTS.

Choisir la destination.

Figure 6.27 — Selectionner le serveur qui renferme le lot DTS

Figure 6.28 — Sélectionner le serveur qui renferme la base de destination

Page 176: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.1 Utiliser l’assistant pour générer un lot import ————————————————————————————————————————————— 165

Cliquez sur Terminer pour mettre fin aux opérations suivantes :

• Migrer le package vers SQL Server Integration Services.

Figure 6.29 — Choisir le lots DTS 2000 à migrer vers 2005

Figure 6.30 — L’assistant demande de préciser un fichier journal dans lequel il va stocker le déroulement des étapes de migration

Page 177: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 166

Les options suivantes ont été sélectionnées :

• Source à partir de laquelle les packages sont migrés :

– Type de source = Microsoft SQL Server.

– Nom de la source = SERVEURDELL.

• Destination où doivent être stockés les packages migrés :

– Type de la destination = Microsoft SQL Server.

– Nom de la destination = (local).

• Le nom du fichier journal est C :\Documents and Settings\Administra-teur\DTSlogBB.log.

Les packages suivants seront migrés :

EssaiDTS À EssaiDTS.

• Nombre total de packages à l’emplacement source = 1.

• Nombre de packages qui seront à migrer = 1.

• Nombre de packages qui ne seront pas migrés = 0.

Figure 6.31 — Formulaire de synthèse des actions menées par l’assistant

Page 178: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.1 Utiliser l’assistant pour générer un lot import ————————————————————————————————————————————— 167

• Les paramètres attachés aux lots DTS 2000 ne sont pas récupérés par SQLServer 2005.

6.1.5 Déploiement de packages SSIS

Le processus de déploiement de package se déroule en deux étapes :

• 1. La première étape consiste à créer le projet Integration Services afin decréer un utilitaire de déploiement de package.

• 2. La seconde étape consiste à copier le dossier de déploiement créé enmême temps que le projet Integration Services sur l’ordinateur cible, puisà exécuter l’Assistant Installation de package pour installer les packages.

Créer l’utilitaire de déploiement

Pour accéder aux propriétés d’un projet Integration Services, cliquez avec le bou-ton droit sur le nom du projet, puis cliquez sur Propriétés.

Passer à True la variable CreateDeploymentUtility.

Puis OK.

Lorsque vous générez un projet Integration Services, un fichier manifeste,<nom de projet>.SSISDeploymentManifest.xml et des copies des packages duprojet et des dépendances de package sont créés et ajoutés dans le dossierbin\Deployment dans le projet ou à l’emplacement spécifié dans la propriété

Figure 6.32 — L’attribut CreateDeployementUtility doit être à True

Page 179: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 168

DeploymentOutputPath. Le fichier manifeste répertorie les packages, les confi-gurations de package et tous les divers autres fichiers du projet.

Installation du déploiement

L installation du déploiement permet de stocker le package sur le serveur Inte-gration services.

L’Assistant Installation de package vous accompagne dans le processus d’ins-tallation des packages sur le système de fichiers et sur SQL Server.

Clic droit sur <nom de projet>.SSISDeploymentManifest. puis deploy.

Figure 6.33 — Ouvrir l’assistant de déploiement

de package

Figure 6.34 — L’assistant permet de déployer des packages SSIS

soit sous forme de systèmes de fichiers XML

ou dans SQL Server

Page 180: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.1 Utiliser l’assistant pour générer un lot import ————————————————————————————————————————————— 169

Conserver le dossier par défaut puis Suivant deux fois.

Vous pouvez vérifier la bonne installation du package en vous connectant auserveur Integration services. Dans File System retrouvez votre projet puis exé-cutez le package.

Lorsque le package est opérationnel dans le serveur Integration Services vouspouvez en planifier l’exécution.

6.1.6 Automatisation de l’exécution des packages

L’automatisation de l’exécution de packages permet de planifier tous types detâches et en particulier des tâches quotidiennes d’alimentation de l’entrepôt dedonnées. Les administrateurs pourront utiliser cette facilité pour exécuter destâches de sauvegardes, ou de ré indexation des bases opérationnelles.

Dans Management studio Démarrer le service SQL Server Agent. Ce servicepeut être démarré automatiquement lors du démarrage de SQL server. SQL ser-ver Agent peut être démarré manuellement lors de la connexion au moteur debase de données SQL server.

Clic droit sur SQL server Agent puis démarrer.

Ouvrir SQL server Agent.

Figure 6.35 L’assistant permet de sélectionner un dossier d’installation

Page 181: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 170

Clic droit sur Travaux.

Lors de l’exécution d’un travail de l’agent SQL préciser qu’il s’agit d’un pac-kage SQL Server Integration services et que la source de fichiers est Système defichiers (pour les packages au format XML). Vous devez également fournir l’empla-cement du package déployé précédemment sur le serveur SSIS.

Avant de planifier l’exécution du package vous pouvez le tester dans son envi-ronnement de production (Clic droit puis exécuter le package).

Ci-dessus nous avons programmé une exécution du package leçon 1.dtsx tou-tes les nuits du lundi au vendredi à 0 h 00.

Le moniteur d’activité des travaux de SQL server Agent permet de suivrel’exécution des travaux et leur traçabilité.

Vous pouvez également consulter la visionneuse du fichier journal.

Figure 6.36 — L’assistant permet de créer un nouveau travail

Page 182: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.2 Concept de packages dynamiques —————————————————————————————————————————————————————— 171

6.2 CONCEPT DE PACKAGES DYNAMIQUES

Il existe un grand nombre d’outils visant à modifier les tâches qu’un package(lot) peut exécuter. Pour ce faire, SSIS dispose d’un jeu de variables et d’expres-sions utilisées dans le flux de contrôle et les transformations des flux de données.Les configurations ont pour but de modifier l’environnement de travail d’un packageSSIS (par exemple, changement de serveur et des sources de données lors de lamise en production).

6.2.1 Les expressions

SSIS intègre un langage permettant de spécifier les transformations dans les fluxde données. La plupart des expressions ont une syntaxe relativement simple telleque A + B ou A >= B, ou une fonction de type GetDate(). On trouve de tellesexpressions dans des transformations du flux de données de type éclatement condi-tionnel des tables ou colonnes dérivées.

Les expressions permettent de modifier le comportement d’un package enévaluant des expressions afin de modifier les propriétés lors de l’exécution.

Figure 6.37 — Interface du planificateur de tâches intégré à SQL Agent

Page 183: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 172

Les identificateurs sont utilisés dans des expressions qui sont inconnues jusqu’àl’exécution du package. Les identifiants peuvent représenter des variables :

• @Filename

• @_LoopCounter

• @PakageName

Les identificateurs qui représentent des variables sont toujours précédés parle caractère @.

Les fonctions mathématiques sont supportées par les expressions.

ExempleABS(-1234) fournit le résultat 234

ROUND(12.3456) fournit le résultat 12.35

On retrouve également des fonctions sur les chaînes de caractères : TRIM(),UPPER(), SUBSTRING(), etc.

Des fonctions portant sur les dates existent également : DATEDIFF(), DATEPART(),GETDATE(), MONTH (), YEAR(), etc.

6.2.2 Les variables

Figure 6.38 — L’onglet Variables liste toutes les variables (système et utilisateur) connues dans le package DimEmployee

Page 184: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.2 Concept de packages dynamiques —————————————————————————————————————————————————————— 173

Les variables sont utilisées pour passer des informations entre les différentes par-ties d’un package. Elles peuvent être passées d’une tâche de transformation dedonnées à un autre ou d’une tâche de contrôle vers le gestionnaire de connexion.C’est le cas par exemple lorsqu’une tâche a pour but de balayer tout un répertoireafin de traiter tour à tour chacun des fichiers qui le compose. La tâche recueilledonc chaque fichier puis passe dans une variable, au gestionnaire de connexion,le nom du fichier en cours de traitement.

Figure 6.39 — Tableau des variables utilisateur. Les noms de variables sont sensibles à la casse (majuscules et minuscules doivent être respectées)

Figure 6.40 — Tâche de requête SQL

Page 185: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 174

Les variables peuvent être créées grâce au bouton d’ajout de variable. Lesnoms de variables et leur type doivent être fournis lors de la création. Il est pos-sible également d’allouer une valeur initiale. Afin de préserver les performancesde SSIS lors de l’exécution, les variables sont fortement typées. L’étendue de lavariable définit la visibilité de celle-ci dans le package.

La tâche d’exécution SQL de la figure 6.40 est développée ci-dessous. Cetterequête permet d’insérer des lignes dans la table AuditPkgExecution tout enrecueillant les valeurs à partir de variables alimentées au cours de l’exécution dupackage. Dans la figure 6.41 les variables système et utilisateurs sont transféréesaux paramètres. A leur tour, ces paramètres (dont le nom commençe par le signe @)sont transmis dans la requête SQL (voir requête ci-dessous).

Cet exemple montre comment il est possible d’auditer les tâches qui s’exé-cutent dans un package. Dans l’exemple ci-dessus on conserve la trace des trai-tements dans une table de l’entrepôt de données(AuditPkgExecution) recevantles variables système ou utilisateur, en particulier le nom du package lancé etla date de début de l’exécution. Voici la requête correspondant à la tâche GetPkgExecKey.

INSERT INTO AuditPkgExecution(PkgName, PkgGUID, PkgVersionGUID, PkgVersionMajor, PkgVersionMinor, ExecStartDT, ParentPkgExecKey)Values(@PkgName, @PkgGUID, @PkgVersionGUID, @PkgVersionMajor, @PkgVersion-Minor, @ExecStartDT, @ParentPkgExecKey)

6.2.3 Les configurations

La technique des configurations répond à un besoin d’adaptation à divers envi-ronnements d’exploitation. Les valeurs prises par défaut peuvent être modifiéesdynamiquement lors de l’exécution du package. L’application d’un fichier de

Figure 6.41 — Mappage des paramètres entre les variables système et les paramètres

Page 186: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.2 Concept de packages dynamiques —————————————————————————————————————————————————————— 175

configuration permet d’initialiser des variables. Un des points majeurs du systèmede configuration consiste à modifier dynamiquement les connexions aux serveurssans modifier le contenu du package. Plusieurs packages peuvent utiliser le mêmefichier de configuration. Il est également possible de définir l’ordre dans lequelles fichiers de configuration doivent s’appliquer.

SSIS peut charger les configurations à partir de plusieurs types de source :SQL Server, un fichier XML, une variable d’un package parent, une variabled’environnement de Windows ou une entrée du registre.

Le lancement du gestionnaire de configuration s’effectue à partir du menudisponible; choisir Gestionnaire de configurations comme indiqué dans lafigure 6.37.

L’exécution d’un package SSIS s’effectue généralement grâce aux commandesDTExecUI ou DTExec. Dans la ligne de commande, il est possible de fournir le nomdu fichier de configuration à exécuter.

Dans le fichier XML de la figure 6.43 le nom du répertoire a été passé en para-mètres entre les balises ConfiguredValue.

Figure 6.42 — SSIS permet de créer un fichier de paramètres grâce au gestionnaire de configurations

Figure 6.43 — Fichier de configuration au format XML

Page 187: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————— 6. Règles d’ETL et assistants 176

6.2.4 La gestion des événements

Le gestionnaire d’événement permet entre autres de contrôler l’état de fonction-nement d’un serveur ou d’envoyer un e-mail à l’administrateur lorsqu’une erreursurvient dans l’exécution d’un package.

On trouve des événements de type OnError, OnPreExecute, OnPostExecute, etc.

Par exemple un événement OnError permet de déclencher la restaurationd’une base en cas d’anomalie lors du déroulement.

6.3 PLANIFICATION DU PROJET ETL

6.3.1 La carte de haut niveau

La connaissance des outils de base, exposés dans les précédents paragraphes, per-met de mieux comprendre les mécanismes de SSIS et ainsi de définir un schémade haut niveau permettant le dialogue entre utilisateurs métier et développeurs.

• Définir une carte des tâches à un niveau élevé.

• Déployer une copie du système et travailler sur la copie.

• Découvrir des données grâce à des outils simples de requêtage (Access enlien ODBC vers SQL Server). Cette démarche permet de découvrir lesdifférents domaines à traiter, les relations entre les données et la qualitédes données.

• Détailler sous forme synthétique (tableau Excel) les tables source et lestables de destination en effectuant un « mappage » des données et leurtransformation.

• Déterminer la fréquence de chargement de chaque table (dimensions et faits).

• Déterminer les données historiques de chaque table pour le premier char-gement.

• Déterminer une stratégie de partitionnement des tables de faits aussi biendans le modèle relationnel du datawarehouse que dans le modèle OLAP.

• Définir une stratégie d’extraction des données pour chaque source système.

• Supprimer les doublons par des algorithmes adaptés.

Sur le site de l’auteur – www.buroformatic.com – vous pourrez téléchargerdes modèles permettant de représenter les grandes tâches qui participent à laconstruction du schéma ETL.

Page 188: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

6.4 Les 38 règles qui régissent l’ETL ———————————————————————————————————————————————————————— 177

6.4 LES 38 RÈGLES QUI RÉGISSENT L’ETL

Afin de créer et de réussir la mise en œuvre d’un entrepôt de données, RalphKimball a énoncé trente-huit règles qui participent au processus d’extraction, detransformation et de chargement. Le processus d’ETL consomme environ 70 %du temps et de l’effort de construction d’un datawarehouse. On peut retrouverces règles sur le site http://www.intelligententerprise.com/showArticle.jhtml?arti-cleID=54200319.

Par chance, SQL Server Integration Services et Analysis Services fournissentun certain nombre d’assistants qui participent naturellement à la mise en placed’un grand nombre de ces règles.

Page 189: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server
Page 190: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7Analysis Services

SQL Server Analysis Services (SSAS) est une plate-forme de développement etd’administration permettant de créer des applications OLAP (On Line AnalyticalProcessing) et de data mining (fouille de données). Cette plate-forme est natu-rellement incluse dans SQL Server 2005 et a pour but d’aider les utilisateurs àanalyser les données historiques et à découvrir des corrélations ou des modèlesde comportement entre les données.

Côté client, un outil de requêtage et de filtrage doit être installé (Excel outout autre outil tiers : Proclarity, Panorama, Powerplay, Crystal, etc.).

Côté serveur, Analysis Services doit être installé et correctement paramétréau niveau de la sécurité afin d’autoriser l’accès aux données selon le profil des uti-lisateurs.

Le composant central de l’infrastructure OLAP est le cube multidimension-nel. Il s’agit d’une base de données spécialement conçue pour permettre un accèsimmédiat aux données d’entreprise stockées dans les entrepôts de données.

Analysis Services est indépendant des sources de données de même que Inte-gration services et Reporting Services. Par exemple, une entreprise utilisera Ana-lysis Services dans le but de créer des cubes à partir de données stockées dansdes bases telles qu’Oracle, DB2 d’IBM, SQL Server, Access ou autres bases com-patibles ODBC et OLE DB.

Enchaînement des données en business intelligence

Dans la figure 7.1, on observe le positionnement de la brique Analysis Servicesdans le cheminement habituel des données, depuis les sources opérationnelles(à gauche) jusqu’à la restitution via Excel (à droite).

Page 191: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 180

Bien que non obligatoire pour la création des cubes OLAP, l’étape de créationdu datawarehouse est fortement conseillée.

Une plate-forme de développement flexible

Comparée à la version 2000, Analysis Services 2005 offre aux développeurs enentreprise et intégrateurs plus de flexibilité dans la modélisation des cubes et lessources de données. Cette plate-forme propose en effet de nouveaux outils decréation de cubes ainsi que huit nouveaux algorithmes de data mining. Ces amé-liorations aident les développeurs à délivrer des solutions plus complètes tout enréduisant le temps nécessaire au développement et au déploiement.

7.1 OLAP ET LE DATA MINING

OLAP (On line Analytical Processing) et le data mining (fouille de données) fontpartie des technologies que les managers utilisent pour rassembler, stocker, inter-roger et analyser des données historiques. Ces technologies font partie des outilsd’aide à la décision. Les applications OLAP sont généralement utilisées pourfournir des réponses aux questions relatives aux performances de l’entreprise. Parexemple, une chaîne de distribution utilisera un cube décisionnel afin d’élaborerdes graphiques des ventes pour un grand nombre de lignes de produits croisésavec des régions et des périodes de temps afin de pouvoir par exemple répondre

Figure 7.1 — Analysis Services dans la chaîne décisionnelle

Page 192: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.1 OLAP et le data mining ———————————————————————————————————————————————————————————————— 181

à la question : « Quels sont les ventes réalisées en quantité et valeur par pointde vente pour chaque collection d’ouvrages ? ». S’il le désire, l’analyste peut sim-plement ajouter un critère supplémentaire afin d’obtenir le même tableau encomparant 2004 avec 2005 en cumul depuis le début de l’année.

Le data mining en revanche, utilise des algorithmes de reconnaissance demodèles afin de détecter des comportements particuliers, des corrélations ou destendances dans les données. Une fois détectés, ces modèles et tendances sontutilisés à des fins de prédiction dans le cadre de processus d’affaires telles queprévisions des ventes, segmentation de populations d’individus aux comporte-ments similaires. Ces techniques sont également utilisées afin de mettre en placedes systèmes de ventes additionnelles (up-sell) ou ventes croisées (cross-sell).

Les cubes OLAP et les techniques de data mining sont basées sur des donnéescollectées et agrégées au sein des entrepôts de données.

Rappelons que la finalité d’un entrepôt de données (datawarehouse) est destocker et historiser des volumes importants de données. Ce processus a été illus-tré au chapitre précédent grâce à SSIS. Nous l’avons vu, les entrepôts de donnéessont alimentés grâce à des outils ETL (Extract, Transform, and Load). Ces outilsont pour vocation d’extraire et de structurer les données en provenance des basesde données opérationnelles dites OLTP (On Line Transactional Processing). Laphase d’ETL réalise également un nettoyage des données suivi généralementd’une phase d’agrégation au sein des entrepôts.

À leur tour, ces données agrégées font l’objet d’une alimentation dans desbases de données multidimensionnelles appelées cubes OLAP.

Un cube est défini par un certain nombre de dimensions ou axes d’observation.Au croisement de ces dimensions se trouvent des mesures ou indicateurs. Engénéral, le cube permet des analyses ad hoc et des requêtes dynamiques ayant uncaractère naturel et intuitif.

Les utilisateurs accèdent aux cubes OLAP grâce à des outils d’analyse offrantainsi la capacité de réaliser à la volée des tableaux de synthèse et rapports gra-phiques.

La structure hiérarchisée des dimensions permet une analyse en profondeurdes données grâce à la technique du drill down et du roll-up. Ces techniques per-mettent un forage progressif des données en passant du niveau le plus élevé auniveau de détail le plus fin (drill down) ou selon un cheminement inversé (drill up).Par exemple, un utilisateur peut effectuer un drill down sur la dimension tempo-relle afin de visualiser des indicateurs de ventes ou de revenus par année, puispar trimestre, par mois et enfin par jour. Il sera alors aisé de déceler des variationssaisonnières ou des tendances à partir des graphes dynamiques générés automa-tiquement. De la même manière, un chef de ventes sera capable d’analyser, pour

Page 193: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 182

un produit donné, les ventes effectuées la veille par point de vente puis d’agrégerrapidement les données au niveau semaine, mois, trimestre ou année (drill up).

Les technologies OLAP, par leur aspect dynamique, et synthétique complè-tent les outils de reporting tels que Reporting Services (inclus dans SQL Server2005). Les outils de reporting sont généralement utilisés afin de fournir des vuesstatiques au travers de rapports instantanés à partir des données de l’entrepôt. Àla différence des outils de requêtage OLAP, les fonctions de forage dynamiqueet de changement d’axes à la demande y sont absentes.

L’exemple de la figure 7.2 montre la structure du cube faisant apparaître lestrois dimensions ou axes d’analyse : dimension Produits, dimension Région, dimen-sion Temps. La mesure analysée au croisement des trois axes est l’indicateur devolume en valeur.

Dans cet exemple, l’outil de restitution du cube est le tableau croisé dyna-mique d’Excel. On observe l’indicateur de volume du chiffre d’affaires (9 000 €)réalisé sur les ventes des vestes pour la région Ouest et pour le mois de mars. Onverra lors de l’étude des outils de restitution que cette analyse ne prend que quel-ques secondes au manager opérationnel ou au contrôleur de gestion doté de sonoutil favori : Excel.

Figure 7.2 — Le cube et sa représentation multidimensionnelle (source : Microsoft)

Le cube et sa représentation multidimensionnelle

Quel a été le volume de commande

■ Pour le Produit veste

■ Dans la région ouest…

■ Pour le mois de mars…

Produit

gio

ns

Ch

au

ssu

re

Bo

nn

et

Ve

ste

Sud

Nord

Ouest

Est

Janvier

Fevr.

Mars

9 000 €

Page 194: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.2 Points d’amélioration entre Analysis 2000 et SSAS 2005 ——————————————————————————————————— 183

7.2 POINTS D’AMÉLIORATION ENTRE ANALYSIS 2000 ET SSAS 2005

Passons rapidement en revue les fonctionnalités de SSAS aussi bien dans ledomaine du développement d’application que de l’administration du référentiel.

UDM (Unified Dimensional Model) combine en un seul référentiel les carac-téristiques des modèles multidimensionnels (DW) et relationnels (ERP).

Le cache proactif permet une alimentation des cubes en quasi temps réel àchaque modification des données dans le système de données opérationnelles.

Les KPI (indicateurs clés de performance) sont un nouveau mécanisme quipermet de définir des indicateurs métiers basés sur des valeurs d’objectif, d’écartet de tendance. La notion de feu tricolore est une illustration assez courante deces KPI. Nous aurons l’occasion de traiter ce sujet dans le chapitre sur la resti-tution des données.

Les translations présentent un mécanisme de traduction multilingue du réfé-rentiel de données (metadata). Cette fonctionnalité permet aux développeurs decréer un unique référentiel et aux utilisateurs de créer des analyses dans leurpropre langue.

Les scripts MDX sont des nouveaux mécanismes utilisés pour la définitiondes membres calculés, des ensembles nommés et des cellules calculées. La syntaxeest simplifiée et améliorée. Les scripts peuvent être débogués ligne à ligne.

Les procédures stockées de SSAS permettent de créer des routines en langagede programmation CLR (Common Langage Runtime) tels que C ou VB.

Les fonctions de writeback (écriture dans le cube) ont été améliorées puisqu’ilest désormais possible d’écrire dans des cellules agrégées (et non pas uniquementau niveau de granularité le plus bas).

De nouveaux outils et assistants permettent se simplifier la création de :

• mesures semi-additives;

• dimensions temporelles intelligentes;

• de compte;

• d’agrégations financières;

• de conversions monétaires.

Les vues des sources de données permettent de s’affranchir de la complexitédes sources de données du SGBD source.

Page 195: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 184

Le nouveau langage de définition des données (DDL dans SSAS 2000) estmaintenant au format XML. XML/A (XML for Analysis) est le nouveau pro-tocole qui assure la communication avec le serveur Analysis. Ainsi, de nouvellessortes d’applications sont rendues plus faciles à développer et permettent auxpostes client d’accéder directement à des services web sans installation locale.

Les calculs sont centralisés sur le serveur et non plus sur le poste client sup-primant ainsi le cache client et l’amélioration des calculs complexes.

Le nouvel environnement de développement d’applications est maintenantunifié dans business intelligence Development Studio. Le nouvel environnementd’administration est SQL Server Management Studio (Enterprise Manager dansla version SQL Server 2000).

Un nouveau modèle d’autorisations d’accès a été redéfini. Les nouveaux rôlessont :

• administrateur de serveur;

• administrateur de base de données;

• droits sur les objets de processus et de structure.

Le modèle de sécurisation des objets SSAS a été redéfini :

• sécurisation par objets de la base de données;

• cryptage des cubes;

• SSAS s’exécute avec le niveau le plus bas d’autorisation;

• les communications entre le client et le serveur sont cryptées assurant unrenforcement de la sécurité face à des techniques comme le sniffing ou lespoofing.

La traçabilité des événements est maintenant possible grâce au gestionnairede profil de SQL Server. Il existe un journal des audits d’accès aux données etaux applications. Un journal des erreurs est également disponible.

L’amélioration des performances porte essentiellement sur le mode de resti-tution des cellules calculées.

• les calculs effectués sur le serveur sont mis en cache;

• l’optimiseur de requêtes redéfinit les requêtes clientes dans le but d’amé-liorer les performances;

• les performances sur les réseaux étendus permettent des accès simultanésde plusieurs centaines d’utilisateurs.

Page 196: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.2 Points d’amélioration entre Analysis 2000 et SSAS 2005 ——————————————————————————————————— 185

SQL Server Management Studio administre aussi bien les bases de donnéesSQL Server que les bases Analysis.

Dans la figure 7.3, le volet de gauche fait apparaître les composants de SQL.On observe également le serveur Analysis Services avec ses composants UDM.

La nouvelle console d’administration remplace en les regroupant EnterpriseManager et Analysis Manager de SQL Server 2000.

Les requêtes SQL et MDX sont analysées dans le même outil.

Le nouveau modèle objet AMO (Analysis Management Objects) remplace DSO.Pour des raisons de compatibilité, DSO est supporté.

Figure 7.3 — Interface présentant SSMS (SQL Server Management Studio)

Page 197: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 186

Les dimensions et leurs attributs

SSAS 2005 définit les dimensions des cubes grâce aux attributs des champs destables dimensionnelles et également sur les hiérarchies comme cela était le casdans AS 2000. En effet, dans AS 2000, une dimension était définie grâce à desstructures hiérarchiques fortes comme année/mois/jour ou pays/région/ville. Ilétait possible de définir des dimensions virtuelles à partir des propriétés des mem-bres. Cependant, les performances sur ce type de dimensions n’étaient pas aurendez-vous. Les développeurs ne déployaient que rarement ces dimensions ettoujours sur des volumétries réduites.

SSAS 2005 définit une dimension à partir de nombreux attributs, chacund’entre eux servant à effectuer du slice (tranche de cube) et du filtrage des don-nées. Chaque attribut peut participer à la définition de hiérarchies selon les rela-tions entre les données.

Les notions de hiérarchie naturelle continuent d’exister et devront être défi-nies avec soin. Les performances qui résultent de ces hiérarchies sont améliorées.

Dans l’exemple suivant considérons la dimension Client. La table qui ren-ferme la source de données contient huit colonnes : Clé client, nom du client, âge,genre (masculin/féminin), e-mail, ville, région, pays.

On observe une hiérarchie naturelle telle que (pays, région, ville, nom duclient). Bien que moins naturel, on peut définir un second axe d’observation(âge, genre).

Les avantages liés à cette nouvelle structure de dimensions sont les suivants :

• Il n’est pas nécessaire de charger en mémoire les dimensions. Il en résultequ’aucune limitation de taille n’est imposée pour une dimension donnée(certaines dimensions peuvent comporter des centaines de millions demembres).

• Les attributs des hiérarchies peuvent être ajoutés ou supprimés sans « repro-cesser » la dimension. Le cube reste donc disponible aux utilisateurs pen-dant la réindexation de la dimension.

• Les dimensions dupliquées sont éliminées. Les dimensions sont plus com-pactes.

• La performance du processus de construction des dimensions est amélioréeet exploite naturellement le mécanisme de processus parallèle.

Types de dimensions

Analysis Services 2000 comporte deux types de dimensions : hiérarchique régulièreet parent-enfant.

Page 198: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.2 Points d’amélioration entre Analysis 2000 et SSAS 2005 ——————————————————————————————————— 187

Analysis Services 2005 offre de nouvelles structures de dimensions :

• Rôles. Une dimension peut jouer plusieurs rôles en fonction du contexte.Par exemple la dimension Temps peut être utilisée indifféremment pour ladate de commande et la date de livraison. Dans SSAS 2005, la dimension eststockée une seule fois mais aura une signification différente en fonction ducontexte.

• Dimension de fait. En réalité ce type de dimension est peu utilisé par Ana-lysis puisqu’elle identifie un objet au niveau le plus fin. Elle prend touteson importance lors de l’identification des lignes détail qui participent aucontenu d’une cellule agrégée.

• Dimension de référence. Ce type de dimension n’est pas en rapport directavec la table de faits. Par exemple une dimension géographie peut aussibien s’appliquer à la dimension Client et à la dimension Équipe de vente.Les données de la dimension sont acquises à partir de tables externes etsont indépendantes de la table de faits.

• Dimension de data mining. Les dimensions de type data mining résultentde modèles mathématiques tels que les arbres de décision, les règles d’asso-ciation, les réseaux de neurones, les clusters, etc. Nous donnerons une listeexhaustive des différents algorithmes dans le chapitre consacré au datamining.

• Dimension de type plusieurs à plusieurs. Ce type de dimension étend leschéma en étoile dans lequel il est habituel de constater qu’un champ dela table de faits est en relation avec un et un seul enregistrement de latable de dimension liée.

Groupes de mesures et Perspectives

SSAS 2005 introduit la notion de groupe de mesures et de perspectives afin desimplifier la création et le déploiement de base de données analytiques. AvecSSAS 2000, un cube était fondé sur une et une seule table de faits. Plusieurscubes étaient nécessaires lorsque des analyses portaient sur plusieurs tables defaits. Le moyen pour rapprocher deux cubes était de constituer un cube virtuel.Ce dernier était en quelque sorte une vue synthétique basée sur une jointure deplusieurs cubes.

Dans SSAS 2005, le développeur construit un seul cube. Le cube contientun ou plusieurs groupes de mesures. Un groupe de mesures est attaché à une etune seule table de faits. Le niveau de granularité de chaque groupe de mesuresdépend de son intersection avec le niveau hiérarchique de chaque dimension.

Du fait de la complexité croissante de la navigation dans le cube liée au nom-bre potentiellement important de mesures et dimensions, il a été mis en place

Page 199: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 188

la technique des perspectives qui consiste à créer une vue représentant un sous-ensemble de mesures et dimensions. Des niveaux d’accès sécurisés peuvent êtreattribués à chaque perspective.

Il résulte de cette nouvelle organisation de meilleures performances. Desmesures peuvent renfermer des cellules ayant des valeurs nulles (et non zéro).

Calculs et analyses

Une mesure est dite additive lorsqu’elle s’agrège quel que soit le niveau d’obser-vation (exemple : le total des ventes pour tous les produits, tous les clients et tousles temps).

Au contraire, une mesure semi-additive peut être additive pour certaines dimen-sions et pas pour d’autres. Prenons l’exemple d’un état des stocks d’un entrepôt;le nombre d’articles en stock aujourd’hui n’est bien évidemment pas la sommede la situation constatée hier augmentée de celle d’aujourd’hui. Dans SSAS, ondispose nativement d’agrégations semi-additives qui permettent de résoudre desproblématiques d’inventaire telles que :

• La moyenne des quantités et des valeurs en stock sur une période donnée.

• La balance d’ouverture et de clôture sur une période.

• La variation d’inventaire entre des périodes consécutives ou parallèles.

• Le niveau d’inventaire minimum et maximum sur une période donnée.

• La contribution relative d’un article en stock par rapport à la valorisationtotal du stock.

L’assistant de calcul des dimensions temporelles apporte une aide non négligea-ble dans le cas de calcul d’agrégation à comparer sur des périodes de temps dif-férentes (calcul du cumul des ventes depuis le début de l’année comparé sur lestrois dernières années). Cette fonction est native alors qu’auparavant il étaitnécessaire de développer une fonction MDX de type ytd().

MDX Scripts

Le langage multidimensionnel MDX (Multidimensional Expressions) est un lan-gage d’interrogation des cubes, aussi complexe que puissant. SSAS 2005 proposeun nouveau modèle de calcul qui simplifie la construction et la syntaxe desrequêtes.

Des outils tels que les tableaux croisés dynamiques accédant aux cubes utili-sent une technique intuitive de glisser-déposer. Derrière cette apparente simpli-cité, la technologie « pivot table » génère des requêtes en langage MDX occultantainsi la complexité de la syntaxe.

Page 200: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.2 Points d’amélioration entre Analysis 2000 et SSAS 2005 ——————————————————————————————————— 189

MDX est aussi le langage naturel utilisé par SSAS pour construire les cubes.

Lorsqu’un cube est traité, les données sont mises à jour seulement au niveaude détail le plus fin (le niveau feuille). C’est lorsque la demande sera formuléepar l’utilisateur que les niveaux d’agrégation intermédiaires seront calculés « à lavolée ». On imagine le gain d’espace procuré par cette technologie.

Procédures stockées

Analysis Services 2005 introduit la notion de procédures stockées afin d’étendreles capacités de traitement (UDF). Une procédure stockée peut être écrite dansn’importe quel langage tel que C++, VB ou C#. Les procédures stockées simpli-fient le développement et l’implémentation par la création unique de scriptscodés réutilisables par d’autres procédures stockées ou requêtes des utilisateurs.Les procédures stockées fournissent des mécanismes afin d’étendre les fonctionsde base du langage MDX. Ces procédures permettent également de réaliser destâches spécifiques comme le rafraîchissement d’un cube ou la mise à jour partielled’une portion du cube.

Indicateurs clés de performance

Une innovation de taille dans SSAS 2005 réside dans la mise à disposition dela technologie des KPI. Il s’agit de suivre des indicateurs métier pour lesquels desobjectifs ont été fournis préalablement. Typiquement, ces indicateurs se retrou-vent dans des rapports, des portails décisionnels et des tableaux de bord. L’outilde restitution est le portail Business Scorecard Management non inclus dansSQL Server 2005. Des outils tiers qui exploitent cette technologie sont déjà dis-ponibles sur le marché (Panorama software, Proclarity, etc.). Les KPI sont dès àprésent pris en charge par les tableaux croisés dynamiques de Excel 2007.

D’une manière générale, un KPI est composé des éléments suivants :

• la valeur à mesurer (ventes, profit, etc.);

• l’objectif de la valeur à atteindre (valeur ou pourcentage);

• l’état de la mesure permettant de juger de l’écart par rapport à l’objectif.Une expression MDX évalue une valeur courante de la mesure dans uneplage allant de – 1 (très mauvais) à + 1 (très bon);

• la tendance : valeur précisant si la valeur de la mesure se rapproche del’objectif ou s’en éloigne.

Voici une illustration de trois KPI affichés dans une page web (figure 7.4):

• KPI du chiffre d’affaires trimestriel (feu vert car le revenu dépasse le butde 12,87 %);

Page 201: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 190

• KPI de la satisfaction client (feu vert);

• KPI du taux d’adoption du marché (feu rouge car inférieur aux prévisions).

Business intelligence en temps réel

Les entrepôts de donnée et les applications de business intelligence reposent tra-ditionnellement sur des données historiques rafraîchies mensuellement, ou quo-tidiennement. Il est admis que les applications décisionnelles stratégiques nenécessitent pas de fréquence de rafraîchissement inférieure au jour. Nous pensonsque la business intelligence doit être omniprésente dans l’entreprise et non seu-lement réservée à quelques décideurs tactiques ou stratégiques. On le constatepar exemple lorsqu’un directeur de supermarché souhaite connaître en quasitemps réel les produits qui se vendent le mieux en fonction des annonces publi-citaires diffusées dans le magasin. Dans ce cas, le temps d’attente entre la réali-sation d’un fait et sa mesure est quasi instantané.

Alors que AS 2000 offrait un mode de rafraîchissement des cubes basé sur lemodèle pull (DTS déclenche une tâche à heure fixe), SSAS 2005 fournit unnouveau modèle qui offre un temps de latence très réduit entre le stockage dela donnée dans l’ERP et sa constatation dans le cube.

Le modèle push déclenché par le pipeline DTS permet aux données d’êtreimmédiatement transférées dans une partition d’Analysis Service sans stockageintermédiaire.

Le modèle de cache proactif permet de définir très précisément la duréed’attente avant la prise en compte des nouvelles données. La fréquence des misesà jour des bases dimensionnelles peut être programmée.

Figure 7.4 — Tableau de bord rassemblant trois KPI

Le chiffre d’affaire

trimestriel dépassera

les prévisions

de 12,87 %.

Les clients ont été

extrêmement satisfaits

en décembre 2001.

Voir le rapport complet…

Le taux d’adoption

de XYZ a été inférieur

de 17,2 % aux prévisions.

Voir le rapport complet…

Chiffre d’affaires trimestriel

Taux d’adoption du marché

Satisfaction client

Voir le rapport complet…

Page 202: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.2 Points d’amélioration entre Analysis 2000 et SSAS 2005 ——————————————————————————————————— 191

Grâce à ces mécanismes optimisés, il n’est pas rare de constater que les don-nées rafraîchies et agrégées sont accessibles plus rapidement dans la base OLAPque dans la base relationnelle source.

Les paramètres ajustables du cache proactif sont :

• La période silencieuse qui définit la durée pendant laquelle la source dedonnée n’a pas reçu de nouvelle transaction avant de lancer le processusde traitement. Ce paramètre est généralement défini à moins de 10 secon-des. Cette période d’attente protège le système de reconstructions fréquen-tes du cache dans le cas où il y aurait de nombreuses transactions de misesà jour sur la source relationnelle.

• La période de latence : durée qui garantit une période maximale au-delàde laquelle un rafraîchissement des données s’effectue.

• L’intervalle de latence : il s’agit de la durée maximum entre la notificationde changement et le démarrage du processus de cache proactif. Si la basede données est rafraîchie constamment, ce paramètre annule le paramètrede période de silence.

• L’intervalle de reconstruction forcée : ce paramètre est utilisé dans le butde fournir un simple cache sur des systèmes dont les bases de donnéessource ne disposent pas des fonctionnalités de notifications de mise à jour.

L’UDM remplace-t-il définitivement la construction du datamart ?

Le modèle UDM permet dans certains cas de s’affranchir de construire le data-mart. En considérant les fonctionnalités citées précédemment, il peut être tentantde passer directement du système opérationnel (OLTP) au mode multidimen-sionnel (OLAP) via UDM.

Il existe cependant des situations qui ne permettent pas de créer ou mettre àjour un cube via UDM.

Figure 7.5 — Le processus UDM

Système

Opérationnel

OLTP(Oracle,

Db2, SQL Server)

Cube

Analysis

Services

OLAP

UDM

Page 203: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 192

• 1. UDM nécessite une connexion OLE DB. Si la source de données setrouve dans un format différent (texte, XML) ou dans un format proprié-taire, il sera nécessaire de passer par le datamart.

• 2. UDM nécessite une connexion permanente avec la source des données.En particulier, si des fichiers doivent être reçus de différentes plates-formesvia FTP ou cédérom avant d’être traités, il sera nécessaire de passer par undatamart.

• 3. UDM alimente le cube à partir de données propres, ne nécessitant pasde transformations préalables. Si le système opérationnel contient deserreurs ou des informations nécessitant d’être nettoyées, il sera indispensablede passer par la phase d’alimentation du datamart via Integration Services.

7.3 MÉTHODOLOGIE DE CRÉATION D’UNE BASE DE DONNÉES DEPUIS UNE SOURCE EXISTANTE

La méthode la plus simple consiste à concevoir une base de données AnalysisServices en partant d’une base de données relationnelle quelle qu’en soit lasource (ERP, PGI, ODS, Oracle, DB2, SQL Server, Access, etc).

D’une manière générale, il est fortement conseillé de créer une base de don-nées relationnelle servant d’entrepôt de données. En effet, le datawarehouse quisert de source à la création des hypercubes joue le rôle d’interface entre les basesopérationnelles multiples et les cubes. On comprend aisément que cette interfaceest nécessaire pour des contraintes de performances, de nettoyage des donnéessource, et d’historisation de celles-ci. Les bases de données opérationnelles sontvolatiles et pour des raisons de performance sont vidées régulièrement des don-nées les plus anciennes (données indispensables aux cubes).

Cependant, il peut être astucieux et peu onéreux de commencer à développerune application décisionnelle en partant directement de la base de données tran-sactionnelle (OLTP) sans mettre en œuvre dès le départ un entrepôt de données.

Figure 7.6 — Dans la plupart des cas, la création du datamart est la solution la plus judicieuse

Système

Opérationnel

OLTP (Oracle,

DB2, SQL

Server)

Cube

Analysis

Services

OLAP

UDMData Mart

Métier

(Oracle,

DB2, SQL

Server)

Intégration

Services

Page 204: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.3 Méthodologie de création d’une base de données depuis une source existante ———————————————— 193

C’est le cas lorsque les données nécessitent peu de transformations, de nettoyageet d’agrégation. Dans ce cas, SSAS sera vu comme un environnement complé-mentaire au système de reporting existant. On gagnera dans ce cas l’avantage del’interactivité et on fera une économie non négligeable sur l’ETL.

Sources de données et vues sur les sources de données

Le point de départ pour la création d’une application décisionnelle consiste àcréer un nouveau projet dans l’interface business intelligence Development Studio.Une fois que le squelette du projet est créé par l’assistant, vous pouvez créer vossources de données pour vous connecter à n’importe quelle source relationnelle.

Les vues sur les sources de données contiennent des informations sur destables constitutives des différentes sources de données. Il est possible non seule-ment d’accéder aux tables et leurs champs mais également d’établir des jointuresentre les différentes tables source. Il est parfois judicieux de renommer les tableset les champs par des appellations plus proches du référentiel métier de l’utili-sateur. Parfois, on sera amené à créer des champs calculés dérivés des champsexistants.

L’avantage de ces vues pour le développeur réside dans le fait qu’elles sontpartagées entre les projets SSAS et SSIS au sein d’un même projet, ce qui estparticulièrement appréciable dans les cas suivants :

• La base de données d’origine comporte des centaines de tables dont seu-lement quelques-unes sont utiles au projet BI.

• Les sources de données sont multiples (serveurs distincts, SGBD distincts,plateformes différentes, fichiers plats, etc.).

• Le développeur BI n’a pas besoin de disposer des privilèges d’administra-tion sur les sources de données opérationnelles des ERP ou DW.

• Le développeur BI peut procéder au développement d’application en modedéconnecté (les sources de données ne sont pas nécessaires pour le déve-loppement).

Cette phase de normalisation sera payante tout au long du processus de déve-loppement des applications BI jusqu’à leur restitution.

Création des dimensions des mesures et des cubes

Après que les vues sur les sources de données ont été créées, vous allez procéderà la création des cubes OLAP. Une batterie d’assistants est disponible afin decréer les mesures (métriques) et les dimensions du cube (axes d’observation). Latechnologie Intellicube examine la base de données et les cardinalités dans lesjointures des tables et, tout naturellement, va déterminer les tables de faits et la

Page 205: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 194

tables de dimensions. L’assistant tente de créer des structures hiérarchiques parmiles attributs des dimensions. En général, il est conseillé de laisser l’assistant réa-liser ce travail préliminaire quitte à revenir ultérieurement sur des choix qui neseraient pas conformes à la définition du cahier des charges.

Maintenant que les dimensions et les mesures ont été définies avec soin, l’étapesuivante consiste à construire et déployer le cube sur le serveur.

Création et déploiement du cube

Jusqu’ici les étapes précédentes de création de dimension et de définition decubes ont généré sur la machine de développement des fichiers intermédiairesau format XML. Les processus de création et de déploiement vont maintenantfournir toutes ces données sur le serveur cible. Par défaut, le serveur de dévelop-pement réside sur votre machine locale. Il est naturellement possible au momentdu déploiement de choisir le serveur qui hébergera l’application BI.

Après cette étape de création, il convient de contrôler le prototype et en par-ticulier le comportement des mesures au travers des dimensions. Il est préférablede démarrer avec une base de données disposant de peu d’informations mais suf-fisamment significatives afin de détecter rapidement toute anomalie éventuelle.

L’étape suivante consiste à créer des composants BI tels que les KPI (Key Per-formance Indicators), les actions, les calculs dérivés. Selon que les utilisateurs cou-vrent des métiers différents, vous créerez des perspectives différentes. Cesperspectives sont en réalité des vues différentes des données à l’intérieur d’unmême cube selon des profils différents. Ces profils disposent également de droitsde consultation différents sur les données du cube. Si vous déployez des cubespour une consultation internationale ou multilingue, vous serez amenés àdéployer les fonctions de « traduction » (Translations). Lors de la création ducube vous, vous poserez la question de son mode d’alimentation et de la fré-quence de son rafraîchissement. Cela fera intervenir des notions de Partition etde cache proactif.

Une fois que la base Analysis Services a été réalisée, les objets sont déployéspour des tests d’alimentation et de performance sur le serveur de production.

7.4 CRÉATION DE NOTRE PREMIER CUBE

Afin de réaliser cet exemple, les composants suivants doivent être installés surle poste de travail :

• Microsoft SQL Server 2005 Database Engine.

• Microsoft SQL Server 2005 Analysis Services.

Page 206: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 195

• Business intelligence Studio.

• AdventureWorks DW sample Database (option à sélectionner).

• Vous devez être membre du groupe local administrateurs sur le serveur etdisposer des autorisations en lecture sur la base AdventureWorks DW.

Bien vérifier la sélection des options ci-dessus lors de l’installation de SQLServer 2005.

Le scénario suivant s’inspire d’une société fictive Cycles et Aventure qui fabri-que et distribue des bicyclettes en matériaux métalliques et composites. Lasociété emploie plusieurs équipes commerciales dans le but de couvrir un marchéqui s’étend sur trois continents : Amérique du Nord, Europe et Asie.

Pour répondre aux besoins en analyse des données des équipes commercialeset marketing, ainsi que de la direction, l’entreprise récupère actuellement lesdonnées transactionnelles dans la base de données Base_Opérationnelle et lesdonnées non transactionnelles comme les quotas des ventes dans des feuilles decalcul, et consolide ces données dans l’entrepôt de données relationnellesBase_Entrepot. Cependant, l’entrepôt de données relationnelles présente les pro-blèmes suivants :

Constat

Actuellement, les rapports prédéfinis fournis par le système opérationnel sontstatiques. Lorsque les utilisateurs désirent établir des tableaux de synthèse, ilsdoivent ressaisir les données dans le tableur Excel. Ils peuvent ensuite élaborerdes graphes. Les données de synthèse saisies manuellement dans Excel ne per-mettent pas d’explorer des niveaux de détail plus fins. Dans ce contexte, iln’existe pas de lien permettant de retrouver les données détaillées qui consti-tuent les données de synthèse.

Les utilisateurs n’ayant pas connaissance des technologies OLAP se conten-tent bien souvent des rapports qu’ils impriment selon leurs besoins. Parmi cesutilisateurs, certains souhaiteraient accéder directement aux données de la baseopérationnelle. Ils disposent parfois d’outils de requêtage. Cependant, du fait dela complexité du schéma de la base, ils renoncent à élaborer eux-mêmes les rap-ports dont ils ont besoin et finissent par solliciter les services informatiques.

Dans les environnements où l’entrepôt de données n’a pas été mis en place,les utilisateurs constatent avec stupeur que les données des années antérieuresne sont plus accessibles. Les processus de « nettoyage » visant à améliorer les per-formances du système transactionnel ont eu raison de l’historique des données.

Les temps de réponse sont aléatoires (plusieurs minutes voire plusieurs heureslorsque les volumétries sont importantes).

Page 207: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 196

La solution passe naturellement par l’entrepôt de données visant à organiserles données en tables dimensionnelles et la technologie OLAP dont un des objec-tifs est de permettre des analyses croisées dynamiques.

Dans l’exemple qui suit, nous allons montrer comment la technologie UDMva nous permettre d’élaborer rapidement un cube OLAP.

Un peu de méthode avant de commencer.

La création d’un cube passe par quatre étapes indispensables.

Étape 1 : Définir le processus à analyser

Cette première étape est souvent attachée à un besoin « métier ». Ce besoin estgénéralement exprimé par un manager opérationnel de l’organisation sous formed’interrogation : quelles sont les ventes réalisées sur Internet comparées sur lestrois dernières années par régions et par lignes de produit ?

Étape 2 : Déterminer le niveau de granularité des données

Les données proviennent des tables de faits pour les métriques et des tables dedimension pour les axes d’observation. La granularité représente le niveau dedétail auquel le manager souhaite parvenir. Bien souvent, les analyses se font surdes données agrégées apportant ainsi une vision globale de l’activité, mais il estégalement nécessaire de connaître les données détaillées qui composent la don-née synthétique. Le niveau de granularité le plus fin est conditionné par la lignede détail stockée dans la table de faits. Ainsi, pour une analyse des ventes réa-lisées sur Internet, il sera nécessaire d’identifier la table de faits susceptible derenfermer cette donnée. Une table candidate est naturellement la table Ventes-Internet. Le niveau de granularité le plus bas sera donc représenté par la lignede facture des ventes internet. En général, cette ligne de facture représente unniveau de détail suffisamment fin pour connaître l’article vendu, par qui etquand, puis de connaître la quantité vendue et le montant. Ralph Kimball etMargy Gross recommandent que la table de faits stocke la donnée à un niveau« atomique » c’est-à-dire au niveau le plus fin. Cependant, si vous décidez d’agré-ger les données dans la table de faits de l’entrepôt de données et que vous désirezaccéder au niveau de détail le plus fin, vous devrez envisager que UDM puisseaccéder à la source représentée par la base transactionnelle OLTP.

Étape 3 : Choisir les dimensions

L’analyse sémantique de la question posée par notre manager permet de déter-miner assez facilement les tables dimensionnelles devant intervenir dans l’éla-boration du cube. En effet, lorsque le responsable demande une analyse parRégions et par ligne de produit, il identifie clairement les axes d’observation,donc les dimensions du cube OLAP. La région étant déterminée par le client,la table dimensionnelle Clients sera introduite par l’UDM dans le référentiel.

Page 208: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 197

La notion de ligne de produit et produit est déterminée par deux champs de latable Produit. Nous devrons donc intégrer la table dimensionnelle Produit.

Notre manager précise également qu’il désire effectuer la même analyse surles trois dernières années. Cette requête implique par conséquent une notiontemporelle. Il sera donc nécessaire d’introduire la dimension Temps. Il est à noterque cette table Temps n’existe nullement dans la base opérationnelle. Elle estun artifice introduit uniquement dans la base entrepôt de données. Son but estde partager plusieurs datamarts selon le même axe temporel. La table Temps estjointe à la table de faits centrale grâce à une clé temporelle ajoutée à la table defaits et alimentée au moment de la phase d’ETL (fonction lookup).

Le niveau de granularité du cube sera déterminé par le niveau hiérarchiquele plus bas de chacune des dimensions qui composent le cube.

Étape 4 : Identifier les métriques

La dernière étape consiste à identifier les données numériques qui répondent àla question de notre manager.

7.4.1 Mesures

Dans l’exemple présenté ci-après, les mesures sont définies par la table Ventes-Internet et sont les suivantes :

• quantité commandée;

• prix unitaire;

• quantité étendue;

• remise unitaire;

• montant de la remise;

• coût standard du produit;

• coût total du produit;

• montant des ventes;

• montant de la taxe.

7.4.2 Dimensions

Notre manager veut effectuer des analyses selon divers axes d’observation.

L’axe clients se décompose de la façon suivante :

• région;

• province;

• ville;

Page 209: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 198

• nom;

• l’axe produits;

• catégorie de produit;

• sous-catégorie;

• ligne produit;

• produit;

• l’axe du temps;

• année;

• trimestre;

• mois;

• jour.

7.4.3 Le schéma en flocons

Les datamarts sont constitués d’une table de faits centrale autour de laquellegravitent des tables de dimensions. Selon que l’axe dimensionnel est composéd’une seule table ou de plusieurs, le schéma sera appelé en étoile ou en flocon.

Dans l’exemple ci-dessous, la table de fait centrale est la table FaitVentes-Internet. La dimension Client est composée de deux tables liées (DimClients etDimGeographie). De ce fait nous parlerons d’un schéma en flocons.

Figure 7.7 — Schéma en flocon composé d’une table de faits et de trois axes dimensionnels

Page 210: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 199

La dimension Produits est constituée à partir de trois tables liées DimProduit,DimSousCatégorieProduit et DimCatégorieProduit).

Dans la figure ci-dessus, l’axe Produits est lui-même composé de trois tables.On parle donc d’un schéma en flocons.

7.4.4 Créer le projet « Mon Premier Cube » à l’aide de l’environnement UDM d’Analysis Services

Un projet Analysis Services se décompose en deux phases. La première consisteà définir l’environnement des sources qui alimentent le cube. La seconde permetde créer le cube en introduisant la notion de mesures et dimensions.

Définir l’environnement des sources de données.

Sélectionner Démarrer, cliquer sur Microsoft SQL Server 2005 ensuite cliquezsur SQL Server business intelligence Development Studio.

L’environnement business intelligence de Visual Studio s’ouvre :

Nouveau projet

Dans la fenêtre Project types sélectionner business intelligence Projects.

Dans la fenêtre Visual studio Modèles Visual Studio effectuez un double-clicsur : Projet Analysis Services.

Figure 7.8 — Formulaire de création d’un projet SSAS

Page 211: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 200

Dans le champ Nom, nommer le projet : Projet Mon Premier Cube.

Dans le champ Emplacement, définir un chemin d’accès aux projets ou conservercelui proposé par VS. Dans le champ Solution, saisir Solution Mon Premier Cube.

Créer la source de données :

• Clic droit sur Source de données.

• Assistant Source de données.

• Cliquer sur Suivant.

• Sélectionner la méthode de définition de la connexion.

• Cliquer sur le bouton Nouveau.

• Dans la liste proposée choisissez OLE DB natif\SQL Native Client.

Choisir le fournisseur d’accès à la base Entrepot.

Figure 7.9 — Composants créés en standard lors de la création d’un projet SSAS

Figure 7.10 — Choix des types de connexion

Page 212: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 201

Le bouton Tester la connexion permet de vérifier la connexion au serveur.

Puis OK deux fois.

Figure 7.11 — Le gestionnaire de connexion

Figure 7.12 — Le Gestionnaire

de connexion vérifie le lien avec la base de données source

Figure 7.13 — L’assistant montre les paramètres

de la connexion de données

Page 213: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 202

Puis dans l’écran suivant, sélectionnez le choix Utiliser le compte de service.

Puis cliquez sur Terminer.

Dans l’explorateur de solutions, nous constatons la présence de la nouvellesource de données : Base_Entrepot.ds.

Figure 7.14 — Information sur l’identité de l’utilisateur accédant à la source de données

Figure 7.15 — Chaîne de connexion fournie par l’assistant

Figure 7.16 — La source de données dans l’explorateur

de solutions

Page 214: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 203

L’étape suivante consiste à créer une nouvelle vue de source de données.

Clic droit sur Vues de sources de données.

Validez Nouvelle vue de source de données…

L’assistant de source de données démarre.

Bouton Suivant.

Figure 7.17 — Création d’une nouvelle vue de source

de données

Figure 7.18 — Formulaire de sélection des tables qui entrent dans le référentiel du modèle en étoile ou en flocon

Page 215: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 204

Sélectionnez la source de données qui vient d’être créée Base Entrepot.

Bouton Suivant.

Dans le formulaire suivant vous allez sélectionner les tables de Base entrepotqui sont à inclure dans la vue de source de données.

Grâce au bouton > sélectionnez la table de faits FaitVentesInternet.

Cliquez sur le bouton Suivant.

Puis validez la fin de la création de source de données en cliquant sur le bou-ton Terminer.

Dans l’explorateur de solution vous observez la création de la vue Base Entre-pot.dsv.

Vous obtenez le schéma suivant (figure 7.19).

Créer le cube à l’aide de l’assistant

La phase de création du cube permet de déterminer les dimensions et les mesuresqui participent à son élaboration.

Dans l’explorateur de solutions, effectuez un clic droit sur Cubes puis validezNouveau Cube…

L’assistant de création de cube est sollicité.

Puis cliquez sur le bouton Suivant.

Figure 7.19 — Source de données selon un schéma en flocon

Page 216: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 205

Sélectionnez la Vue de source de données Base Entrepot puis cliquez sur lebouton Suivant.

L’assistant tente de détecter automatiquement les tables de faits et de dimension.

Puis cliquez sur le bouton Suivant.

Vous vérifiez que la table de faits est bien FaitsVentesInternet. Toutes lesautres tables sont des tables de dimension.

Précisez à l’assistant quelle est la table de dimension temporelle. Pour cela,sélectionnez la table de dimension temps DimTemps.

Dans l’écran présenté dans la figure 7.21, vous devez préciser la table qui jouele rôle de dimension de temps.

Figure 7.20 — Création d’un cube à l’aide de l’assistant UDM

Figure 7.21 — L’assistant détecte les tables de dimension et tables de faits

Page 217: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 206

Figure 7.22 — Identifier les tables

de faits et de dimension

Figure 7.23 — Créer une hiérarchie dans la dimension temporelle

Page 218: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 207

Sur la figure 7.22, le diagramme fait apparaître le schéma en étoile ou flocon endistinguant les tables de dimension et les tables de faits (au centre du diagramme).

Puis cliquez sur le bouton Suivant.

Sur la figure 7.23, l’assistant définit une hiérarchie pour la dimension Temps.À la différence de AS 2000 qui déduit automatiquement la hiérarchie temporelleà partir d’une date, SSAS 2005 doit recevoir un « mappage » manuel entre lespropriétés de la hiérarchie et les champs sélectionnés dans la table de dimen-sions. On remarquera que les valeurs année, trimestre, mois, etc. doivent existerdans la table dimensionnelle.

Lorsque la table dimensionnelle n’existe pas dans le modèle (cas fréquent) ilest nécessaire d’en générer une grâce à l’assistant de création de dimension tem-porelle sans source de données.

Figure 7.24 — Lorsque la table temps n’existe

pas, il est impératif de la créer grâce à l’assistant

dimension temps. Cette tâche a pour but de créer une nouvelle table dans l’entrepôt

de données

Figure 7.25 — Fournir les bornes pour la construction de la table temporelle

Page 219: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 208

Il est nécessaire de fournir les bornes pour la construction de la table.

Puis cliquez sur le bouton Suivant.

L’assistant détermine les mesures en fonction des champs numériques détec-tés dans la base de faits. Conservez uniquement les mesures qui ont un sens àêtre agrégées (mesures additives) comme ci-dessous.

Par défaut, l’assistant repère les champs au format numérique et tente d’encréer des mesures. Décochez les clés qui ne constituent pas des mesures dans labase de faits.

Puis cliquez sur le bouton Suivant.

L’assistant détecte automatiquement les hiérarchies.

Puis cliquez sur le bouton Suivant.

Déployez les nouvelles dimensions détectées afin de contrôler les choix effec-tués par l’assistant.

Vérifiez la pertinence des hiérarchies et des attributs.

Puis cliquez sur le bouton Suivant.

Figure 7.26 — Sélectionnez les mesures ou indicateurs pertinents

Page 220: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 209

Figure 7.27 — Décochez les attributs de dimensions qui ne définissent pas des axes d’analyse (le champ Photo n’est pas un axe d’analyse)

Figure 7.28 — L’assistant de création de cube affiche la structure

des nouvelles dimensions

Page 221: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 210

Puis cliquez sur le bouton Terminer.

Figure 7.29 — L’assistant affiche les groupes de mesures et les dimensions qu’il vient d’attribuer au cube MonPremierCube

Figure 7.30 — Le concepteur de cube présente l’explorateur de solutions, les groupes de mesures, les dimensions incluses

dans le cube et la vue de source de données

Page 222: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 211

Dans la vue de la source de données, vous observez la table de faits au centredu schéma en flocon (figure 7.30).

Le concepteur de cube contient les onglets suivants, qui affichent différentesvues du cube.

Structure de cubeCet onglet permet de modifier l’architecture d’un cube et d’en modifier les com-posants.

Utilisation de la dimensionCet onglet permet de définir les relations entre des dimensions et des groupesde mesures, ainsi que la granularité de chaque dimension au sein de chaquegroupe de mesures. Si vous utilisez plusieurs tables de faits, il se peut que vousdeviez identifier si les mesures s’appliquant ou non à une ou plusieurs dimensions.Chaque cellule représente une relation potentielle entre le groupe de mesures etla dimension intersectée.

CalculsCet onglet permet d’étudier les calculs définis pour le cube, de définir de nou-veaux calculs pour le cube dans sa totalité ou pour un sous-cube, de réorganiserles calculs existants et de déboguer les calculs, pas à pas, en s’aidant des pointsd’arrêt. Les calculs permettent de définir de nouveaux membres et mesures baséssur des valeurs existantes, tels que des calculs de profit, et de définir des jeuxnommés.

KPICet onglet permet de créer, éditer et modifier les indicateurs de performanceclés (KPI) dans un cube. Ceux-ci permettent au concepteur de déterminer rapi-dement les informations utiles relatives à une valeur et par exemple, de déter-miner si la valeur définie est supérieure ou inférieure à un objectif ou si latendance que suit la valeur définie augmente ou diminue.

ActionsCet onglet permet de créer ou de modifier des extractions, des rapports et d’autresactions pour le cube sélectionné. Il contient des informations contextuelles surles applications clientes, les commandes et les rapports auxquels les utilisateursfinaux peuvent accéder.

PartitionsLes partitions permettent de stocker les sections d’un cube dans différents empla-cements avec des propriétés différentes, telles que des définitions d’agrégations.

Page 223: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 212

PerspectivesUne perspective est un sous-ensemble défini d’un cube et sert à réduire la com-plexité d’un cube du point de vue de l’utilisateur.

TraductionsCet onglet permet de créer et gérer les noms traduits des objets de cube, tels queles noms de mois ou de produits.

NavigateurCet onglet permet d’afficher les données du cube selon une présentation prochedu tableau croisé dynamique.

L’explorateur de solutions présente les nouvelles dimensions (figure 7.31).

Dans le menu de Visual studio sélectionnez Fichiers puis cliquez sur Enre-gister tout.

Modification des mesures et dimensions créées par défautSélectionnez l’onglet Structure du cube puis dépliez les mesures de Fait VentesInternet.

Le volet Dimensions de l’onglet Structure de cube affiche les dimensions quiont été créées à l’étape précédente. Les dimensions Produit et Clients apparais-sent clairement. En revanche, la table de dimension Dim Temps a généré troisdimensions de cube temporelles. Ces dimensions temporelles correspondent auxchamps de type date observés dans la table de faits : date de livraison, date decommande et date expédition.

Figure 7.31 — L’explorateur de solution présente trois dimensions partagées alors que le cube lui-même en contient cinq (la dimension temps

est triplée dans le cube car il existe trois dates différentes liées à la table temps)

Page 224: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 213

Dans le volet Dimensions, déve-loppez Dim Clients, puis cliquez sur lelien Modifier Dim Clients.

Le concepteur de dimension appa-raît. Vous observez trois onglets :Structure de dimension, Traductionset Navigateur.

L’onglet Concepteur de dimensioncontient à son tour trois onglets :Attributs, Hiérarchies et niveaux etvue source de données.

Les choix effectués par l’assistantne nous conviennent pas. Par consé-quent, vous allez procéder à la modifi-cation de la hiérarchie de la dimension.

Commencez par renommer la hié-rarchie en Clients.

Figure 7.32 — Groupe

de mesures et dimensions

du cube

Figure 7.33 — L’onglet structure de dimension se décompose en Attributs, Hiérarchies et vue source de données propre à la dimension

Page 225: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 214

Clic droit sur l’en-tête de la hiérarchie, puisRenommer, puis saisissez Clients.

Vous allez reconstruire les niveaux hiérarchi-ques de la dimension clients.

Vous allez supprimer les niveaux actuels par unclic droit sur chaque niveau puis Supprimer.

Grâce à la fonction glisser déplacer, vous recons-tituez la hiérarchie de la dimension Clients.

Dans l’ordre, glissez tout d’abord Nom RégionFrançais puis immédiatement en-dessous NomProvince puis Ville et enfin Nom.

Vous obtenez ainsi la nouvelle hiérarchieClients.

Vous allez effectuer le traitement de réorganisation sur la dimension Produit.

Dans l’explorateur de solution sélectionnez la dimension Dim Produit.

Figure 7.34 — Supprimer ou renommer un niveau

dans la hiérarchie

Figure 7.35 — Grâce à un glisser-déplacer depuis la source de données vers la hiérarchie il est possible

de construire une ou plusieurs hiérarchies de dimension

Page 226: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 215

Les trois onglets Structure de dimension, Traductions et Navigateur s’ouvrentde nouveau. L’onglet Hiérarchie est vide.

Vous allez créer de toute pièce une nouvelle hiérarchie Produit en incluantla hiérarchie LigneProduit et Produit.

Avant de créer cette nouvelle hiérarchie et afin de mieux sélectionner leschamps, vous allez observer le contenu de la table DimProduit à partir de laquellevous allez reconstituer la hiérarchie.

Dans l’onglet Vue Source de données, faites un clic droit sur la table Dim-Produit puis Explorer les données.

En cliquant sur l’en-tête de colonne, vous pouvez trier en ordre croissant oudécroissant les données (ici NomProduitFrançais).

Figure 7.36 — Pour créer une hiérarchie, faites glisser une colonne ou un attribut sur la partie centrale

Page 227: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 216

Dans la hiérarchie Produit, vous allez sélectionner Ligne de produit puisimmédiatement en dessous, NomProduitFrançais.

Revenez sur l’onglet DimProduit puis glissez le champ LigneProduit de laVue source de données vers Hiérarchie et Niveaux.

Figure 7.37 — Un clic droit sur une table dans la source de données permet d’explorer le contenu de la table

Figure 7.38 — Glisser déplacer

un champ de la vue source de données dans la hiérarchie

Page 228: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 217

Une nouvelle hiérarchie vient d’être créée avec unseul élément LigneProduit.

Vous obtenez une nouvelle hiérarchie.

Hiérarchie temporelleDans l’explorateur de solutions, cliquez sur la dimen-sion Dim Temps. Dans l’onglet Hiérarchie et niveaux,renommez la hiérarchie en Dates.

Dans le menu Fichiers, choisissez alors Enregistrertout.

Pour afficher les données du cube dans le projet, ilest nécessaire de déployer le projet sur une instancespécifiée de Analysis Services, puis traiter le cube etses dimensions.

Le déploiement d’un projet Analysis Services entraînela création des objets définis dans une instance deAnalysis Services. Le traitement des objets dans uneinstance de Analysis Services, entraîne la copie desdonnées à partir des sources de données sous-jacentesdans les objets du cube.

Déployez le cubeFaites un clic droit sur MonPremierCube puis sélectionnez Déployer.

Figure 7.39 — Hiérarchie après introduction

d’un nouveau champ

Figure 7.40 — Renommer une hiérarchie

Figure 7.41 — Déployer le cube permet de créer la structure du cube sur le serveur Analysis Services

Page 229: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 218

À l’issue du déploiement, l’assistant récapitule l’ensemble des actions qu’il aréalisées.

Après que le cube est déployé puis traité sur le serveur, il est possible denaviguer dans le cube grâce à l’onglet Navigateur.

Dans le répertoire Cubes de l’explorateur de solutions, double-cliquez surMonPremierCube.cube puis dans la fenêtre de gauche, sélectionnez l’ongletNavigateur.

Vous observez un affichage proche du tableau croisé dynamique d’Excel. Vousallez progressivement déplacer les champs de mesures et dimension vers cetableau vierge.

Tout d’abord, glissez-déplacez la mesure Quantité commandée dans la partiecentrale du rapport.

Les champs de dimension vont être dirigés vers les en-têtes de lignes et decolonnes.

Glissez-déplacez la dimension Dim Clients vers les en-têtes de lignes puisDim Produit dans en-têtes de colonnes.

Figure 7.42 — Récapitulatif du déploiement du cube sur le serveur

Page 230: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 219

Glissez-déplacez la dimension temporelle Clé Date Commande vers l’empla-cement des champs de filtre. Dans la liste déroulante désélectionnez toutes lesannées sauf 2003.

Figure 7.43 — Onglet de navigation dans le cube

Figure 7.44 — La mesure Quantité commandée a été glissée

sur la partie détail du navigateur

Figure 7.45 — Le champ Ligne Produit définit les colonnes et Région définit les lignes

Page 231: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 220

En cliquant sur le signe + associé aux champs, vous allez pouvoir « forer »dans la hiérarchie des dimensions. Cette technique est également appelée drilldown. Le signe – permet d’effectuer un drill up.

Faites un clic droit sur l’espace du tableau puis sélectionnez Commandes etOption puis comportement puis cochez les cases Barre de titre et Barre d’outils.Vous pouvez obtenir un contexte proche de celui des tableaux croisés dynami-ques d’Excel.

Rappelons que l’outil de navigation n’est pas mis à la disposition de l’utilisa-teur final. Dans la phase de développement, il est utile au développeur et àl’administrateur (au travers de la console de management) à des fins de contrôle.

Figure 7.46 — La date de commande remplit le rôle de filtre

Figure 7.47 — Les signes + et — permettent d’effectuer drill down et drill up

Page 232: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 221

Vous pouvez continuer de déposer des champs mesures et/ou dimensions àpartir de la liste des champs disponibles.

Vous pouvez également retirer des champs (mesures ou dimensions) en sélec-tionnant l’en-tête du champ et en glissant celle-ci hors du tableau.

Créer une nouvelle hiérarchie de dimensionLa dimension Produit contient actuellement deux niveaux (Ligne produit et Pro-duit). L’analyste souhaite établir une subdivision par catégorie de produit et sous-catégorie de produit.

Figure 7.48 — Formulaire permettant de d’afficher des éléments afin de rendre le navigateur proche du tableau croisé dynamique

Figure 7.49 — L’interface est maintenant celle du tableau croisé dynamique d’Excel

Page 233: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 222

L’observation du diagramme de la base Base_Entrepot dans SQL ManagementStudio fait clairement apparaître les liens d’intégrité qui existent entre les tablesDimProduit, DimSousCatégorieProduit et DimCatégorieProduit.

La clé étrangère CléSousCatégorie de la table DimProduit et en jointure avecla clé principale CléSousCatégorieProduit de la table DimSousCatégorieProduit.

De même la clé étrangère CléCatégorieProduit de la table DimSousCatégorie-Produit et en jointure avec la clé principale CléCatégorieProduit de la table Dim-CatégorieProduit.

Afin d’ajouter les niveaux hiérarchiques Sous-catégorie de produit et Caté-gorie de produit, il est nécessaire d’ajouter les deux tables correspondantes dansla vue Base Entreprot.dsv.

Dans l’explorateur de solutions, cliquez avec le bouton droit sur la vue Baseentrepot.dsv.

Puis sélectionnez concepteur de cube.

Dans l’onglet de définition de vue, vous allez ajouter deux tables supplé-mentaires. Dans le menu BI studio, choisissez Vue des sources de données puisAjouter/Supprimer des tables…

Figure 7.50 — De nouvelles tables (catégories et sous-catégories) doivent être ajoutées au modèle en flocon. Ci-dessus, représentation des tables dans Management Studio

Page 234: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 223

Dans la partie droite de l’écran (figure 7.51), cliquez sur la table dbo.Dim-Produit puis actionnez le bouton Ajouter des tables associées.

Retirez la table FaitVentesRevendeur qui n’est pas utile pour le moment, puiscliquez sur DimSousCatégorieProduit et actionnez de nouveau le bouton Ajou-ter des tables associées.

Figure 7.51 — Ajouter des tables à une vue des sources de données grâce aux tables associées

Figure 7.52 — Ajouter des tables associées

Page 235: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 224

L’assistant détecte automatiquement les jointures entre les tables puis lesintègre automatiquement à la vue.

Cliquez sur OK.

Les deux nouvelles tables font maintenant partie de la vue Base Entrepot.dsv.

Sauvegardez tout.

Vous allez maintenant ajouter deux niveaux supplémentaires dans la hiérar-chie Produit.

Dans l’explorateur de solution, double-cliquez sur la dimension DimProduit.dim.

Dans la vue Source de données, utilisez le clic droit et l’option ajouter lestables… Vous ajoutez les deux tables suivantes DimSousCatégorieProduit etDimCatégorieProduit (figure 7.54).

Figure 7.53 — Objets inclus dans la vue finale

Figure 7.54 — Ajouter les tables DimSousCatégorieProduit

et DimCatégorieProduit au schéma en flocon

Page 236: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.4 Création de notre premier cube ————————————————————————————————————————————————————————— 225

Grâce au glisser-déplacer, vous allez insérer le champ NomFrançaisSous-Catégorie au-dessus de ligne Produit. Vous allez faire de même en amenant lechamp NomFrançaisCatégorieProduit au-dessus du champ précédent.

Renommez également le titre de la hiérarchie en Produit et Catégories.

Puis déployez le cube : clic droit dans l’explorateur de dimension puisDéployer.

Dans l’explorateur de solution, effectuez un clic droit sur la dimension DimProduit.dim, puis dans l’onglet central Navigateur, choisissez la hiérarchie glo-bale Produit et catégories puis déroulez l’arborescence des catégories de produit.

Figure 7.55 — Glisser-déplacer un champ d’une table vers la hiérarchie

Figure 7.56 — La nouvelle hiérarchie après introduction des champs de catégorie

Page 237: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————————————————————————— 7. Analysis Services 226

Figure 7.57 — Navigateur de dimension

Figure 7.58 — Il est possible de naviguer dans tous les attributs de la dimension

Page 238: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

7.5 Conclusion ——————————————————————————————————————————————————————————————————————————— 227

Vous pouvez changer de niveau hiérarchique et observer les membres selonle nouvel axe dimensionnel.

La navigation dans le cube fait clairement apparaître la nouvelle hiérarchieProduit et Catégorie.

7.5 CONCLUSION

Ce chapitre nous a permis de comprendre les différentes étapes qui participentà la création d’un cube. Nous avons successivement défini les sources de données.Nous avons défini un schéma en flocon faisant apparaitre clairement la table defaits centrale et les tables descriptives appelées dimensions. Lors de la créationdu cube l’assistant a détecté le rôle des tables en présence. Il a déterminé la tablede faits comportant les mesures (métriques), puis les tables dimensionnelles. Ila déterminé le niveau de granularité et les liaisons entre tables de faits et tablesde dimension.

Le déploiement du cube sur le serveur Analysis Services a ensuite permis denaviguer dans le cube grâce à l’outil intégré à BI studio.

Dans le chapitre suivant nous apporterons un éclairage complémentaire enprésentant de façon plus détaillée les composants essentiels du cube afin derépondre plus précisément à des problématiques métier.

Figure 7.59 — Les attributs catégories et sous catégories sont maintenant intégrés au cube

Page 239: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server
Page 240: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8Méthode

de conception des cubes avec SSAS

Nous l’avons vu, créer un cube OLAP avec l’assistant ne présente pas de diffi-culté majeure, en particulier si l’on respecte les paramètres standard fournis parl’outil. La base de données relationnelle sous-jacente est indispensable à la fabri-cation du cube, mais de par sa structure tabulaire et linéaire, elle reste difficile-ment exploitable pour l’analyse. Le langage SQL, seul outil de requêtage, permetde réaliser des rapports simples basé sur des notions de listes dont la valeur ajou-tée consiste à effectuer des regroupements matérialisés par des sous-totaux inter-médiaires de colonnes et totaux généraux. Un véritable serveur analytiquedispose de la couche OLAP offrant des performances constantes quelle que soitla volumétrie. À la vision purement séquentielle de l’information, OLAP en apporteune transverse permettant ainsi de mettre en relation des données non contiguësdans l’entrepôt. Cette capacité à définir des rapprochements structurés dansl’espace est rendue possible grâce au langage MDX.

De telles performances sont rendues possibles grâce à une gestion simplifiéedes agrégations. Celles-ci résultent de calculs visant à regrouper des donnéesnumériques puisées dans les tables de faits. Ces calculs sont préstockés dans lecube OLAP à des niveaux variables de regroupement, rendant possible un affi-chage instantané. Cette technique de regroupement de données sous forme préa-grégée est de loin plus efficace que la méthode ancienne qui consistait à indexer

Page 241: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 230

des vues SQL. Cette technique d’indexation était également accompagnée d’unemise à niveau coûteuse des matériels afin de répondre à toujours plus d’exigence.

L’objectif principal est de déterminer les agrégations qui répondent le mieuxaux besoins métier et d’identifier la fréquence de mise à jour des agrégats. Unautre enjeu consiste à décider de la façon de conserver l’historique et particuliè-rement s’il est nécessaire de tracer les changements d’états successifs au niveaudes axes d’observation (produits, clients, fournisseurs, etc.).

La mise en place d’agrégations permet de prévenir des risques de mauvaiseinterprétation des données. En effet, dans un modèle relationnel, comments’assurer que l’utilisateur qui désire suivre son stock semaine par semaine ne vapas par erreur additionner des stocks successifs au lieu de ne considérer que la varia-tion constatée d’une semaine sur l’autre. Nous l’avons déjà vu, il s’agit là d’unenotion de mesure semi-additive, totalement prise en compte par OLAP. Un autreaspect naturellement pris en compte par OLAP est le rapprochement de donnéesà des niveaux de granularité différents (budget défini à un niveau trimestriel,comparé à des données journalières).

Une fois que les membres de l’organisation ont décidé des besoins métiers,ils vont alors préciser comment ils souhaitent y accéder (Internet, intranet, viaExcel ou autre outil tiers) et la manière dont ils veulent naviguer au sein deleurs données (forage progressif selon différents niveaux d’agrégation).

8.1 ORGANISATION LOGIQUE DES CUBES

8.1.1 Définition de la structure OLAP

Plusieurs étapes sont à respecter lors du développement d’un projet Analysis Ser-vices.

Démarrer le projet OLAP

Vous devez disposer de l’outil client BI Development Studio sur votre machinede développement. Votre ordinateur doit pouvoir être connecté au serveur dedonnées de SQL Server 2005 afin d’accéder au datawarehouse. Il doit égalementêtre connecté au serveur d’analyse de SQL Server 2005. De nombreux déve-loppeurs qui travaillent en mode déconnecté installent les composants serveursur leur machine de développement. BI Studio sert à concevoir et à développerla base Analysis Services. Management Studio a pour vocation de maintenir labase de données d’analyse (ajout et exécution de partitions, sauvegarde, etc.). Larègle est que tout développement ou toute modification de définition des cubesdoit être réalisée dans BI Studio puis déployée sur le serveur. Plutôt que d’accéder

Page 242: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.1 Organisation logique des cubes ————————————————————————————————————————————————————————— 231

directement aux tables des bases sources, Analysis Services accède à celles-ci aumoyen d’une couche d’exposition qui simplifie grandement le processus de main-tenance. C’est également grâce à ces vues que le développeur exposera les champsde données selon des règles de nommage métier compréhensible par l’utilisa-teur final.

Bien qu’il faille attendre que la phase de définition du datawarehouse soit ter-minée avant d’entamer celle de la construction des cubes OLAP, il n’est cepen-dant pas nécessaire que la phase d’ETL soit terminée. Il est tout à fait possibleet même recommandé de ne pas attendre la fin du processus Integration Servicespour démarrer le projet SSAS. Bien souvent on se contentera de quelques don-nées de test, que l’on pourra modifier manuellement afin de créer différentes situa-tions. Les résultats seront d’autant plus faciles à contrôler que les données sontpeu nombreuses (contrôle des moyennes, et des mesures semi-additives). Letemps de rafraîchissement des cubes sera réduit d’autant.

Créer le projet et la vue des sources de données

Afin de contrôler une solution globale faisant intervenir des projets divers telsque SSIS, SSAS, SSRS, il est fortement conseillé de créer une seule solutionintégrant elle-même les trois projets différents.

Cette stratégie permet de créer une vue dessources de données qui sera partagée dans l’ensem-ble de la solution. Les sources de données parta-gées sont plus aisées à maintenir parce qu’elles sontdéfinies à un endroit unique (figure 8.1).

L’assistant des sources de données peut en créerune nouvelle basée sur une existante dans la mêmesolution ou créer une source de données basée surun projet Analysis Services existant.

Figure 8.1 — Trois projets dans la même solution

Figure 8.2 — Le menu ci-contre permet d’effectuer toutes les modifications sur une vue de données

Page 243: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 232

Lors de l’ajout de tables dans la vue (choix Ajouter/Supprimer des tables…,figure 8.2), les jointures existantes dans la base de données sous-jacente sontimmédiatement reconstituées. On peut vouloir créer de nouvelles jointures entredes champs de tables. Un simple glisser-déplacer suffit. Il est important d’effec-tuer le glisser depuis le champ représentant la clé étrangère de la table côté n,vers le champ représentant la clé unique dans la table côté 1 (figure 8.3).

Les attributs de description des tables et des champs seront remplis avec soincar Analysis Services utilise ces données lors de la création du cube. On éviterade stocker les commentaires dans le cube lui-même car il seraient alors remplacésà chaque retraitement du cube.

Il est possible d’ajouter dans la vue des tables en provenance de serveur tiers (Ora-cle, DB2, etc.). D’une manière générale, on préfèrera effectuer des jointures sur destables de bases de données tiers dans l’environnement propre du datawarehouse.

8.1.2 Définir les dimensions

D’une manière générale, lesdimensions sont construites àpartir du schéma en étoile ou enflocon et sont a priori indépen-dantes de tout cube.

Les dimensions sont par naturepartageables entre plusieurscubes. Lors de la construction ducube les dimensions sont sélec-tionnées. La figure 8.4 montredes dimensions qui peuvent êtrepartagées entre plusieurs cubes.

Une dimension standardcontient une clé (Product Namedans la figure 8.6) un ou plusieursattributs, et une ou plusieurs hié-

Figure 8.3 — Les jointures sont reconstituées lors de l’ajout de tables

Figure 8.4 — Dans le projet Analysis Services Tutorial, huit dimensions ont été préparées

Page 244: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.1 Organisation logique des cubes ————————————————————————————————————————————————————————— 233

rarchies. Analysis Services crée des dimensions à partir de tables dénormalisées.Le passage de la troisième forme normale à une forme de table « plate » permetde répondre à des critères de performance.

Une dimension peut inclure des hiérarchies de type parent/enfant. Unedimension peut être à variation lente de type 1 (ne tient pas compte de l’histo-rique) ou de type 2 (garde la trace des changements). Une dimension peut pré-senter les deux types simultanément. En effet les types de réaffectation sontdéfinis au niveau de chaque attribut de dimension et non pas au niveau global.

Une dimension de type 2 est toujours préférée au type 1, car il n’y a pas deréaffectation globale sur l’historique à chaque rechargement de la table dimen-sionnelle. Les traitements de reconstruction des cubes sont allégés d’autant.

Figure 8.5 — Le cube est composé de dix dimensions (trois dimensions

temporelles, Due date, Order date, Ship date, sont dérivées des trois champs de type Date dans la table de faits). La figure 8.5 montre les dimensions

utilisées par le cube Analysis Services Tutorial

Figure 8.6 — Les dimensions sont caractérisées par des attributs et des hiérarchies

Page 245: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 234

Modifier les propriétés des dimensions

Une dimension possède plusieurs propriétés modifiables. Les plus importantes sont :

• Le nom de la dimension est visible de l’utilisateur. Il convient de le définirde façon très représentative du métier.

• La description est également exposée à l’utilisateur.

• Le type peut revêtir des usages différents : les plus importants sont Regular,Time, Accounts. Le type, déduit par l’assistant lors de la création de ladimension, est naturellement modifiable et permet à SSAS d’établir uncertain nombre de contrôles lors de la création des cubes.

Nous donnons la définition de quelques propriétés de dimension :

• AttributeAllMemberName : affiche le texte au niveau le plus élevé de la hié-rarchie de dimension (exemple : All Customers).

• ErrorConfiguration : SSAS détecte de lui-même des incohérences auniveau des données de dimensions comme des clés dupliquées ou des vio-lations d’intégrité référentielle. Il s’agit d’un paramètre de gestion deserreurs configurable pour gérer les clés dupliquées, les clés inconnues, leslimitations des erreurs, l’action lors de la détection d’erreurs, le fichierjournal des erreurs et les clés NULL.

La figure 8.7 montre les différentes options offertes par la gestion des erreurslors de l’alimentation d’une dimension. Les options par défaut sont affichées etsont explicites. Il est possible de tracer dans un fichier journal la liste des erreursrencontrées lors du traitement. Le choix pour cette option est personnalisé ou pardéfaut. Il est souhaitable de laisser l’option par défaut.

• Processing Mode : indique si l’indexation et l’agrégation doivent se produiredurant le traitement (Regular) ou après le traitement (Lazy).

Figure 8.7 — Options disponibles en cas de personnalisation de la configuration des erreurs

Page 246: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.1 Organisation logique des cubes ————————————————————————————————————————————————————————— 235

• Processing priority : détermine la priorité de traitement du cube durant lesopérations en arrière-plan, telles que les agrégations et l’indexation diffé-rées. La valeur par défaut est 0.

• ProactiveCaching : paramètres de mise en cache proactive pour le cube.

• Source : précise la vue de source de données utilisée pour le cube.

• StorageLocation : emplacement de stockage du système de fichiers pour lecube. Si aucun n’est spécifié, l’emplacement est hérité de la base de don-nées qui contient le cube.

• StorageMode : mode de stockage pour le cube; les valeurs sont MOLAP, ROLAPou HOLAP comme illustré dans la figure 8.8.

• Visible : détermine si le cube est visible ou non.

Modifier les attributs des dimensions

La plupart des attributs de dimensions sont définis correctement par l’assistantde création de dimension. Quelques propriétés utiles ne sont cependant pasgérées par l’assistant.

• Usage : Key est l’usage réservé à la clé de substitution (ou clé unique).L’usage Regular sera choisi pour l’ensemble des attributs à une exception :une dimension parent-enfant présentera un usage Parent.

• Keycolumns : représente la colonne source de la table de dimension rela-tionnelle. En général, il s’agit de la clé unique représentée par la clé desubstitution.

• OrderBy et OrderByAttribute : permettent de trier un attribut par la valeurde la clé ou par le nom de l’attribut. Il est possible également de trier unattribut selon l’attribut relié.

Figure 8.8 — Paramètres de stockage pour la dimension Customer

Page 247: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 236

• IsAggregatable : un attribut peut être ou non agrégé. La valeur par défautest vrai.

• AttributeHierarchyDisplayFolder : il est possible de regrouper artificiellementplusieurs attributs. Il suffit de saisir un libellé dans la zone réservée à ceteffet. Celui-ci enrichit une liste déroulante qui peut être réutilisée pourd’autres attributs.

• AttributeHierarchyVisible : permet de cacher des attributs que l’on ne sou-haite pas exposer à l’utilisateur. Un attribut peut être caché mais participerà une hiérarchie de dimension.

• AttributeAllMemberName : est composé de all plus le nom de la hiérarchie.Il est cependant possible d’en modifier le contenu.

• Attribut parent-enfants Une hiérarchie parent-enfant est une hiérarchiedans une dimension standard qui contient un attribut parent. Un attributparent décrit une relation d’auto-référencement, ou jointure réflexive, dansune table de dimension principale. Les hiérarchies parent-enfant sontconstruites à partir d’un seul attribut parent. La figure 8.10 montre unerelation parent-enfant. La jointure récursive permet de faire pointer lechamp EmployeeKey vers le champ ParentEmployeeKey dans la mêmetable Employee.

Figure 8.9 — Les attributs sont organisés en trois ensembles homogènes(Contacts, Demographic, Location)

Page 248: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.1 Organisation logique des cubes ————————————————————————————————————————————————————————— 237

• RootMemberIf : permet d’identifier le membre parent le plus élevé dans lahiérarchie.

• NamingTemplate : le modèle de nom de niveau détermine les noms deniveaux affichés pour les utilisateurs lorsqu’ils parcourent le cube. Par exem-ple, Employee Level * permet d’afficher (Tout); Employee Level 02; EmployeeLevel 03 ; Employee Level 04 ; etc.) en fonction du niveau sélectionné. Ilest possible de préciser manuellement des noms de niveaux distincts.

Modifier les attributs liés des dimensions

Figure 8.11 — L’attribut date est relié à l’attribut Month name, lui-même relié à l’attribut Calendar

Quarter, lui-même relié à Calendar Semester lui-même relié à Calendar Year dans une cardinalité de type

plusieurs et un type de relation flexible

La notion d’attributs liés est une caractéristiquequ’il est important de connaître car sa maîtriseconditionne grandement les performances d’inter-rogation du cube. Les attributs reliés participentà un mécanisme qui permet d’établir une intégritéréférentielle entre plusieurs attributs d’une mêmedimension. Lors de la création de la dimension,l’assistant affecte à la clé de la dimension un liend’intégrité de type « un à plusieurs » avec l’ensemble des autres attributs de ladimension. Le paramètre RelationShipType indique si une relation change dansle temps. Les valeurs sont les suivantes :

Figure 8.10 — Attribut parent-enfant de la dimension Employee

Page 249: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 238

• Rigid : signifie que les relations entre les membres ne changent jamais dansle temps.

• Flexible : indique un changement possible dans le temps.

Créer des hiérarchies ou modifier les attributs de hiérarchie de dimensions

La création d’une hiérarchie résulte d’un besoin métier ou de contraintes denavigation.

Structure de dimensionCertaines hiérarchies sont naturelles telles que année/mois/jour ou catégorie deproduit/sous-catégorie de produit/produit. D’autres sont moins naturelles tellesque fréquence de commande/nom du revendeur.

Les niveaux des hiérarchies sont construits à partir des attributs des hiérar-chies. Les propriétés de chaque niveau sont également empruntées aux attributscorrespondants et ne peuvent être modifiés au sein de chaque hiérarchie.

Pour une hiérarchie régulière, utilisez la propriété HideMemberIf d’un niveaud’une hiérarchie pour masquer les membres manquants aux utilisateurs finaux.

TraductionsLes traductions permettent au serveur de prendre en charge les applicationsclientes en adaptant le langage de présentation selon la langue du client. Il estutile de pouvoir traduire divers éléments d’un cube et de ses dimensions dansune langue différente, de sorte que des personnes de divers pays puissent afficheret comprendre le cube. Au moment de l’affichage de la requête, un dialogue

Figure 8.12 — Créer des hiérarchies et des niveaux par un glisser-déplacer des attributs des dimensions vers la fenêtre hiérarchies et niveaux

Page 250: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.1 Organisation logique des cubes ————————————————————————————————————————————————————————— 239

s’établit entre la station du client et le serveur. Le client renvoie la langue utiliséeau serveur qui renvoie à son tour le résultat de la requête dans la langue de l’uti-lisateur.

NavigateurL’onglet Navigateur permet d’explorer les attributs ou les hierarchies de dimen-sion. La figure 8.13 montre une navigation dans la hierarchie Product Categories.Après toute modification d’un attribut ou hiérarchie il est nécessaire de se recon-necter au cube avant d’explorer à nouveau les données.

Avant de parcourir les données il est nécessaire de traiter la dimension. Iln’est cependant pas nécessaire de déployer le cube ou de traiter la base de don-nées du cube.

Dans la figure 8.13, si une traduction avait été développée, la liste déroulanteferait apparaître les membres dans la langue adéquate.

8.1.3 Modification du cube

Nous l’avons vu, l’assistant permet de créer rapidement un cube en précisant :

• la vue de la source de données;

• les tables de dimensions;

• les tables de faits;

• les tables qui servent de passerelles dans des relations de dimensions detype plusieurs à plusieurs.

Figure 8.13 — Choisir une hiérarchie ou un attribut et parcourez la liste des données

Page 251: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 240

Après que le cube a été créé grâce à l’assistant, il est possible de revenir surtous les composants du cube grâce au concepteur de cube. Il est possible de testerle cube, d’ajouter de nouvelles dimensions à des groupes de mesures et d’ajouterdes groupes de mesure.

Les objets qui composent le cube sont présentés ci-après.

Les mesures sont des données en provenance des tables de faits. On distingue :

• les mesures physiques définies à partir des colonnes de la vue source;

• les mesures calculées dérivées d’autres colonnes de la table de faits. Les cal-culs sont élaborés grâce au langage MDX (Multidimensional Expressions);

• les fonctions d’agrégation permettent des fonctions de type sum, count, min,max, distinct count.

Les groupes de mesures rassemblent des mesures extraites d’une même tablede fait et dont la granularité est définie par les dimensions.

Le cube rassemble dimensions, mesures et groupes de mesure. Ceux-ci secomportent comme les cubes virtuels de la version MSAS 2000, les cubes vir-tuels étant le résultat de jointure de cubes physiques distincts.

Figure 8.14 — Cellules feuilles

Page 252: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.1 Organisation logique des cubes ————————————————————————————————————————————————————————— 241

La base de données Analysis Services peut héberger plusieurs cubes. Pourune bonne organisation, il est préférable de ne traiter qu’un seul cube par basede données.

Lorsque de nombreuses mesures et dimensions sont disponibles dans le cube,il est souhaitable de présenter les informations d’entreprise en fonction du métierde l’utilisateur. C’est le rôle des perspectives. Cette fonctionnalité est disponibleuniquement dans la version SQL Server Enterprise.

Les cellules se distinguent en cellules feuilles (terminales) et cellules nonterminales non-feuilles. Dans SSAS, la cellule représente l’unique intersectionlogique d’un membre de n’importe quelle dimension référencée dans un cube.Un cube se compose essentiellement de cellules, rassemblées dans des groupesde mesures et classées par dimension.

Un membre non-feuille est un membre qui possède un ou plusieurs membresenfants. Dans ce cas, la valeur de la cellule dérive le plus souvent de l’agrégationde membres enfants associés au membre non-feuille.

Dans la figure 8.14, une seule cellule est ombrée. Cette cellule est l’intersec-tion des membres suivants :

• le membre avion de la dimension Itinéraire;

Figure 8.15 — Cellules non-feuilles

Page 253: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 242

• le membre Afrique de la dimension Source;

• le membre quatrième trimestre de la dimension Temps;

• la mesure Packages.

La valeur de la mesure Packages (240 dans notre exemple) peut être extraitedirectement de la colonne correspondante d’une ligne de la table de faits, cartous les membres sont terminaux (feuilles).

Dans l’exemple fourni par la figure 8.15, les deux cellules en grisé représen-tent un agrégat du 3e et 4e trimestre soit le 2e semestre. Le membre du 2e semestreest non-feuille car tous les membres qui lui sont associés doivent être agrégés.

La dimension Mesures fait l’objet d’un traitement particulier. Cette dimen-sion regroupe les données numériques faisant l’objet de traitement d’agrégation.

8.1.4 L’utilisation des dimensions

L’onglet « utilisation de la dimension » permet rapidement d’observer quellesdimensions participent à quels groupes de mesures.

La structure du cube fait apparaître le groupe de mesures ainsi que les dimen-sions générées avec l’assistant. Chaque groupe de mesures rassemble des donnéesen provenance d’une même table de faits. On observe que les trois dates diffé-rentes dans les tables de faits ont généré trois axes dimensionnels différents (DueDate, Order Date, Ship Date).

Figure 8.16 — La structure du cube présente les groupes de mesures et le dimensions du cube

Page 254: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.1 Organisation logique des cubes ————————————————————————————————————————————————————————— 243

L’onglet Utilisation de la dimension permet, pour chaque groupe de mesures,de préciser si telle ou telle dimension participe à ce groupe et à quel niveau degranularité. On trouve fréquemment des niveaux de granularité différents. C’estle cas lorsque l’on désire comparer des prévisions (table de faits prévus) connuesà un niveau trimestriel alors que la table de faits réalisés fournit des donnéesquotidiennes.

Chaque table de faits dans la vue des sources de données constitue un groupede mesures.

Chaque dimension peut participer ou non à une agrégation de mesure.

À chaque intersection d’une mesure et d’une dimension, on peut trouver dif-férents types de relations entre les tables de faits et les dimensions :

• Aucune dimension : la table de faits et la table de dimension ne sont pasassociées.

• Normale : la table de dimension est directement jointe à la table de faits.

• Fait : la table de dimension est la table de fait.

• Référencé : la table de dimension est jointe à une table intermédiaire, elle-même jointe à la table de faits.

Figure 8.17 — L’onglet utilisation de la dimension

Page 255: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 244

• Plusieurs à plusieurs : la table de dimension est jointe à une table de faitsintermédiaire, elle-même jointe à un table de dimension qui à son tour estjointe à une table de dimension intermédiaire, cette dernière étant jointeà la table de faits. SSAS simplifie en proposant une jointure entre la dimen-sion et un groupe de mesures intermédiaire.

• Exploration des données : la dimension cible est basée sur un modèle d’explo-ration de données (voir algorithmes dans le chapitre « Data mining »).

8.1.5 Les calculs

La création de calculs portant sur différents objets du cube (mesures, dimensions,membres, etc.) nécessite l’utilisation du langage MDX. Parce qu’il est dans lanature humaine de résister à tout nouvel apprentissage, SSAS fournit encoreune fois un point d’entrée relativement aisé grâce à un assistant dont le but estd’occulter une grande part de complexité. Il s’agit de l’outil d’ajout de businessintelligence qui permet de créer plusieurs types de calculs.

De nombreux calculs sont aisés à créer tels que des sommes de mesures oudes ratios. Les mesures calculées s’ajoutent à la liste des mesures existantes. Pourl’utilisateur final, il n’existe pas de différences entre une mesure physique et unemesure calculée.

Dans l’exemple ci-dessous, nous créons une mesure calculée nommée Moyenne-DesVentes dont l’expression de calcul est obtenue par glisser déplacer des mesures

Figure 8.18 — Formulaire permettant de créer une mesure calculée

Page 256: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.1 Organisation logique des cubes ————————————————————————————————————————————————————————— 245

du volet de gauche vers le champ Expression. La fonction division a été fourniemanuellement.

L’assistant génère la commande MDX suivante :

CALCULATE;CREATE MEMBER CURRENTCUBE.[MEASURES].MoyenneDesVentesAS [Measures].[Internet Sales-Sales Amount]/[Measures].[Internet Sales Count],FORMAT_STRING = "Percent",VISIBLE = 1;

Une liste de fonctions est fournie grâce à l’onglet Fonction. On y retrouvedes fonctions statistiques (arithmétiques), temporelles, de manipulation de chaînede caractères, conditionnelles, etc.

Il faudra rester vigilant sur la complexité des calculs car les mesures calculéesfont l’objet de traitement d’agrégation à la volée, au moment de l’affichage. Lesmesures calculées ne sont pas stockées dans le cube.

Les membres calculés sont définis à l’intérieur des dimensions plutôt que dansles mesures.

Les jeux nommés représentent un ensemble de membres de dimensions. Parexemple, un jeu nommé peut représenter un groupe de produits, ou un sous-ensemble de clients que l’on veut identifier rapidement.

8.1.6 Ajouter de la business intelligence

À moins que vous ne soyez un expert en langage MDX, la meilleure méthodepour vous initier au langage MDX est d’utiliser l’assistant de business intelligence.Cet assistant propose un ensemble de calculs que l’on rencontre fréquemmentdans l’entreprise.

Le bouton Ajouter de la business intelligence vous permet de lancer l’assis-tant qui propose un certain nombre d’améliorations telle que :

• Assistant Time Intelligence : permet d’ajouter des vues supplémentairesparamétrées en fonction du temps et du niveau hiérarchie sélectionné. Ilest ainsi possible de calculer des mesures de type Year to Date (période-à-date), moyenne mobile, moyenne sur douze mois et comparaison de pério-des en valeur et en pourcentage. Cet assistant ne fonctionne que si aumoins une dimension date existe dans le cube.

• Intelligence comptable : permet d’attribuer des classifications comptablesstandard, par exemple les bénéfices et les dépenses, aux membres d’unattribut de compte. Le serveur utilise ces classifications pour agréger lescomptes (débit/crédit, positif ou négatif).

Page 257: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 246

• Intelligence des dimensions : identifie une dimension et ses attributscomme étant de types prédéfinis tels que produits, clients, taux, temps etc.Lorsque le type de dimension a été défini, des valeurs calculées addition-nelles peuvent être créées en utilisant la définition de la dimension.

• Opérateur unaire pour remplacer l’agrégation par défaut qui est associéeaux membres dans une hiérarchie parent-enfant.

• Formule de membre personnalisée : pour remplacer l’agrégation pardéfaut d’une hiérarchie par les résultats d’une expression MDX.

• Ordre de classement des attributs pour spécifier comment les membres d’unattribut sont classés. Ils peuvent être classés d’après le nom ou la clé del’attribut, ou d’après le nom ou la clé d’un autre attribut. Par défaut, lesmembres sont classés par le nom.

• Écriture différée de la dimension permet aux utilisateurs de modifiermanuellement la structure de la dimension. Les mises à jour effectuées surune dimension activée en écriture sont enregistrées directement dans latable de la dimension.

• Comportement semi-additif définit la méthode d’agrégation pour les mesu-res ou les membres individuels d’un attribut de type compte.

• Conversion monétaire définit les règles de conversion et d’analyse desdonnées multinationales du cube. Les règles de conversion s’appliquent auniveau du cube dans le script de calcul.

8.1.7 Les indicateurs clé de performance (KPI)

Les indicateurs clé de performance mesurent la santé de l’entreprise. Ces dispo-sitifs sont généralement mis à disposition des managers afin de leur permettre depiloter leur business. À l’instar d’un tableau de bord de voiture qui regroupe lescadrans essentiels pour la conduite du véhicule, on retrouve ces indicateurs depilotage de l’entreprise au sein du « digital dashBoard » ou tableau de bord numé-rique de l’entreprise. Celui-ci offre une vue synthétique de l’activité et grâce àdes systèmes d’alerte permet en un seul coup d’œil de contrôler toute dérive ausein de l’entreprise.

Afin d’interpréter ces indicateurs visuels, il est nécessaire de disposer d’outilscapables de lire et de restituer les KPI de SQL Server 2005. On dispose d’outilstels qu’Excel (à partir de la version 2007) ou Panorama Software.

Un indicateur clé de performance reflète cinq niveaux d’observation : très bon,bon, moyen, mauvais, très mauvais.

Page 258: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.1 Organisation logique des cubes ————————————————————————————————————————————————————————— 247

Un indicateur clé est conçu à partir de quatre composants :

• L’expression de valeur résulte d’une simple mesureou d’un membre calculé. Exemple : [Measu-res].[Reseller Sales-Sales Amount].

• L’expression de l’objectif à atteindre, en général uneexpression MDX, ou peut-être un membre ou unattribut de dimension. Exemple : [Measures].[SalesAmount Quota].

• L’état avec son indicateur d’état très visuel.

Tapez l’expression MDX qui renvoie la valeur d’état de l’indicateur de per-formance clé lorsque ce dernier est exécuté.

Faites glisser les éléments sélectionnés du volet Outils de calcul vers cetteoption pour inclure la syntaxe MDX des éléments sélectionnés.

Il est recommandé que cette expression renvoie une valeur décimale compriseentre – 1 et 1. Une valeur inférieure à zéro représente une situation négativealors qu’une valeur supérieure à zéro représente une situation positive.

Exemple de code calculant l’état de l’indicateur :

CaseWhen KpiValue("Reseller Revenue")/KpiGoal ("Reseller Revenue")

>=.95Then 1When KpiValue("Reseller Revenue")/KpiGoal ("Reseller Revenue")

< .95AndKpiValue("Reseller Revenue")/KpiGoal ("Reseller Revenue") >=.85

Then 0Else – 1

End

• La tendance.

La tendance est représentée par des valeurs numériques qui se traduisent gra-phiquement par des flèches.

CaseWhen IsEmpty(

ParallelPeriod(

[Date].[Calendar Time].[Calendar Year],1,

Figure 8.19 — Liste des indicateurs d’état

Page 259: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 248

[Date].[Calendar Time].CurrentMember)

)Then 0When (

KpiValue("Reseller Revenue") –(

KpiValue ("Reseller Revenue"),ParallelPeriod([Date].[Calendar Time].[Calendar Year],

1, [Date].[Calendar Time].CurrentMember))/ (

KpiValue ("Reseller Revenue"),ParallelPeriod([Date].[Calendar Time].[Calendar Year],

1, [Date].[Calendar Time].CurrentMember))

)>=.02Then 1When (

KpiValue("Reseller Revenue") –(

KpiValue ("Reseller Revenue"),ParallelPeriod([Date].[Calendar Time].[Calendar Year],

1, [Date].[Calendar Time].CurrentMember))/ (

KpiValue ("Reseller Revenue"),ParallelPeriod([Date].[Calendar Time].[Calendar Year],

1, [Date].[Calendar Time].CurrentMember))

)<=.02Then – 1Else 0

End

Le résultat affiché dans le navigateur de l’onglet KPI est montré figure 8.20.

Microsoft dispose d’ores et déjà d’un outil très élaboré de définition et derestitution des KPI. Business Scorecard Manager permet de définir ses propresKPI puis de les intégrer grâce à des webpart dans le portail « maison » SharePointPortal.

Les KPI sont maintenant interprétés par les tableaux croisés dynamiquesd’Excel version 2007.

Page 260: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.1 Organisation logique des cubes ————————————————————————————————————————————————————————— 249

8.1.8 Les actions

SSAS permet d’exécuter des commandes sur le serveur. Les actions sont définiesgrâce au langage MDX. Une action peut être déclenchée par l’utilisateur eneffectuant un clic droit sur une cellule agrégée d’un tableau afin de connaître leslignes qui participent à la valeur de la cellule.

Plusieurs types d’action peuvent être envisagés :

• l’accès au détail (drillthrough);

• l’exécution d’un rapport grâce à Reporting services (voir chapitre 10);

• l’exécution d’une action générique telle que l’appel d’une URL ou l’exé-cution d’un commande. Une action est une instruction MDX et peut êtreexécutée par l’utilisateur en cliquant (droit) sur la valeur contenue dansune cellule ou sur le nom du membre de la cellule. L’action reçoit en para-mètres des données du cube qui sont transmises à l’application cliente.

Lors de la modification d’une action dans le cube il n’est pas nécessaire deretraiter les données. Seules les métadonnées doivent être déployées.

8.1.9 Les perspectives

Une perspective s’apparente à une vue qui s’applique au sommet de la base dedonnées et qui permet de limiter l’accès à certaines dimensions et groupes demesures. Dans certaines organisations, on cherche même à ne présenter que cer-taines perspectives à certains utilisateurs autorisés. Il est possible également decacher le cube

Les perspectives ne sont disponibles que dans la version SQL Server 2005Enterprise ou Developer. Si vous disposez de la version standard avec un modèle

Figure 8.20 — Le navigateur dans SSAS permet d’afficher la valeur, l’objectif, l’état et la tendance

Page 261: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 250

de cube qui intègre des perspectives, vous devrez les supprimer avant de déployerle cube.

8.1.10 Les traductions

L’onglet Traductions permet d’exposer les métadonnées du cube selon la languede l’utilisateur. Il est possible d’apporter des traductions aux groupes de mesure,aux mesures, aux dimensions, aux KPI, aux actions, aux jeux nommés et auxmembres calculés.

Le choix de la langue est déterminé en fonction des paramètres régionauxstockés sur le poste client.

8.1.11 Le navigateur de données

Le dernier onglet du concepteur de cube offre l’opportunité de tester le cube.Avant de pouvoir naviguer dans les données du cube, vous devez traiter etdéployer le cube. Le navigateur qui s’apparente au tableau croisé dynamiqued’Excel, permet de contrôler rapidement l’effet de modifications apportées dansle cube. Il n’est donc pas nécessaire de disposer d’un outil tiers tel qu’Excel ouProclarity pour procéder aux tests de validation.

8.2 L’ORGANISATION PHYSIQUE DU CUBE

8.2.1 Les groupes de mesures et les partitions

Lors de la création du cube via l’assistant, celui-ci crée automatiquement unepartition par groupe de mesures.

Figure 8.21 — L’onglet Partitions montre les partitions liées aux groupes de mesures

Page 262: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.2 L’organisation physique du cube ———————————————————————————————————————————————————————— 251

L’assistant attribue un nom à chaque partition emprunté au groupe de mesureauquel il est lié. La source précise la table ou la vue qui alimente la partition. Lasource est identique à celle sur laquelle repose le groupe de mesures. Un groupede mesure repose sur une table de faits.

La colonne agrégations précise le mode de stockage des agrégations de don-nées. Dans certains cas, il sera nécessaire de créer plusieurs partitions pour unmême groupe de mesures. Chaque partition dispose de sa propre source de don-nées qui peut se traduire par une vue filtrée. Les partitions sont associées dansle groupe de mesure.

Figure 8.22 — Chaque partition correspond à un groupe de mesure du cube

Figure 8.23 — Groupe de mesure avec plusieurs partitions temporelles en provenance d’une même table de faits

Page 263: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 252

8.2.2 Les différents modes de stockage

Par défaut, SSAS propose le mode de stockage MOLAP (Multidimensional OLAP)qui est de loin le plus performant. Le mode MOLAP est adapté au modèle dimen-sionnel. Il utilise un algorithme de compression des données et des techniquesd’indexation offrant d’excellentes performances. MOLAP sera préféré aux vuesindexées aussi bien en termes d’espace requis pour le stockage des index qu’entermes de performances. Dans le mode MOLAP, toutes les données sont stockéesdans le cube selon une organisation dimensionnelle.

Il est cependant possible de stocker les dimensions dans deux autres modesappelés ROLAP (Relational Olap) et HOLAP (Hybride OLAP).

Lorsque les données sont stockées dans l’ordinateur sur lequel la partition estdéfinie, une partition locale est créée. Lorsque les données sont stockées sur unautre serveur Analysis Services, une partition distante est créée. La structure mul-tidimensionnelle qui stocke les données de la partition se situe dans un sous-dossier du dossier Data des fichiers programmes de Analysis Services.

Dans le mode ROLAP, les données de détail et les agrégats sont stockés dansdes tables relationnelles. Lorsque les résultats ne peuvent pas être dérivés desagrégations ou du cache de requête, le système accède à la table de faits de lasource de données pour répondre aux requêtes. Ce mode offre des performancesinférieures aux deux autres modes. Le mode ROLAP permet d’économiser del’espace de stockage pour les grands datasets qui sont rarement interrogés, commeles données purement historiques. Si une partition utilise le mode de stockageROLAP et que ses données sources sont stockées dans SQL Server 2005 AnalysisServices, Analysis Services tente de créer des vues indexées pour contenir lesagrégations de la partition. La création et l’utilisation de vues indexées pour lesagrégations exigent que la partition ROLAP et les tables de son schéma rem-plissent les conditions suivantes :

• la partition ne peut contenir de mesures qui utilisent la fonction Min()ou Max() ;

• chaque table de la partition ne peut être utilisée qu’une seule fois;

• les colonnes source ne doivent pas contenir de données NULL.

Dans le mode HOLAP, les données de détail sont stockées dans des tablesrelationnelles tandis que les agrégats le sont dans un format multidimensionnel.Le mode de stockage HOLAP convient pour les partitions de cubes qui néces-sitent des réponses rapides aux requêtes sur des données de synthèse calculées àpartir d’un volume important de données source. Les performances sont inter-médiaires entre MOLAP et ROLAP.

Page 264: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.2 L’organisation physique du cube ———————————————————————————————————————————————————————— 253

8.2.3 Comment SSAS rafraîchit-il les données du cube ?

Le service de notification de SQL Server 2005 informe Analysis Services lorsquedes changements surviennent dans les tables sources. Lorsqu’une partition estliée à une vue, il est nécessaire de préciser la table de suivi

L’interrogation planifiée interroge régulièrement la base afin de déterminersi des données ont changé.

Figure 8.24 — Paramétrer les options de stockage

Figure 8.25 — Préciser la table de suivi qui informe SSAS en cas de modification

Page 265: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 254

Dans le cas du mode ROLAP temps réel, les données sont directement stoc-kées dans la table relationnelle. Il n’y a pas besoin de notification ni de cacheproactif. Les données sont toujours à jour mais ce au détriment des performances.

Après le déploiement du cube, SQL Server Management Studio permet d’obser-ver le cube et ses dimensions attachées à chaque groupe de mesures.

Du fait de sa capacité à optimiser les accès aux données, le partitionnementest indispensable lorsque les groupes de mesures sont volumineux (millions oumilliards de lignes). Il est également plus rapide d’ajouter des données dans unenouvelle partition plutôt que dans une partition déjà très volumineuse. Le par-titionnement est également utile lorsque l’on désire conserver des données surune période glissante (par exemple, lorsque l’on souhaite conserver les trois der-nières années ou les 90 derniers jours). Dans ce cas, il suffit de supprimer la parti-tion plutôt que de supprimer des lignes dans une énorme partition. Enfin, lepartitionnement améliore les performances lors du processus de traitement com-plet d’un groupe de mesures.

Le partitionnement multiple peut être envisagé pour de très gros volumes. Ilest possible par exemple de créer des partitions par mois et par catégorie de pro-duits. Cette fonctionnalité est réservée à SQL Server Enterprise Edition.

Figure 8.26 — Management studio présente les partitions associées aux groupes de mesures

Page 266: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.2 L’organisation physique du cube ———————————————————————————————————————————————————————— 255

Lorsque vous établirez des partitions, soyez vigilants aux bornes que vousdevez définir dans la clause WHERE. BI Studio ne permet pas de détecter si des don-nées en provenance des tables de faits sont doublées ou manquantes.

Lors du développement avec BI Studio, vous pouvez préciser l’édition du ser-veur de déploiement (Enterprise ou Standard). Ce dispositif permet de fournirà BI Studio les fonctionnalités autorisées ou non, et de signaler toute incohérenceavant le déploiement.

Figure 8.27 — Les propriétés de la partition sont modifiables dans Management Studio telles que le mode

de stockage et la mise en cache proactif

Figure 8.28 — Dans les propriétés du projet, précisez l’édition du serveur de déploiement

Page 267: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 256

8.2.4 Paramétrer les agrégations

Le paramétrage des agrégations permet de définir les limites de stockage ou deperformance des agrégations générées.

L’espace de stockage estimé atteint xxx Mo

Limite les agrégations en indiquant l’espace disque autorisé pour générer les agré-gations.

Les gains de performance atteignent xx %

Limite la conception d’agrégation en définissant le pourcentage maximal de gainde performance estimé que la conception d’agrégation peut fournir.

Je clique sur Arrêter

Arrête la conception d’agrégation en cliquant sur Arrêter au cours du processusde conception.

Ne pas créer d’agrégations (0 %)

On utilise cette option pour supprimer des agrégations existantes pour une par-tition, un groupe de mesures ou un cube.

Figure 8.29 — Le formulaire « Définir les options d’agrégations » permet de définir les limites de stockage

ou de performance des agrégations générées

Page 268: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

8.2 L’organisation physique du cube ———————————————————————————————————————————————————————— 257

Démarrer

Démarre le processus de conception d’agrégation.

Arrêter

Arrête le processus de conception d’agrégation.

8.2.5 Processus de mise à jour des cubes

Il existe plusieurs méthodes d’alimentation du cube. Depuis SQL Server 2005,une méthode réside dans la technique du cache proactif. L’alimentation s’effec-tue à partir des tables opérationnelles lors de leurs mises à jour. Il est possibleégalement d’alimenter directement le cube à partir de SSIS à l’aide du flux dedonnées multidiffusion afin d’alimenter simultanément le datawarehouse et lecube multidimensionnel. Sauf cas exceptionnel, nous conseillons toujours de pas-ser par l’étape du datawarehouse qui, à son tour, sert à alimenter le cube.

Plusieurs méthodes peuvent être mises en œuvre.

Retraitement completCette méthode consiste à retraiter la totalité du cube à chaque ajout de donnéesdans un groupe de mesures. Il s’agit naturellement de la méthode la plus simpleà mettre en œuvre et probablement la plus sûre. Elle est choisie par la plupartdes administrateurs. Elle est naturelle et même conseillée si les cubes ont unefaible volumétrie et, par conséquent, un temps de retraitement court. Cette méthodeest à proscrire si les mises à jour des tables de faits sont quotidiennes avec desvolumétries très élevées (centaines de milliers d’enregistrements). Dans ce cas,nous aurons recours à la méthode de traitement incrémentiel.

Traitement incrémentielLe traitement incrémentiel consiste à filtrer les données les plus récentes destables de faits afin de ne traiter qu’un nombre réduit de lignes. Cette techniqueest séduisante mais elle nécessite une très grande rigueur lors de la phase d’ali-mentation. Le risque naturel est de traiter deux fois les mêmes données ou toutsimplement d’omettre de les traiter. Malheureusement, SQL Server 2005 ne dis-pose pas de solution intégrée. Le développeur doit mettre en place un mécanismed’audit qui consiste à « marquer » les lignes ayant fait l’objet d’un traitementafin de s’assurer de ne pas les traiter une seconde fois. L’absence de traitementou un traitement partiel sont plus délicats à gérer puisqu’ils ne laissent aucunetrace. Dans ce cas, on pourra développer un script MDX qui établira un contrôlequotidien avec la base de production pour détecter des écarts éventuels et retrai-ter la partition incriminée.

Page 269: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————— 8. Méthode de conception des cubes avec SSAS 258

8.3 RECOMMANDATIONS

Bien que les assistants soient nombreux dans Analysis Services, ce logiciel estcomplexe et nécessite beaucoup de soin dans sa conception. Lors de la mise aupoint initiale, testez, contrôlez autant que vous le pourrez. Après la mise en pro-duction du cube, donnez-vous les moyens de croiser des données du cube avecd’autres sources telles que le datawarehouse sous-jacent. Il n’y a rien de plus effi-cace pour jeter le discrédit sur votre œuvre qu’un utilisateur qui lance en pleineréunion que le cube donne des résultats incohérents. Testez avec les utilisateurs,observez leur façon d’interpréter et de contrôler les données. Mettez en produc-tion les automates de contrôle et faites-vous alerter par SSIS au moindre écart.Soyez le premier à alerter les utilisateurs qu’un dysfonctionnement a eu lieu plu-tôt que d’apprendre par un utilisateur que votre cube est faux.

Page 270: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9Le data mining

Un diffuseur d’ouvrages distribue plusieurs sortes de magazines : sciences humai-nes, philosophie, roman, sport et beaux-arts. Il souhaite mieux étudier ses clientspour découvrir de nouveaux marchés ou vendre plus de nouveautés à ses libraires.Les questions qu’il se pose sont les suivantes :

• Combien de libraires ont acheté des ouvrages de sport cette année ?

• A-t-on vendu plus d’ouvrages de sport cette année que l’année dernière àla même période ?

• Les libraires qui achètent des ouvrages de philosophie achètent-ils égale-ment des ouvrages de « beaux-arts » ?

• Quels sont les critères qui caractérisent une librairie orientée sport ousciences humaines ?

• Comment puis-je prédire la perte des clients et les actions nécessaires pourla réduire ?

Les réponses aux questions 1 et 2 peuvent être fournies par de simples outilsde requêtage de type SQL.

La question 1 trouvera une réponse en exécutant une requête SQL sur la basede données opérationnelle ou mieux sur l’entrepôt de données. Les critères d’extrac-tion sont dans ce cas l’année de l’achat et le type d’ouvrage (sport).

La question 2 implique de conserver en ligne deux années de ventes, puis decomparer l’agrégat des ventes réalisées en Year to date (cumul depuis le début del’année) et d’en déduire l’écart en valeur. La réponse sera fournie très facilement

Page 271: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 260

par une requête MDX exécutée sur le cube OLAP. Excel fournira une réponse,grâce au tableau croisé dynamique.

La question 3 permet de déterminer la probabilité que la règle d’associationentre plusieurs éléments est vérifiée. Il s’agit d’un type de recherche dirigée carl’objectif est totalement identifié. Si la valeur de la probabilité est élevée, lediffuseur serait avisé d’effectuer des offres promotionnelles en associant les deuxproduits. La réponse à cette question sera fournie par un des algorithmes de datamining.

La question 4 est de nature exploratoire. Il s’agit de découvrir une règle plutôtque de la vérifier. Cela est du ressort du data mining, technologie qui offre plu-sieurs algorithmes répondant à cette problématique.

La question 5 est également exploratoire et nécessite de conserver un histo-rique afin de modéliser les comportements d’attrition (départ volontaire du client).Il y a lieu de mettre en œuvre des indicateurs tels que quantités retournées, délaisde paiements, impayés. La notion temporelle est très importante car elle permetd’observer au fil du temps des changements parfois imperceptibles.

9.1 MÉTHODOLOGIE DE CRÉATION DU MODÈLE DE DATA MINING

9.1.1 Définition du problème à résoudre

Lorsque l’on entreprend un processus de data mining, on cherche à définir leproblème à résoudre.

• Un commercial désire prévoir si un client particulier achètera ses produits.

• Un diffuseur désire constituer des groupes homogènes de personnes quipartagent des informations démographiques similaires et qui achètent desproduits similaires.

• Un webmaster d’un site de commerce électronique souhaite analyser dessimilitudes de comportements successifs (exemple : des séquences declics similaires. Il désire connaître comment les utilisateurs se déplacentsur le site).

• Le directeur commercial veut mesurer l’attrition des clients et anticiper lesactions correctives.

• Le directeur marketing veut optimiser les coûts d’une campagne de com-munication (exemple : cibler les clients potentiels en n’envoyant des pros-pectus qu’aux clients susceptibles de répondre).

Page 272: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.1 Méthodologie de création du modèle de data mining —————————————————————————————————————— 261

• Le directeur commercial de Adventureworks désire savoir si la vente d’unmodèle de vélo peut-elle être utilisée pour prédire la vente d’un autre modèle ?

• Un grossiste en produits culturels souhaite identifier les articles qui onttendance à être achetés ensemble (analyse de panier, up sell, cross sell).

9.1.2 Préparation des données

Si les données proviennent de sources diverses, il est nécessaire de procéder àl’alimentation du datawarehouse. C’est le rôle de l’ETL. Ensuite, le processus dedata mining puise ses données dans différentes sources comme les cubes OLAPou les bases de données relationnelles via le connecteur OLE DB.

À ce stade, la connaissance des données et la signification des rubriques sontdéterminantes pour la construction du schéma de données. Par exemple si ondésire connaître les critères les plus importants dans l’achat d’un vélo tout terrain,on s’oriente vers les caractéristiques du client et on sélectionne celles qui parais-sent pertinentes dans l’acte d’achat (âge, revenu, nombre d’enfants, sexe, etc.).

9.1.3 Construction du schéma de données

Cette étape consiste à sélectionner les sources de données. Les sources peuventêtre extraites des schémas relationnels ou des cubes OLAP. Avant de créer unmodèle, vous devez sélectionner les données qui serviront à l’apprentissage dumodèle.

9.1.4 Création du modèle

Si vous désirez prédire quels prospects seront susceptibles d’acheter vos produits,il vous faut analyser le comportement des acheteurs actuels. Il s’agit de créer unjeu de données d’apprentissage qui servira à nourrir le modèle. Un modèle contientdes colonnes d’entrées (critères pertinents), une colonne d’identification (clé)et une ou plusieurs colonnes prévisibles. Le modèle applique sur le jeu de donnéesun ou plusieurs algorithmes tels que classification, association ou régression choi-sis en fonction du but recherché.

9.1.5 Exploration du modèle

Lorsque le modèle est construit, il convient de l’explorer afin de découvrir lesanalyses prédictives effectuées par les algorithmes. business intelligence Studiodispose d’outils d’exploration très visuels. Nous aurons l’occasion de les présenterplus loin dans ce chapitre.

Page 273: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 262

9.1.6 Validation du modèle

La validation du modèle consiste à lui appliquer un jeu de données de test danslequel les valeurs des variables prédictives sont connues et à les comparer auxprédictions fournies par le modèle. Cette étape permet également de choisir entreplusieurs algorithmes celui qui correspond le mieux à l’échantillon analysé. Sile modèle créé à l’étape précédente ne fonctionne pas correctement, il faudrarevenir sur la conception du modèle en redéfinissant le problème, ou en modi-fiant les critères sélectionnés dans le jeu d’origine.

9.1.7 Déploiement du modèle

Lorsque le modèle a été validé, il y a lieu de le déployer sur le serveur de pro-duction. On attribuera des rôles autorisant tel ou tel utilisateur à accéder auxmodèles déployés.

Lorsque les modèles sont déployés, il est possible de les utiliser lors du pro-cessus ETL ou lors d’une validation de transaction dans la base opérationnelle.Cette dernière fonctionnalité permet par exemple de savoir avec précision si leprospect récemment introduit dans la base de données sera ou non un acheteurpotentiel.

La mise à jour du modèle doit être réalisée lorsque de nouvelles données vien-nent alimenter les bases.

9.2 QUELLES SONT LES TÂCHES DU DATA MINING ?

ClassificationLa classification consiste à examiner les caractéristiques d’un objet afin de luiattribuer une classe. Les caractéristiques sont généralement basées sur des valeursdiscrètes (tranche d’âge, genre, marié/célibataire, etc). La classification est utiledans les cas suivants :

• attribuer ou non un prêt à un client;

• établir un diagnostic;

• accepter ou refuser un retrait dans un distributeur.

RégressionÀ la différence de la tâche de classification, la régression sert à déterminer unerelation entre deux colonnes continues. La relation se présente sous la formed’une équation correspondant à la droite représentant le mieux une série de don-

Page 274: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.2 Quelles sont les tâches du data mining ? ————————————————————————————————————————————————— 263

nées. Par exemple, la droite dans le diagramme suivant est la meilleure repré-sentation linéaire possible des données. Cette notion est souvent utilisée dansla partie graphique d’Excel.

L’équation qui correspond à la droite du diagramme est de type y = ax + b.On la nomme équation de régression. La variable y représente la variable de sortie,x représente la variable d’entrée, et a et b sont des coefficients ajustables. Pourchaque point de données du diagramme, une erreur est associée à la distanceentre le point et la droite de régression. Les coefficients a et b de l’équation derégression ajustent l’angle et l’emplacement de la droite de régression. L’ajuste-ment des variables a et b peut être renouvelé jusqu’à ce que la somme des erreursassociées aux points atteigne le plus petit nombre possible.

SegmentationLa segmentation consiste à former des groupes (clusters) homogènes à l’intérieurd’une population afin de répondre à la question « Quels attributs trouve-t-on encommun dans chaque groupe ? » La tâche de segmentation précède souvent lesautres tâches afin de construire des groupes sur lesquels on applique des tâchesde classification.

AssociationL’association examine les comportements de groupes d’individus afin de déter-miner quels liens existent entre eux. Les règles d’association sont souvent liéesau secteur de la distribution à travers ce qu’on appelle l’analyse du panier de laménagère. Des sites d’achats en ligne de produits culturels utilisent cette méthodeafin de rechercher les produits qui tendent à être achetés ensemble et proposeren ligne des offres complémentaires (vente additionnelle).

Un des principaux attraits de la méthode est la clarté des résultats produits.En effet, le résultat de la méthode est un ensemble de règles d’association dontvoici quelques exemples :

• si un client achète des plantes, alors il achète du terreau;

Figure 9.1 — Graphe présentant une droite de régression

Page 275: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 264

• si un client achète du poisson et du citron, alors il achète du vin blanc;

• si un client achète une télévision, il achètera un magnétoscope dans un an.

Bien souvent, les commerciaux ont déjà intuitivement déterminé des groupesqui seront probablement confirmés par l’algorithme. Bien que cela puisse rassu-rer, il est évident que les décideurs attendent des réponses non triviales et utiles,allant bien au-delà d’une simple analyse.

Cette méthode est par définition non supervisée car il n’existe pas d’indicea priori permettant d’effectuer une recherche prédéfinie.

Analyse de séquenceL’algorithme de séquence permet d’analyser un chemin réalisé par le passé afind’en déduire la route probable dans le futur.

On applique souvent ce type d’algorithmes à l’analyse des séquences de clicsque les internautes effectuent sur un site web.

L’analyse de séquence sert également à découvrir l’ordre dans lequel un clientajoute des éléments dans son panier d’achat sur un site de vente en ligne.

Toute société qui offre un service d’achat en ligne est intéressée par cettedémarche. En effet, pour acheter, les clients doivent se connecter au site. La sociétécollecte des informations sur les pages que les internautes visitent et l’ordre danslequel ils consultent les pages. Il analyse également quelles sont les pages les plusconsultées avant l’acte d’achat d’un produit.

9.3 CRÉER LE MODÈLE D’UNE CAMPAGNE CIBLÉE

Afin d’offrir au lecteur une vue globale des outils de data mining, nous pensonsutile de lui présenter les étapes de la méthode et, pour chacune d’elles, les outilsfournis par business intelligence Studio.

Nous allons tour à tour construire trois types d’application. Nous commen-cerons par un premier scénario de publipostage ciblé qui permettra de présenterles algorithmes de classification. Nous présenterons également des scénarios deprévision, d’analyse de panier et enfin de séquence clustering.

Ces exemples peuvent être réalisés par le lecteur s’il dispose de SQL Server2005 version standard ou Enterprise avec Analysis Services, et les exemplesmodèles AdventureWorks.

Le lecteur trouvera tous les outils nécessaires sur le site de l’auteur à l’adressewww.buroformatic.com.

Page 276: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.3 Créer le modèle d’une campagne ciblée ————————————————————————————————————————————————— 265

La création d’un modèle d’exploration de données commence par la créationd’un projet Analysis Services dans lequel nous créerons les sources de donnéesen lien avec les bases relationnelles ou OLAP.

Nous allons créer un nouveau projet Analysis Services que nous nommonsAdventureWorks DataMining.

9.3.1 Créer la source des données

La source des données est une connexion qui identifie le serveur et la base dedonnées dans laquelle résident les données à analyser.

• Choisissez OLE DB natif\SQL Native Client comme fournisseur d’accès.

• Serveur Localhost et utilisez l’authentification Windows.

• Sélectionnez la base de données dimensionnelle (datawarehouse) Adventure-WorksDW.

9.3.2 Créer la vue de source des données

Faites un clic droit sur Vue des sources de données puis Nouvelle vue des sour-ces de données, puis sélectionnez la source de données opérationnelle Adven-tureWorks créée à l’étape précédente.

Figure 9.2 — Création du projet data mining via Analysis Services

Page 277: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 266

Sélectionnez la vue dbo.vTargetMail dans laquelle se trouvent les donnéesnécessaires à l’analyse (voir figure 9.3).

Cette requête détermine quel client est acheteur ou non de produits « bikes ».On calcule la somme des occurrences des acheteurs de « bikes ». L’algorithmeattribue la valeur 1 si le nombre de ventes est >=1 et 0 dans le contraire.

Voici la structure de la vue :

CREATE VIEW [dbo].[vTargetMail]AS

SELECTc.[CustomerKey],c.[GeographyKey],c.[CustomerAlternateKey],c.[Title],c.[FirstName],c.[MiddleName],c.[LastName],c.[NameStyle],c.[BirthDate],c.[MaritalStatus],c.[Suffix],c.[Gender],c.[EmailAddress],c.[YearlyIncome],c.[TotalChildren],c.[NumberChildrenAtHome],c.[EnglishEducation],c.[SpanishEducation],c.[FrenchEducation],c.[EnglishOccupation],c.[SpanishOccupation],c.[FrenchOccupation],c.[HouseOwnerFlag],c.[NumberCarsOwned],c.[AddressLine1],c.[AddressLine2],c.[Phone],c.[DateFirstPurchase],c.[CommuteDistance],x.[Region],x.[Age],CASE x.[Bikes]

WHEN 0 THEN 0ELSE 1

END AS [BikeBuyer]

Page 278: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.3 Créer le modèle d’une campagne ciblée ————————————————————————————————————————————————— 267

FROM[dbo].[DimCustomer] c INNER JOIN (

SELECT[CustomerKey],[Region],[Age],Sum(

CASE [EnglishProductCategoryName]WHEN ‘Bikes’THEN 1ELSE 0

END) AS [Bikes]FROM

[dbo].[vDMPrep]GROUP BY

[CustomerKey],[Region],[Age]

) AS [x]ON c.[CustomerKey] = x.[CustomerKey]

La vue vDMPrep qui participe elle-même à la vue vTargetMail est basée surle schéma en flocon dont la table de fait centrale est FactInternetSales et lestables dimensionnelles : Customers, DimProduct, DimProductSubcategory, Dim-ProductCategory, DimCustomer, DimGeography, DimSalesTerritory.

Cette vue permet de déterminer l’âge du client au moment de l’extrationgrâce à la fonction DateDiff(yy, c.[BirthDate], GetDate()) qui calcule l’écart enannées entre la date du jour et la date de naissance. La vue constitue égalementdes tranches de revenu selon les gains annuels.

Yearly Income est déterminé comme Low, Moderate ou High selon que lerevenu annuel est inférieur à 40 000, compris entre 40 000 et 60 000 ou supérieurà 60 000.

Les noms longs sont réduits afin d’offrir plus de lisibilité dans le modèle.

Figure 9.3 — Voici la vue vTargetMail

Page 279: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 268

CREATE VIEW [dbo].[vDMPrep]AS

SELECTpc.[EnglishProductCategoryName],Coalesce(p.[ModelName], p.[EnglishProductName]) AS [Model],c.[CustomerKey],s.[SalesTerritoryGroup] AS [Region],CASE

WHEN Month(GetDate()) < Month(c.[BirthDate])THEN DateDiff(yy, c.[BirthDate], GetDate()) – 1

WHEN Month(GetDate()) = Month(c.[BirthDate])AND Day(GetDate()) < Day(c.[BirthDate])

THEN DateDiff(yy, c.[BirthDate], GetDate()) – 1ELSE DateDiff(yy, c.[BirthDate], GetDate())

END AS [Age],CASE

WHEN c.[YearlyIncome] < 40000 THEN ‘Low’WHEN c.[YearlyIncome] > 60000 THEN ‘High’ELSE ‘Moderate’

END AS [IncomeGroup], t.[CalendarYear], t.[FiscalYear], t.[MonthNumberOfYear] AS [Month], f.[SalesOrderNumber] AS [OrderNumber], f.SalesOrderLineNumber AS LineNumber, f.OrderQuantity AS Quantity, f.ExtendedAmount AS Amount

FROM[dbo].[FactInternetSales] f

INNER JOIN [dbo].[DimTime] tON f.[OrderDateKey] = t.[TimeKey]

INNER JOIN [dbo].[DimProduct] pON f.[ProductKey] = p.[ProductKey]

INNER JOIN [dbo].[DimProductSubcategory] pscON p.[ProductSubcategoryKey] = psc.[ProductSubcategoryKey]

INNER JOIN [dbo].[DimProductCategory] pcON psc.[ProductCategoryKey] = pc.[ProductCategoryKey]

INNER JOIN [dbo].[DimCustomer] cON f.[CustomerKey] = c.[CustomerKey]

INNER JOIN [dbo].[DimGeography] gON c.[GeographyKey] = g.[GeographyKey]

INNER JOIN [dbo].[DimSalesTerritory] sON g.[SalesTerritoryKey] = s.[SalesTerritoryKey]

;

Voici le résultat de la vue vDMPrep (tableau 9.1).

Page 280: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.3 Créer le modèle d’une campagne ciblée ————————————————————————————————————————————————— 269

Tabl

eau

9.1

— R

ésul

tat

de la

vue

vD

MPr

ep

Engl

ish-

Pro

duct

Mod

elC

usto

mer

-K

eyR

egio

nA

geIn

com

e-G

roup

Cal

enda

r-Y

ear

Fisc

al

Yea

rM

onth

Ord

er-

Num

ber

Line

-N

umbe

rQ

uan-

tity

Am

ount

Bike

sM

ount

ain-

100

1100

3Pa

cific

38H

igh

2001

2002

7SO

4370

11

13

399,

9900

Bike

sRo

ad-6

5014

501

Nor

th

Am

eric

a68

Hig

h20

0120

027

SO43

700

11

699,

0982

Bike

sRo

ad-1

5021

768

Nor

th

Am

eric

a59

Hig

h20

0120

027

SO43

697

11

357

8,27

00

Bike

sM

ount

ain-

100

2586

3N

orth

A

mer

ica

59M

oder

ate

2001

2002

7SO

4369

91

13

399,

9900

Bike

sM

ount

ain-

100

2838

9Eu

rope

41Lo

w20

0120

027

SO43

698

11

339

9,99

00

Bike

sM

ount

ain-

100

1100

5Pa

cific

40H

igh

2001

2002

7SO

4370

41

13

374,

9900

Bike

sM

ount

ain-

100

1101

1Pa

cific

42M

oder

ate

2001

2002

7SO

4370

51

13

399,

9900

Bike

sRo

ad-1

5016

624

Paci

fic33

Hig

h20

0120

027

SO43

703

11

357

8,27

00

Bike

sRo

ad-1

5027

645

Nor

th

Am

eric

a44

Hig

h20

0120

027

SO43

702

11

357

8,27

00

Bike

sRo

ad-1

5013

513

Euro

pe64

Low

2001

2002

7SO

4371

21

13

578,

2700

Bike

sRo

ad-1

5027

606

Nor

th

Am

eric

a49

Hig

h20

0120

027

SO43

711

11

357

8,27

00

Bike

sRo

ad-1

5013

591

Euro

pe53

Hig

h20

0120

027

SO43

714

11

357

8,27

00

Bike

sRo

ad-1

5016

483

Paci

fic55

Mod

erat

e20

0120

027

SO43

715

11

357

8,27

00

Bike

sRo

ad-1

5016

529

Paci

fic28

Low

2001

2002

7SO

4371

61

13

578,

2700

Bike

sRo

ad-6

5025

249

Paci

fic48

Hig

h20

0120

027

SO43

717

11

699,

0982

Page 281: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 270

Les données sources sont maintenant définies. Nous allons construire le modèlede publipostage ciblé.

9.3.3 Créer le modèle

Le besoin métier s’exprime selon ces termes : l’équipe marketing désireuse d’aug-menter ses ventes souhaite communiquer au moyen d’une campagne de publi-postage. Les coûts d’une telle campagne étant lourds, le service marketingsouhaite connaître les critères qui caractérisent les acheteurs de vélos afin dedéduire parmi un lot de prospects ceux qui sont le plus susceptibles d’acheter.

Il s’agit d’un problème de classification pour lequel les algorithmes NaïveBayes, Decision tree et Clusters sont particulièrement adaptés.

Nous devons commencer par créer une nouvelle structure d’exploration dedonnées à partir de la base de données relationnelle. Un clic droit sur Structuresd’exploration de données permet de lancer l’assistant de création du modèle. Ilserait également possible d’établir un modèle basé sur un cube OLAP.

Nous choisissons tout d’abord l’algorithme MDT (Microsoft Decision Trees).

Figure 9.4 — L’explorateur de solutions permet de créer un modèle d’exploration

Figure 9.5 — Un choix de neuf algorithmes est proposé

Page 282: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.3 Créer le modèle d’une campagne ciblée ————————————————————————————————————————————————— 271

La vue des sources de données est la requête vTargetMail.

Figure 9.6 — Spécifier les types de tables. Ici vTargetMail représente le fichier des cas à analyser

Figure 9.7 — Option Customer Key

Page 283: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 272

Le formulaire des données d’apprentissage définit les clés et les colonnes àprévoir.

La clé est déterminée grâce au champ CustomerKey, lui-même défini en tantque clé dans la source. Le champ à prévoir est BikeBuyer. En ce qui concerneles colonnes en entrée, nous allons demander à l’assistant de nous suggérer leschamps les plus susceptibles d’entrer dans le processus prédictif.

Le bouton Suggérer permet de lister ces champs.

L’assistant effectue un choix parmi les types de données et les types de contenus.Il est conseillé de vérifier les choix effectués par l’assistant. Complétez la sélec-tion des colonnes pertinentes en cochant les entrées désirées.

Donnons le nom Publipostage Ciblé à la structure d’exploration puis Deci-sion_Tree au modèle d’exploration.

Avant de traiter le modèle d’exploration, nous ajouterons deux modèles com-plémentaires respectivement basés sur les algorithmes Microsoft Clustering etMicrosoft Naïve Bayes.

Figure 9.8 — Formulaire de suggestion des colonnes susceptibles d’entrer dans le processus prédictif

Page 284: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.3 Créer le modèle d’une campagne ciblée ————————————————————————————————————————————————— 273

L’ajout s’effectue sans difficulté puisque le modèle de base (Decision Tree)fournit les éléments aux deux autres modèles .

Le modèle Naïve Bayses ne traite que des données discrètes. Il ignore ainsiles données comme le revenu annuel ou l’âge du client qui sont considérés commedes variables continues.

Nous procédons ensuite au déploiement des modèles et à leur traitement.

Figure 9.9 — Formulaire présentant les types de contenu (Continu, Discret ou Clé) et les types de données des colonnes sélectionnées

Page 285: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 274

Figure 9.10 — Terminer en attribuant un nom à la structure d’exploration

Figure 9.11 — Ajout d’un nouveau modèle basé sur l’algorithme Naïve Bayes

Page 286: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.3 Créer le modèle d’une campagne ciblée ————————————————————————————————————————————————— 275

Naviguer dans le modèle Decision Tree

La navigation dans les modèles s’effectue grâce à l’onglet visionneuse de modèled’exploration.

La visionneuse offre le choix entre les trois modèles (Decision Tree, NaïveBayes ou Clusters). Dans la liste déroulante nous choisissons le modèle Deci-sion_Tree. L’arborescence propose une liste des variables à prévoir. Ici, une seulevariable est à rechercher : Bike Buyer. Cette variable prend la valeur 1 lorsquele client a acheté au moins un vélo et 0 dans le cas contraire. Afin de suivre lemode de répartition des acheteurs, nous sélectionnons la valeur 1. L’arrière-plande chaque nœud se teinte en fonction de la fréquence du cas.

Dans l’arborescence du modèle, on observe quels sont les facteurs les plusimportants qui déterminent les acheteurs. On observe que l’âge de l’acheteurvient en première position suivi du nombre d’enfant au foyer. Viennent ensuitedes critères de revenu puis de région.

Chaque nœud affiche une trame de couleur plus ou moins foncée. Plus lecritère recherché (ici les acheteurs de vélos) est important, plus foncée sera lacouleur du fond du nœud.

Figure 9.12 — L’onglet Modèles d’exploration affiche les trois modèles qui participent à l’analyse du cas « mailing ciblé »

Page 287: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 276

Le nœud racine est toujours le plus sombre.

Portons notre attention sur le nœud racine. La légende d’exploration nousindique que 18 484 cas ont été recensés, se répartissant en 9 132 cas représen-tant 49,39 % d’acheteurs et 9 352 cas de non-acheteurs représentant 50,58 %.La barre graphique répartit les proportions entre les acheteurs et le non acheteursmatérialisée par des couleurs différentes.

En suivant l’arborescence selon les nœuds les plus sombres, on observe quela population des 39-53 ans est celle qui achète le plus de vélos (3 934 ache-teurs). Parmi cette population, on observe que les acheteurs sont ceux qui n’ont

Figure 9.13 — La visionneuse de modèle. Ici, modèle d’exploration Decision_Tree

Figure 9.14 — Légende d’exploration du nœud sélectionné

Page 288: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.3 Créer le modèle d’une campagne ciblée ————————————————————————————————————————————————— 277

pas d’enfant au foyer, qui ont un revenu supérieur à 26 000 € et qui n’habitentpas en Amérique du Nord. Il est possible d’extraire cette population puis decopier la liste dans Excel ou Word afin d’effectuer un publipostage.

Effectuez un filtrage sur Bike Buyer = 1 pour obtenir uniquement les ache-teurs de vélos.

Comprendre le réseau de dépendance.

Lorsque les critères sont nombreux, il n’est pas toujours aisé de comprendre lesfacteurs qui participent à la détermination de la variable à prévoir. L’onglet deréseau de dépendance permet de sélectionner un nœud puis à l’aide des liens quipointent vers ce nœud d’en connaître les attributs qui le déterminent. La réglette

Figure 9.15 — Fenêtre d’extraction d’un nœud. On observe que la colonne Bike Buyer comprend acheteurs et non-acheteurs

Figure 9.16 — Le réseau de dépendance montre les liens qui ont un fort degré de dépendance avec le critère Bike Buyer

Page 289: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 278

verticale sur le côté droit permet de faire apparaître progressivement ces liens(du poids le plus fort au poids le plus faible).

Dans notre cas, il est aisé de constater que les liens les plus forts sont l’âge,le nombre d’enfants au foyer, le revenu, le nombre de voitures possédées et larégion. Ces liens sont apparus dans l’ordre précité.

Naviguer dans le modèle Naïve Bayes

Le choix du navigateur Naïve Bayes permet d’observer le même cas d’une façondifférente. Dans ce modèle, les variables continues ont été exclues (âge et revenu).

Chaque attribut génère une ligne avec une colonne représentant les différentsétats de l’attribut, puis autant de colonnes qu’il y a d’états possibles pour la valeurà prévoir (Bike Buyers = 1 ou 0).

À l’intersection d’une ligne et d’une colonne, on peut observer la distribution.

L’onglet Caractéristique d’attribut se présente comme suit dans la figure 9.19.Cet onglet permet de sélectionner un attribut (acheteur de vélo) et d’établir desliens décroissants avec d’autres attributs.

Figure 9.17 — Le modèle Naives Bayes présente uniquement les variables discrètes

Page 290: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.3 Créer le modèle d’une campagne ciblée ————————————————————————————————————————————————— 279

Du tableau représenté dans la figure 9.19, il est possible de déduire que lesacheteurs de vélos ont une forte probabilité de ne pas avoir d’enfants, de ne pasêtre de la région Amérique du Nord, de niveau bachelier, etc.

On observe que l’absence des critères d’âge et de revenu dans l’analyse NaïveBayses entraîne des résultats différents de ceux de l’algorithme d’arbre de décision.

Il peut être intéressant de comparer deux groupes côte à côte. Si l’on désirecomparer les acheteurs et les non-acheteurs, nous obtenons le graphe de lafigure 9.20.

On peut déduire du tableau qui précède que les acheteurs de vélos ne possè-dent pas d’auto alors que ceux qui n’achètent pas de vélos possèdent deux autos.

Figure 9.18 — Légende d’exploration des données. La figure 9.18 montre la distribution des acheteurs en fonction

du nombre d’enfants au foyer (62,7 % des acquéreurs n’ont pas d’enfants)

Figure 9.19 — Onglet Caractéristiques d’attribut

Page 291: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 280

Les acheteurs de vélos ont un enfant et habitent la région Pacifique, etc. Plusieursattributs peuvent se retrouver avec des poids relatifs différents.

Naviguer dans le modèle clusters

Le diagramme cluster permet d’établir des relations entre des groupes homogènes.Les lignes qui relient les clusters sont plus denses si les liens entre clusters sontétroits. Le curseur à gauche du diagramme permet d’appliquer un filtre afind’occulter les liens les moins forts (figure 9.21).

Dans le diagramme ci-après, le cluster 6 (en bas) contient la plus grande quan-tité d’acheteurs de vélos. Un lien avec le cluster 1 apparaît comme très étroit.

Évaluer le modèle

Maintenant que nous avons mis en place nos trois modèles, nous devons lesévaluer afin de déterminer lequel est le meilleur pour prédire le profil d’acheteur.Pour cela, nous allons appliquer successivement nos modèles sur une table decas dont les résultats sont déjà connus. Le but étant de comparer la capacité deprédiction de chaque algorithme avec la réalité.

• Sélectionner une table de cas (différente de la table qui a servi à modé-liser).

Figure 9.20 — L’onglet Discrimination d’attribut permet une comparaison deux à deux

Page 292: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.3 Créer le modèle d’une campagne ciblée ————————————————————————————————————————————————— 281

Figure 9.21 — Le diagramme de cluster permet de réaliser des groupes homogènes

Figure 9.22 — Graphique d’analyse de précision pour la valeur 1 = acheteurs

Page 293: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 282

• Effectuer le mappage des colonnes entre la structure d’exploration et leschamps de la table de cas. Le mappage s’effectue naturellement lorsque lesnoms de colonnes sont identiques.

• Le filtrage des lignes d’entrée permet d’affiner la recherche dans la tablede cas.

• Sélectionnez les modèles qui seront inclus dans le graphique.

• Sélectionnez la ou les colonnes prévisibles (ne sont proposées que lescolonnes dont le type est Predict ou Predict Only).

• Sélectionnez une valeur prévisible afin de montrer l’efficacité du modèle.Si vous ne précisez pas de valeur prévisible, le graphique montre le degréde précision du modèle.

Le graphique de courbe d’élévation permet de comparer la précision des troisalgorithmes.

La requête de prévision s’exécute sur le serveur. La courbe idéale est maté-rialisée par la diagonale. Les algorithmes matérialisés par les trois courbes peu-vent ainsi être comparés entre eux :

Figure 9.23 — Graphique de courbes d’élévation comparant les trois algorithmes

Page 294: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.3 Créer le modèle d’une campagne ciblée ————————————————————————————————————————————————— 283

• L’algorithme Decision Tree permet un remplissage correct de 52 sur 65;

• L’algorithme Naïve Bayes permet un remplissage correct de 46 sur 68;

• L’algorithme Cluster permet un remplissage correct de 39 sur 63.

Créer le graphique des bénéficesAjoutons une dimension financière à notremodèle en cherchant à connaître le profitgénéré par chacun des algorithmes.

Prenons comme hypothèse les éléments sui-vants :

• cible de clients : 5 000;

• coût fixe de la campagne (frais de con-ception et d’impression) : 10 000 € ;

• coût variable de 5 € par client (expédi-tion);

• le service marketing estime à 50 € parpersonne par vente réussie.

Figure 9.24 — Formulaire permettant de recueillir

les caractéristiques financières et d’estimation

Figure 9.25 — Graphique des bénéfices prévisibles en fonction du modèle

Page 295: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 284

L’axe Y du graphique représente les bénéfices, tandis que l’axe X représentele pourcentage de la population contactée. La meilleure performance financièreest donnée grâce à l’algorithme Decision Tree.

Un graphique des bénéfices montre une augmentation des bénéfices jusqu’àun certain point. Ensuite, plus le nombre d’individus contactés augmente moinsles bénéfices augmentent.

Le graphique des bénéfices contient une ligne verticale grise et positionnéepar défaut à 50 %. Cette barre peut être ajustée en cliquant dans le graphique.Le calcul des bénéfices est recalculé immédiatement.

Si vous sélectionnez le point des bénéfices maximaux dans le graphique enutilisant la ligne grise, vous observez une valeur qui détermine un seuil de pro-babilité lié au fait de contacter un client.

Dans l’exemple ci-dessus, le sommet de la courbe des bénéfices se trouve à88 % de remplissage pour une probabilité de prévision de 13,77 %. Cela indiqueque pour réaliser des bénéfices maximaux, vous devez contacter uniquement lesclients dont la réponse est prévue avec une probabilité de 13,77 % ou plus.

Comment sélectionner la liste des clients potentiels dans un jeu de données ?

Lorsque nous avons choisi un modèle d’exploration, il convient de créer unerequête DMX (Data Mining Extensions). Cette requête de prévision permet desélectionner dans une table de cas une liste de clients potentiels.

Dans l’exemple suivant, la table à examiner est ProspectiveBuyer.

La première source de la prévision repose sur le modèle Decision_Tree avecle champ prévisible Bike Buyer.

La seconde source fournit l’identifiant unique du prospect ProspectAlternate-Key.

La troisième source PredictProbability fournit le degré de probabilité.

Figure 9.26 — Bénéfices maximaux avec un remplissage de 88 euros

Page 296: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.3 Créer le modèle d’une campagne ciblée ————————————————————————————————————————————————— 285

Voici la requête DMX générée par l’assistant :

SELECT[TM Decision Tree].[Bike Buyer],t.[ProspectAlternateKey],PredictProbability([bike buyer])

From[TM Decision Tree]

PREDICTION JOINOPENQUERY([Adventure Works DW],‘SELECT

[ProspectAlternateKey],[MaritalStatus],[Gender],[YearlyIncome],[TotalChildren],[NumberChildrenAtHome],[Education],[Occupation],[HouseOwnerFlag],[NumberCarsOwned]

FROM[dbo].[ProspectiveBuyer]

‘) AS t

Figure 9.27 — Mappage des données du modèle de prévisions avec les champs de la table d’entrée

Page 297: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————— 9. Le data mining 286

ON[TM Decision Tree].[Marital Status] = t.[MaritalStatus] AND[TM Decision Tree].[Gender] = t.[Gender] AND[TM Decision Tree].[Yearly Income] = t.[YearlyIncome] AND[TM Decision Tree].[Total Children] = t.[TotalChildren] AND[TM Decision Tree].[Number Children At

Home] = t.[NumberChildrenAtHome] AND[TM Decision Tree].[Education] = t.[Education] AND[TM Decision Tree].[Occupation] = t.[Occupation] AND[TM Decision Tree].[House Owner Flag] = t.[HouseOwnerFlag] AND[TM Decision Tree].[Number Cars Owned] = t.[NumberCarsOwned]

Le résultat de la requête peut être envoyé dans Excel puis traité en ne sélec-tionnant que les acheteurs potentiels c’est-à-dire Bike Buyer = 1.

Figure 9.28 — Copier dans Excel la liste extraite

Page 298: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

9.4 Conclusion ——————————————————————————————————————————————————————————————————————————— 287

Le code ProspectAlternate identifie précisément le client. L’expression per-met de donner la précision de la prédiction.

Dans Excel, nous trions la colonne Expression (Probabilité) en mode décrois-sant. Trions également la colonne Bike Buyer. Nous en déduisons les 1 041 ache-teurs potentiels sur une population de 2 059.

Notre publipostage portera sur tout ou partie de cette population d’acheteurs(Bike Buyers = 1).

9.4 CONCLUSION

Ce chapitre nous a montré les nombreux assistants fournis par Analysis Services.Nous espérons avoir convaincu le lecteur que le data mining n’est pas réservéaux grandes entreprises qui disposent d’un large volume de données.

Il n’est pas non plus indispensable d’être statisticien pour exploiter ces nou-velles possibilités. Les entreprises qui se donneront la peine d’exploiter les nom-breuses facettes de cet outil découvriront de nouvelles pistes jusque là encoreinexplorées.

Page 299: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server
Page 300: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10Reporting Services

10.1 QU’EST-CE QUE REPORTING SERVICES ?

En janvier 2004, Microsoft introduisait pour la première fois un nouveau com-posant à SQL Server 2000 : Reporting Services. Ce nouvel outil avait pour butde combler un vide dans la chaîne décisionnelle de Microsoft. En effet, SQLServer 2000 disposait d’un outil OLAP puissant : Analysis Services. Excel per-

Figure 10.1 — Positionnement de Reporting Services dans la chaîne décisionnelle

Page 301: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 290

mettait d’accéder aux cubes et d’effectuer des analyses grâce au tableau croisédynamique. Or, nous l’avons déjà dit, l’essentiel des données de l’entreprise estconsulté au moyen de rapports prédéfinis. À cette époque, Cognos et BusinessObjects disposaient déjà d’outils de reporting tels que ReportNet et CrystalReport. Microsoft n’a donc pas attendu la version 2005 de SQL pour offrir sonmodule de reporting.

Reporting Services regroupe un ensemble d’outils, d’interfaces de program-mation, de services run-time et d’outils visant à définir, générer, déployer, et gérerdes rapports. Reporting Services comprend un moteur pour héberger et traiterles rapports. Une interface de programmation permet également d’incorporer desrapports dans différents environnements informatiques.

10.1.1 À quoi sert Reporting Services ?

SSRS permet de créer des rapports pour une diffusion interne ou externe à l’entre-prise. Reporting Services offre la possibilité d’accéder aussi bien aux bases de don-nées opérationnelles qu’aux magasins de données ou cubes OLAP. Les rapportspeuvent être diffusés largement par messagerie électronique ou sur un portail web.

Lorsqu’un éditeur de logiciel offre des solutions d’ERP basées sur SQL Server,il peut intégrer Reporting Services dans sa solution afin de proposer des rapportsinteractifs prédéfinis.

Cette solution permet au client final de disposer d’un outil lui permettant decréer lui-même ses propres rapports dynamiques. Ce nouvel outil, Report Builder,isole la complexité de la base de données en exposant la couche métier à l’uti-lisateur.

SSRS permet aux entreprises de mettre des rapports à disposition sur le Web.Elles peuvent en effet concevoir des extranets sécurisés à destination de leursclients et fournisseurs.

Voici quelques scénarios d’utilisation de Reporting Services.

Rapports internes

• Rapports « Maison » (vente, finance, DRH).

• Administrables, accessibles via un portail ou intégrés aux solutions d’entre-prise.

Rapports embarqués

• Afficher des rapports dans n’importe quelle application d’entreprise (ERP,CRM) ou analytique.

• Architecture extensible et flexible.

Page 302: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.1 Qu’est-ce que Reporting Services ? ————————————————————————————————————————————————————— 291

Rapports collaboratifs

• B2B, B2C, échanges inter ou intra entreprises, etc.

Rapports externes

• Publier des rapports via extranet, Internet.

• Isolation de données, sécurité extensible.

10.1.2 Fonctionnalités de Reporting Services

SSRS gère de manière centralisée le cycle de vie d’un rapport depuis sa créationjusqu’à sa diffusion. Il utilise une architecture multiniveau illustrée dans la figure 10.2.

Les principaux composants de SSRS sont donnés dans le tableau 10.1.

Tableau 10.1 — Composants de SSRS

La gestion des rapports

Reporting Services dispose d’une interface web permettant d’effectuer des tâchesde gestion de rapports. Le tableau ci-dessous recense les différentes tâches.

Base de données et sources

de données

MS SQL Server (2000 et 2005) MS Analysis Services (la version 2005 remplace la version 2000 sur un même serveur). Toutes sources de données conformes au standard OLE DB, ODBC.

Outils de création de rapports

Générateur de rapports grâce à Visual Studio pour Business. Intelligence.Langage de définition de rapports basé sur le langage XML. De nombreux outils tiers permettent de développer des rapports au format RDL.

Les formats de rapports

Format libre.Format tabulaire. Format matriciel (tableau croisé).Graphique de données.Filtrage dynamique lors de l’exécution.Regroupement en sous-totaux et totaux généraux.Tris ascendant/descendant.Rapports liés activés par lien hypertexte avec passage de paramètres.

Exécution de rapports

Plusieurs formats de restitution (PDF, TIFF, CSV, Excel, XML, Archive web).Planification de l’envoi des rapports à la demande de l’utilisateur ou de l’administrateur.

Page 303: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 292

SQ

LS

erv

er

Ca

talo

g

Re

po

rt S

erv

er E

xpo

rta

tio

n

Cib

les

(Co

urr

ier,

Fic

hie

r,A

utr

es)

Ser

vic

es

Séc

uri

té(N

T, P

asse

po

rt,

Au

tre

)

Séc

uri

So

urc

es d

e d

on

née

s(S

QL

, OL

E D

B, O

DB

C,

Ora

cle

, clie

nts

)

Fo

rma

ts

(HT

ML

, Exc

el,

PD

F, A

utr

es

)

Re

po

rt P

roce

ss

ing

Nav

igat

eur

Ad

min

istr

atio

nA

pp

lica

tio

n

UR

LW

MI

We

bS

erv

ice

Inte

rro

gat

ion

des

do

nn

ées

Fo

rma

tag

e

Rep

ort

Bu

ild

er

Figu

re1

0.2

— A

rchi

tect

ure

de R

epor

ting

Serv

ices

(sou

rce

: Mic

roso

ft)

Page 304: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.1 Qu’est-ce que Reporting Services ? ————————————————————————————————————————————————————— 293

Tableau 10.2 — Tâches de gestion de rapports

Le serveur de rapports (Report Server) contient un moteur qui interprète ladéfinition des rapports, exécute les requêtes et restitue les rapports. Il permetégalement de planifier l’exécution et l’envoi de rapports en mode sécurisé. Leserveur de rapports héberge un service web permettant à des applications exter-nes de communiquer avec le moteur de rapports.

Le gestionnaire de rapports se présente sous la forme d’un portail web fourniavec Reporting Services. Le gestionnaire de rapport est destiné aussi bien à l’uti-lisateur qui désire exécuter un rapport qu’à l’administrateur désireux de mettreen place la sécurité ou la planification de distribution des rapports.

Le concepteur de rapport est hébergé dans l’interface commune de Visual Stu-dio BI. Celle-ci permet grâce à de nombreux assistants de développer et déployerdes rapports sans connaissance approfondie de SQL Server.

Gestion des sources de données

Connexions aux serveurs avec authentification.

Gestion des paramètres des rapports Valeurs par défaut proposéesInvites avec listes déroulantes.

Planification de l’exécution des rapports SQL Server Agent doit être installé et en service.

Mode d’exécution des rapports Direct.Mise en cache. Capture instantanée.Historique des rapports exécutés conservé pour consultation ultérieure.

Sécurité Utilisateurs.Groupes.Rôles.

Report Server Web Application Définir la sécurité.Planifier l’exécution et la remise de rapports.Effectuer le suivi des rapports.API de service web.

Le rendu des rapports Format HTML et XML.Format d’impression PDF et TIFF.Format Excel, CSV.Autres formats via API ouvertes.

Options de remise Exécutions planifiées.Exécutions pilotées par événements.Abonnements.Rapport reçu ou lien avec le serveur.Abonnements pilotés par les données.

Page 305: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 294

Report Builder est un outil client qui permet aux utilisateurs non-programmeursde définir et déployer des rapports sans aucune connaissance de SQL Server.

Report Builder se base sur des modèles conçus à l’aide du concepteur de modèlesde rapports (Report Model Designer). Cet outil stocke les définitions de rapportsdans la base de données Report Server. Ces rapports peuvent ensuite être modi-fiés, complétés et publiés par l’utilisateur lui-même via l’interface web.

10.2 LA CRÉATION DE RAPPORT

Afin d’illustrer les différents concepts abordés dans le paragraphe précédent,nous allons créer un rapport de ventes de la société AdventureWorks, puis nousle publierons sur le serveur de rapports. Enfin, nous le consulterons via le Web.

Avant de créer un nouveau rapport il est nécessaire d’introduire la notion derégion de données. Celle-ci peut être liée à de nombreuses sources de données.Dans le principe, une région de données lit un enregistrement contenu dans unjeu d’enregistrements (dataset), remplit une portion du rapport en utilisant lesdonnées de l’enregistrement, puis lit l’enregistrement suivant. Ce processus estrépété autant de fois qu’il y a d’enregistrements dans le dataset.

Un rapport peut être constitué de quatre types de régions :

• La table permet de lister le contenu des enregistrements selon un formattabulaire. La table est composée d’un nombre de colonnes fixe et d’un

Figure 10.3 — Le gestionnaire de rapports

Page 306: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.2 La création de rapport ———————————————————————————————————————————————————————————————— 295

nombre d’enregistrements variable. Les lignes peuvent être regroupées afinde composer des lignes de totalisation ou sous-totalisation.

• Le tableau croisé ou matriciel est composé d’un nombre variable de ligneset de colonnes. Il s’apparente au tableau croisé d’Access. Les lignes etcolonnes ne peuvent être interverties lors de l’exploration. Un pseudo drilldown permet d’afficher les totaux de ligne puis de déplier les lignes qui com-posent ce total afin d’en connaître le détail.

• La liste permet de créer une section sur voire plusieurs pages pour chaqueenregistrement du jeu de données.

• Le graphe permet de représenter sous forme visuelle les données relativesà chaque enregistrement.

La création de rapport débute dans BI Visual Studio. À l’instar des autresmodules de Visual Studio, un assistant guide pas à pas le développeur de rapport.Il suffit ensuite de revenir sur la conception libre du rapport afin d’apporter lesmodifications souhaitées.

La création d’un rapport débute toujours par la définition de la source dedonnées.

Figure 10.4 — Choisir la source de données (ici la base opérationnelle AdventureWorks) Nous utilisons le générateur de requête afin de concevoir le dataset

Figure 10.5 — Le générateur de requête aide le concepteur au travers d’une interface graphique

Page 307: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 296

La requête générée est la suivante :

SELECT PC.Name AS ProdCat,PS.Name AS SubCat,DATEPART(yy, SOH.OrderDate) AS OrderYear,

‘Q’ + DATENAME(qq, SOH.OrderDate) AS OrderQtr,SUM(SOD.UnitPrice * SOD.OrderQty) AS Sales

FROM Production.ProductSubcategory AS PS INNER JOINSales.SalesOrderHeader AS SOH INNER JOINSales.SalesOrderDetail AS SOD ON

SOH.SalesOrderID = SOD.SalesOrderID INNER JOINProduction.Product AS P ON SOD.ProductID = P.ProductID ON

PS.ProductSubcategoryID = P.ProductSubcategoryID INNER JOINProduction.ProductCategory AS PC ON

PS.ProductCategoryID = PC.ProductCategoryIDWHERE (SOH.OrderDate BETWEEN ‘1/1/2002’ AND ‘31/12/2003’)GROUP BY DATEPART(yy, SOH.OrderDate), PC.Name, PS.Name, ‘Q’+ DATE-NAME(qq, SOH.OrderDate), PS.ProductSubcategoryID

L’exécution de la requête fournit la liste suivante :

Figure 10.6 — Le générateur de requêtes permet de consulter immédiatement le résultat. La figure 10.6 montre un extrait de la requête précédente

La requête ci-dessus fait l’objet d’une rapport de type tabulaire ou matriciel.

Components Forks 2002 Q4 23543,1060

Bikes Road Bikes 2002 Q1 3171787,6112

Components Wheels 2002 Q4 163921,8870

Clothing Socks 2003 Q3 6968,6884

Bikes Road Bikes 2003 Q4 3734891,6389

Components Mountain Frames 2002 Q3 608352,8754

Components Handlebars 2002 Q4 18309,4452

Accessories Tires and Tubes 2003 Q3 41940,3364

Components Road Frames 2003 Q2 457688,8401

Clothing Vests 2003 Q4 66882,6450

Page 308: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.2 La création de rapport ———————————————————————————————————————————————————————————————— 297

L’assistant propose de disposer les champs disponibles en lignes et colonnes.La case à cocher Activer l’exploration vers le bas permet de regrouper/déplierles lignes du rapport.

L’assistant propose six styles d’affichage du rapport.

L’assistant termine en proposant un récapitulatif des choix effectués. Le nomdu rapport est fourni à cette étape.

Figure 10.7 — Choisir le type de rapport : tabulaire ou matriciel

Figure 10.8 — Formulaire de conception de la matrice du rapport. Disposer les champs en lignes ou colonnes

Page 309: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 298

Après activation du bouton Terminer, l’aperçu du rapport s’effectue dans BIStudio.

L’étape suivante consiste à déployer le nouveau rapport sur le serveur derapport.

Au préalable, nos devons nous assurer que le serveur de rapport est correcte-ment paramétré, comme dans la figure 10.12.

Figure 10.9 — Choix du style de rapport

Figure 10.10 — L’assistant propose

un résumé des actions effectuées

lors de la création du rapport

Page 310: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.2 La création de rapport ———————————————————————————————————————————————————————————————— 299

Un clic droit sur la solution AdventureWorks Sample Reports permet de véri-fier le paramètre de déploiement. TargetServeurURL doit fournir une adressetelle que http://localhost/reportserver.

Figure 10.11 — Le mode aperçu permet une visualisation immédiate du rapport

Figure 10.12 — Formulaire de configuration précisant l’URL du serveur de rapports

Page 311: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 300

Requête MDX sur cube OLAP

Grâce au générateur de requête MDX, on utilise la technique du glisser-déplacerafin de préparer les dimensions (date et produit) puis les mesures à analyser.

La requête MDX générée est la suivante :

SELECT NON EMPTY {[Measures].[Internet Sales Amount]} ON COLUMNS,NON EMPTY {([Product].[Category].[Category].ALLMEMBERS *Product].[Subcategory].[Subcategory].ALLMEMBERS * [Date].[Calen-dar].[Month].ALLMEMBERS)}DIMENSION PROPERTIES MEMBER_CAPTION, MEMBER_UNIQUE_NAME ON ROWSFROM [Adventure Works]CELL PROPERTIES VALUE, BACK_COLOR, FORE_COLOR, FORMATTED_VALUE, FORMAT_STRING, FONT_NAME, FONT_SIZE, FONT_FLAGS

La représentation visuelle de la requête précédente est illustrée dans le tableausuivant aux lignes imbriquées.

Figure 10.13 — Source de données Analysis Services

Figure 10.14 — Le générateur de requête MDX

Page 312: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.2 La création de rapport ———————————————————————————————————————————————————————————————— 301

L’assistant propose alors de mettre en forme la matrice.

Ne pas oublier d’activer l’exploration vers le bas permettant le regroupementdes données et le dépliement des lignes (drill down).

Figure 10.15 — Le résultat de la requête MDX

dans Proclarity

Figure 10.16 — Le concepteur

de matrice dispose les axes Produits et Date en lignes

et colonnes

Page 313: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 302

L’étape suivante consiste à déployer ce rapport dans Reporting Services.

Avant d’exécuter le rapport dans Reporting Services, veillez à établir unesource de données partagée et sécurisée selon les paramètres donnés figure 10.18.

Figure 10.17 — Rapport

des ventes élaboré à partir d’une source

OLAP Analysis Services

Figure 10.18 — Créer

une source de donnée

personnaliséede type Analysis

Services

Page 314: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.2 La création de rapport ———————————————————————————————————————————————————————————————— 303

La source de données doit préciser la chaîne de connexion. Celle-ci est four-nie dans le formulaire des propriétés de la source de données partagée commedans l’exemple de la figure 10.19.

Il convient de préciser également le type de sécurité intégrée de Windows.

La barre d’outil permet d’ajouter un graphique au rapport.

La figure 10.20 montre l’outil graphique et la manière de l’utiliser. Un simpleglisser/déposer des champs de la source de données sur les axes du graphe permetde construire un graphe lié au données de la source.

L’exemple de la figure 10.21 montre le rendu du rapport après ajout d’ungraphe.

Figure 10.19 — Source de données partagée dans BI Studio

Figure 10.20 — Outil d’ajout de graphique

Page 315: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 304

L’interface de Reporting Services permet un affichage du rapport qui offre lapossibilité de l’exporter selon plusieurs formats :

• Fichier au format HTML/XML. Format à privilégier pour des transfertsentre plateformes. Ce format n’est pas le plus fidèle et n’est pas à retenirlorsque la disposition du texte nécessite une grande précision.

• Fichier au format CSV (ASCII). Texte séparé par des virgules. Ce formatest très commun. De plus, il est directement interprété par Excel.

• Fichier TIFF (image).

• Fichier Acrobat (PDF) fournit un rendu plus fidèle que le format TIFF.PDF est devenu le format standard de lecture grâce au logiciel AdobeAcrobat Reader. Le format TIFF est lu par des logiciels de traitementd’image tels que Windows Picture, Paint ou Fax Viewer. Il est ainsi pos-

Figure 10.21 — Le même rapport qu’en 10.17 avec introduction d’un graphe

Page 316: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.2 La création de rapport ———————————————————————————————————————————————————————————————— 305

sible d’envoyer des documents en pièces jointes grâce à un logiciel de mes-sagerie.

• Archive Web.

• Excel (versions 97 à 2007).

Lors de l’exportation, les données sont converties en valeurs permettant ainsid’être déconnectées de la source des données. Les groupes sont dynamiques etpeuvent faire l’objet d’un drill down/drill up.

La sortie papier reste cependant un choix très fréquent. Reporting Servicesoffre la possibilité d’imprimer directement côté client. Lors de la premièreimpression, l’utilisateur est averti de l’installation d’un composant ActiveX (bienvérifier que le composant est signé Microsoft). Ce composant permet d’activerl’interface d’impression telle que la gestion des marges, la taille de la page etmême l’orientation.

Ajouter des paramètres de sélection à un rapport OLAP

Lorsque l’on observe la première fois les rapports fournis en standard par SQLServer 2005, la notion de filtrage sur rapports OLAP paraît pertinente, mais en

Figure 10.22 — Le rapport exporté dans Excel (ici version 2007)

Page 317: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 306

même temps semble complexe. En réalité, Visual Studio offre un assistant pourles paramètres de filtrage d’une grande simplicité. Fort heureusement, nousn’aurons pas à modifier manuellement le code MDX généré par l’assistant.

Dans notre exemple, nous ajouterons successivement un filtre sur l’année puisun second sur la catégorie de produit.

Depuis l’onglet Données, nous glissons l’attribut CalendarYear dans la zoneréservée au filtrage matérialisée par le texte <Sélectionnez une dimension>. Aus-sitôt une ligne nouvelle apparaît permettant d’effectuer une sélection sur lesannées. Il est impératif de cliquer dans la case Paramètres afin de générer unnouveau dataset au format MDX permettant ainsi de proposer une liste dérou-lante à l’utilisateur. Cette fonction permet également d’imbriquer le fitrage dansle dataset initial (AdventureWorksAS).

Voici le nouveau code MDX généré :

SELECT NON EMPTY {[Measures].[Internet Sales Amount]} ON COLUMNS,NON EMPTY {([Product].[Category].[Category].ALLMEMBERS * [Product].[Subcategory].[Subcategory].ALLMEMBERS * [Date].[Calendar].[Month].ALLMEMBERS)} DIMENSION PROPERTIES MEMBER_CAPTION, MEMBER_UNIQUE_NAME ON ROWSFROM (SELECT (STRTOSET(@DateCalendarYear, CONSTRAINED)) ON COLUMNSFROM [Adventure Works]) WHERE (IIF(STRTOSET(@DateCalendarYear, CONSTRAINED).Count = 1, STRTOSET(@DateCalendarYear, CONSTRAINED), [Date].[Calendar Year].currentmember))CELL PROPERTIES VALUE, BACK_COLOR, FORE_COLOR, FORMATTED_VALUE, FORMAT_STRING, FONT_NAME, FONT_SIZE, FONT_FLAGS

Figure 10.23 — Ajout d’un paramètre de filtrage

Page 318: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.2 La création de rapport ———————————————————————————————————————————————————————————————— 307

Un nouveau dataset DateCalendarYear a été créé automatiquement.

Le dataset DateCalendarYear dispose de quatre champs :

• Calendar Year;

• ParameterCaption;

• ParameterValue;

• ParameterLevel.

Le formulaire présentant les paramètres du rapport est défini comme dans lafigure 10.24.

Figure 10.24 — Le dataset de

filtrage est généré automatiquement

Figure 10.25 — Formulaire

des paramètres du rapport

Page 319: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 308

L’exécution du rapport fait immédiatement apparaître le choix des données.

La même procédure permet d’ajouter un second filtrage sur la catégorie. Lerésultat est donné figure 10.26.

10.3 LA GESTION DES RAPPORTS

Lorsque les rapports sont publiés sur le serveur de rapports, il est indispensablede procéder à un certain nombre de réglages supplémentaires. Généralement, lesrapports font l’objet d’une mise en sécurité visant à permettre la consultationuniquement par les personnes autorisées. Les utilisateurs, de plus en plus exigeants,souhaitent obtenir sans délai les informations sur leur activité dans l’entreprise.Ils désirent également recevoir périodiquement leurs informations métier sousforme électronique ou exécuter eux-mêmes les traitements selon leurs besoins.

Figure 10.26 — Aperçu du rapport avec choix de la sélection des années

Figure 10.27 — Rapport filtré sur deux paramètres : année et catégorie

Page 320: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.3 La gestion des rapports ——————————————————————————————————————————————————————————————— 309

Les utilisateurs et administrateurs accèdent au gestionnaire de rapports à l’adressesuivante : http://localhost/reports.

Le gestionnaire de rapports met à disposition de l’administrateur un certainnombre d’outils permettant de répondre à ces contraintes. Passons-les en revue.

10.3.1 La sécurité

Reporting Services met en place plusieurs niveaux de sécurité.

• Le gestionnaire de rapports web requiert une authentification Windows.

• Les utilisateurs autorisés à accéder au gestionnaire de rapports doivent fairepartie du groupe des administrateurs (BUILTIN\Administrateurs).

Reporting Services ne gère pas de liste spécifique d’utilisateurs. Il s’appuietotalement sur les utilisateurs et rôles créés dans le système de sécurité de Win-dows. Si vous désirez autoriser d’autres utilisateurs à accéder aux rapports, vousdevrez ajouter de nouveaux utilisateurs ou groupes Windows dans des rôles Repor-ting Services.

Les rôles de Reporting Services

Reporting Services fournit cinq rôles standards pour lesquels il est nécessaired’attribuer un compte utilisateur ou groupe Windows.

Tableau 10.3 — Les rôles de Reporting Services

Par exemple, un utilisateur auquel il a été attribué un rôle de serveur de publi-cation sera autorisé à publier, créer, voir et supprimer des rapports. En revanche,il ne sera pas autorisé à créer de nouveaux rôles.

Générateur de rapports Permet de visualiser les définitions de rapports.

Gestionnaire de contenu Peut gérer un contenu sur Report Server, notamment des dossiers, des rapports et des ressources.

Lecteur Peut afficher des dossiers et des rapports, et s’abonner à des rapports.

Mes rapports Peut publier des rapports et des rapports liés, gérer des dossiers, des rapports et des ressources dans le dossier « Mes rapports » d’un utilisateur.

Serveur de publication Peut publier des rapports et des rapports liés sur Report Server.

Page 321: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 310

Dans la plupart des cas, les droits d’accès aux différents dossiers et objetsdevront faire l’objet d’une attribution spécifique de la part de l’administrateur.Il existe une exception à cette règle : l’administrateur local dispose de toutes lesautorisations. Un utilisateur qui appartient au groupe local Administrateurs surle serveur qui héberge Reporting Services disposera de tous les droits.

Si vous supprimez l’attribution de rôle pour BUILTIN\Administrateurs et lesmembres du groupe administrateur local, vous continuerez à disposer des droitsde gestion de tous les dossiers et objets.

Les tâches et les droits dans Reporting Services

Chaque tâche de Reporting Services fait l’objet d’une attribution de droit. Voiciles droits des rôles.

Tableau 10.4 — Tâches des rôles dans Reporting Services

Afficher les dossiers

Permet d’afficher les éléments dans l’arborescence des dossiers, ainsi que les propriétés des dossiers.

Afficher les modèles

Afficher des modèles de l’arborescence des dossiers, utiliser des modèles comme sources de données pour un rapport et exécuter des requêtes sur le modèle pour extraire des données.

Afficher les rapports

Permet d’afficher les rapports et les rapports liés dans l’arborescence des dossiers, ainsi que les captures instantanées d’historique de rapport et les propriétés de rapport.

Afficher les ressources

Permet d’afficher les ressources dans l’arborescence des dossiers, ainsi que les propriétés des ressources.

Afficher les sources de données

Permet d’afficher les éléments de source de données dans l’arborescence des dossiers, ainsi que les propriétés de la source de données.

Créer des rapports liés

Permet de créer des rapports liés et de les publier dans un dossier du serveur de rapports.

Figure 10.28 — Page de sécurité pour le dossier racine

Page 322: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.3 La gestion des rapports ——————————————————————————————————————————————————————————————— 311

En complément des tâches d’accès aux rapports, des tâches complémentairesde gestion du système font également l’objet de droits spécifiques.

Tableau 10.5 — Tâches de rôle système

Définir la sécurité pour des éléments

individuels

Permet d’afficher et de modifier les paramètres de sécurité des rapports, des dossiers, des ressources et des sources de données partagées.

Gérer les abonnements

individuels

Chaque utilisateur peut créer, afficher, modifier et supprimer des abonnements dont il est propriétaire.

Gérer les dossiersPermet de créer, d’afficher et de supprimer des dossiers, ainsi que d’afficher et de modifier des propriétés des dossiers.

Gérer les modèles Créer, afficher et supprimer des modèles, et afficher et modifier des propriétés de modèle.

Gérer les rapports Permet de créer, d’afficher et de supprimer des rapports, ainsi que de modifier des propriétés des rapports.

Gérer les ressourcesPermet de créer, de modifier et de supprimer des ressources, ainsi que d’afficher et de modifier des propriétés des ressources.

Gérer les sources de données

Permet de créer et de supprimer des éléments de source de données partagée, ainsi que de modifier des propriétés de source de données.

Gérer l’historique de rapport

Permet de créer, d’afficher et de supprimer des captures instantanées d’historique de rapport, ainsi que de modifier des propriétés d’historique de rapport.

Gérer tous les abonnements

Permet d’afficher, de modifier et de supprimer un abonnement quel que soit son propriétaire.

Lire les rapports Lit les définitions de rapport.

Afficher les planifications partagées

Permet d’afficher une planification prédéfinie qui est disponible à des fins d’utilisation générale.

Afficher les propriétés du serveur de rapports

Permet d’afficher les propriétés qui s’appliquent au serveur de rapports.

Exécuter les définitions de rapport

Démarrer l’exécution à partir de la définition de rapport sans la publier sur Report Server.

Page 323: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 312

Les rôles dans Reporting Services

Les droits autorisent des tâches. Afin de simplifier la gestion des droits, il estpossible de regrouper des tâches en créant des rôles.

Reporting Services propose cinq rôles en standard.

Tableau 10.6 — Rôles standards créés lors de l’installation de Reporting Services

Chaque rôle prédéfini comporte un certain nombre de tâches.

Générer des événements

Fournit une application qui permet de générer des événements dans l’espace de noms du serveur de rapports.

Gérer la sécurité du serveur de rapports

Permet d’afficher et de modifier les attributions de rôles au niveau du système.

Gérer les planifications partagées

Permet de créer, de modifier et de supprimer des planifications partagées qui sont utilisées pour exécuter des rapports ou les actualiser.

Gérer les propriétés du serveur de rapports

Permet d’afficher et de modifier les propriétés qui s’appliquent au serveur de rapports et aux éléments gérés par celui-ci.

Gérer les rôles Permet de créer, d’afficher et de modifier des définitions de rôles.

Gérer les travaux Permet d’afficher et d’annuler les travaux en cours d’exécution.

Générateur de rapports

Permet de visualiser les définitions de rapports.

Gestionnaire de contenu

Peut gérer un contenu sur Report Server, notamment des dossiers, des rapports et des ressources.

Lecteur Peut afficher des dossiers et des rapports, et s’abonner à des rapports.

Mes rapportsPeut publier des rapports et des rapports liés, gérer des dossiers, des rapports et des ressources dans le dossier « Mes rapports d’un utilisateur ».

Serveur de publication Peut publier des rapports et des rapports liés sur Report Server.

Page 324: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.3 La gestion des rapports ——————————————————————————————————————————————————————————————— 313

Tableau 10.7 — Attribution des tâches par rôle

Rôles Générateurde rapports

Gestionnairede contenu Lecteur Mes

rapports Publication

Afficher les dossiers OUI OUI OUI OUI NON

Afficher les modèles OUI OUI OUI NON NON

Afficher les rapports OUI OUI OUI OUI NON

Afficher les ressources OUI OUI OUI OUI NON

Afficher les sources de données

NON OUI NON OUI NON

Créer des rapports liés NON OUI NON OUI OUI

Définir la sécurité pour des éléments individuels

NON OUI NON NON NON

Gérer les abonnements individuels

NON OUI OUI OUI NON

Gérer les dossiers NON OUI NON OUI OUI

Gérer les modèles NON OUI NON NON OUI

Gérer les rapports NON OUI NON OUI OUI

Gérer les ressources NON OUI NON OUI OUI

Gérer les sources de données

NON OUI NON OUI OUI

Gérer l’historique de rapport

NON OUI NON OUI NON

Page 325: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 314

Les tâches spécifiques au rôle Administrateur systèmeLe rôle Administrateur système est un rôle prédéfini qui comprend des tâches

utiles pour un administrateur qui a la responsabilité générale du serveur de rap-ports, mais pas nécessairement de son contenu.

Tableau 10.8 — Attribution des tâches par rôle

Les tâches spécifiques au rôle Utilisateur systèmeLe rôle Utilisateur système est un rôle prédéfini qui comprend des tâches per-

mettant aux utilisateurs d’afficher des informations de base sur le serveur de rap-ports. Il prend également en charge le chargement d’un rapport dans le Générateurde rapports.

Rôles Générateurde rapports

Gestionnairede contenu Lecteur Mes

rapports Publication

Gérer tous les abonnements NON OUI NON NON NON

Lire les rapports OUI OUI NON NON NON

Afficher les planifications

partagées

Permet d’afficher une planification prédéfinie qui est disponible à des fins d’utilisation générale.

Afficher les propriétés du serveur de rapports

Permet d’afficher les propriétés qui s’appliquent au serveur de rapports.

Exécuter les définitions de rapport

Démarrer l’exécution à partir de la définition de rapport sans la publier sur Report Server.

Générer des événements

Fournit une application qui permet de générer des événements dans l’espace de noms du serveur de rapports.

Gérer la sécurité du serveur de rapports

Permet d’afficher et de modifier les attributions de rôles au niveau du système.

Gérer les planifications partagées

Permet de créer, de modifier et de supprimer des planifications partagées qui sont utilisées pour exécuter des rapports ou les actualiser.

Gérer les propriétés du serveur de rapports

Permet d’afficher et de modifier les propriétés qui s’appliquent au serveur de rapports et aux éléments gérés par celui-ci.

Gérer les rôles Permet de créer, d’afficher et de modifier des définitions de rôles.

Gérer les travaux Permet d’afficher et d’annuler les travaux en cours d’exécution.

Page 326: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.3 La gestion des rapports ——————————————————————————————————————————————————————————————— 315

Tableau 10.9 — Liste des tâches du rôle Utilisateur Système

Les tâches et les rôles ont été définis. Il convient maintenant d’attribuer desutilisateurs ou groupes d’utilisateurs Windows dans chaque rôle.

Dans le champ Nom d’utilisateur ou de groupe, vous devez entrer un nomd’utilisateur ou groupe Windows. Il est possible également de préfixer le nomd’utilisateur par le nom de domaine tel que DOMAIN\Utilisateur.

Afficher les planifications

partagées

Permet d’afficher une planification prédéfinie qui est disponible à des fins d’utilisation générale.

Afficher les propriétés du serveur de rapports

Permet d’afficher les propriétés qui s’appliquent au serveur de rapports.

Exécuter les définitions de rapport

Démarrer l’exécution à partir de la définition de rapport sans la publier sur Report Server.

Figure 10.29 — Nouvelle attribution

de rôle système

Figure 10.30 — Formulaire de nouvelle

attribution de rôle système

Page 327: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 316

Sécuriser les objets de Reporting Services

Dans le but d’autoriser l’accès aux rapports ou répertoires de Reporting Services,vous allez devoir ajouter la sécurité à chaque élément. Par exemple, pour donneraccès au répertoire AdventureWorks Sample Reports et tous les rapports qu’ilcontient, il est nécessaire d’ouvrir le répertoire puis d’accéder à l’onglet Proprié-tés puis Sécurité.

Vous observez une page identique à celle donnée figure 10.30.

Cliquez sur Modifiez la sécurité de l’élément Une confirmation de modifica-tion de l’héritage des paramètres de sécurité du dossier parent est demandée àl’opérateur. Il est ainsi possible d’effectuer une nouvelle attribution de rôle.

Figure 10.31 — L’onglet Propriété du rapport permet de modifier la sécurité d’accès au rapport

Figure 10.32 — Propriétés de sécurité

Page 328: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.3 La gestion des rapports ——————————————————————————————————————————————————————————————— 317

Ajoutez un utilisateur Windows.

Attribuer l’utilisateur Windows au rôle prédéfini Lecteur. Il est possible decréer un nouveau rôle si aucun ne correspond au choix souhaité.

Figure 10.33 — Créer un nouvel utilisateur

Windows

Figure 10.34 — Attribution du rôle Lecteur à l’utilisateur Bertrand

Page 329: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 318

À l’issue de ce traitement, voici les rôles attribués au répertoire Adventure-Works Sample Reports (figure 10.34).

La sécurité attribuée au dossier racine AdventureWorks Sample Reports seranaturellement reportée sur l’ensemble des sous-répertoires contenus dans le dos-sier Racine.

La procédure d’attribution de sécurité d’un répertoire peut être appliquée defaçon identique aux rapports et aux ressources.

10.3.2 Les rapports liés

Reporting Services offre une technique permettant de partager un rapport qui aété déployé dans un répertoire afin de le partager dans d’autres dossiers. Cettetechnique permet de n’avoir qu’une seule définition du rapport rendant la main-tenance et le déploiement plus aisés. Le rapport est cependant accessible à partirde différents dossiers. Pour des raisons évidentes, le rapport lié n’hérite pas de lasécurité du rapport sur lequel il pointe (figure 10.36).

10.3.3 L’exécution de rapports

L’onglet Propriétés de l’exécution d’un rapport permet de définir le processusd’optimisation lors de l’affichage. Ces options déterminent à quel moment seproduit le traitement du rapport. Vous pouvez ainsi définir ces options pour pro-grammer l’exécution d’un rapport la nuit ou lorsque le serveur est le moins sol-licité. Si un rapport est consulté fréquemment, vous pouvez également mettre en

Figure 10.35 — Le lien Sécurité de l’onglet Propriétés du dossier racine fait apparaître les utilisateurs Windows et les rôles associés

Page 330: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.3 La gestion des rapports ——————————————————————————————————————————————————————————————— 319

cache de façon temporaire des copies de ce dernier pour éliminer les tempsd’attente lorsque plusieurs utilisateurs y accèdent à quelques minutes d’intervalle.

Pour ouvrir cette page, sélectionnez un rapport, cliquez sur l’onglet Propriétéssitué en haut de la page, puis sur le menu Exécution situé sur le côté gauche dela page.

Précisons les différents choix proposés.

• Toujours exécuter ce rapport avec les données les plus récentes : Utilisez cetteoption lorsque vous souhaitez que le rapport soit exécuté à la demande oulorsqu’un utilisateur le sélectionne. Si une copie du rapport est encore dis-ponible en cache mémoire, l’extraction ne sera pas exécutée et l’affichagedu rapport sera instantané.

• Ne pas mettre en cache les copies temporaires de ce rapport. Le rapport seratoujours exécuté avec les données les plus récentes. Chaque utilisateur quiouvre le rapport déclenche un accès à la source de données.

Figure 10.36 — Le menu General de l’onglet Propriétés du rapport permet de créer un rapport lié avec une sécurité différente

Page 331: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 320

• Mettre en cache une copie temporaire du rapport place une copie temporairedu rapport dans un cache lorsqu’un premier utilisateur ouvre le rapport.Les performances sont meilleures pour les utilisateurs qui ouvrent le mêmerapport avec les mêmes paramètres d’extraction, car il n’y aura pas d’accèsà la source de données.

• Faire expirer la copie du rapport après un certain nombre de minutes. Saisissezle nombre de minutes après lequel la copie temporaire n’est plus valide.Une fois cela, elle n’est plus renvoyée à partir du cache. La prochaine foisqu’un utilisateur ouvrira le rapport, le serveur de rapports retraitera ce der-nier et replacera une copie du rapport actualisé dans le cache.

• Faire expirer la copie du rapport selon la planification suivante : ce paramètrepermet de définir une date et heure d’expiration pour un rapport. Pourqu’un rapport mis en cache expire en fin de journée, par exemple, vouspouvez sélectionner une heure durant la nuit après laquelle la copie expire.

• Effectuer le rendu de ce rapport à partir d’une capture instantanée d’exécutiondu rapport : cette option permet de traiter un rapport comme un cliché, àl’heure planifiée. Choisissez cette option lorsque vous souhaitez exécuterun rapport aux heures creuses. Contrairement aux copies mises en cachequi sont créées lorsqu’un utilisateur ouvre le rapport, un cliché est créé,puis actualisé, suivant une planification. Les clichés restent en servicejusqu’à ce qu’ils soient remplacés par de nouvelles versions.

Figure 10.37 — Formulaire de définition des propriétés lors de l’exécution du rapport

Page 332: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.3 La gestion des rapports ——————————————————————————————————————————————————————————————— 321

• Les clichés générés par les paramètres d’exécution de rapport ont les mêmescaractéristiques que les clichés d’historique de rapport. La seule différenceréside dans le fait qu’il n’existe qu’un seul cliché d’exécution de rapport etplusieurs clichés d’historique de rapport. Les clichés d’historique de rapportsont accessibles à partir de la page Historique du rapport, qui stocke denombreuses instances d’un rapport à différents moments dans le temps.Les utilisateurs ont accès aux clichés d’exécution de rapport à partir desdossiers (comme pour les rapports actifs).

• Créer une capture instantanée du rapport lorsque vous cliquez sur le boutonAppliquer de cette page : cliquez sur ce bouton pour rendre le cliché dispo-nible avant l’heure de début planifiée.

• Délai d’expiration de l’exécution des rapports : spécifie si le traitement d’un rap-port doit être interrompu après un certain nombre de secondes. Si vouschoisissez le paramètre par défaut, le paramètre du délai d’expiration spé-cifié dans la page Paramètres du site est utilisé pour le rapport.

10.3.4 L’historisation des rapports

Cette fonctionnalité permet de conserver une trace des rapports exécutés. Plutôtque de conserver des copies des données à des instants différents, il sera plus

Figure 10.38 — Formulaire permettant de préciser les détails de la planification d’envoi de rapports

Page 333: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 322

simple de conserver les instantanés des rapports. Il est ainsi possible de conserverdes listes d’inventaire, des ratios financiers ou des rapports de production à dif-férentes périodes et ainsi d’analyser les tendances. Précisons que ces analyses res-tent visuelles et que les rapports ne peuvent à nouveau faire l’objet de réexécution.Pour les analyses de tendance nous préférerons naturellement la richesse des KPIfournis avec Analysis Services.

L’onglet Historique permet de consulter les instantanés.

Figure 10.39 — Le menu Historique de l’onglet Propriétés permet de paramétrer la fréquence d’historisation des instantanés

Figure 10.40 — L’onglet Historique du rapport Company Sales fournit la liste des instantanés

Page 334: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.3 La gestion des rapports ——————————————————————————————————————————————————————————————— 323

10.3.5 Abonnements aux rapports

Plusieurs types de souscription aux rapports sont proposés par Reporting Services.

Lorsqu’un utilisateur qui affiche un rapport désire souscrire à un envoi régulierdu rapport, il crée un abonnement.

Il peut recevoir ses rapports soit par e-mail, soit dans un répertoire partagé.La dernière option permet également de placer le rapport dans un entrepôt dedocuments indexé par une application telle que SharePoint Portal.

Le formulaire ci-dessous présente les options liées à la procédure d’abonne-ment au rapport Company Sales.

La gestion des abonnements nécessite que le service SQL Server Agent soitactif. Le gestionnaire d’abonnements envoie les rapports via le compte SMTP.Ce compte a été paramétré lors de la configuration de Reporting Services (exem-ple : smtp.wanadoo.fr).

Les champs Objet et Commentaire permettent d’introduire du texte avec desvariables comme le nom du rapport et l’heure d’exécution (@ReportName et @Exe-cutionTime).

Figure 10.41 — Formulaire d’options d’abonnement de rapport

Page 335: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 324

Un lien dynamique vers le serveur permet de rafraîchir le rapport et de retrou-ver une navigation dynamique (drill down sur les années ou les catégories).

D’autres formats peuvent être joints en pièces attachées (PDF, CSV, Excel, etc.).

10.4 REPORTING À LA DEMANDE AVEC REPORT BUILDER

Le générateur de rapports Report Builder est une application côté client qui per-met de créer et de concevoir des rapports à la demande. Cet outil est mis à ladisposition des managers. Il est en effet orienté métier et ne nécessite pas deconnaissance technique.

Report Builder (SSRB) offre un service de données au niveau entité concep-tuelle. Nous l’avons vu précédemment, l’écriture de rapports avec SSRS néces-site de savoir élaborer des requêtes au niveau du schéma logique. Par exemple,la création d’un rapport sur l’état des commandes nécessite d’écrire la jointure

Figure 10.42 — La réception du rapport dans Outlook

Page 336: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.4 Reporting à la demande avec Report Builder ———————————————————————————————————————————— 325

entre les différentes tables qui constituent une commande (entête de commande/lignes de commande/clients/produits).

Un grand nombre d’utilisateurs souhaite disposer d’un environnement utili-sateur de création de rapports n’imposant ni d’utiliser Visual Studio ni de créerdes requêtes SQL pour les rapports. Les utilisateurs et analystes souhaitent créerdes rapports directement sur les clients, les commandes, les ventes, etc. Certainsraisonnent au niveau concept métier, ou « domaine », et souhaitent exprimerleurs requêtes à ce niveau plutôt qu’au niveau du schéma logique.

Report Builder permet de décrire et de mettre en correspondance les entités« métier » avec la couche de schéma logique. Cette méthode porte le nom deSMDL (Semantic Model Definition Language).

Report Builder permet de créer des rapports de type tabulaire, matriciel ougraphique. La création d’un rapport nécessite au préalable la mise à dispositiond’un modèle de rapport. Ce modèle est conçu grâce à l’assistant de création d’unmodèle de rapport. Les modèles de rapport portent l’extension .smdl.

Lors de la publication du modèle sur le serveur, de nombreuses entités etchamps dérivés sont créés. Le tableau 10.10 donne la liste des options disponibleslors de la génération du modèle de rapport.

Tableau 10.10 — Options disponibles lors de la génération du modèle de rapport

Options Description de l’option

Créer des entités pour toutes les tables

Crée une entité pour chaque table, qu’elle contienne ou non des données.

Créer des agrégations de comptage

Crée un champ d’agrégation qui contient le nombre d’instances uniques d’une entité.

Créer des attributs Crée un attribut pour chaque colonne de chaque table.

Créer des attributs pour les colonnes à incrémentation automatique

Crée un champ masqué qui contient les données de la base de données incrémentées automatiquement.

Créer des variations de date Crée des variations sur les champs de date en fonction des différentes parties de la date, par exemple l’année, les mois ou les jours.

Créer des agrégations numériques

Crée des champs somme, moyenne, minimum et maximum pour chaque champ numérique.

Créer des agrégations de date

Crée un champ d’agrégation de la première date et un champ d’agrégation de la dernière date pour chaque champ de date.

Page 337: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 326

Options Description de l’option

Créer des rôles Crée deux rôles (un sortant et un entrant) pour chaque relation découverte entre les entités.

Entités de recherche Considère les entités ne contenant qu’un champ en tant qu’entités de recherche. Ces entités sont placées dans un dossier nommé Lookup.

Petites listes Crée des listes déroulantes lorsqu’il existe dans l’entité moins de 100 instances à partir desquelles choisir.

Grandes listes Impose aux utilisateurs de choisir dans une liste où il existe dans l’entité plus de 500 instances parmi lesquelles choisir.

Très grandes listes Impose aux utilisateurs de filtrer avant de choisir dans une liste où il existe dans l’entité plus de 5 000 instances parmi lesquelles choisir.

Définir des attributs d’identification

Indiquent les champs qui sont uniques à cette entité. Le générateur de rapports identifie les attributs d’identification potentiels.

Définir les attributs de détail par défaut

Indique les champs qui sont affichés par défaut lorsqu’un utilisateur clique sur un élément lié dans un rapport consultable à l’aide de clics.

Nom du rôle uniquement Définit automatiquement la propriété de nom contextuel de l’attribut Rôle.

Mise en forme des nombres et de la date

Tire les champs numériques et de date dans l’ordre décroissant.

Mise en forme des nombres entiers/décimaux

Met en forme les nombres entiers et décimaux.

Mise en forme des nombres à virgule flottante

Définit la mise en forme des champs à virgule flottante.

Mise en forme de la date Met en forme les champs de date et d’heure pour qu’ils affichent uniquement la partie date et non la partie heure du champ.

Déconseiller le regroupement

Empêche les utilisateurs de regrouper les champs uniques. Cette option prend la valeur True par défaut pour les attributs d’identification.

Sélection des valeurs de liste déroulante

Définit la propriété de sélection des valeurs aux listes déroulantes pour les champs contenant moins de 200 valeurs uniques.

Page 338: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.4 Reporting à la demande avec Report Builder ———————————————————————————————————————————— 327

La table source SalesPerson est composée de neuf champs. Le générateur demodèle crée des colonnes dérivées à partir des champs de la table source.

Les attributs de type texte sont préfixés par l’icône a tandis que les champsnumériques sont repérés par un #.

Lorsque le modèle de rapport est publié sur le serveur, le manager peut conce-voir ses rapports personnalisés. Il manipule les données métier en les filtrant, enles groupant, en les triant ou en créant de nouvelles formules.

Lorsque le rapport est défini, il peut être enregistré sur le serveur de rapports.Il devient donc disponible aux utilisateurs autorisés.

Le filtrage offre des conditions simples à utiliser et intuitives.

Figure 10.43 — Le formulaire liste les champs source

repris dans le modèle

Figure 10.44 — L’entité Sales Person montre les colonnes

dérivées

Page 339: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 10. Reporting Services 328

Figure 10.45 — Grâce à un glisser-déplacer, la construction du rapport s’effectue

Figure 10.46 — Filtrage sur l’année de commande

Page 340: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

10.5 Conclusion —————————————————————————————————————————————————————————————————————————— 329

Lorsque le rapport est prêt, il est nécessaire de l’enregistrer sur le serveur derapports afin qu’il soit disponible dans Reporting Services.

10.5 CONCLUSION

Les managers opérationnels disposent de peu de temps pour se former aux tech-niques de la création de rapports. Les informaticiens joueront pleinement leurrôle en préparant des rapports utiles aux personnels de l’entreprise. La facilitéde compréhension des rapports et leur mise à disposition rapide permettra auxopérationnels de suivre les indicateurs essentiels et ainsi de partager avec ladirection, la vision de l’entreprise.

Figure 10.47 — Le rapport filtré affiché dans Reporting Services

Page 341: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server
Page 342: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

11L’analyse de données

avec Excel

Dans le chapitre précédent, nous avons montré comment Reporting Servicespermet d’accéder à toutes les sources d’informations (relationnelles et OLAP)et d’en découvrir le sens. SSRS offre de nombreuses formes de restitution del’information : listes, graphes, tendances, alertes.

Report Builder offre une certaine autonomie au manager pour accéder auxinformations dont il a besoin. Malgré de nombreux efforts déployés par l’éditeur,Report Builder nécessite un minimum de formation. Or, les managers ont peude temps à consacrer à leur formation aux techniques de l’information.

Microsoft avait depuis longtemps introduit la notion de rapport de massegrâce à une fonctionnalité que l’on trouve dans Excel : le tableau croisé dyna-mique. Excel est depuis longtemps l’outil d’analyse le plus répandu et n’a pasbesoin d’être présenté aux managers.

Depuis le début des années 2000, Microsoft a introduit de nouvelles fonc-tionnalités à Excel permettant ainsi d’accéder à des cubes OLAP. Cette techno-logie a offert de nouvelles opportunités d’analyse. Excel peut également effectuerdes requêtes sur l’entrepôt de données.

Excel offre ainsi de nombreuses possibilités d’analyse : accès au datawarehousevia MS Query, accès aux cubes OLAP via les tableaux croisés dynamiques.

Une conséquence bénéfique de l’existence du datawarehouse réside dans lacentralisation naturelle des données de l’entreprise. Excel ne doit donc plus être

Page 343: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 11. L’analyse de données avec Excel 332

un lieu de ressaisie manuel mais un outil d’analyse accédant aux données stra-tégiques.

Dans ce chapitre nous présenterons les tableaux croisés dynamiques d’Excelaccédant aux cubes OLAP 2000 ou 2005. Depuis la version d’Excel 2000 le modeopératoire d’accès à un cube OLAP est le même. La version Excel 2007 (Office 12)ne déroge pas à la règle. Elle apporte cependant une fonctionnalité liée à SSAS2005 : les indicateurs clés de performance (KPI).

Microsoft a également mis à disposition des utilisateurs d’Excel un complé-ment nommé Office Excel pour SQL server Analysis services. Cet outil apportedes fonctionnalités qui n’existent pas dans les tableaux croisés dynamiques, enparticulier l’accès simultané à plusieurs cubes, et les fonctionnalités d’écrituredans un cube OLAP. Nous présentons cet outil dans ce chapitre.

Grâce aux Office Web Components (OWC), Microsoft offre la possibilité d’encap-suler des tableaux et graphes dynamiques dans des pages web. Cette fonctionna-lité est très prisée des utilisateurs nomades qui peuvent ainsi accéder à leurs analysessur Excel via un navigateur web.

Avec Office Business Scorecard Manager 2005, Microsoft offre une ouverturenouvelle aux managers soucieux de gouvernance d’entreprise. Les indicateurs clésde l’entreprise sont présentés sous forme de tableaux de bord synthétiques. BSMs’intègre naturellement dans un portail maison, Sharepoint Portal.

Depuis avril 2006, la société Proclarity, spécialisée dans les outils de restitu-tion sur plateformes MS OLAP, a été rachetée par Microsoft. Nous montronsl’apport de cette société dans la chaîne décisionnelle de Microsoft.

11.1 L’ANALYSE AD HOC GRÂCE AUX TABLEAUX CROISÉS DYNAMIQUES

L’utilisation des tableaux croisés dynamiques nécessite que le composant PivotTablesoit installé sur le poste client. Ce composant est téléchargeable sur le Web. Vouspouvez également le télécharger sur le site de l’auteur www.buroformatic.com.

L’installation de ce composant nécessite la présence d’Excel sur le poste client.

Voici les étapes nécessaires à la création d’un tableau croisé dynamique. Il està noter que les paramètres de connexion sont à définir lors de la création du tableau.Les accès ultérieurs permettront un rafraichissement automatique des données.

Choisir Données/Rapport de tableau croisé dynamique/Source de donnéesexternes.

Puis Obtenir les données/Choisir une source/OLAP/Nouvelle source dedonnées.

Page 344: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

11.1 L’analyse ad hoc grâce aux tableaux croisés dynamiques ————————————————————————————————— 333

Sélectionnez la base de données (ou cube ou perspective) désirée. Il est néces-saire de créer une nouvelle source de données et de choisir un cube à analyser.

Le fournisseur OLAP varie en fonction de la version du serveur Analysis Ser-vices. La version 8 correspond à AS 2000, la version 9.0 à MSAS 2005.

Figure 11.1 — Connexion

au serveur Analysis Services 2005

Figure 11.2 — Créer une nouvelle source de données OLAP

Figure 11.3 — Liste de sources OLAP

Page 345: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 11. L’analyse de données avec Excel 334

La nouvelle source OLAP est maintenant créée. Il convient de choisir cettesource en entrée du tableau croisé.

Le tableau croisé peut être créé dans la feuille Excel existante ou dans une nou-velle feuille. Le positionnement du tableau dans la feuille doit également être précisé.Dans la figure 11.4 le tableau croisé sera créé dans la feuille existante en cellule A3.

L’assistant fournit un modèle de rapport Vierge que l’utilisateur devra complé-ter. L’espace de travail est composé de régions qui ont chacune un rôle spécifique.

Les champs de ligne et de colonnes reçoivent les attributs ou hiérarchies de dimen-sions. Voir figure 11.5.

Les champs de page permettent d’effectuer un filtrage de la source de donnéessur plusieurs critères.

Figure 11.4 — Sélectionner

l’emplacement du rapport

Figure 11.5 — L’assistant propose trois axes dimensionnels et une zone réservée aux mesures

Page 346: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

11.1 L’analyse ad hoc grâce aux tableaux croisés dynamiques ————————————————————————————————— 335

L’espace nommé Déposer Données ici reçoitles donnée numériques ou mesures du cube.

Par un glisser-déposer, on introduit la caté-gorie de produit en tête de ligne, les annéescalendaires en tête de colonnes et les territoiresen filtre de page.

Dans la figure 11.6 la sélection d’un seulpays France, aura pour conséquence de filtrer lasource de données sur ce critère. On observe surla figure 11.7 le pays France sur la zone champsde page.

Figure 11.6 — Sélectionner un ou plusieurs éléments

en filtre de page

Figure 11.7 — Le tableau croisé présente les ventes effectuées sur le territoire français, par catégorie de produit (lignes) et par années calendaires (colonnes)

Figure 11.8 — Options avancées

de champ dynamique

Page 347: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 11. L’analyse de données avec Excel 336

Figure 11.9 — Liste des dix meilleures ventes de vélos (Road Bikes) de 2001 à 2004

Figure 11.10 — Le tableau croisé et le graphique croisé sont synchronisés dynamiquement

Page 348: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

11.1 L’analyse ad hoc grâce aux tableaux croisés dynamiques ————————————————————————————————— 337

La figure ci-dessus montre une sélection des 10 meilleures ventes (Total salesamount) triées en ordre décroissant.

Il est possible d’agrémenter la présentation du tableau en appliquant diffé-rents types de formats. Dans la figure 11.9 le format standard a été appliqué.

Afin de rendre plus visuel le tableau il est possible d’ajouter une graphiquecroisé dynamique.

Le graphique croisé dynamique est directement lié au tableau croisé. Le gra-phique est mis à jour dynamiquement en fonction des choix effectués dans letableau. Un drill down dans le tableau entraine la même opération dans le gra-phique et réciproquement.

Excel 2007 présente des améliorations visuelles et de nouvelles fonctionnalités.

Excel 2007 permet également une restitution des KPI (Indicateurs clés deperformances) inclus dans Analysis services 2005.

Créer un cube local

Pour des collaborateurs nomades qui par définition se déplacent et qui ne dis-posent pas toujours d’une connexion Internet il est parfois souhaitable de leurfournir des outils d’analyse. Les administrateurs pourront ainsi extraire des cubeset les stocker sur des portables avec toutes les données nécessaires. Des aspectsde sécurité doivent également être pris en compte.

Figure 11.11 — La nouvelle interface des tableaux croisés dynamiques d’Excel 2007

Page 349: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 11. L’analyse de données avec Excel 338

Excel dispose d’une fonction de création de cube local à partir d’un cubeSSAS. Il s’agit de la fonction OLAP hors connection du menu Tableau croisédynamique.

L’assistant de création de cube OLAP permet de stocker le cube localement.

Les paramètres constitutifs du tableau croisé sont transférés dans le cube local.

Figure 11.12 — OLAP hors connexion permet de copier

le cube sur le poste client

Figure 11.13 — Permet de créer un fichier

de données hors connexion

Figure 11.14 — On choisit les dimensions et les mesures à exporter

Page 350: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

11.1 L’analyse ad hoc grâce aux tableaux croisés dynamiques ————————————————————————————————— 339

Le fichier extrait porte le nom du cube source : Analysis Services Tutorial.cub.

Lors de l’analyse du cube local on accédera au fichier .cub et non au serveurde cubes.

Il est à noter que Microsoft Query, inclus dans Excel, dispose d’un assistantpermettant de créer des cubes à partir d’une source relationnelle.

Depuis la version 2000, Excel permettait déjà de réaliser des cubes. Cettefonctionnalité reste rudimentaire et ne s’applique qu’à des sources de donnéespeu volumineuses. Cette fonctionnalité ne doit pas occulter la recommandationmajeure de la business intelligence : partager un même et unique référentiel dansl’entreprise.

Ces recommandations étant faites, nous présentons succinctement les étapesqui permettent de créer un cube avec Excel.

Dans MS Query aller dans Fichier puis Création de cube OLAP.

Figure 11.15 — Connexion OLAP à un cube OLAP

Figure 11.16 — L’assistant de création

de cube OLAP à partir de MS

Query

Page 351: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 11. L’analyse de données avec Excel 340

La requête porte une extension .oqy et est stockée par défaut dans le répertoirerequêtes d’Excel : C :\Documents and Settings\Administrateur\Application Data\Microsoft\Requêtes\AdventureWorks.cub.

Le tableau croisé dynamique d’Excel est l’outil permettant de relire un cubestocké selon ce format.

11.2 COMPLÉMENT MICROSOFT OFFICE EXCEL POUR SQL SERVER ANALYSIS SERVICES

Le complément Microsoft Office Excel pour SQL Server Analysis Services estune nouvelle offre d’analyse décisionnelle qui permet aux utilisateurs de créerrapidement des rapports personnalisés dans Microsoft Excel. Ce complément estdisponible gratuitement sur le site de Microsoft. Il est compatible avec les ver-sions Excel 2002 (XP) et 2003.

Interactivité de l’analyse et de la génération des rapports

Conçu pour étendre les fonctionnalités de Microsoft Office Excel, le complé-ment Excel pour Analysis Services permet d’accéder aux données de différentessources, de les analyser, puis de créer des rapports riches et personnalisés direc-tement dans Excel. Grâce à ce complément, les utilisateurs individuels peuventgérer le cycle des rapports du début à la fin, et éliminer le copier-coller des don-nées issues de différents systèmes.

Fonctionnalités techniques clés

Le complément Excel pour Analysis Services, étroitement intégré à MicrosoftSQL Server et Analysis Services, étend les fonctionnalités d’analyse et de géné-ration de rapports de Microsoft Office Excel. Il contient un ensemble completd’outils qui simplifient la liaison avec diverses sources de données, la gestion desrequêtes, la génération de rapports sophistiqués dans plusieurs formats, l’enregis-trement des données dans le cube, etc. Les composants clés du complément Excelpour Analysis Services sont :

Les fonctionnalités principales sont les suivantes :

• récupère et partage les données des cubes OLAP (2000/2005);

• regroupe et exécute les requêtes;

• met en forme les résultats des requêtes;

• enregistre des données dans les cubes OLAP (write back);

• gère la mise en forme des rapports;

Page 352: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

11.2 Complément Microsoft Office Excel pour SQL Server Analysis Services —————————————————————— 341

• permet l’insertion ou la suppression de ligne;

• offre des possibilités de drill down/drill up ;

• gère les formules et présente les résultats dans les cellules Excel;

• permet de répondre à des simulations de type « what if »;

• affiche les formules au format MDX.

Après installation du complément, un nouveau menu Analyse des cubesapparaît dans la barre Excel.

Le menu gérer les connexions permet de connecter plusieurs cubes.

Figure 11.17 — Le menu Analyse des cubes du complément Excel pour OLAP

Figure 11.18 — Gestion des connexions

Page 353: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 11. L’analyse de données avec Excel 342

Lors de la création d’un nouveau rapport plusieurs dispositions sont fournies :

Plusieurs filtrages peuvent être associés. Les navigations drill down et drill upsont disponibles. À la différence du tableau croisé dynamique, le tableau peutêtre scindé. Des lignes et colonnes peuvent y être ajoutées.

Figure 11.19 — Outil de disposition des rapports

Figure 11.20 — La sélection du choix Ligne, colonne et filtre de page crée un rapport composé de quatre sections

Page 354: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

11.2 Complément Microsoft Office Excel pour SQL Server Analysis Services —————————————————————— 343

À titre d’exemple, voici le code MDX généré par l’assistant :

SELECT {Hierarchize({{[Customer].[Customer Geography].[All Customers],AddCalculatedMembers({[Customer].[Customer Geography].[All Custo-mers].children})}})} on 0, {Hierarchize({{[Product].[Subcate-gory].[All Products],AddCalculatedMembers({[Product].[Subcategory].[All Products].chil-dren})}})} on 1from [Adventure Works]where ([Date].[Calendar].[Calendar Year].&[2003])CELL PROPERTIES VALUE, FORMATTED_VALUE, FONT_NAME, FONT_SIZE, FONT_FLAGS, FORE_COLOR, BACK_COLOR, FORMAT_STRING

Les fonctionnalités de l’analyseur de cube permettent d’isoler ou d’éliminerdes membres de dimension.

Bien que de quelques fonctionnalités nouvelles liées à SSAS 2005 aient étéajoutées (groupes de mesures, dimensions hiérarchiques) à l’heure où nous tes-tons le complément d’analyse sur les cubes UDM (AS 2005) certaines fonctionsne sont pas encore opérationnelles. Cela est probablement lié à la différence destructure entre les cubes AS 2000 et 2005.

Il s’agit en particulier de l’accès au détail par un clic droit sur les cellulesagrégées. Les actions et les fonctions de simulation ne sont pas opérationnelles.

La version Excel 2007 intègre définitivement l’analyse des cubes avec toutesles fonctionnalités propres à SSAS 2005.

Figure 11.21 — Rapport défini avec l’outil Analyse de données

Page 355: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 11. L’analyse de données avec Excel 344

11.3 REPORTING INTERACTIF SUR LE WEB AVEC OWC

Les managers nomades qui désirent accéder régulièrement à leurs tableaux trou-veront appréciable d’utiliser des tableaux croisés dynamiques sur le Web. Si lecomposant OWC n’est pas installé sur le poste client, le téléchargement du contrôleActiveX s’effectue lors du premier accès au cube.

L’utilisateur accède au cube OLAP via une interface web. L’outil d’interroga-tion des cubes via le Web est similaire au tableau croisé dynamique intégré à Excel.

En pratique, le concepteur intègre le composant OWC (tableau croisé dyna-mique) dans une page web puis établit les connexions vers les sources de données.

Dans FrontPage il est possible de créer un tableau croisé dynamique (figure 11.22).

Le composant ActiveX permet de disposer d’une interface proche du tableaucroisé.

Figure 11.22 — Insertion

d’un composant web avec FrontPage

Figure 11.23 — Le composant web dans FrontPage

Page 356: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

11.4 Conclusion —————————————————————————————————————————————————————————————————————————— 345

La liste des champs de tableau croisé apparaît dans la fenêtre de droite. Leconcepteur de la page web élabore un premier tableau qui servira de modèle debase à l’utilisateur final.

Par la suite, l’utilisateur définit lui-même les axes d’analyse, filtre et trie lesdonnées selon ses propres analyses.

11.4 CONCLUSION

De nombreux outils étaient déjà intégrés dans Office 2000 permettant d’effectuertoutes sortes de requêtes et d’analyses. MS Access et MS Excel sont largement

Figure 11.24 — Avec le graphe associé

Page 357: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 11. L’analyse de données avec Excel 346

répandus dans les entreprises. De nombreuses pme/pmi ont mis en place dessystèmes décisionnels efficaces grâce à de tels outils.

Les limitations de tels outils ont été évoquées plus haut. Grâce à SQL server2005 et Analysis services, Microsoft a su concilier la puissance et la robustessed’un système centralisé connectés à des outils fortement répandus auprès desmanagers d’entreprises.

Pour les utilisateurs nomades désireux d’effectuer tous types d’analyse tout enrestant connecté à leur entreprise, Microsoft ne disposait pas de solution satis-faisante. Depuis l’acquisition de la société Proclarity ce vide est comblé. Nousverrons dans le chapitre suivant les différentes solutions d’analyse offertes via le web.

Page 358: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

12L’analyse de données

sur le Web

Reporting Services, totalement orienté Web, offre une lecture statique des don-nées de l’entrepôt et des cubes OLAP. Excel, grâce aux OWC permet une lectureplus dynamique des mesures et axes dimensionnels. Bien qu’Excel soit l’outild’analyse le plus répandu et le mieux maîtrisé par les managers, il n’en reste pasmoins que certains prérequis sont nécessaires : une licence Excel est nécessairesur chaque poste utilisateur et le composant OWC doit également être installépour une lecture sur le Web.

Si l’on désire accéder à des informations d’analyse dans un contexte extranet,il est indispensable de disposer d’outils qui ne nécessitent aucune installationcôté poste client.

Afin de répondre à cette attente, Microsoft a acquis cette technologie enavril 2006, auprès de la société Proclarity. La vocation de Proclarity fut pendantdes années de développer des outils de restitution autour des outils SQL Server2000/2005 et du portail Sharepoint.

Microsoft annonce que les outils développés par Proclarity feront partie inté-grante de la suite décisionnelle aux côtés de Business Scorecard Manager. On ytrouve les fonctionnalités exposées dans les sections suivantes.

Page 359: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 12. L’analyse de données sur le Web 348

12.1 PROCLARITY FOR BUSINESS SCORECARD MANAGER

Sans installation côté client, Proclarity Business Scorecard permet d’obtenir untableau synthétique des objectifs avec une vision de haut niveau. Derrière cha-que indicateur, il est possible de découvrir les raisons qui mènent à ce résultat.

Derrière chaque indicateur clé de performance, le client analytique léger per-met de répondre à la question « Pourquoi ? ». Proclarity propose des modes dereprésentation inhabituels et complémentaires à ceux d’Excel, tels que l’arbre dedécomposition, la carte de performance et la vue en perspective.

12.1.1 L’arbre de décomposition

Un arbre de décomposition fractionne une valeur pour mettre en évidence leséléments qui y contribuent et affiche leurs relations dans une arborescence hié-rarchique avec, éventuellement, un graphique de Pareto. Il permet égalementde répondre à des questions telles que : « Quels sont les produits alimentairesqui se vendent le mieux ? », « Quel pourcentage des ventes globales du deuxièmetrimestre représente les aliments en boîtes de conserve ? »

Figure 12.1 — Le logiciel Proclarity for Business Scorecard. Rassemble les indicateurs clés de l’entreprise

Page 360: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

12.1 Proclarity for Business Scorecard Manager —————————————————————————————————————————————— 349

Les données sont affichées sous forme de chiffres bruts et de pourcentages. Vouspouvez trier les nœuds du plus grand au plus petit ou inversement. En outre, lesgraphiques de Pareto illustrent la répartition des valeurs afin de permettre d’iden-tifier rapidement les groupes qui apportent la plus grande contribution à un total.

La figure 12.2 présente les informations suivantes :

• La quantité totale des ventes Internet représente 5 436 429 € pour le 2e tri-mestre de l’année calendaire 2004.

• Sur la même période, les accessoires représentent 4 % des ventes.

• Les Fenders et les Bikes Racks représentent respectivement 7 % et 6 % desaccessoires Ces deux catégories sont matérialisées par les deux barres plusclaires du graphique de Pareto.

• Dans le graphique de Pareto, la ligne des 76 % croise la ligne du pourcen-tage du total au-dessus de la barre représentant les Fenders. Cela signifiequ’environ 76 % des ventes d’accessoires sur Internet sont représentées parles trois premières catégories (Top 3) et représentées graphiquement par lesbarres situées à gauche de la catégorie Fenders. Pour connaître le détail de

Figure 12.2 — L’arbre de décomposition s’affiche dans une page web

Page 361: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 12. L’analyse de données sur le Web 350

ces accessoires, il suffit de placer le curseur sur les barres ou de cliquer surle nœud Top 3 (3 premiers) afin d’afficher son contenu.

• Une diminution significative de la quantité d’accessoires vendus est obser-vée à partir de la troisième barre. Cette situation pourrait éventuellementfaire l’objet d’une analyse plus approfondie.

12.1.2 La carte de performance

Une carte de performances (figure 12.3) utilise des ratios de tailles et de couleurspour comparer les valeurs de deux mesures pour chaque élément de la vue :

• la taille de case représente la première mesure;

• la couleur de case représente la seconde mesure.

En un seul coup d’œil, il est possible d’évaluer l’importance de ces mesuresappliquées à la requête. Par exemple, si la taille correspond aux ventes et la cou-leur, aux bénéfices, vous pouvez :

• Évaluez les performances en vous posant des questions telles que « Quelproduit a réalisé les plus fortes ventes au cours du quatrième trimestre2002 ? » (plus grande taille affichée dans l’angle supérieur gauche : SE200) et« Quel est le produit qui a réalisé la meilleure progression ? » (couleur claireen bas à gauche : CA 635).

• Identifiez des opportunités d’amélioration en vous demandant : « Pour-quoi, malgré sa position en tête des ventes (case la plus grande), le produitMI-562 a-t-il réalisé une progression médiocre (couleur la plus foncée) ? »

• Identifiez les exceptions en vous demandant : « Pourquoi tel produit réa-lise-t-il des ventes inférieures aux autres produits doublées d’une faible pro-gression (petite taille et couleur noire) à celles des autres produits durant lamême période ? »

Figure 12.3 — Carte

de performances

Page 362: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

12.2 Proclarity Analytics Server (PAS) ——————————————————————————————————————————————————————— 351

12.1.3 La vue en perspective

Une vue en perspective ressemble à un nuage de points, à ceci près qu’elle offredes informations plus détaillées et plus nombreuses. Elle affiche les performancesde grandes quantités de données en fonction de deux mesures. Elle permet derépondre à des questions telles que :

• Quels sont les clients avec lesquels je fais le plus de bénéfices ? (Quelle estla part du bénéfice par rapport à la rentabilité ?)

• Quel est le rapport entre le chiffre d’affaires prévisionnel et le chiffre d’affai-res réel ?

• Quel est le rapport entre le budget et la situation réelle ?

La vue en perspective (figure 12.4) est utilisée pour mettre en évidence lesrelations entre de nombreuses représentations de données. Elle permet d’effectuerune analyse sectorielle, d’expliciter d’importants volumes de données et d’établirdes correspondances entre plusieurs mesures simultanément au sein d’une hié-rarchie.

Lorsque vous déplacez les règles mobiles statistiques, vous pouvez vous concen-trer sur un pourcentage donné de la valeur totale. Vous pouvez, par exemple, dépla-cer la règle pour afficher les quatre-vingts premiers pour cent du chiffre d’affaireset 80 % des quantités.

12.2 PROCLARITY ANALYTICS SERVER (PAS)

Analytics Server permet de fournir des analyses basées sur le Web auprès d’uti-lisateurs disposant d’un simple navigateur (zero footprint).

PAS Intègre un serveur de cubes. Les tableaux sont accessibles grâce à desvues stockées dans des livres. Chaque livre fait l’objet d’une sécurité particulière

Figure 12.4 — Vue en perspective permettant de comparer les quantités vendues sur Internet avec le montant des ventes (chiffre d’affaires)

Page 363: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 12. L’analyse de données sur le Web 352

au moyen du gestionnaire d’administration du serveur PAS. La sécurisation descubes (accès aux dimensions, aux mesures, etc.) est effectuée dans Analysis Ser-vices 2005.

Analytics Server est le composant central de la plate-forme de business intel-ligence (figure 12.5). Les utilisateurs peuvent manipuler leurs données, les ana-lyser et communiquer des tableaux au moyen d’une grande variété d’interfaces.

Les administrateurs disposent d’un outil leur permettant de centraliser lesdroits d’accès aux librairies en un endroit unique.

Le serveur analytique centralise la définition de rapports pré-établis dans unlivre (briefing book).

La publication du livre sur le serveur PAS autorise son exploitation via unnavigateur Internet. La figure 12.6 montre les différents onglets permettant d’effec-tuer tous types de traitements sur les rapports. L’onglet navigation rassemble desfonctions de Drill down (forage vers le bas), de Drill Up (forage vers le haut),

L’onglet Data Layout permet de disposer les mesures et les dimensions sur lasurface du dessin.

L’onglet View permet de choisi le type de graphe. L’onglet Sort effectue destris sur les données. L’onglet Filter autorise des filtres sur les sources de données;

Ces onglets sont détaillés dans les figures 12.11 et suivantes.

L’interface d’administration est composée de deux parties : la gauche présenteles composants tels que les librairies et les rôles, la droite fournit les détails desrépertoires.

Figure 12.5 — Plate-forme de business intelligence de Proclarity

Page 364: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

12.2 Proclarity Analytics Server (PAS) ——————————————————————————————————————————————————————— 353

Le lecteur pourra découvrir par lui-même le mode de fonctionnement de cet outil en se connectant sur le site de l’auteur www.buroformatic.com

Figure 12.6 — Rapport stocké sur la plate-forme analytique permettant une navigation dans un cube OLAP sur le Web

Figure 12.7 — Console d’administration du serveur analytique de Proclarity

Page 365: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 12. L’analyse de données sur le Web 354

Dans la figure 12.7 on observe la console de management de PAS. Celle-cifait apparaitre le serveur composé de librairies, de roles et d’utilisateurs. Chaquelibrairie et chaque livre qui la compose fait l’objet d’une autorisation d’accès expli-cite. Dans la partie de droite on observe les rapports appartenant à chaque librairie.

Les Librairies sont créées sur le serveur analytique par les utilisateurs autorisésà l’aide de Proclarity Professionnal. Lors de la création d’une librairie, le dossierBooks est créé. Il rassemble les rapports partagés sur le serveur.

Le répertoire Components contient les logiciels distribuables auprès des utili-sateurs sur le Web. Par exemple, le composant Web Professional peut être auto-risé au téléchargement afin de permettre la création de rapports sur le Web.

Le répertoire des Rôles contient des groupes d’utilisateurs.

Le répertoire des Users contient les comptes individuels ajoutés au serveuranalytique. Par défaut PAS (Proclarity Analytic Server) refuse les droits depublication ou de fournir des liens vers les livres de rapports via e-mail.

Le serveur Proclarity agit comme une sorte de portail intégrant des rapportsd’origines différentes telles que Reporting Services. La figure 12.9 montre l’inté-gration d’un Rapport des ventes élaboré avec Reporting Services dans une inter-face Proclarity.

Les outils disponibles dans l’interface web sont nombreux. La figure 12.10montre une sélection de sets (ensemble de données). Les boutons ADD ou Removepermettent d’ajouter ou de retirer les sélections.

Figure 12.8 — Détail de la console d’administration de Proclarity

Page 366: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

12.2 Proclarity Analytics Server (PAS) ——————————————————————————————————————————————————————— 355

L’onglet NavigationSur le web il existe deux modes de navigation : standard et Professional. Le modestandard ne nécessite aucun ajout ou téléchargement de contrôle activeX. Le modeprofessional n’est disponible que si l’application Proclarity Professional est instal-lée sur le poste client.

Figure 12.9 — Reporting Services encapsulé dans le portail Proclarity

Figure 12.10 — Le gestionnaire de hiérarchie

Page 367: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 12. L’analyse de données sur le Web 356

Dans la même interface web, il est possible de recourir à tous types de navi-gation (figure 12.11) tels que Drill down, Drill Up, Expand (développer), Showonly (sélectionner un membre seulement) ou Hide (cacher tel ou tel membre dedimension).

L’onglet ViewL’onglet View permet de choisir les types de graphiques, d’ajouter des options detotalisation par ligne et colonnes ou de supprimer les hiérarchies dimensionnelles.

L’onglet Sort permet de trier toute colonne en ordre ascendant ou descendanttout en préservant les groupes hiérarchiques.

L’onglet Filter permet de sélectionner ou cacher des lignes selon les critèreshabituels : les n meilleurs, les x valeurs les plus basses. Les valeurs au-dessus, au-dessous ou entre des bornes. Il est possible de fournir les valeurs en pourcentagesou en sommes de mesures.

L’utilisateur dispose d’un choix de fonctions (figure 12.13) permettant de sau-vegarder ses vues personnelles afin d’organiser son propre environnement d’ana-lyse. Il peut également imprimer sur l’imprimante disponible ou exporter les

Figure 12.11 — Navigation en mode web

Page 368: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

12.2 Proclarity Analytics Server (PAS) ——————————————————————————————————————————————————————— 357

données dans la version d’Excel installée sur le poste utilisateur. L’envoi par e-mail permet de faire parvenir un lien au destinataire. Ce lien exécute un accèssécurisé au serveur afin de fournir des données dynamiques et à jour.

L’envoi par mail d’un rapport au format PDF estégalement possible grâce à la fonction imprimer. Lafigure 12.13 montre les différentes options d’envoi dedocuments (Imprimante, Excel, Messagerie électroni-que, serveur PAS etc.)

Les utilisateurs qui disposent d’une version Procla-rity Professional installée sur le poste peuvent aussicréer et publier de nouveaux rapports sécurisés.

Figure 12.12 — L’onglet View

Figure 12.13 — Différentes options

d’envoi de documents

Page 369: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————— 12. L’analyse de données sur le Web 358

PAS gère toutes les connexions et les droits d’accès aux cubes. Dans un envi-ronnement de clusters, PAS permet un accès simultané de plusieurs milliersd’utilisateurs.

Les techniques de caching optimisent les performances.

12.3 DASHBOARD SERVER

Dashboard Server requiert une installation complémentaire. Le tableau de bordpermet de regrouper de façon très synthétique un grand nombre d’applicationstelles que Reporting Services grâce à des liens ou des portlets embarqués dans leportail.

Il y a fort à parier que Proclarity Dashboard et Business Scorecard Managerfusionneront en une nouvelle version.

Figure 12.14 — L’interface de Proclarity Dashboard offre les fonctionnalités d’un portail

Page 370: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

12.4 Conclusion —————————————————————————————————————————————————————————————————————————— 359

12.4 CONCLUSION

Ce chapitre a montré l’innovation apportée par le logiciel Proclarity et ses dif-férentes déclinaisons. L’accès aux tableaux via le web est une demande croissanteen particulier pour les opérateurs qui offrent des solutions d’hébergement d’appli-cations (ASP : Applications Services Providers).

Selon les informations en notre possession, Microsoft projette d’inclure l logicielProclarity dans son futur produit PerformancePoint. Une version de Performance-Point integrera également BSM. Le lecteur intéressé par PerformancePoint pourraconsulter le site http://office.microsoft.com/fr-fr/assistance/CH101649551033.aspx.

Page 371: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server
Page 372: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

13Passez à l’action !

Tous les projets ne se ressemblent pas et tous les chefs de projets sont différents.

Commençons par le premier constat. La gestion d’un projet décisionnel (BI)est différente de celle d’un projet traditionnel car elle implique un grand nombrede technologies différentes, tant sur le plan logiciel que matériel. En outre, lesprojets traditionnels de développement de logiciels impliquent une méthodolo-gie de développement linéaire, alors que les projets de BI exigent une approcheitérative. L’approche itérative débute par l’étude des besoins, l’ébauche du modèleanalytique, sa mise à disposition auprès des utilisateurs et les corrections quis’imposent en fonction de l’adéquation des résultats obtenus par rapport à ceuxattendus et des contraintes d’évolution du métier.

Les projets BI exigent également de l’équipe projet d’avoir une plus grandeinteraction avec un large périmètre fonctionnel, rassemblant des interlocuteurscompétents en systèmes d’information ainsi que des analystes et managers.

Pour réussir dans le domaine de la BI, une équipe de projet doit être composéede membres ayant une forte composante métier conjuguée à une bonne compé-tence technique.

Ces contraintes exigent souvent une connaissance approfondie sur le sujettraité (finance, marketing, achats, etc.).

Naturellement, la maîtrise des technologies essentielles telles que l’intégra-tion de données, la modélisation ou l’analyse d’entreprise est indispensable.

Page 373: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 13. Passez à l’action ! 362

13.1 LES CARACTÉRISTIQUES DU CHEF DE PROJET DÉCISIONNEL

Les personnes qui se cachent derrière les projets sont les pilotes fondamentauxdu succès. Elles doivent posséder un large éventail de qualifications afin d’êtreefficaces. Au cours de ces dernières années, nous avons travaillé sur de nombreuxprojets BI, en revêtant tour à tour le rôle d’analyste, d’architecte ou de techni-cien des systèmes d’information.

Nous avons travaillé avec des chefs de projets exceptionnels. Mais nous avonsaussi hérité de projets enlisés par manque de compétence des acteurs ou par absencede volonté de la part de la direction.

Notre expérience dans le domaine des projets décisionnels nous a amené à défi-nir les caractéristiques essentielles du chef de projet décisionnel.

Être bien informé

Au-delà de la maîtrise d’une méthodologie de gestion de projet, un chef de projetBI doit être bien informé des contraintes du métier traité ainsi que des aspectstechniques du projet.

Les chefs de projet qui réussissent se tiennent constamment informés des avan-cées les plus récentes en matière de BI. Un chef de projet qui veut affirmer sonleadership sur son équipe doit imposer des méthodes éprouvées aussi bien face auxresponsables métier que face aux techniciens du datawarehouse.

Les bons chefs de projet en BI ont une grande connaissance des architecturestechniques ainsi que des liens existant entre les données opérationnelles et le modèledimensionnel de l’entrepôt de données.

Le chef de projet compétent a une conscience objective de son niveau deconnaissance. Il est capable de mesurer ses propres lacunes et de les combler parune assistance complémentaire. Son seul but est la réussite globale du projet.

Être expérimenté

Ils sont peu nombreux, les chefs de projets disposant d’une expérience en tantque chef de projet BI et ayant une connaissance des outils de mise en œuvre.

Une connaissance théorique de la gestion de projets BI est certes nécessaire.Cependant, pouvoir anticiper les problèmes dès la phase conceptuelle est un atoutsupplémentaire qui ne peut résulter que d’une expérience de terrain. Pouvoirdéceler dès le départ certaines carences dans la mise à disposition des donnéesévite un enlisement probable. Le processus itératif, dans la mesure où il ne remetpas en cause le schéma initial, permet de réagir positivement aux demandesd’adaptation liées à une meilleure appréciation des besoins. Idéalement, le chef

Page 374: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

13.1 Les caractéristiques du chef de projet décisionnel ———————————————————————————————————————— 363

de projet BI aura assumé par le passé plusieurs rôles différents dans des projetsantérieurs.

En plus de l’expérience pratique des projets BI, un chef de projet efficace doitcontrôler l’étendue du projet et de son budget. Ceci exige de sa part qu’il surveilleactivement l’avancement des tâches, les livrables, le temps passé et les dépensesoccasionnées par chaque membre de l’équipe projet. En contrôlant activementtous ces points, le chef de projet peut déterminer l’impact d’une demande dechangement et les risques de dépassement de budget.

Leadership

Tout le monde ne dispose pas des qualifications ou des qualités personnellesnécessaires au contrôle d’un projet informatique. Un chef de projet doit pouvoirêtre source d’inspiration et forcer le respect, vis-à-vis des membres de l’équipeprojet mais également vis-à-vis des commanditaires et des représentants de lacommunauté d’utilisateur. Cela exige du chef de projet de pouvoir gérer lesattentes de ceux à qui il rapporte directement aussi bien que de ceux qui luirapportent directement.

Le chef de projet doit construire une équipe formée d’individus qui possèdentdifférentes qualifications et si possible complémentaires. Développer une équipeaux compétences croisées représente un réel défi parce que les membres sont sou-vent issus de disciplines et de milieux différents. Cela exige du leader une volontéd’unir des membres pour le bien commun de l’équipe et le succès du projet.

Le chef de projet doit également maîtriser la gestion des conflits et l’art dela négociation. On constate cependant que beaucoup de dirigeants manquenttout simplement de compétences dans l’art de manager les hommes.

Compétences en organisation

Les meilleurs chefs de projet BI sont très organisés et adhèrent aux principes debase de la gestion de projet. Cela exige d’eux de développer et soumettre pourapprobation un plan formel de projet intégrant les livrables, les charges, la chro-nologie des tâches et le budget.

Une fois que le planning a été approuvé, le chef de projet surveille activementl’avancement des travaux par rapport au plan. La seule manière de communiquerl’état d’avancement du projet est de tenir des réunions hebdomadaires auxquellessont conviés tous les membres de l’équipe, les commanditaires du projet et lecomité de coordination de projet. En conduisant ces réunions régulièrement, tousles acteurs du projet sont informés de l’avancement, des problèmes éventuels etdes retards qui en découlent.

Page 375: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 13. Passez à l’action ! 364

Compétences en communication

Pour être un chef efficace, un individu doit également être un grand communi-cateur. Un chef de projet efficace transmet ses messages de manière compréhen-sible afin d’être entendu par l’ensemble des acteurs. Cela exige des capacités decommunication écrite et orale. La communication claire et concise est indispen-sable au soutien de la solution par la communauté des utilisateurs.

Le succès d’un projet BI est intimement lié à la compréhension de l’utilité età l’efficacité de la solution développée. Si les utilisateurs ne parviennent pas àutiliser simplement la solution ou ne comprennent pas les avantages qu’elle leurfournit, pourquoi devraient-ils changer leur comportement ? La communicationefficace est essentielle aux attentes des gestionnaires. De plus elle instruit lesutilisateurs et encourage les individus à accepter plus facilement le changement.

Qualités personnelles

De notre point de vue, il y a quelques traits personnels qui distinguent de bonschefs de projet de ceux qui sont exceptionnels. Tout d’abord, il y a l’honnêtetéet le désir de franchise dans les communications. Un excellent chef de projet saitnuancer son attitude, qui peut être ferme et claire afin d’insister sur un point précisou remplie de tact pour ne pas détériorer des relations ou endommager des rap-ports entre individus. L’honnêteté stimule la confiance et le respect entre les mem-bres de l’équipe projet et les sponsors.

En second lieu, les chefs de projet BI exceptionnels sont positifs, ce qui nesignifie pas d’un optimisme béat. Un optimiste espère toujours que le meilleur arri-vera en dépit des difficultés, et ne parvient pas à anticiper les problèmes avant qu’ilne soit trop tard. D’autre part, une attitude positive inclut une certaine quantitéde scepticisme et une bonne compréhension des réalités de la situation.

Troisièmement, les excellents chefs de projet BI sont clairvoyants et peuventidentifier des sujets de préoccupation avant qu’ils ne deviennent de vrais problè-mes. Tandis que la perception est influencée par l’expérience, la capacité à identifierces difficultés réduit considérablement le risque et permet au projet de continuerd’avancer.

Apprendre des expériences passées

Les excellents chefs de projet possèdent de nombreuses qualités acquises au filde leur parcours professionnel, et sont influencés par leurs expériences précéden-tes. Les caractéristiques communes d’un tel chef de projet sont ces traits qui lesdistinguent de leurs confrères. Le succès d’un projet BI repose sur le chef de projetet sa capacité à composer avec les courants politiques de l’organisation tout encherchant l’appui du commanditaire de projet et du comité de coordination.

Page 376: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

13.2 Quel est le retour sur investissement ? —————————————————————————————————————————————————— 365

13.2 QUEL EST LE RETOUR SUR INVESTISSEMENT ?

Il est important de considérer que ce qui compte n’est pas ce que l’on sait maisbien ce que l’on fait avec ce que l’on sait. De la même manière, tout actif d’entre-prise n’a de valeur que si l’on en fait quelque chose.

Dans le monde de la BI, il convient d’observer que des investissements sontnécessaires à la construction d’un environnement dans lequel les données setransforment en connaissance. Mais le réel bénéfice provient de l’action généréepar la connaissance. Cela signifie simplement que chaque organisation ne faitpas simplement que produire de l’information. Elle dispose de méthode pourextraire de la valeur de la connaissance, agir en conséquence et mesurer l’effi-cacité de son action. Il s’agit là non pas d’un problème technique mais biend’organisation. Identifier une connaissance « active » est une chose, mais réaliserl’action requise nécessite une organisation agile et fortement réactive.

Les gestionnaires évaluent sans cesse les coûts comparés aux avantages de telleou telle option. La compréhension et la quantification des coûts comparés auxbénéfices sont nécessaires afin de répondre à une telle question.

De plus en plus souvent, les chefs de projet sont invités à évaluer le coûtrelativement à l’avantage d’entreprendre un projet de business intelligence. Plu-sieurs mesures financières peuvent être retenues telles que le taux interne derendement (IRR), la valeur nette (NPV), la période de remboursement et leretour sur l’investissement (ROI). Chacune de ces mesures présente des avanta-ges. Cependant, une mesure généralement admise est le ROI.

Les composants de cette stratégie comportent une analyse des coûts, unaccroissement des revenus liés à cette activité, et d’autres bénéfices. On peutdistinguer les points suivants :

• les coûts fixes liés à l’acquisition de l’infrastructure (achats du dataware-house et des licences de base);

• les coûts variables associé à l’activité. (achat des licences des outils derestitution);

• les coûts induits par la maintenance de l’activité;

• la valeur des bénéfices dérivés des actions induites par la connaissance;

• le modèle de valeur attendu de cette activité;

• la détermination à rentrer dans ses frais tout en proposant un modèle deprofitabilité.

Les coûts directs sont des dépenses réelles qu’une organisation peut claire-ment identifier. Ils incluent le prix d’achat du logiciel, des honoraires de main-

Page 377: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 13. Passez à l’action ! 366

tenance, des dépenses de développement générant des coûts de main d’oeuvreinternes et externes. S’ajoute à cela des coûts de logiciels et de formation desutilisateurs.

Les coûts indirects sont plus difficiles à identifier ou mesurer. Puisqu’ils seproduisent habituellement après le démarrage de l’application, ils ne sont passouvent inclus dans le coût de mise en œuvre d’un projet décisionnel. Cepen-dant, ces coûts indirects sont une composante importante du coût global. Ilsintègrent la mise à niveau des postes client, des infrastructures de réseau, la miseà niveau des logiciels, le soutien des utilisateurs et leur formation aux nouvellesapplications. La compréhension du coût total est impérative pour que le projetne sorte pas du cadre du budget.

Le chiffrage des différents composants du projet tels que les coûts de logicielet des honoraires de maintenance et le coût moyen de configuration peuventêtre obtenus auprès de ressources externes. Les coûts estimatifs de déploiementde l’application feront partie intégrante du calcul du ROI.

Si le modèle ne permet pas clairement de rentrer dans ses frais il convientd’être circonspect sur la nécessité d’entreprendre ce chantier.

La formule communément admise pour le calcul du ROI est la suivante :

ROI = [(Économies réalisées – Investissement)/Investissement)] × 100

ExempleLa société Adventure Works Cycles souhaite mettre en place un projet décision-nel afin d’offrir à son personnel des outils d’interrogation et de reporting. Cepen-dant, compte tenu de l’engagement financier important, le sponsor du projet etla direction générale veulent connaître le ROI généré par le projet BI. Afin d’éta-blir des éléments de comparaison, on estime la charge de travail actuelle dureporting à 120 heures/mois.

On calcule les coûts de la mise en place d’un nouveau développement BI. Ilssont synthétisés dans le tableau suivant.

Durée estimée du projet : trois mois.

Dépenses Coût

Matériel 5 000 €

Logiciel (SQL Server Enterprise) 25 000 €

Main d’œuvre (chef de projet + développeur) 35 000 €

Total 65 000 €

Page 378: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

13.2 Quel est le retour sur investissement ? —————————————————————————————————————————————————— 367

Maintenance et support :

Le coût de maintenance des logiciels est de 10 % par an.

Le nombre d’heures de travail par individu est de 2000 par an.

Le salaire horaire moyen est estimé à 75 €.

Voici un calcul du ROI sur un horizon de trois ans.

L’économie réalisée sur les trois premières années est de 249 000 €.

Total de l’investissement des quatre premières années = 140 000 €.

ROI = [(249 000 – 140 000)/140 000)] × 100

Soit un ROI de 78 % sur 3 ans.

Ce rendement peut être considérablement accru dans le cas ou la sociétéAdventure Works Cycles commercialisant un grand nombre de marques décidede fournir l’accès aux données à chacun des ses fournisseurs. Créant un portail

Fonction % du temps de travail

Coût en €(2 000 h/an)

Administrateur de base de données 5 % 7 500

Administrateur système 5 % 7 500

Administrateur réseau 5 % 7 500

Total 22 500

Adventure Works Cycles ne déployant pas de projet BI

Année 0 Année 1 Année 2 Année 3

Main d’œuvre (120 h/mois) 108 000 108 000 108 000 108 000

Adventure Works Cycles déployant un projet BI

Matériel 5 000

Logiciel 25 000 2 500 2 500 2 500

Main d’œuvre 35 000 22 500 22 500 22 500

Total investissement 65 000 25 000 25 000 25 000

Résultats

Économie n/a 83 000 83 000 83 000

Page 379: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 13. Passez à l’action ! 368

décisionnel à haute valeur ajoutée pour ses fournisseurs, elle peut en attendreun loyer mensuel basé par exemple sur le chiffre d’affaires réalisé.

Dans l’exemple ci-dessus nous avons volontairement comparé un systèmemanuel à un système automatisé. Nous n’avons pas intégré des notions telles quel’amélioration considérable de la qualité des données, de la rapidité de leur miseà disposition et de leur diffusion, ainsi que la disponibilité d’analyses permettantd’effectuer des choix de gestion pertinents grâce à des observations qu’il étaitimpossible de réaliser dans un système manuel.

13.3 FAIRE UNE OFFRE DE SOLUTION DÉCISIONNELLE

La mise en œuvre d’une solution décisionnelle nécessitait jusqu’à présent un bud-get conséquent et une maintenance très lourde. Toutefois, depuis que la démo-cratisation de l’informatique décisionnelle s’est mise en marche, la donne aconsidérablement changé. Le développement d’offres de plus en plus packagéeset complètes ainsi que la naissance d’outils de reporting orientés utilisateurs faci-litent grandement l’accès à une version unique et vérifiée de l’information selonle format désiré.

En guise de synthèse de cet ouvrage, nous proposons une démarche progres-sive et concrète de mise en place de solutions décisionnelles, quelle que soit lataille de l’organisation considérée.

Dans sa plus simple expression, la solution est articulée autour de deux éléments :

• SQL Server 2005 côté serveur;

• Office 2003 côté client.

Le serveur SQL Server comporte de manière intégrée tous les éléments néces-saires à une solution décisionnelle :

• un ETL d’entreprise, Integration Services, pour l’extraction, la transfor-mation et le chargement des données à partir de n’importe quelle source;

• une base de données relationnelle intégrée à un moteur multidimensionnelOLAP;

• un serveur de rapport, Reporting Services, qui permet des restitutionsd’informations sous toutes formes. (reporting de masse, reporting ad hoc).

Côté client, notre solution comporte :

• Excel complété par un add-in Excel pour les besoins de simulation;

• les Office Web Components pour un accès via le Web;

Page 380: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

13.3 Faire une offre de solution décisionnelle ———————————————————————————————————————————————— 369

• SharePoint Portal Server, pour le partage des graphiques et tableaux croi-sés dynamiques sur l’intranet ou le portail d’entreprise;

• optionnellement, MapPoint peut être intégré au dispositif pour une repré-sentation cartographique ou à des fins de « géo-analyse »;

• Proclarity, nouvel add-in de Microsoft, pour une meilleure visualisationdes données et un serveur de cubes sur le Web;

• un serveur de Business Performance Management (Business Scorecard Mana-gement) permettant une mise en place et un suivi de tous types d’indica-teurs clés de performance.

Il est conseillé d’avoir connaissance des évolutions de ces deux produits dansla stratégie Microsoft. En effet, Microsoft annonce Office PerformancePoint pourle premier semestre 2007. Il s’agit d’une application de planification, de budgé-tisation et de prévisions. D’après les informations en notre possession lors de larédaction de cet ouvrage, il semblerait que cette appellation englobe Proclarityet Business Scorecard Management au sein de SharePoint.

13.3.1 Un ETL d’entreprise, Integration Services

L’accès aux données – dispersées dans différentes parties du système d’informa-tion des entreprises, selon de multiples sources – nécessite la mise en place de

IntégrationServices

CRM

LOB

ERP

Sources

StockageStockage

DataMarts

AnalysisServices

Reporting

SQLServer

Analyse

Outils familiers (Excel,

Navigateur,…)

Terminaux

Applications tierces

ReportingServices

Tableaux Tableaux de bordde bord

Rapports Rapports interactifsinteractifs

Analyses Analyses détailléesdétaillées

ReportingReporting

Figure 13.1 — Les composants d’une offre décisionnelle globale

Page 381: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 13. Passez à l’action ! 370

protocoles. Simplifier cette étape est indispensable pour pouvoir ensuite mani-puler les données, les confier aux utilisateurs et améliorer la diffusion d’informa-tion dans l’entreprise.

Un ETL extrait les données de sources hétérogènes, les transforme et les réin-jecte dans une nouvelle base, le datawarehouse. Cela permet de nettoyer et trans-former les données. Une seule source de données est ensuite interrogée par l’outilde restitution.

Le module d’ETL qui porte le nom d’Integration Services (SSIS) permet uneintégration des données en provenance de diverses sources hétérogènes vers lesenvironnements d’aide à la décision (moteur OLAP, datamart, datawarehouse)ou tout autre type d’application. Les caractéristiques majeures de SQL Integra-tion services sont les suivantes :

• service de transfert de données (ETL);

• accès à tous types de sources de données (SGBD tiers, mainframe, fichiers,ODBC, XML, ERP, CRM…);

• transfert et conversion des données à l’aide de scripts;

• planification de l’exécution des tâches;

• moteur d’agrégation;

• support des environnements 64 bits;

• intégration avec le reste des composants;

• les fonctions de SSIS sont exposées au travers d’un modèle objet;

• migration depuis DTS 2000;

• signature des packages à l’aide des certificats;

• visualisation en temps réel des données traitées;

• possibilité de créer des points de reprise;

• débogage facilité par l’insertion de points d’arrêt;

• environnement de développement intégré à Visual Studio.

13.3.2 Un SGBD pour la gestion des gros volumes de données

SQL Server 2005 gère à la fois des bases de données de taille modeste mais ausside très grandes bases de données (plusieurs dizaines de téra-octets).

Les fonctionnalités de partitionnement des données, de restauration (récu-pération rapide et restauration en ligne), d’opérations de gestion (ré-indexationen ligne, etc.), d’isolation des transactions, permettent de mieux répartir lacharge et de travailler sur une base en permanence disponible.

Page 382: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

13.3 Faire une offre de solution décisionnelle ———————————————————————————————————————————————— 371

13.3.3 Une architecture qui garantit la disponibilité des données

SQL Server 2005 permet la mise en place de solutions de haute disponibilité,tout en minimisant les charges d’administration et d’exploitation. Par exemple,la mise en miroir (nouvelle fonction de SQL Server 2005) permet un bascule-ment automatique pour les applications clientes en cas de défaillance d’un ser-veur, sans perte de données et dans un temps très réduit.

13.3.4 Compatibilité, ouverture

Intégration des données : des sources de données de tous types peuvent être inté-grées dans les flux de transformation : Oracle, sources XML, services web, fichiersplats, etc.

Mécanisme de réplication : SQL Server peut être utilisé comme répliquat d’unebase Oracle.

Chaîne décisionnelle : le mécanisme UDM (Unified Dimensional Model) permetl’intégration dans la chaîne décisionnelle de n’importe quelle source de données(base ERP, CRM, relationnelle, multidimensionnelle…).

Reporting : pour créer des rapports depuis des bases de données non Microsoft,de produire des rapports avec des outils tiers dans des formats au standard dumarché (PDF, XML, HTML, CSV, etc.).

SQL Server 2005 ajoute un support natif des services web et de XML dansla base de données. Cela permet une gestion complète et optimisée des docu-ments XML dans la base de données et la possibilité d’ouvrir les services dumoteur relationnel en utilisant des standards du marché (services web).

SQL Server 2005 offre aussi une meilleure compatibilité avec les environne-ments Oracle, et des interfaces sont disponibles pour SAP.

13.3.5 Productivité dans le développement d’applications liées à SQL Server 2005

SQL Server 2005 intègre le framework d’exécution .Net et le moteur relationnel.Cette intégration permet d’optimiser des traitements (fonctions et procéduresSQL, etc.) stockés dans la base de données en utilisant un langage de program-mation classique (C#, VB.Net, J#).

La création de projets et solutions autour de SQL Server 2005 (création deprojets d’ETL, de projets décisionnels, de projets de reporting, etc.) s’effectuedésormais au travers d’une interface unique : business intelligence DevelopmentStudio (Visual Studio). Cette utilisation de Visual Studio permet d’une part uneplus grande productivité pour les développeurs (débogage plus aisé, choix du lan-

Page 383: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 13. Passez à l’action ! 372

gage de développement le plus adapté), et une industrialisation plus poussée desdéveloppements (gestion de sources, isolation des serveurs de développement etdes serveurs de production). De plus, le développeur peut s’appuyer sur les ser-vices de notification, de reporting, sur une infrastructure complète de servicepour se concentrer sur les aspects métier de son application.

13.3.6 Administration renforcée

L’administration se fait via des interfaces graphiques : SQL Server 2005 introduitla console d’administration SQL Server Management Console qui permetl’administration centralisée de l’ensemble des services SQL Server (moteur rela-tionnel, moteur OLPA, moteur ETL, serveur de reporting, mobilité) à traversun unique outil.

13.3.7 Sécurité

SQL Server 2005 introduit de nouvelles fonctionnalités qui renforcent la sécu-rité des données et des échanges avec SQL Server :

• chiffrement des données;

• chiffrement des échanges sur le réseau;

• gestion des certificats;

• filtrage des adresses IP pouvant invoquer un service web.

13.3.8 Analysis Services

Il s’agit de mettre en place une vision multidimensionnelle des données del’entreprise de sorte à croiser des axes et perspectives à l’aide de nombreusesmesures.

La composante multidimensionnelle du moteur SQL Server 2005 est Analy-sis Services 2005. Elle apporte des fonctions d’analyse en temps réel, un fra-mework de création d’indicateurs de performance (KPI), de modélisation libre(plus grande flexibilité en termes de création des cubes) et des fonctions de hautedisponibilité à son moteur OLAP. SQL Server 2005 améliore également sonmoteur de data mining, permettant d’effectuer des découvertes au sein desdatawarehouses.

13.3.9 Reporting

SQL Server 2005 comporte une plate-forme complète de reporting. De la créa-tion de rapports au travers de Visual Studio, à la mise à disposition de ces rapportsà l’utilisateur via une intégration possible au portail ou à des applications métier.

Page 384: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

13.3 Faire une offre de solution décisionnelle ———————————————————————————————————————————————— 373

Report Builder permet aux analystes métier de créer des rapports et tableauxavec des fonctions de navigation interactive au sein des rapports. Report Builderest complètement intégré à Reporting Services 2005. Les outils de reporting, unefois déployés par les informaticiens, donnent aux managers une réelle indépen-dance pour l’accès à leurs données.

Les différentes façons de créer un rapport

Il existe différentes manières de créer un rapport :

• pour les développeurs : Visual Studio;

• pour l’utilisateur final : Report Builder;

• importation de rapports depuis Microsoft Access;

• via des outils partenaires;

• génération de description de rapports en RDL.

Client Report Builder

Report Builder est destiné aux utilisateurs finaux pour leur faciliter la créationde rapports. Les utilisateurs n’ont pas besoin de comprendre la structure techni-que des données sous-jacentes.

Les rapports sont construits sur la base de modèles développés à partir deReporting Services (table, matrice, graphique) et mis à disposition des utilisa-teurs sur le portail intégré.

Les rapports sont directement sauvegardés sur le serveur de rapports. Les rap-ports conçus par les utilisateurs peuvent être publiés et partagés sur le serveur.

13.3.10 Donner un véritable cockpit de pilotage de l’activité adapté aux différents niveaux de l’organisation

Les Anglo-saxons mettent en place des salles de type Management Cockpit.Sans aller jusqu’aux war-room (salles de guerre) présentes dans les grands grou-pes aux États-Unis, la salle de Management Cockpit permet de réagir rapide-ment aux événements et aux crises. Les murs de telles salles sont recouvertsd’indicateurs visant à faciliter le pilotage de l’entreprise. On retrouve souventles indicateurs répartis selon les quatre perspectives du Balanced Scorecard défi-nis par MM Norton et Kaplan (Financier, Client, Processus et apprentissageorganisationnel).

L’ensemble des techniques présentées au cours de cet ouvrage peuvent êtreregroupées au sein d’un schéma global de la plate-forme décisionnelle. La

Page 385: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 13. Passez à l’action ! 374

figure 13.2 montre les différentes couches qui composent cette plate-forme (cou-che physique d’alimentation, couche applicative, couche de restitution).

13.4 COMMENT METTRE EN PLACE UN PROJET DÉCISIONNEL ?

Un projet décisionnel met en œuvre des technologies diverses et des savoir-fairedans des domaines complémentaires. L’expérience parfois douloureuse des res-ponsables informatiques confrontés aux discours marketing des éditeurs de solu-tions de business intelligence ont forcé les organisations à la prudence. Avantde s’engager définitivement dans le choix de telle ou telle solution, les décideursont besoin de savoir si les outils répondront aux exigences formulées par lesdemandeurs, mais également le degré d’implication des différents acteurs del’entreprise.

Il est maintenant acquis qu’une première étape d’étude de faisabilité estnécessaire au processus de décision. La terminologie anglo-saxonne est proof ofconcept (POC).

Figure 13.2 — La plate-forme décisionnelle

Page 386: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

13.4 Comment mettre en place un projet décisionnel ? ———————————————————————————————————————— 375

13.4.1 Objectifs de la preuve de faisabilité

Les objectifs sont les suivants :

• permettre dans un délai très court de formaliser les attentes du client etde les matérialiser au travers d’un prototype personnalisé;

• cerner les capacités de la solution et acquérir les connaissances de base;

• une base de travail et de discussion avec les responsables techniques(architectes, DSI) et les utilisateurs (responsables des directions fonction-nelles ou opérationnelles (finance, achat, marketing, commercial, commu-nication, RH, etc.).

13.4.2 Faisabilité sur site

La démarche de faisabilité sur site inclut les étapes suivantes :

• Analyse des besoins.

• Interviews et questionnaires.

• Implémentation d’un prototype se basant sur les données du client.

• Présentation/analyse de la valeur/transfert de compétences.

13.4.3 Livrables

Les livrables sont :

• document de synthèse;

• prototype;

• licence à durée limitée du produit utilisé;

• prévoir une durée d’étude de 10 jours.

L’étude de faisabilité peut déboucher sur le déploiement de la solution com-plète. Voici un planning type pour le déploiement.

13.4.4 Planning pour le déploiement de la solution

Les points qui seront abordés sont les suivants :

• l’architecture globale;

• le planning de la montée en charge;

• les recommandations pour les configurations clientes;

• les recommandations pour les configurations serveur;

• les configurations d’installation des produits.

Page 387: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————————— 13. Passez à l’action ! 376

13.4.5 Prototype/pilote

Ce pilote sera conçu en fonction du cahier des charges défini précédemment.

Il faudra procéder à :

• l’installation sur un des serveurs de l’organisation cliente;

• l’intégration des sources de contenus;

• la mise en place et la personnalisation de la solution décisionnelle;

• l’installation sur les postes client;

13.4.6 Opérations

Il faut définir les procédures opérationnelles principales et toutes les procéduresde contrôle :

• définition des procédures opérationnelles;

• contrôle des performances;

• optimisation des performances.

13.5 CONCLUSION

Le lecteur aura pu s’en rendre compte, MS SQL 2005 offre une réponse plus quesatisfaisante à la mise en œuvre de tout projet décisionnel. L’apprentissage d’untel outil permet de découvrir non seulement de nouveaux concepts liés au pro-cessus décisionnels mais de les mettre rapidement en œuvre grâce à une boîte àoutils immédiatement opérationnelle.

L’apparente facilité de déploiement d’un projet décisionnel ne doit cependantpas occulter l’impérative nécessité de procéder avec méthode. Tout commencepar la vision claire des objectifs à atteindre. Les outils ne sont que le moyen demettre la stratégie au service de l’entreprise.

N’oublions jamais que la phase la plus importante du cycle décisionnel estl’action !

Page 388: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Conclusion

Sans action l’intelligence est vaine !

Une enquête récente publiée par le CIO (Le Monde Informatique) montre que lemoteur de la stratégie décisionnelle est alimenté à 69 % par le pilotage de laperformance, à 53 % par la réduction des coûts opérationnels et à 51 % par l’opti-misation de la productivité.

À la question « quels sont les facteurs clés de succès d’un projet décisionnel »,86 % des décideurs pensent que l’adéquation aux objectifs métier est essentielle.Viennent ensuite l’adhésion des utilisateurs (78 %), l’implication de la directiongénérale (72 %), l’adéquation à la stratégie de l’entreprise (61 %) puis la rapiditéde mise en œuvre (51 %). Enfin, les managers pensent que les fonctions déci-sionnelles à mettre en place sont prioritairement le reporting ad hoc (61 %), letableau de bord pour 59 %, le portail décisionnel (54 %), et l’analyse multidi-mensionnelle (51 %).

Comme nous l’avons vu dans cet ouvrage, des outils sont largement disponi-bles. De nombreux assistants logiciels tentent de banaliser les fonctions qui, il ya peu encore, semblaient réservées à des élites (statisticiens, prévisionnistes, spécia-listes en intelligence artificielle ou systèmes experts). La technologie d’aujourd’huimet à portée de clic les analyses les plus complexes (data mining, simulations,analyses prédictives). Rappelons que 80 % de la réussite d’un projet de businessintelligence provient de la qualité du datawarehouse. La méthodologie qui pré-side à la conception de l’entrepôt (cf. chapitre 2) est à ce titre fondamentale.

Les logiciels sont largement compatibles avec les technologies OLAP de Micro-soft. Que vous utilisiez des outils d’analyse comme Excel, Powerplay de Cognos,Business Objects, Hyperion, vous pouvez réaliser rapidement et à peu de frais unsystème décisionnel. Le processus itératif d’un projet décisionnel permet de pren-dre en compte de plus en plus de besoins et ainsi de suivre la progression del’activité de toute entreprise.

Page 389: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————————————————————————————————————— Conclusion 378

Cependant, peu nombreux sont les décideurs qui exploitent ces outils en tota-lité. Qui peut se vanter de connaître (et encore moins d’appliquer) toutes lesfonctionnalités d’Excel ? Aujourd’hui les outils de BI sont extrêmement aboutiset vont même bien au-delà des besoins des décideurs. Le véritable enjeu ne résidepas dans le mode d’emploi des outils de BI, lesquels sont dotés de plus en plusd’assistants (ils seront bientôt banalisés comme ce fut le cas de la bureautiquedans les années quatre-vingt-dix) mais bien d’avantage dans la capacité d’utiliserces outils au service de la stratégie de l’entreprise.

Appliquons l’adage de Socrate, « connais-toi toi-même », à notre sujet d’étude.C’est parce que l’entreprise réalise un travail d’introspection sur elle-mêmequ’elle va pouvoir se situer dans le monde qui l’entoure. Mais pour bien connaîtrele monde, l’entreprise doit exercer une veille permanente.

Le Corporate Performance Management (CPM), qui se définit comme un ensemblede méthodes et d’outils destinés au contrôle des performances de l’entreprise, s’appuied’ores et déjà sur les fondements de la business intelligence. La chaîne de comman-dement dans les organisations passe du mode simulation au mode opératoire et réci-proquement selon un cycle vertueux mû par la stratégie globale de l’entreprise.

La business intelligence n’est ni un mirage, ni un miracle de la technologie.Si elle n’a pas toujours été comprise, c’est qu’elle n’a pas été suffisamment expli-quée par ses promoteurs. Nous pensons qu’elle s’intègre elle-même dans une appro-che multidimensionnelle où les trois axes sont pragmatisme, rigueur et pédagogie.

Pragmatisme parce que la business intelligence s’impose au-delà des modes enmettant en concordance technologie et stratégie d’entreprise.

Rigueur dans le respect de règles de l’art et des méthodologies de gestion deprojets.

Pédagogie afin de rapprocher ceux qui conçoivent les systèmes et les mettenten œuvre de ceux qui les utilisent au quotidien.

L’auteur espère apporter sa modeste contribution au mouvement de démo-cratisation de la business intelligence. Il forme et encadre en entreprise des étu-diants en informatique à l’Institut du management de l’université de Savoie. Cesjeunes, compétents, ouverts à toutes les technologies, apportent des réponsesconcrètes aux problématiques rencontrées dans les entreprises industrielles oude services.

Mais ne l’oublions jamais, le but principal de l’éducation n’est pas le savoir,mais l’action. La connaissance seule ne suffit pas. La connaissance n’a de valeurque si on l’exploite. Sans action, l’intelligence est vaine. Ce n’est pas ce qu’onsait qui est le plus important, mais plutôt ce qu’on fait avec ce qu’on sait.

Et un dernier conseil à ceux qui douteraient encore : il y a pire dans la vieque de ne pas avoir réussi, c’est de ne pas avoir essayé !

Page 390: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Bibliographie

Ouvrages sur la business intelligence

e-business Intelligence, Bernard Liautaud avec Mark Hammond, Éditions Maxima,2001.

Tableaux de bord et Balanced scorecards, Carla Mendoza, Revue Fiduciaire (Guidede gestion), 2002.

L’essentiel du tableau de bord, Alain Fernandez, Éditions d’organisation.

The Microsoft Data Warehouse Toolkit – With SQL Server 2005 and the Microsoftbusiness intelligence Toolset, Ralph Kimball, John Wiley & Sons, 2006.

Le data warehouse, Guide de conduite de projet, Ralph Kimball, Laura Reeves,Margy Ross, Warren Thornthwaite, Éditions d’Organisation, Fev. 2005.

The Multidimensional Manager. 24 ways to impact your bottom line in 90 days,Richard Connelly, Robin McNeill, Roland Mosimann Cognos, Juin 2001.

The Multidimensional Organization. How to deliver the 24 ways, Richard Connelly,Roland Mosimann, Cognos, Avril 1999.

Microsoft OLAP Solutions, Erik Thomsen, George Spofford, Dick Chase, Edi-tions Wiley, 1999.

Mesurer et développer les performances, Jean-Pierre Mercier, Éditions Quebecor, 2003.

Indicateurs et tableaux de bord; 100 questions pour comprendre et agir, Roger Aïm,Éditions AFNOR, 2004.

Le pilotage opérationnel de l’entreprise, Jean-Michel Treille, Éditions d’Organisa-tion, 2004.

Page 391: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————————————————————————————————————————————— Bibliographie 380

Analyse financière et reporting avec Excel, Joseph Rubin, Éditions d’Organisation,2004.

Le tableau de bord facile, Daniel Boix – Bernard Féminier, Éditions d’Organisa-tion, 2003.

Le Management Cockpit, Patrick M. Georges, Éditions d’Organisation, 2002.

Data Mining with SQL Server 2005, ZhaoHui Tang – Jamie MacLennan, JohnWiley & Sons, 2005.

Applied Microsoft Analysis Services 2005, TEO Lachev, Éditions Prologika, 2005et 2006.

Delivering business intelligence with Microsoft SQL Server 2005, Brian Larson,Osborne Mc Graw Hill, 2006.

Diriger un projet Informatique – Les secrets des consultants, Jacques Claviez, Édi-tions JCI inc., 1993.

Scénarios pour la NET Economie, Karim Mokhnachi, Sandra Spinek Éditionsd’Organisation, 2000.

Le tableau de bord prospectif, pilotage stratégique : les quatre axes du succès, KaplanRobert S. et Norton David P., Éditions d’Organisation, 1998.

Maîtriser les processus de l’entreprise, Michel Cattan Nathalie Idriss, Patrick Knoc-kaert., Éditions d’Organisation, 2005.

Découvrir Microsoft SQL SERVER 2005, Peter DeBetta, Éditions Microsoft Press,2004.

Quel sytstème décisionnel pour les entreprises agiles ?, Philippe Nieuwbourg Edi-tions Microsoft, mai 2004.

Le guide Decideo, Philippe Nieuwbourg, Luc Mornat, Véronique Blanc, MarcomGeneration, 2004.

Liens vers des sites Internet

Site de l’auteur : http://www.buroformatic.com

Site de Ralph Kimball : http://www.kimballgroup.com/

Site de Bill Inmon : http://www.billinmon.com

Site de l’Institut du Management de l’Université de Savoie : http://www.imus.univ-savoie.fr/

Témoignages de mise en œuvre de SQL Server et la business intelligence :www.microsoft.com/france/sql/sql2005/evaluez/temoignages.mspx

Page 392: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Bibliographie ———————————————————————————————————————————————————————————————————————————— 381

Guides comparatifs des fonctionnalités de business intelligence :http://www.guidescomparatifs.com/guide-bi-olap-decisionnel.html

Site de présentation de Office PerformancePoint :http://www.microsoft.com/performancepoint

Le site de référence Microsoft pour la business intelligence :http://www.microsoft.com/france/sql/sql2005/default.mspx

Microsoft et Proclarity :http://www.proclarity.com/fr/

À la découverte de SQL server 2005 : http://www.microsoft.com/france/sql/sql2005/solution/edito/decouverte.mspx

Les 30 fonctionnalités majeures de SQL Server 2005 : http://www. microsoft.com/france/sql/sql2005/decouvrez/fonctionnalites.mspx

Comparaison des fonctionnalités de SQL Server 2005 : http://www. microsoft.com/france/sql/sql2005/achetez/versions.mspx

Formation à SQL Server 2005 e-learning : http://www.microsoft.com/france/sql/sql2005/utilisez/e-learning.mspx

Le décisionnel avec SQL Server 2005 : http://www.microsoft.com/france/technet/produits/sql/decisionnel.mspx

Site des utilisateurs de SQL Server :http://www.guss.fr/

Business intelligence en Open Source :http://www.palo.net/http://www.pentaho.com/

La Synthèse 2007 de l’offre Microsoft pour les entreprises :http://www.calipia.com/lasynthese.asp

Vous pouvez télécharger la version française et gratuite de SQL Server 2005Enterprise, valable 180 jours, à l’adresse suivante : http://www.microsoft.com/downloads/details.aspx?familyid=6931FA7F-C094-49A2-A050-2D07993566EC&displaylang=fr

Site mondial d’observation du marché OLAP : http://olapreport.com

Page 393: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server
Page 394: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

APetit historique

de la BI

Voici un bref historique des étapes essentielles qui ont jalonné la longue marchede ce que l’on appelle aujourd’hui la business intelligence.

Année Événement Commentaire

1962 Ken Iverson publie le langage APL (A Programming Langage)

Premier langage multidimensionnel.

1970 Express Premier outil multidimensionnel visant les applications de type marketing. La version modernisée de ce moteur OLAP est intégrée aujourd’hui dans Oracle 9i Release 2 Option OLAP.

1982 Comshare System W Premier outil OLAP visant les applications financières. Ancêtre de Essbase.

1984 Lancement de Metaphor Premier moteur ROLAP (Relational OLAP).

1985 Lancement de Pilot Command Center

EIS en mode client/serveur.

1990 Lancement de Cognos Powerplay

Premier client OLAP pour station de travail sous PC Windows. Indissociable de Transformer (moteur de fabrication des cubes) et Impromptu (requêteur du datawarehouse).

Page 395: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

————————————————————————————————————————————————————————————————— A. Petit historique de la BI 384

Année Événement Commentaire

1992 Lancement de Essbase

1993 E. Codd dicte les règles qui décrivent les moteurs OLAP

À la demande de la société Arbor Software. E. Codd avait précédemment dicté les règles universelles du modèle relationnel.

1994 Lancement de DSS Agent par Microstrategy

La version actuelle 7i présente une architecture OLAP à 3 niveaux.

1995 Lancement de Holos 4.0 Outil d’accès aux SGBD relationnels et aux cubes OLAP multidimensionnels. La technologie fut acquise par Crystal Decisions en 1996.

1996 Oracle acquiert Express Événement d’importance qui propulse l’analyse multidimensionnelle au premier rang. Moteur hybride d’accès aux sources relationnelles et multidimensionnelles.

1996 Lancement de Business Objects 4.0

Création dynamique de cubes fondés sur des données relationnelles. La technologie client/serveur et Web a été acquise par le rachat de Crystal Enterprise.

1997 Microsoft lance la technologie OLE DB for OLAP

Livrable sous forme d’API (module interface).

1998 IBM lance Db2 pour OLAP Cette version d’Essbase stocke les données selon le modèle en étoile.

1998 Hyperion fournit ses solutions L’entrée de Microsoft sur le marché OLAP pousse Arbor et Hyperion à fusionner.

1999 Lancement de Microsoft OLAP services

Initialement nommé DSS (Decision Support Services). La technologie OLAP Services a été achetée auprès de la société israélienne Panorama Software en 1996.

2000 Microsoft renomme OLAP Services en Analysis Services

Cette version d’Analsys Services est intégrée gratuitement dans SQL Server 2000.

2000 XML/A Hyperion, SAS Institute et Microsoft définissent les règles d’accès aux données OLAP via XML for Analysis.

2001 Oracle 9i OLAP Successeur d’Oracle Express.

2002 Oracle 9i Release 2 OLAP À mi-chemin entre une base relationnelle et OLAP multidimensionnel.

Page 396: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Petit historique de la BI ——————————————————————————————————————————————————————————————————— 385

Si SQL Server 2005 intègre aujourd’hui les techniques les plus abouties enmatière de BI, c’est qu’il a hérité des nombreuses recherches qui se sont dérouléesdepuis une quarantaine d’années.

Année Événement Commentaire

2003 Année de consolidation BO achète Crystal Decisions, Hyperion achète Brio Software, Cognos achète Adaytum et Geac achete Comshare.

2004 Les éditeurs fournissent des add-ins pour Excel

BO, Cognos, Microsoft, Microsotrategy et Oracle mettent à disposition des add-ins pour le tableur Excel.

2004 Hyperion livre Essbase 7X Orienté applications marketing et financières.

2005 Microsoft livre sa suite inté-grale de business intelligence dans SQL Server 2005

La suite SQL Server 2005 intègre un SGBD, le datawarehouse, l’ETL, OLAPet le data mining avec Analysis Services, le reporting avec Reporting Services.

Page 397: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

BLe marché mondial de la BI aujourd’hui

L’observatoire indépendant de l’OLAP publie chaque année l’état du marché del’OLAP et les tendances. Il est possible de consulter les résultats de cette étudesur le site www.olapreport.com.

Le graphe de la figure B.1 représente les parts de marché de l’OLAP ainsi queles tendances des dix acteurs majeurs mondiaux.

Figure B.1 — Le marché mondial de l’OLAP a progressé de 15,7 % en 2005

Page 398: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Le marché mondial de la BI aujourd’hui ————————————————————————————————————————————————————— 387

On observe la percée de Microsoft depuis la sortie de SQL Server 2000incluant la brique Analysis Services. De nombreuses sociétés ont fait l’acquisitionde SQL Server 2000 dans le but de déployer uniquement la partie décisionnelle(Analysis Services). Le taux de progression de la plate-forme Microsoft est supé-rieur à la moyenne du marché. On peut penser que la courbe de pénétration dumarché devrait repartir en 2006 du fait de l’arrivée de SQL Server 2005 (8 nov.2005) incluant une plate-forme décisionnelle complète.

État du marché mondial de l’OLAP en 2005

Tableau B.1 — Les 10 leaders OLAP en 2005

Le tableau ci-dessus montre la répartition des parts du marché mondial del’OLAP avec l’évolution entre 2004 et 2005.

La dynamique du marché français des solutions décisionnelles

Aujourd’hui les éditeurs d’ERP ont l’ambition affirmée d’étendre les fonction-nalités de leurs applications transactionnelles disposant déjà d’un embryon de repor-ting vers les applications analytiques décisionnelles (tableaux de bord, balancedscorecard, KPI, etc.).

Éditeur Rang sur le marché

Évolution sur année

précédente

% de parts de marché

Microsoft ecosystem 1 ➚ 28,0 %

Hyperion Solutions incluant Brio Tech

2 ➘ 19,3 %

Cognos (incluant Adaytum) 3 ➘ 14,0 %

Business Objects (incluant Crystal Décisions)

4 ➚ 7,4 %

Microstrategy 5 ➚ 7,3 %

SAP (BW) 6 ➘ 5,9 %

Cartesis 7 ➚ 3,8 %

Systems Union 8 ➚ 3,4 %

Oracle 9 ➘ 3,4 %

Applix 10 ➚ 3,2 %

Page 399: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————— B. Le marché mondial de la BI aujourd’hui 388

-10%

0%

10%

20%

30%

40%

Décisionnel

ERP

CRM

Logiciel global

Décisionnel 32,0% 27,6% 7,2% 8,4%

ERP 15,8% 9,9% 3,5% 2,0%

CRM 117,7% 6,8% -4,6% -4,1%

Logiciel global 11,6% 8% -1,1% 0,6%

2000 2001 2002 2003

• ETL

• Data Mining

• Reporting

• Applications analytiques

Logiciel global

Décisionnel

ERP

CRM

197 M€

392 M€

452 M€

670 M€

0 200 400 600

CRM

Sécurité

Décisionnel

ERP

Figure B.2 — Le décisionnel représente le marché le plus dynamique

de l’informatique (source : IDC)

Figure B.3 — Panorama des éditeursde solutions décisionnelles

IBM, Oracle, Microsoft

SGBD/R

Ascential, Informatica, SunopsisOracle, Microsoft, IBM, Cognos, BO

Hummingbird, SAS

ETL

Microsoft, Hyperion, Microstrategy

Oracle, IBM

OLAP

SAS, SPSS, KXEN, Microsoft

Data Mining

Office 2007, BSM, Panorama

KPI

Microsoft (Excel, Proclarity, SSRS) BO (Crystal), Cognos, Panorama, Hyperion (Brio),

Temtec

Analyse multidimensionnelle

Informatique

Décisionnelle

Page 400: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Le marché mondial de la BI aujourd’hui ————————————————————————————————————————————————————— 389

Tableau B.2 — Liste des éditeurs qui offrent des solutions décisionnelles

Éditeur SGBD/R Moteur OLAP ETL Restitution

Actuate Nimble Technology

Actuate 7e-AnalysisActuate Query

Ascential (IBM) DB2 DB2 OLAP Server (Moteur OLAP d’Hyperion)

DataStage

Business Objects

Business Data Integrator

Enterprise 6 Crystal Decisions

Cognos PowerCube Decision Stream

Serie 8Impromptu (requêtage) Powerplay (analyse ad hoc)Reportnet (rapports web)

Informatica PowerCenterPowerExchange

AnalyticsPowerAnalyser

Information Builders

Iway

Hummingbird Desktop OLAP Genio BI Suite

Hyperion Essbase BrioPerformance suite 8

Microstrategy Moteur ROLAP Microstrategy 7(reporting masse, ad hoc, analyses multi dim)

Microsoft SQL Server 2005

OLAP (Analysis Services et UDM)

Integration Services

Excel, office 2007, Reporting services, Proclarity

Oracle Oracle Oracle 10 i R2 OLAP

Oracle BI WarehouseDatawarehouse builder

Applications analytiques (OFA, OSA)

Page 401: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————————— B. Le marché mondial de la BI aujourd’hui 390

Pourquoi Microsoft est-il entré sur le marché de l’OLAP ?

Microsoft observe constamment les nouveaux marchés à forte capacité de crois-sance. Plusieurs facteurs ont guidé son choix avant d’entrer sur le marché OLAP.

• La taille : Les marchés inférieurs à 1 M$ ne sont pas de nature à attirerl’attention de Microsoft.

• Le taux de croissance : Microsoft s’intéresse à des marchés présentant unfort taux de croissance.

• Les volumes : Microsoft vend des produits standard dans de très grandsvolumes, à des prix bas et faciles à déployer.

• La synergie avec ses produits existants : renforcer la domination de Windowset Office est un objectif connu de Microsoft. Les technologies OLAP deSQL Server 2005 trouveront un écho avec Excel et en particulier la ver-sion 2007.

• Il n’existe pas de compétiteur dominant : Hyperion, Cognos et Business Objectsse partageaient le marché depuis le début des années quatre-vingt-dix.Aucun d’entre eux n’avait la capacité à freiner les ardeurs de Microsoft.

En 1996, le marché de l’OLAP présentait toutes les conditions requises pourune arrivée de Microsoft sur ce marché, aux côtés d’Oracle, Informix, Seagateet IBM.

Le positionnement de Microsoft avec SQL Server 2005 (version Enterprise)est de couvrir l’ensemble des domaines de l’informatique décisionnelle (SGBD,ETL, reporting, analyse, data mining). Selon un principe qui lui a bien réussidans le domaine de la bureautique avec Word et Excel, Microsoft souhaite impo-ser un standard des bases de données en incluant dès maintenant une offre déci-sionnelle complète.

Parallèlement à cette percée de la BI, les grands éditeurs d’ERP ont la fermeintention d’étendre les fonctionnalités de leurs applications transactionnellesdisposant déjà d’un embryon de reporting vers les applications analytiques déci-sionnelles (tableaux de bord, analyses ad hoc, balanced scorecard, KPI, etc.).

Éditeur SGBD/R Moteur OLAP ETL Restitution

SAS ETL SAS activity-based Management

Sybase IQ (moteur SQL optimisé pour le décisionnel)

Sunopsis Sunopsis v3.2

Page 402: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

CLes différentes versions

de SQL Server 2005

La version Express Manager

Cette version remplace MSDE. Il s’agit d’une version allégée de la versionWorkgroup. Cette version gratuite dispose maintenant d’un outil d’administra-tion (Express Manager) :

• Pas de haute disponibilité.

Figure C.1 — Comparaison des versions de SQL Server 2005

EnterpriseLa plate-forme intégrée

pour la gestion et l’analyse de données

des applications critiques de l’entreprise

Pas de limitation +Partitionnement

Miroir BD complet & Cluster 8 nœuds

Opérations en ligne et redémarrage rapide

Clichés BD

Outils avancés (ETL, OLAP et Data Mining)

Serveurs de rapports multiples

Pas de limitation +Partitionnement

Miroir BD complet & Cluster 8 nœuds

Opérations en ligne et redémarrage rapide

Clichés BD

Outils avancés (ETL, OLAP et Data Mining)

Serveurs de rapports multiples

Express Workgroup StandardAdaptée aux

développeurs pour apprendre, construire

et déployer

La base de données pour les petites entités

et les activités en croissance

La plate-forme complète pour la gestion et

l’analyse des données destinée aux entités moyennes à grandes

Gratuit

2 Proc 3 Go mémoire

Outil d’administration Management Studio

SQL Agent

Assistant d’optimisation

Recherche en texte intégral

Serveur de Réplication limité

Transfert journaux (Log shipping)

4 Proc versions 32 & 64-bit

Miroir de BD limité

Cluster 2 noeuds

Integration Services

(ETL)

Analysis Services(Serveur OLAP)

Data Mining

Réplication complète

Notification Services

1 Proc1 Go mémoire4 Go base

Outil d’administration simplifié

Sécurité intégrée

Support XML & Améliorations T-SQL

Intégration .Net & CLR

Serveur de rapports

Import/Export

Client Réplication

Page 403: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

——————————————————————————————————————————————— C. Les différentes versions de SQL Server 2005 392

• Pas de décisionnel (ni KPI, ni Olap UDM).

• Pas d’ETL (Integration Services).

• Pas de recherche en texte ni d’agent SQL.

• Pas de Notification Services.

• Pas de réplication Oracle.

• Réplication SQL Server limitée.

• Reporting très limité.

Version SQL server Workgroup

Cette version est destinée aux applications départementales. Elle dispose derecherche en texte intégral et de l’agent SQL. L’outil d’administration est Mana-gement Studio doté d’un assistant de paramétrage de la base de données.

Limitations :

• reporting limité.

• limité à 2 processeurs.

• limité à 3 Go de mémoire.

Exclusions :

• pas de haute disponibilité.

• pas de décisionnel ni KPI, ni UDM.

• pas de réplication Oracle.

• pas de 64 bits.

Édition standard

Cette édition dispose des fonctionnalités de data mining :

• Réplication SQL Server.

• Décisionnel (KPI et UDM). Sauf Perspectives et mesures semi-additives.

• Outil d’administration complet (Management studio).

Limitations :

• la haute disponibilité est limitée à deux nœuds pour les clusters.

• ETL simplifié (import/export, et transformations de base).

• limité à 4 processeurs.

Page 404: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Les différentes versions de SQL Server 2005 ————————————————————————————————————————————————— 393

Exclusions :

• pas de réplication Oracle.

• pas de partitionnement des tables.

• pas de cache pro-actif.

• pas d’opérations on-line.

• pas de partitionnement des cubes OLAP.

Édition Enterprise

• Haute disponibilité illimitée.

• ETL complet.

• Data mining (dix algorithmes).

• Réplication Oracle.

• Replication SQL Server.

• Décisionnel illimité.

• Très haute performance (93 000 utilisateurs SAP concurrents).

Page 405: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server
Page 406: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

DLes profils d’apprentissage

des différents acteurs de la BI

Le parcours d’apprentissage peut être suivi selon un axe métier IT (InformationTechnology) ou selon un axe outils. Dans le parcours présenté ci-dessous, nousparcourrons les compétences à acquérir par module outil puis dans chaque outilnous présenterons les profils IT. Ces profils se décomposent en quatre catégories :

• utilisateur professionnel;

• administrateur;

• développeur;

• architecte.

Parcours d’apprentissage pour SQL Server Integration Services (SSIS)

Parcours d’auto-formation pour le profil Utilisateur professionnel SSISUn travailleur du savoir remplit le rôle traditionnel d’expert dans le domaine del’aide à la décision : c’est un acteur qui comprend les données métier et est capa-ble de traduire ces données en informations utiles pour l’entreprise. Souvent, letravailleur du savoir est celui qui analyse l’activité de l’entreprise pour identifierles problèmes, les opportunités et les caractéristiques du projet.

Dans cette catégorie, on trouve des fonctions telles que :

• analyste d’entreprise;

Page 407: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————— D. Les profils d’apprentissage des différents acteurs de la BI 396

• formateur technique;

• chargé de l’assistance technique et des opérations;

• administrateur réseau.

Tableau D.1 — Parcours de formation pour le profil Utilisateur professionnel SSIS

Parcours d’auto-formation pour le profil Administrateur d’IntegrationServices

Un administrateur gère et optimise les solutions et les projets au niveau opéra-tionnel. Il peut se voir attribuer différentes fonctions telles que :

• administrateur de base de données;

• administrateur de serveur de rapports (informatique d’entreprise);

• expert en sécurité;

• administrateur d’entrepôts de données.

Thèmes abordés pour l’utilisateur

professionnel SSISParcours d’apprentissage

Améliorations version 2005 Stocke, traite et sécurise les données

Présentation des packages Packages Integration ServicesÉléments de flux de contrôleComposants des flux de donnéesObjets et concepts d’Integration Services

Création de packages Création de solutions de projets ISCréation de packages dans le concepteur SSISCréation de packages à l’aide de l’assistant Import et Export

Ajout de fonctionnalités aux packages SSIS

Journalisation dans les packagesUtilisation des expressions de propriétés des packagesUtilisation des variables dans les packagesCréation de configuration de basePoints d’arrêt dans les packagesIncorporation des transactions dans les packages

Dépannage des packages Débogage du flux de contrôleDébogage d’un flux de données

Déploiement des packages Déploiement des packages SSIS

Page 408: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Les profils d’apprentissage des différents acteurs de la BI —————————————————————————————————————— 397

Tableau D.2 — Parcours de formation pour le profil Administrateur de SSIS

Parcours d’auto-formation pour le profil Développeur Integration ServicesUn développeur conçoit et implémente des solutions suivant la technologie pré-conisée par l’architecte SSIS, l’assistance opérationnelle de l’administrateur SSISet les commentaires de l’utilisateur final de SSIS. Le développeur SSIS peut revê-tir les fonctions suivantes :

• développeur d’applications;

• développeur de rapports;

• développeur ETL;

• programmeur datawarehouse;

• programmeur de base de données;

• modélisateur de données.

Tableau D.3 — Parcours de formation pour le profil Développeur de SSIS

Thèmes abordés pour l’administrateur

professionnel SSISParcours d’apprentissage

SSIS Améliorations apportées à SSISNotion de packages SSIS

Migration des versions antérieures des packages DTS

Compatibilité descendante de SSISMigration des packages DTSUtilisation de l’assistant Migration de package

Enregistrement et exécution de packages

Enregistrement des packagesSauvegarde et restauration des packagesExécution des packagesPlanification de l’exécution d’un package dans l’Agent SQL ServerUtilisation des points d’arrêt dans les packages

Contrôle de l’exécution des packages

Service Integration ServicesAnalyse des performances et de l’activité de SSIS

Déploiement des packages Création de configuration de packageCréation d’un utilitaire de déploiementInstallation des packagesRedéploiement des packages

Thèmes abordés pour le développeur SSIS Parcours d’apprentissage

SSIS Améliorations apportées à SSIS

Programmation SSIS Integration Services ProgrammingExtension des packages grâce aux tâches de script

Page 409: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————— D. Les profils d’apprentissage des différents acteurs de la BI 398

Parcours d’auto-formation pour le profil Architecte Integration ServicesL’architecte choisit les technologies à utiliser pour l’implémentation d’une solu-tion Integration Services. Il privilégie l’interaction et l’interopérabilité entre lesprojets de l’entreprise. L’architecte assure une vision d’ensemble et une cohé-rence des projets au sein d’une solution Integration Services. On retrouve desfonctions telles que :

• architecte de datawarehouse;

• architecte des données d’entreprise.

Tableau D.4 — Parcours de formation pour le profil Architecte de SSIS

Thèmes abordés pour le développeur SSIS Parcours d’apprentissage

Programmation des flux de contrôle

Construction de packages par programmationSurvol du développement de tâches personnalisées

Programmation de flux de données

Programmer les flux de donnéesComposants personnalisésPropriétés des flux de données

Extension des packages avec des fonctionnalités avancées

Création et utilisation des variables de packagesProgrammation de la gestion des événements dans SSISProgrammation du loging

Documentation de référence sur le langage SQL Server

Guide de référence de Transact-SQLInformation de référence des expressions SSISRéférence du langage MDX (accès OLAP)Guide de référence du langage DMX (data mining)XMLA (XML pour Analysis)

Exemples de programmation

Transformation d’agrégation et colonne dérivéePackage d’exécution de processusUtiliser le modèle SMO pour énumérer les tables utilisateurExemple de source ADOComposant de transformationComposant de suppression de doublons

Thèmes abordés pour l’Architecte SSIS Parcours d’apprentissage

SSIS Améliorations apportées à SSIS

Composants SQL Server 2005

Moteur de base de données SQL ServerSQL Server Analysis Services (SSAS)SQL Server Reporting Services (SSRS)SQL Server Notification ServicesService Broker

Page 410: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Les profils d’apprentissage des différents acteurs de la BI —————————————————————————————————————— 399

Parcours d’apprentissage pour SQL Server Analysis Services (SSAS)

Parcours d’auto-formation pour le profil Utilisateur professionnel SSAS

Tableau D.5 — Parcours de formation pour le profil Utilisateur Professionnel SSAS

Thèmes abordés pour l’Architecte SSIS Parcours d’apprentissage

Utilisation d’Intégration services dans les solutions d’entreprise

Développement de solutions de business intelligenceConception et création de packages Integration ServicesProgrammation de SSIS

Configuration système requise

Éditions et composants de SQL Server 2005SSIS et les ordinateurs 64 bitsConnaissance de la configuration matérielle et logicielle requise pour l’installation de SQL server 2005Paramètre de l’outil d’analyse de configuration système

Compatibilité descendante Compatibilité descendante de SSIS avec DTS 2000Utilisation de plusieurs versions de SQL Server (2000/2005)Migration des packages DTS

Considération sur les implications d’un déploiement international

Manipulation de données multilinguesParamètres régionaux WindowsIncidence sur l’exploration de texte et correspondance floue (fuzzy lookup) dans un contexte multilingue

Thèmes abordés pour l’utilisateur

professionnel SSASParcours d’apprentissage

Concepts Développement de solutions et projets Analysis ServicesModèle dimensionnel unifié (UDM)Concepts d’exploration de données (data mining)

Gestion Analysis Services Utilisation de OLAPUtilisation de l’exploration de donnéesTraitement des objets Analysis Services (dimensions, mesures, cubes, etc.)

Langages Référence au langage MDX (accès aux cubes OLAP)Référence au langage DMX (data mining)

Page 411: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————— D. Les profils d’apprentissage des différents acteurs de la BI 400

Parcours d’auto-formation pour le profil Administrateur SSAS

Tableau D.6 — Parcours de formation pour le profil Administrateur Professionnel SSAS

Parcours d’auto-formation pour le profil Développeur SSAS

Tableau D.7 — Parcours de formation pour le profil Développeur SSAS

Thèmes abordés pour l’utilisateur

professionnel SSASParcours d’apprentissage

Outils Présentation de BIDS (business intelligence Development Studio)Présentation de SQL Server Management studio

Dépannage des packages Débogage du flux de contrôleDébogage d’un flux de données

Déploiement des packages Déploiement packages SSIS

Thèmes abordés pour l’Administrateur SSAS Parcours d’apprentissage

Concepts Les rôles SSAS (sécurité d’accès aux données)

Administration Mise à niveau ou migration d’Analysis ServicesTraitement des objets Analysis Services via l’interface IHMTraitement des objets Analysis Services à l’aide de Integration ServicesAnalyse des performances de SSASSauvegarde et restauration d’une base de données Analysis ServicesSécurisation d’Analysis Services

Déploiement Utilisation de l’assistant de déploiement SSAS

Langages MDXDMX

Outils Présentation de BIDSPrésentation de SQL Server Management Studio

Thèmes abordés pour le Développeur SSAS Parcours d’apprentissage

Concepts Architecture d’Analysis ServicesConcept de SSASAssemblys SSAS afin d’étendre les fonctions d’entreprise de MDX et DMX

Page 412: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Les profils d’apprentissage des différents acteurs de la BI —————————————————————————————————————— 401

Parcours d’auto-formation pour le profil Architecte SSAS

Tableau D.8 — Parcours de formation pour le profil Architecte SSAS

Parcours d’apprentissage pour SQL Server Reporting Services (SSRS)

Parcours d’auto-formation pour le profil utilisateur professionnel de Reporting ServicesLes utilisateurs de SSRS créent des rapports pour leurs propres besoins et, éven-tuellement, pour d’autres personnes au sein de l’organisation. Un utilisateur pro-fessionnel orienté reporting connaît les types de données gérés par l’organisationet cherche à exploiter ces données pour réaliser d’autres tâches métier.

Souvent, l’utilisateur exécute des rapports pour analyser des données et iden-tifier les opportunités métier. Il peut également collecter et distribuer des infor-

Thèmes abordés pour le Développeur SSAS Parcours d’apprentissage

Langages MDXDMX

Programmation de l’accès aux données

Schema RowsetsXML for Analysis (XMLA) accès à toutes les sources multidimensionnelles standard.ADOMD.NET (accès à SSAS ou toutes bases multidimensionnelles via TCP/IP ou HTTP)

Programmation de l’administration

Langage de script pour SSAS (ASSL)DSO pour gérer les objets Analysis services (serveurs, sources de données, cubes, modèles de mining)

Thèmes abordés pour l’Architecte SSAS Parcours d’apprentissage

Concepts Modèle dimensionnel unifiéConcept d’exploration de données

Planification Fonctionnalités prises en charge par les éditions SQL Server 2005Compatibilité descendante de SSASMise à niveau ou migration d’Analysis SevicesConsidérations sur la localisation des applications SSAS

Autres composants SSISSSRSMoteur de base de données SQL Server

Page 413: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————— D. Les profils d’apprentissage des différents acteurs de la BI 402

mations sur les processus et les ressources de l’organisation. Les tâches associéesau rôle d’utilisateur de reporting se retrouvent dans les fonctions suivantes :

• directeur commercial;

• assistant de direction;

• chef de projet.

Tableau D.9 — Parcours de formation pour le profil Utilisateur professionnel de SSRS

Parcours d’apprentissage pour le profil Analyste de Reporting Services

Les analystes d’entreprise créent des rapports et des modèles de données pourleurs propres besoins ou pour d’autres personnes au sein de l’organisation. Unanalyste crée des rapports pour identifier les tendances, les opportunités, les pro-blèmes d’un projet métier.

Les fonctions habituelles que l’on retrouve sont les suivantes :

• modélisateur de données;

• analyste de gestion;

Thèmes abordés pour l’utilisateur SSRS Parcours d’apprentissage

Concepts de SSRS Présentation de Reporting servicesRapports et définitions de rapport

Recherche et affichage des rapports

Démarrage du gestionnaire de rapportsRecherche de rapports sur le serveur de rapportsAffichage de rapportsUtilisation du dossier Mes Rapports

Exportation et Impression des rapports

Exportation des rapportsEnregistrement des rapportsImpression d’un rapport

Création des rapports Création d’un rapport avec l’assistantLancer le générateur de rapportsImportation d’états à partir d’AccessAperçu des rapportsPublication de rapports

Abonnements aux rapports

Vue d’ensemble des abonnementsS’abonner à un rapportPlanification d’un abonnement

Page 414: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Les profils d’apprentissage des différents acteurs de la BI —————————————————————————————————————— 403

• analyste financier;

• contrôleur de gestion;

• analyste commercial.

Tableau D.10 — Parcours de formation pour le profil Analyste de SSRS

Parcours d’apprentissage pour le profil Administrateur de SSRSUn administrateur du serveur de rapports installe, configure, sécurise et gère ledéploiement d’un serveur de rapports. Un administrateur de SSRS doit avoirune vision claire de la topologie du réseau et la configuration des ordinateursutilisés pour l’hébergement des composants SQL Server 2005 Reporting Serviceset pour l’accès à ces derniers.

Les fonctions d’administration de SSRS sont les suivantes :

• administrateur de base de données;

• administrateur du serveur de rapports (service informatique);

• expert en sécurité;

• administrateur principal de base de données.

Thèmes abordés pour l’Analyste SSRS Parcours d’apprentissage

Concepts de SSRS Présentation de Reporting ServicesRapports et définitions de rapportModèles de rapportMéthodes de création de rapportUtilisation des données dans SSRSRégion de donnéesMise en page et rendu des rapports

Définition des données du rapport

Connexion à une source de donnéesRécupération des données relationnelles à partir d’une base SQL ServerUtilisation de paramètres dans un rapportFiltrage de donnéesExpressions dans Reporting Services

Conception et publication des rapports

Conception de la mise en page de rapportFonctionnalités interactivesAperçu des rapportsDéploiement de rapports dans un environnement de production

Conception de modèles de rapport

Utilisation du générateur de modèlesCréation d’un projet de modèle de rapport

Page 415: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

———————————————————————————————————— D. Les profils d’apprentissage des différents acteurs de la BI 404

Tableau D.11 — Parcours de formation pour le profil Administrateur de SSRS

Thèmes abordés pour l’Administrateur SSRS Parcours d’apprentissage

Concepts de SSRS Serveur de rapportsDéfinition de rapportsRapports liésCaptures instantanées de rapportEspace de nom de dossier du serveur de rapportsComptes dans un déploiement de SSRS

Configuration Liste de vérification pour le déploiement du serveurListe de vérification pour l déploiement de rapportsConfiguration des composants de SSRSDéploiement sur Internet

Sécurité Configuration de la sécurité du serveur de rapportsUtilisation de la sécurité basée sur les rôles

Administration du serveur Modification des mots de passe et des comptes de servicesAdministration d’une base de données du serveur de rapportsGestion et utilisation des rapports publiés

Page 416: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

EGlossaire de la BI

actionLance une action prédéfinie sur un cube ou une partie d’un cube. Une actionpermet par exemple de lancer un rapport ou d’effectuer un drill through en cli-quant sur une cellule du cube.

analyse de scénariosTechnique adoptée pour concevoir des scénarios à caractère commercial en met-tant à jour des données, puis en analysant les effets des modifications apportéesaux données. Les analyses de scénarios font partie intégrante d’Excel et de SQLServer OLAP grâce à la technique d’écriture différée.

Analysis ServerComposant serveur d’Analysis Services spécialement conçu pour créer et entre-tenir des structures de données multidimensionnelles et produire des donnéesmultidimensionnelles en réponse aux requêtes des clients. Voir aussi donnéesmultidimensionnelles, OLAP.

attributUn fait décrivant chaque position d’une dimension.

agrégationAction de calculer les valeurs associées aux positions parentes des dimensionshiérarchiques. Cette agrégation peut être une somme, une moyenne ou touteautre opération plus complexe.

Page 417: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————————————————————————————— E. Glossaire de la BI 406

axeEnsemble de tuples où chaque tuple est un ensemble de membres issus de diffé-rentes dimensions. Un ensemble d’axes définit les coordonnées d’un jeu de don-nées multidimensionnelles. Plus simplement, correspond à une dimension ducube. Voir aussi tranche, tuple.

Balanced ScorecardMéthode consistant à décliner les objectifs d’une entreprise en indicateurs deperformance clés.

base de données multidimensionnelle OLAPModèle de base de données traitant les données non comme des tables et descolonnes relationnelles, mais en tant que cubes d’information dont les cellulescomportent des données de synthèse et de dimension. Chaque cellule est fonc-tion d’un ensemble de coordonnées qui précisent sa position dans les dimensionsde la structure. Par exemple, la cellule située aux coordonnées {SALES, 1997,WASHINGTON, SOFTWARE} dévoile la synthèse des ventes de logiciels réa-lisées dans l’État de Washington en 1997.

base de données relationnelleEnsemble d’informations organisées sous forme de lignes et de colonnes dans destables. Chaque table détermine une classe d’objets pour l’organisation concer-née. Les requêtes peuvent exploiter les données d’une table pour rechercher desdonnées associées dans d’autres tables. Les liens entre les tables (qui donnent lapossibilité de traiter simultanément les données de plusieurs tables) sont établisà l’aide de jointures entre les champs clés.

BI (business intelligence)Concept désignant les moyens permettant de rassembler, intégrer, analyser etpartager des données de l’entreprise afin d’optimiser la prise de décision. Parextension, BI désigne les solutions logicielles combinant à des fins décisionnellesdes fonctions d’interrogation de bases de données, de reporting, d’analyse mul-tidimensionnelle (ou OLAP), de data mining et de visualisation des données.

catégorieS’emploie pour décrire ou classifier les données détaillées d’une société, parexemple la date d’une transaction, un produit donné, un client donné ou unerégion commerciale. Les catégories peuvent être regroupées en catégories pluslarges, par exemple les dates sont regroupées en mois et les mois en années.

celluleUne donnée définie par une position de chaque dimension (comme dans le casd’un document Excel).

Page 418: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Glossaire de la BI ———————————————————————————————————————————————————————————————————————— 407

champZone d’une fenêtre ou d’un enregistrement stockant une valeur de donnéesunique. Certaines bases de données interprètent le champ comme un synonymede la colonne.

checkpointPoint de contrôle permettant une reprise des traitements de chargement des don-nées dans un ETL.

clé de membrePropriété d’un niveau de dimension qui spécifie les identificateurs des membresdu niveau. La valeur de cette propriété peut désigner une colonne dans laquellefigurent les identificateurs ou une expression correspondant aux identificateurs.

connexionLiaison établie entre le complément et un cube Analysis Services.

cookiesCertains sites web enregistrent sur votre disque dur des informations à votre sujet(par exemple, la date de votre dernière connexion). On appelle ces informations« cookies ». Internet Explorer enregistre les cookies dans le dossier Cookies deWindows. Vous pouvez les supprimer sans aucun danger.

CPM (Corporate Performance Management)Outil de pilotage global des performances de l’entreprise. Afin de répondre auxcontraintes de la loi Sarbanes-Oxley, le CPM permet d’obtenir une vue globalenon seulement sur les performances financières mais en outre de la conformitédes résultats par rapport aux prévisions.

CRM (Customer Relationship Management)Gestion de la relation client.

cross-sellTechnique de vente consistant à proposer au client un produit lié à celuidemandé, soit parce qu’il existe un lien technique, soit parce que l’étude descomportements des consommateurs montre l’existence d’une corrélation entreles ventes des deux produits.

cubeEnsemble de données organisées et synthétisées dans une structure multidimen-sionnelle définie par un ensemble de dimensions et de mesures. Dans le cas denombreuses dimensions, on parle d’« hypercube »). Bien qu’un hypercube com-

Page 419: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————————————————————————————— E. Glossaire de la BI 408

porte normalement plus de trois dimensions, on emploie souvent le synonyme« cube multidimensionnel » pour le désigner. Voir aussi dimension, mesure, basede données multidimensionnelle, OLAP.

cube localCube créé et stocké avec l’extension .cub sur un ordinateur local. On parle éga-lement de cube hors connexion.

cube virtuelCube logique fondé sur un ou plusieurs cubes réguliers ou liés.

datamartSous-ensemble d’un datawarehouse lié à un métier de l’entreprise (finance, mar-keting, RH, etc.) et conçu pour répondre aux besoins d’un groupe spécifiqued’utilisateurs en respectant les exigences de sécurité de l’entreprise. L’entreprisepeut construire des datamarts "Ventes", "Finance" ou "Ressources Humaines" enayant l’assurance que les utilisateurs n’ont accès qu’aux données qui les concer-nent. Les datamarts simplifient également le travail des services informatiquesen leur permettant de gérer pour chaque communauté d’utilisateurs des ensem-bles de données moins volumineux.

dataminingMéthode d’exploitation automatique des données visant à révéler les tendances,récurrences et corrélations entre les données. Basé sur des méthodes d’analysestatistique et/ou d’intelligence artificielle, le data mining permet de déceler desinformations essentielles difficiles à repérer « à l’œil nu » telles que les corréla-tions entre des événements, des relations de causes à effets, des classifications,des regroupements, des projections et des prévisions. On parle aussi de Webmining.

datawarehouseEntrepôt de données, isolé des systèmes opérationnels, permettant d’agréger desdonnées thématiques, intégrées, non volatiles et historisées, dans un but de faci-liter la prise de décision.

datastoreBase de données intermédiaire avant spécialisation.

datawebAccès à une base de données via un serveur Internet et un navigateur web, quelque soit sa plate-forme d’hébergement, sa localisation ou le format des données.

Page 420: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Glossaire de la BI ———————————————————————————————————————————————————————————————————————— 409

décisionnelProcessus d’utilisation des connaissances issues des informations et des donnéesgénérées par les processus métier de l’entreprise pour déterminer la meilleureaction à entreprendre, la meilleure décision à prendre. Le reporting et l’analysesont des outils décisionnels typiques. L’analyse décisionnelle aide la prise de déci-sions stratégiques en permettant de visualiser les données de l’entreprise à l’aided’indicateurs métier.

descendantDans une hiérarchie de dimension, membre associé au membre d’un niveau supé-rieur de la même dimension. Par exemple, dans une dimension de temps com-posée des niveaux Année, Trimestre, Mois et Jour, Janvier est un descendant de2005. Voir aussi enfant, parent, frère.

dimensionAttribut structurel d’un cube constituant une hiérarchie organisée de catégories(niveaux) qui décrivent les données d’une table de faits. Ces catégories décriventgénéralement un ensemble identique de membres sur lesquels les utilisateurs sou-haitent fonder une analyse. Par exemple, une dimension géographique peutinclure des niveaux Pays, Région, Département et Ville. Voir aussi table de faits,mesure, niveau.

dimension de tempsDimension divisant le temps en niveaux, tels que Année, Trimestre, Mois etJour. Dans Analysis Services, type spécial de dimension créée à partir de la colonnedate/heure.

DOLAP (Desktop OLAP)Ce terme désigne un petit produit OLAP faisant de l’analyse multidimension-nelle en local. Il peut impliquer l’utilisation d’une minibase multidimensionnelleou de l’extraction de cube.

données sourceLignes ou enregistrements sous-jacents d’une base de données fournissant lesdonnées d’un rapport.

drill down (zoom en profondeur)C’est la fonctionnalité d’analyse des données qui permet, en cliquant sur unedonnée ou sur une dimension, d’obtenir un nouveau rapport avec un niveaud’information supplémentaire se rapportant à la zone cliquée. Cette fonctionna-lité permet d’approfondir un axe d’analyse en descendant aux niveaux de détailde plus en plus fins d’un système multidimensionnel.

Page 421: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————————————————————————————— E. Glossaire de la BI 410

drill through (zoom en travers)Fonctionnalité d’analyse des données qui permet, comme le drill down, d’obtenirun niveau de détails supplémentaire, mais ici, l’accès se fera à une base différente.Cette base peut être soit un cube multidimensionnel, soit une base relationnelle.

drill up (forage arrière)Fonction de zoom arrière d’un outil décisionnel permettant, en cours d’analyse,de passer d’un niveau de détail fin à un niveau de données plus synthétique.

DSS (Decision Support System)Système d’interrogation et de présentation des données adapté à l’aide à la décision.Appelé aussi SIAD (système d’information d’aide à la décision) ou encore EIS.

écriture différéeDonnées de scénarios enregistrées et écrites dans le cube. Ces données sont dis-ponibles pour une analyse ultérieure et peuvent être consultées et partagées pard’autres personnes ayant accès au cube. Voir aussi analyse de scénarios.

EIP (Enterprise Information Portal)Portail d’entreprise donnant un point d’accès unique à l’ensemble des ressources :données, applications, services…

EIS (Executive Information System)Tableaux de bord et graphiques synthétiques présentant une vision assez largede l’activité.

enfantMembre du niveau inférieur suivant dans la hiérarchie directement associé aumembre actuel. Par exemple, dans une dimension de temps composée des niveauxTrimestre, Mois et Jour, Janvier est un enfant du trimestre 1 (Q1).

ERP (Enterprise Resource Planning) ou PGI (progiciel de gestion intégré)L’ERP regroupe tout ou partie des applications nécessaires à la gestion de l’entre-prise. Que ce soit des applications horizontales (comptabilité, paie, facturation, ges-tion des ressources humaines) ou verticales (gestion de production, gestion de stockspar secteur d’activité). Les ERP se dotent progressivement de fonctions décision-nelles et front office.

ETL (extract, transform, load)Outils destinés à l’extraction, à la transformation et au chargement des donnéesdans un datawarehouse.

Page 422: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Glossaire de la BI ———————————————————————————————————————————————————————————————————————— 411

expression personnaliséeExpression chargée de renvoyer des données à un rapport selon une ou plusieursconditions.

expressions multidimensionnelles (MDX)Syntaxe servant à définir des objets multidimensionnels et à interroger et mani-puler des données multidimensionnelles.

extractionAction d’extraire des données détaillées à partir desquelles les données d’une cel-lule du cube ont été synthétisées. Voir drill through.

FASMI (Fast Analysis of Shared Multi-dimensional Information)« Analyse rapide d’information multidimensionnel partagée ». Critères retenuspour simplifier les règles de E. Codd et faciliter l’évaluation des outils OLAP.

filtre de pageFiltre dans un rapport affichant des sous-ensembles de données.

frèreDans une hiérarchie de dimensions, membre spécifié du même parent. Par exem-ple, dans une dimension de temps dotée des niveaux Année et Mois, les membresJanvier 2005 et Février 2005 sont des frères. Voir aussi enfant, descendant, parent.

frère (membre)Dans une structure arborescente, élément sans éléments subordonnés. Par exem-ple, dans Analysis Services, un frère est un membre de dimension qui n’a pas dedescendants.

hiérarchieLes positions d’une dimension organisées selon une série de relations (1 – n) encascade. Cette organisation de données est comparable à un arbre logique oùchaque membre n’a pas plus d’un père mais un nombre quelconque d’enfants.Exemple de hiérarchie temporelle : Année/Trimestre/Mois/Jour.

hiérarchie de dimensionUne des hiérarchies d’une dimension. Voir aussi hiérarchie.

HistoriserStocker des données pour leur utilisation à long terme. Une fois historisées, lesdonnées ne sont plus volatiles, elles entrent dans l’histoire (d’une entreprise, parexemple). Voir datawarehouse.

Page 423: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————————————————————————————— E. Glossaire de la BI 412

HOLAP (Hybrid OLAP)La solution HOLAP combine les avantages des solutions MOLAP et ROLAP.

HypercubeVoir cube.

jeu de sélectionDéfinit le niveau des données à insérer dans un rapport.

jointure imbriquéeAction de fusionner le contenu de deux ou plusieurs dimensions et de produireun ensemble de résultats qui englobe les lignes et les colonnes de chaque dimen-sion. Par exemple, une jointure imbriquée fusionne les données des villes de ladimension Magasins et les données des boissons de la dimension Produits.

magasin de donnéesBase de données spécialement structurée pour les requêtes et l’analyse. Un maga-sin de données contient généralement des données qui illustrent l’historiquecommercial d’une organisation.

MDB (Multidimensional DataBase)Permet le stockage, le traitement et la restitution de données multidimension-nelles.

MDXVoir expressions multidimensionnelles.

membreÉlément d’une dimension représentant une ou plusieurs occurrences de données.Un membre peut être unique ou non. Par exemple, 2004 et 2005 sont les mem-bres uniques du niveau Année d’une dimension de temps tandis que Janvierreprésente les membres non uniques du niveau Mois car la dimension de tempspeut révéler plusieurs fois le mois de janvier si elle contient des données surplusieurs années.

membre calculéMembre d’une dimension dont la valeur est calculée à l’aide d’une expression.Les valeurs des membres calculés peuvent provenir des valeurs d’autres membres.Par exemple, vous pouvez définir un membre calculé Profit en soustrayant lavaleur du membre Coûts de celle du membre Ventes.

membre frèreMembre de dimension qui n’a pas de descendants.

Page 424: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Glossaire de la BI ———————————————————————————————————————————————————————————————————————— 413

mesure

Dans un cube, ensemble de valeurs, généralement numériques, basées sur unecolonne dans la table de faits du cube. Les mesures sont des valeurs centrales quisont agrégées et analysées. Voir aussi cube, table de faits.

métadonnées

Les métadonnées constituent l’ensemble des données qui décrivent des règles ouprocessus attachés à d’autres données.

modèle en étoile

Arrangement de tables dans une base de données relationnelles. Au centre, ontrouve la table de faits; les branches de l’étoile qui rayonnent à partir de la tablede faits correspondent aux dimensions.

modèle en flocon

Le modèle en flocon reprend les principes du modèle en étoile; le flocon est uneétoile dont les branches sont décomposées en sous-hiérarchies.

MOLAP (Multidimensional OLAP)

Stocke les données basiques et leurs agrégations sur un serveur spécialisé OLAP.

monter dans la hiérarchie/descendre dans la hiérarchie

Technique permettant de parcourir les niveaux de données, du plus synthétisé(vers le haut) au plus détaillé (vers le bas). Par exemple, lorsqu’il consulte lesdonnées détaillées des ventes annuelles, un utilisateur peut descendre d’un niveaudans la hiérarchie pour afficher les données par trimestre, puis encore d’un niveaupour afficher les données par mois.

multidimensionnel

Structure de données ayant au moins trois dimensions indépendantes.

niveau

Nom désignant un ensemble de membres dans une hiérarchie de dimension oùtous les membres sont placés à distance égale de la racine de la hiérarchie. Parexemple, une hiérarchie de temps comprend les niveaux Année, Mois et Jour. Voiraussi dimension, hiérarchie.

niveau hiérarchique

Au sein d’une hiérarchie, les positions sont en général organisées en niveaux.Les positions d’un même niveau correspondent à une classification précise.

Page 425: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————————————————————————————— E. Glossaire de la BI 414

nom de membrePropriété d’un niveau de dimension qui spécifie les noms des membres du niveau.La valeur de cette propriété peut désigner une colonne dans laquelle figurent lesnoms ou une expression correspondant aux noms.

OLAP (Online Analytical Processing)Technologie utilisant des structures multidimensionnelles pour offrir un accèsrapide aux données en vue d’une analyse. Les données source OLAP sont sou-vent stockées dans les magasins de données d’une base de données relationnelle.Voir aussi magasin de données, base de données relationnelle.

parentMembre du niveau supérieur suivant dans la hiérarchie directement associé aumembre actuel. La valeur parente est généralement une consolidation des valeursde tous ses enfants. Par exemple, dans une dimension de temps composée desniveaux Trimestre, Mois et Jour, le trimestre 1 (Q1) est le parent de Janvier. Voiraussi enfant, descendant, frère.

pivoter (table pivot)Possibilité de modifier l’aspect d’un rapport en déplaçant un champ (ou un groupede champs) de ligne en colonne ou inversement. On peut également ajouter deschamps en les sélectionnant dans une liste de choix.

positionUne valeur d’une dimension.

propriété de membreInformation supplémentaire stockée dans un cube OLAP Analysis Services etdécrivant un membre de dimension.

rapport au format libreRapport offrant une granularité au niveau des cellules et ne dépendant pas de lastructure des données source sous-jacentes. Les rapports au format libre peuventcombiner des données de plusieurs sources OLAP. Le rapport au format libre faitl’objet d’un add-in dans Excel. Il est intégré à Excel 2007. Voir aussi rapportstructuré.

rapport structuréRapport dépendant de la structure des données source sous-jacentes et offrantdes fonctions d’analyse avancées. Le rapport au format structuré fait l’objet d’unadd-in dans Excel. Il est intégré à Excel 2007.

Page 426: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Glossaire de la BI ———————————————————————————————————————————————————————————————————————— 415

reportingOutil de mesure de faits a posteriori.

repositoryRéférentiel permettant de stocker les métadonnées c’est à dire les données quidécrivent les données.

ROLAP (Relational OLAP)Les données ne sont pas stockées dans le cube mais dans une base de donnéesrelationnelles selon les principes OLAP.

rollbackPermet d’annuler un processus de mise à jour dans une base de données relation-nelle. La phase de Commit permet d’appliquer définitivement les modificationsapportées dans la base.

SGBD (système de gestion de bases de données)Les bases de données relationnelles (SGBDR) ont tendance à se banaliser.Domaines de prédilection d’Oracle, IBM (DB2), SQL Server, MySql.

SIAD (système d’information d’aide à la décision)Équivalent de EIS.

supply chainGestion et optimisation de la chaîne logistique, de la fabrication d’un produit àsa distribution finale.

table de faitsTable centrale dans un schéma de magasin de données composée de mesuresnumériques et de clés associant des faits à des tables de dimension. Les tables defaits renferment des données qui décrivent des événements inhérents à une acti-vité commerciale, tels que des transactions bancaires ou des ventes de produits.Voir aussi magasin de données.

tableau de bordRapport dynamique composé d’indicateurs clés d’une activité, permettant d’avoirune vision globale des performances; il s’agit d’un outil de mesure et de pilotage.

tableau croisé dynamiqueAction de transformer les lignes en colonnes et inversement.

total visuelValeur de cellule agrégée et affichée pour un membre de dimension et cohérenteavec les valeurs de cellules affichées pour ses enfants. Le total visuel d’une cellule

Page 427: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————————————————————————————— E. Glossaire de la BI 416

peut être différent du total réel si certains enfants de la cellule sont masqués. Parexemple, si la fonction d’agrégation est SUM, la valeur de cellule affichée pourEspagne est 1000, celle de Portugal est 2000 et le total visuel pour Péninsuleibérique est 3000.

trancheSous-ensemble de données dans un cube, spécifié en limitant une ou plusieursdimensions en fonction des membres de la dimension. Par exemple, des faits pro-pres à une année donnée forment une tranche d’un ensemble de données portantsur plusieurs années. Voir aussi axe.

tupleEnsemble ordonné de membres appartenant à différentes dimensions. Par exem-ple, (Boston, [1995]) est un tuple composé de membres de deux dimensions : Géo-graphie et Temps. Un membre unique est un cas dégénéré de tuple qui peut êtreutilisé comme expression sans parenthèses. Voir aussi axe.

up-sellTechnique de vente consistant à proposer au client un produit générant unemarge plus élevée que celui demandé, soit typiquement un produit plus cher.Cette technique s’appuie sur l’identification des besoins et habitudes de consom-mation des clients, et en particulier sur du marketing one-to-one et des outils CRM.

Page 428: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Index

A

Accès au détail (drillthrough) 249Action 13, 211, 249ActiveX 344Add-in Excel 368Agent SQL Server 106Agrégations 251

paramétrer les – 256Alimentation 13Analyse 188

ad hoc 181, 332, 390de cube 341de données avec Excel 331de séquence 264

Analysis Services 179Approche itérative 361Arbre de décomposition 84, 348ASCII 304Assistant

d’exportation 146d’importation 146

Association 263Attribut 186

lié 237Attrition 24

B

Balanced scorecard 34, 64, 390Bâle 2 22Base de données multidimensionnelle 181BIDS 108BO 62Briefing book 352BSC 34Business intelligence 3, 11, 33, 245Business Objects 377Business Performance Management 369Business Scorecard Management 67Business Scorecard Manager 347

intégré 62

C

Cache proactif 96, 98, 183, 190Calcul 188, 211, 244Capture instantanée 320Carte de performance 85, 350Cellule feuille 241Checkpoint 46Classification 262Clé

étrangère 222principale 222

CLR (Common Langage Runtime) 183

Page 429: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————————— Business Intelligence avec SQL Server 2005 418

Clusters 270, 283Cockpit 11

de pilotage 373Codd Edgar 8Cognos 377Collecte de données 13Comportement semi-additif 246Concepteur de rapport 293Configuration 171, 174Conteneur

de boucleFor 118Foreach 114

de séquences 118Conversion monétaire 246Cookies 20CPM (Corporate Performance Management)

378CRM 19Cross-sell 20Crystal 62CSV 304Cube 97, 211, 240

déploiement 194local 337multidimensionnel 179OLAP 181

Cycle en V 30

D

Dashboard Server 358Data mining 180, 181, 259Datamart 94, 104Dataset 294, 307Datawarehouse 17, 45, 94Date Chris 8Décision

stratégique 68tactique 68

Decision tree 270, 283Dénormalisation 105Destination 130Développement linéaire 361

Dimension 181, 182, 186, 193, 194, 196, 197, 211, 232à multiples hiérarchies 96à variation lente (Slowly changing dimen-

sions) 48, 96, 135attributs 235de data mining 187de fait 187de référence 187hiérarchie 221intelligence 246parent-enfant 96plusieurs à plusieurs 187propriétés 234structure 238temporelle 47utilisation 242

Dimensionnel 45DMX (Data Mining Extensions) 119Domaine

analytique 9transactionnel 9

Donnée catégorielle 76Drill down 48, 83, 181, 220, 301, 305, 324Drill up 181, 220, 305DTS 2000 112

E

Échellenominale 76ordinale 76

Écriture différée 246EIS (Executive Information System) 25Enjeux du décisionnel 7Entrepôt de données 104ERP 9, 46, 96Espace d’analyse 13ETL (Extract, Transform, and Load) 46, 181

d’entreprise 369Étude de faisabilité 32Excel 377

2007 343Explorateur de Package 110Exploration vers le bas 301

Page 430: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Index ——————————————————————————————————————————————————————————————————————————————————— 419

F

FASMI 56Fichier plat 132Filtre 219Flux

de contrôle 104, 108de données 104, 109, 130

Fonction lookup 105Fouille de données 62FrontPage 344FTP 107Fuzzy lookup 65

G

Gestiondes rapports 308du risque 22

Gestionnaired’événements 109de rapports 293

Graphique croisé dynamique 337GRC 19Groupe de mesures 187, 240

H

HOLAP (Hybride OLAP) 252HTML 304Hyperion 377

I

Indicateurclé de performance 24, 189de performance 64externe 13

Infocentres 25Informatique décisionnelle 3Inmon Bill 380Integration Services (SSIS) 101Intellicube 193Intelligence comptable 245Intervalle

de latence 191de reconstruction forcée 191

IRR 365

J

Journal des audits 184Juste à temps 22

K

Kaplan Robert 34, 373Key Users 62Kimball Ralph 47, 94, 177, 380KPI (Key Performance Indicator) 24, 47, 62,

80, 183, 211, 246, 390

L

Loi SOX 46LOLF 21Lot 104

M

Mapping 134MapPoint 369MDX

requête 300script 183, 188

Membrecalculé 245inféré 136non-feuille 241

Mesure 50, 181, 193, 197calculée 244semi-additive 230

Metadata 183Microsoft Access 373Microsoft Clustering 272Microsoft Decision Trees 270Microsoft Naïve Bayes 272Migration de lots DTS 163Modèle

Clusters 280d’autorisations 184de données entité-relation 49de rapports 294Decision Tree 275dimensionnel 49multidimensionnel 183Naïve Bayes 278relationnel 183

Page 431: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————————— Business Intelligence avec SQL Server 2005 420

Modélisation 60MOLAP (Multidimensional OLAP) 252MS Access 345MS Excel 345MS Query 339

N

Naïve Bayes 270, 283Navigateur 212, 225, 239

de données 250Navigation

en mode web 356Professional 355standard 355

Niveaux d’abstraction 10Norton David 34, 373Notification Services 98NPV 365

O

Office2007 67Excel pour SSAS 332, 340PerformancePoint 369Web Components 368

OLAP (On line Analytical Processing) 8, 55, 56, 57, 180, 230

OLTP (On Line Transactional Processing) 45, 46, 49, 53, 56, 181

Opérateur unaire 246OWC (Office Web Components) 332, 344,

347

P

Package 104automatisation de l’exécution 169déploiement 167dynamique 171enfant 123parent 123

Panorama software 67Paramètres 306Partition 211Partitionnement multiple 254PAS (Proclarity Analytics Server) 351

PDF 304Performances 184Période

de latence 191silencieuse 191

Perspective 97, 187, 212, 249PGI 9, 46PivotTable 332Plan 127Planification 320Planning 21POC (proof of concept) 374Powerplay 62, 377Procédure stockée 183, 189Processus 196

d’apprentissage 11de décision 7

Proclarity 67, 84, 347, 348for Business Scorecard 348Professional 357

Productivité 21Profils d’apprentissage 395Projet décisionnel 374Prototype 375Pull 190Push 190

R

Rapportabonnement 323clichés d’historique 321exécution 318historisation 321lié 318matriciel 297tabulaire 297

RDL 373Recherche

exacte 105floue 105

Référentiel 60métier 10

Région de données 294Régression 262Relation

d’écart ou de déviation 79

Page 432: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

Index ——————————————————————————————————————————————————————————————————————————————————— 421

de comparaison nominale 82de corrélation 82de distribution 81

Report Builder 64, 294, 324, 373Reporting 15, 26, 47, 57

financier 21interactif 344

Reporting Services 67, 289droits 310rôles 312tâches 310

Réseau de dépendance 277Retour sur investissement 365ROI 365ROLAP (Relational Olap) 252, 254Rôle 184, 187, 309

administrateur système 314utilisateur système 314

Rollback 46Roll-up 181

S

SAP NetWeaver business intelligence 99Sarbane-Oxley 22Scénario 68Schéma

en étoile 49en flocons 198

Sécurité 309Segmentation 263Serveur de rapports (Report server) 293Services de notification 99SharePoint Portal 62, 67, 369SMDL (Semantic Model Definition Language)

325SMTP 323Sniffing 184Solution décisionnelle 368Solver 68Source 129

de données 193, 199Spoofing 184SQL Server 2005

Enterprise 391, 393Express 391Express Manager 391

Standard 391, 392Workgroup 391, 392

SQL Server Agent 169SQLiMail 128SSAS 229SSIS 92SSRB 324SSRS 291Stratégie 13

T

Tablede dimensions 50de faits 50

Tableaucroisé dynamique 64, 182, 332de bord 11, 13, 25, 64

Tâched’exécution

de Package 123DTS 2000 123

de processus 124de requêtes SQL 124

d’insertion en bloc 125DDL 119de flux de données 119de script 120de service Web 122de système de fichiers 122de traitement Analysis Services 122de transfert

d’objets SQL Server 123de base de données 122de connexions 122de messages d’erreur 122de procédures stockées 123de travaux 126

Envoyer un message 125FTP 126Lecteur de données WMI 126MSMQ 126observateur d’événements WMI 126XML 127

TIFF 304Time Intelligence 245Traçabilité 184

Page 433: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

—————————————————————————————————————————————————— Business Intelligence avec SQL Server 2005 422

Traduction 212, 238, 250Traitement incrémentiel 257Transformation 129Translation 183

U

UDM (Unified Dimensional Model) 64, 93, 94, 96, 97, 183, 191, 343

Up-sell 20

V

Visual Studio 373

Vuedes sources de données (Data Source

Views, DSV) 96, 193en perspective 86, 351

W

Webpart 248Workflow 107Writeback 183

X

XML 92, 304

Dépôt légal: janvier 2007Imprimé en Belgique

Achevé d’imprimer sur les presses deSNEL Grafics sa

Z.I. des Hauts-Sarts - Zone 3Rue Fond des Fourches 21 – B-4041 Vottem (Herstal)

Tél +32(0)4 344 65 60 - Fax +32(0)4 289 99 61décembre 2006 – 40711

050536 – (I) – (1,5) – OSB 100° – SCM – API

Page 434: INFOPRO L'ESSENTIEL TYPE D’OUVRAGE SE FORMER …docshare01.docshare.tips/files/25523/255235334.pdf · 2.5.2 Le modèle multidimensionnel (OLAP) ... 5.1 Présentation de SQL Server

B.

BU

RQ

UIE

R

BUSINESSINTELLIGENCE

AVECSQL SERVER 2005

Bertrand Burquier

Ce livre s’adresse aux directeurs informatiques, administratifs,financiers et opérationnels, ainsi qu’à tout responsable informatiqueayant à mettre en œuvre des systèmes décisionnels. Il intéresseraaussi les consultants et les architectes en systèmes d’information.On assiste aujourd'hui à une démocratisation de l'informatiquedécisionnelle. Chaque décideur qui le souhaite peut désormaisdisposer de puissants outils d'analyse, de reporting ou de datamining.Cet ouvrage donne un cadre méthodologique à la mise en œuvred’un projet décisionnel complet, en s’appuyant sur les nouvellesfonctions de Business Intelligence offertes par SQL Server 2005.Après avoir passé en revue les principes fondamentaux qui présidentà la réalisation d’un projet décisionnel, il identifie les pièges àéviter et les facteurs clés de succès. Il montre ensuite commentune solution de Business Intelligence peut analyser lesrenseignements stratégiques de l'entreprise, quels sont les différentsindicateurs disponibles, et comment les interpréter pour définirdes cibles, des prévisions ou des tendances. Des cas concrets expliquent comment mettre en œuvre la BusinessIntelligence dans l’entreprise avec SQL Server 2005.De nombreuses ressources complémentaires sont disponibles surle site www.buroformatic.com.

BUSINESS INTELLIGENCE AVEC SQL SERVER 2005 Mise en œuvre d'un projet décisionnel

Bertrand Burquier

BUSI

NES

S IN

TELL

IGEN

CE

INFOPRO

MANAGEMENT DES SYSTÈMESD'INFORMATION

APPLICATIONS MÉTIERS

ÉTUDES, DÉVELOPPEMENT,INTÉGRATION

EXPLOITATION ET ADMINISTRATION

RÉSEAUX & TÉLÉCOMS

L'ESSENTIEL

TYPE D’OUVRAGE

RETOURS D'EXPÉRIENCESE FORMER

AP

PLIC

ATIO

NS &

TIE

RS

Mise en œuvre d'un projet décisionnel

BERTRAND BURQUIER

est consultant et ingénieuren systèmes d’information,spécialisé dans la BusinessIntelligence. Il dirige depuis1985 le cabinet de conseilBuroFormatic. Il estégalement formateur enentreprise et enseigne laBusiness Intelligence àl’Institut de management del’université de Savoie.

6639389ISBN 978-2-10-050536-4 www.dunod.com