Bi Open Source Livre Blanc v10

99
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source Ce document est sous licence GNU Free Documentation Licence. RESTITUER, ANALYSER ET PILOTER : EVALUER LES OPPORTUNITES OPEN SOURCE _________ Livre Blanc _________ SSLL du groupe UMANIS

Transcript of Bi Open Source Livre Blanc v10

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence.

RESTITUER, ANALYSER ET PILOTER : EVALUER LES OPPORTUNITES OPEN SOURCE

_________

Livre Blanc _________

SSLL du groupe UMANIS

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence.

SOMMAIRE

1 OBJECTIFS DU DOCUMENT ......................................................................................................... 1 2 OPENBIZZ – QUI SOMMES NOUS ? ............................................................................................. 2 3 INTRODUCTION .............................................................................................................................. 3 3.1 Rappel des principales briques fonctionnelles du SI décisionnel ........................................ 3

3.1.1 Restitution .............................................................................................................................. 3 3.1.2 Analyse .................................................................................................................................. 4 3.1.3 Pilotage .................................................................................................................................. 5

3.2 Les approches décisionnelles BI OpenSource ....................................................................... 5 3.2.1 Les solutions spécifiques ...................................................................................................... 5 3.2.2 Les suites BI .......................................................................................................................... 5

3.3 Guide de lecture du document .................................................................................................. 6 4 LES SOLUTIONS SPECIFIQUES DE RESTITUTION .................................................................... 8 4.1 Rapports statiques ou dynamiques .......................................................................................... 8

4.1.1 iReport – JasperReport ....................................................................................................... 10 4.1.2 BIRT .................................................................................................................................... 15 4.1.3 Synthèse des outils de restitution ........................................................................................ 19

4.2 Rapports Ad hoc ....................................................................................................................... 21 5 LES SOLUTIONS SPECIFIQUES D’ANALYSE MULTIDIMENSIONNELLE ............................... 24 5.1 Définitions ................................................................................................................................. 24 5.2 La solution MONDRIAN ............................................................................................................ 27

5.2.1 Mise en œuvre du serveur .................................................................................................. 27 5.2.2 Outils de design du fichier « schema XML » ....................................................................... 29 5.2.3 Outillage d’interrogation et de restitution ............................................................................. 35 5.2.4 JRubik .................................................................................................................................. 37 5.2.5 FreeAnalysis ........................................................................................................................ 39

5.3 La solution PALO ...................................................................................................................... 41 5.3.1 Roadmap, évolutions futures ............................................................................................... 42 5.3.2 Mise en œuvre du serveur .................................................................................................. 42 5.3.3 Outillage d’interrogation et de simulation ............................................................................ 44

5.4 Synthèse des cubes OLAP ...................................................................................................... 49 6 LES SOLUTIONS SPECIFIQUES DE PILOTAGE........................................................................ 51 6.1 MarvelIT ..................................................................................................................................... 52

6.1.1 « Roadmap », évolutions futures ......................................................................................... 53 6.1.2 Outils disponibles dans la plateforme .................................................................................. 53

6.2 OpenI .......................................................................................................................................... 54 6.2.1 Outils disponibles dans la plateforme .................................................................................. 56

6.3 Synthèse des tableaux de bord ............................................................................................... 57 7 LES SUITES BI OPENSOURCE - INDUSTRIALISER LES SID .................................................. 58 7.1 La suite Pentaho ....................................................................................................................... 59

7.1.1 Intégration dans un portail ................................................................................................... 60 7.1.2 Gestion des accès et des utilisateurs .................................................................................. 60

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence.

7.1.3 Outillage dédié ..................................................................................................................... 60 7.1.4 Rapports « ad hoc » ............................................................................................................ 65 7.1.5 Outils disponibles dans la plateforme .................................................................................. 67 7.1.6 Outils complémentaires ....................................................................................................... 67 7.1.7 « Roadmap », évolutions futures ......................................................................................... 68

7.2 La suite SpagoBI ....................................................................................................................... 69 7.2.1 Portail .................................................................................................................................. 70 7.2.2 Gestion des accès et des utilisateurs .................................................................................. 70 7.2.3 Outillage dédié ..................................................................................................................... 70 7.2.4 Outils disponibles dans la plateforme .................................................................................. 73 7.2.5 « Roadmap », évolutions futures ......................................................................................... 73

7.3 La suite Jasper Server ............................................................................................................. 74 7.3.1 Portail .................................................................................................................................. 75 7.3.2 Gestion des accès et des utilisateurs .................................................................................. 75 7.3.3 Outillage dédié ..................................................................................................................... 75 7.3.4 Outils disponibles dans la plateforme .................................................................................. 76 7.3.5 Outils complémentaires ....................................................................................................... 76 7.3.6 « Roadmap », évolutions futures ......................................................................................... 76

7.4 OpenReports ............................................................................................................................. 77 7.4.1 Gestion des accès et des utilisateurs .................................................................................. 78 7.4.2 Outils disponibles dans la plateforme .................................................................................. 78 7.4.3 « Roadmap » et évolutions futures ...................................................................................... 78

7.5 La suite Vanilla 1.2 (BPM Conseil) .......................................................................................... 79 7.5.1 Portail .................................................................................................................................. 80 7.5.2 Gestion des accès et des utilisateurs .................................................................................. 80 7.5.3 Outillage dédié ..................................................................................................................... 80 7.5.4 Outils disponibles dans la plateforme .................................................................................. 91 7.5.5 « Roadmap », évolutions futures ......................................................................................... 91

7.6 Synthèse des plateformes ....................................................................................................... 92 8 L’INTEGRATION DES COMPOSANTS OPEN SOURCE ............................................................ 95 9 POUR CONCLURE… .................................................................................................................... 96

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

1 OBJECTIFS DU DOCUMENT Ce livre blanc intitulé « Restituer, Analyser et Piloter : Evaluer les opportunités Open Source » traite au sein de la chaîne décisionnelle des aspects de reporting, analyse, pilotage et distribution de l’information. Nous avons souhaité y orienter la thématique plutôt que d’aborder de manière large mais superficielle l’ensemble des aspects relevant de la BI. Ce livre blanc ne traitera donc des autres aspects importants de la chaîne décisionnelle, à savoir les ETL et base de données. Ceux-ci relevant plus des moyens que des usages. Il ne traite pas non plus du Datamining pour deux raisons : c’est une étape complémentaire dans la business intelligence qui n’interpelle pas à ce jour tous les secteurs d’activité et ce sujet mérite à lui seul une livre blanc dédié. Quant au processus d’élaboration budgétaire, qui s’apparente à une discipline de la business intelligence tout en étant au cœur de l’activité opérationnelle, il n’est pas abordé en tant que tel mais mis en avant sur une des solution OLAP que nous présentons. Ce livre blanc abordera dans des chapitres dédiés chaque problématique (restitution, analyse, pilotage et industrialisation) sous l’angle de la MOE (installation, conception, production et exploitation) et sous l’angle MOA (usages). Nous y présenterons le panel des outils disponibles au moment de la rédaction. Outils que nous avons eu l’occasion d’intégrer pour le compte de nos clients ou pour lesquels nous avons complété notre savoir faire en procédant à des bench sur nos plates formes, avec des environnements de données significatifs. C’est pourquoi tous les outils disponibles ne sont pas décrits, certains d’entre eux ne nous semblant pas capables d’assurer à court ou moyen terme, les besoins qu’ils sont censés adresser. Certains ne nous étant pas encore suffisamment familier non plus ! Nous présentons en toute objectivité, l’ensemble de notre analyse sur les outils BI Open Source dans les quelques pages qui suivent. Bonne lecture !

Ce document est sous licence GNU Free Documentation Licence. Page 1/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

2 OPENBIZZ – QUI SOMMES NOUS ? OpenBizz est la Société de Services en Logiciels Libres (SSLL) du groupe UMANIS. Notre mission est de proposer aux entreprises une alternative logicielle forte en proposant l’intégration de composants open source dans leur SI, des couches infrastructure (OS, messagerie, LDAP) jusqu’au couches métiers (BI, CRM, ERP, SOA, GED, ECM, portail collaboratif...). Nous accompagnons nos clients dans leur réflexion open source, qu’elle relève d’une démarche de maîtrise des coûts ou d’une volonté d’assurer efficacement l’interopérabilité des composants du SI.

Créé en 1991, Umanis est une société de conseil et d’ingénierie spécialisée en Business Intelligence, Gestion de la Relation Client (CRM) et en E-Business. Umanis, un des leaders français dans ces domaines, accompagne ses clients sur la globalité de leurs projets informatiques : conseils, réalisation, intégration, Tierce Maintenance Applicative et formation

En 2007, le Groupe Umanis a réalisé un Chiffre d’Affaires de 60 millions d’Euros et compte parmi ses 400 clients actifs des grands comptes internationaux, nationaux et régionaux. Avec près de 1000 collaborateurs, Umanis est implanté à Aix en Provence, Lille, Lyon, Metz, Nantes, Paris, Pau, Toulouse, Tours. Reconnu pour son expertise technologique et fonctionnelle, le Groupe Umanis est partenaire des plus grands éditeurs de logiciels du marché.

www.openbizz.fr www.groupeumanis.com

Ce document est sous licence GNU Free Documentation Licence. Page 2/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

3 INTRODUCTION 3.1 RAPPEL DES PRINCIPALES BRIQUES FONCTIONNELLES DU SI DECISIONNEL Le thème « Consommer, Analyser et Piloter » est en correspondance avec les pratiques actuelles de la business intelligence. Ces trois notions correspondent à des usages qui se veulent différent de par la nature des acteurs et de leur responsabilité dans le dispositif d’entreprise. Quand on examine les services décisionnels impliqués dans les entreprises, ceux-ci sont déterminés sous cette triple approche :

3.1.1 Restitution De plus en plus intégrée dans les dispositifs métiers opérationnels, la consommation d’information « business intelligence » concerne un large scope d’utilisateurs au sein des entreprises. Basée directement sur les outils de production ou en aval d’une chaîne décisionnelle (nous de traitons pas ici des apports de la chaîne décisionnelle ni des alternatives existantes), le besoin reste le même : Disposer d’informations chiffrées sur son activité, sur un pas temporel. Que ce soit sur des indicateurs de type flux (volume entre deux dates) ou de type stock (volume à date). Ces usages s’inscrivent dans un pilotage fin et industrialisé de l’activité rendu nécessaire par l’envergure de l’activité, la tension de la concurrence ou encore la rationalisation des ressources disponibles pour maximiser la profitabilité. En cela ils concernent une grande proportion des personnels de l’entreprise et à tous les niveaux de la chaîne de responsabilité. Il est commun de distinguer trois modes de restitution, matérialisés par des rapports aux nuances suivantes : Rapport statique : il s’agit d’un rapport dont la structure est figée tant en termes de présentation que du périmètre des données présentées. Il présente l’avantage d’être généré en dehors du temps de travail de l’utilisateur et d’être consommable instantanément. Par exemple, l’acheteur logistique d’une plateforme de commerce voudra disposer de manière hebdomadaire d’un rapport présentant l’évolution de la qualité de service de ses prestataires logistiques (capacité à délivrer la quantité dans les délais et la qualité attendue) afin de peser sur les négociations futures ou établir les pénalités. Rapport dynamique : il s’agit d’un rapport ayant une structure de présentation semi statique au sein duquel le périmètre des données peut varier. Cela en offrant à l’utilisateur final la possibilité de choisir les valeurs de paramètres dynamiques intégrés dans le rapport. Cela présente l’avantage indéniable de disposer d’une grande amplitude sur les rapports finaux puisque à partir d’une même structure de rapport on pourra par exemple aussi bien générer un rapport de comparaison annuelle qu’un rapport de comparaison trimestrielle. La notion de paramètre implique cependant d’interroger la BDD ce qui dégrade l’instantanéité. Par exemple, un responsable commercial régional travaillant pour une société de service en recrutement voudra consulter un rapport d’alerte de consommation (nb d’entreprises clientes n’ayant pas consommé depuis X mois telles offres) en sélectionnant un ou plusieurs codes d’activité INSEE et tout ou partie des offres de service proposées par sa société. Ce document est sous licence GNU Free Documentation Licence. Page 3/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Rapport Ad hoc : il s’agit d’un rapport librement aménagé par l’utilisateur final. Il aménage les données qui l’intéressent dans une structure type tableau ou graphique en définissant le périmètre de consultation de ses axes et indicateurs. Cette approche nécessite que soit mis en place une « couche métier » (ou semantic layer) d’accès aux données. Cette couche permet de présenter à l’utilisateur une approche fonctionnelle des données et de leur relation, affranchissant ce dernier de la complexité des BDD et du langage SQL. Concrètement, les données sont regroupées au sein de thématiques métiers et reliées entre elles selon cette même logique métier. L’utilisateur n’a plus qu’à sélectionner ses données et les disposer dans son rapport. La encore, la volonté de l’utilisateur se traduit en une sollicitation de la base de données avec une performance d’affichage variable selon la complexité de la demande. Par exemple, un chargé d’études au sein d’une société de services immobiliers voudra composer un rapport mettant en scène un nouvel indice illustrant mieux la tendance du marché des bureaux en IDF. Pour ces trois aspects de la restitution, l’open source propose des solutions sous formes de composants intégrés ou non. Nous vous proposons de les découvrir dans la suite du document.

3.1.2 Analyse Au-delà de l’activité qu’il faut surveiller à tous les échelons opérationnels (pour laquelle les services de restitution remplissent parfaitement leur rôle), il appartient à certains niveaux de management de comprendre plus profondément les mécanismes influant sur cette activité. Il s’agit par exemple de rechercher les causes d’une inflexion afin de mettre en place les mécanismes managériaux, organisationnels ou décider des investissements en vue de contrôler les facteurs déterminants les évolutions de l’activité. Pour cela, le manager doit disposer d’une structure plus souple d’interrogation des données. Il doit pouvoir de manière libre naviguer dans les données sans à priori initial plus que la simple découverte. Sa navigation peut se faire de manière croisée (interroger la valeur de son indicateur de satisfaction client réparti selon la géographie, le temps et décliné par produit par exemple) et de manière ascendante / descendante en jouant sur le niveau de granularité des axes métiers (vision niveau mois, Europe, famille de produit puis mois, France, famille de produit en remontant ensuite sur une consolidation annuelle etc…) Un des intérêts reconnus réside dans la capacité à trouver rapidement l’origine, la cause d’un phénomène. Par exemple, l’origine d’une inflexion des ventes constatée à un niveau agrégé (monde, annuel, gamme de produit) peut être identifiée par une navigation dans les niveaux plus fin de la géographie, des périodes ou des produits, aboutissant à situer une partie importante du problème au niveau d’un produit en particulier, d’un mois en particulier et enfin d’une structure commerciale en particulier. Cette approche est volontairement théorique et non généralisable. En effet, on trouvera certaines catégories d’utilisateurs opérationnels qui peuvent profiter des services offerts pour effectuer leur travail au quotidien. Ca peut être le cas pour un département marketing qui cherchera à comprendre les résultats de sa campagne et qui pour cela trouvera un intérêt certain à manipuler des données disponibles dans un format multidimensionnel. En fait, elle peut être considérée comme un prolongement du reporting ad hoc. Il est commun d’appeler « moteur OLAP » l’outillage permettant ce service.

Ce document est sous licence GNU Free Documentation Licence. Page 4/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Un moteur OLAP (autrement appelé multidimensionnel) permet à l’utilisateur d’accéder à un environnement fournissant de manière quasi instantanée la valeur des indicateurs au croisement des axes d’analyses. L’utilisateur sélectionne de manière conviviale les axes, le niveau sur les axes et les indicateurs qu’il veut y décliner. Ce système offre des fonctions natives de navigation dans le détail ou dans la consolidation des valeurs.

3.1.3 Pilotage Les cadres dirigeants ont des besoins complémentaires. La surveillance de l’activité, non plus au niveau de son delivery opérationnel, mais dans sa capacité à remplir ses objectifs stratégiques, amène à considérer un outillage spécifique. Les tableaux de bords du pilote (on entendra les termes associés de KPI, Dashboard, Balanced scorecard) sont des formats agrégés de présentation de contenu. Ils mettent en scène les indicateurs clés et les objectifs stratégiques en les confrontant. Très visuel, le tableau de bord permet de savoir rapidement si l’entreprise est en avance ou en retard sur son plan stratégique.

3.2 LES APPROCHES DECISIONNELLES BI OPENSOURCE

3.2.1 Les solutions spécifiques Les premiers composants OpenSource diffusés n’avaient pour objectif que de rendre un service. Sont donc souvent absents de l’approche les notions d’authentification, de définition du périmètre suivant l’utilisateur. Ces solutions permettront la production du reporting statique, l’analyse au moyen de cubes OLAP. Optimisés pour le service à rendre, ces composants stables et pérennes sont les briques essentielles des suites.

3.2.2 Les suites BI Les suites vont plus loin, permettant l’agrégation de composants dans un portail dans un premier temps, puis intégrant la gestion de liens entre eux. Le portail permettra une gestion centralisée des accès, avec définition du périmètre utilisateur selon son profil. Les mécanismes de workflow des portails dédiés vont permettre le reporting de masse. Les suites offrent en plus les composants dédiés aux utilisateurs non techniques, leur permettant de définir et de produire le reporting ad-hoc. Certaines suite sont complétées par des outils techniques, permettant à la MOE la conception des rapports ou des axes d’analyse des cubes, et facilitant ensuite le déploiement automatisé des fichiers de configuration directement dans la plateforme mise à disposition des utilisateurs finaux.

Ce document est sous licence GNU Free Documentation Licence. Page 5/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

GUIDE DE LECTURE DU DOCUMENT Dans ce document, nous préciserons pour chacun des outils étudiés, les besoins couverts, mais aussi les contraintes afférentes, en termes de pré requis techniques à la mise en œuvre, les compétences techniques nécessaires, la conduite de changement possiblement induite. Nous préciserons la licence, les différences entre celles-ci impliquant parfois des contraintes légales à respecter. Selon nos contacts avec les « éditeurs » ou « mainteneurs » des solutions, nous avons indiqué les développements futurs ou « roadmap » connues. Un tableau, tel qu’en exemple ci-dessous, reprend une synthèse des éléments abordés et introduit quelques commentaires et notre retour d’expérience sur la mise en œuvre de la solution.

Item Type d’item

Nom de l’outil

Description succincte

Public Services concernés par l’usage, population

Pré-requis

- Pré requis techniques - Compétences nécessaires à la mise

en œuvre ou à l’usage

DESCRIPTION

- Description synthétique de la mise en œuvre

o Complexité de la mise en œuvre de la solution o Poste de travail ou mode partagé (mode web) o ….

- Description synthétique de l’usage o Complexité d’appropriation de la solution o Description de la couverture fonctionnelle

Licence Indication du type de licence, du support disponible, des coûts à prévoir (selon informations disponibles)

Notes Commentaires

Nous conclurons chaque chapitre par une synthèse des outils et leurs indications métier. Le tableau suivant présente une brève description des distinctions principales entre les différentes licences open source évoquées dans ce document. Nous n’avons pas souhaité aborder plus profondément le sujet, de multiples littératures sur le sujet étant déjà disponibles sur le web.

Ce document est sous licence GNU Free Documentation Licence. Page 6/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Licences Description synthétique

GPL General Public License : Code ouvert, usage libre, modification et évolution du code possible, distribution libre avec pour seule contrainte de propager le type de licence. (notion de copyleft). GPL est restrictif quant à l’assemblage de codes logiciels. Seuls les codes logiciels compatibles GNU GPL peuvent être assemblés.

CPL Common Public License : La différence essentielle avec la GPL est la liberté offerte aux personnes ayant apporté des évolutions majeure au produit d’attribuer la licence de leur choix sur ces évolutions.

Cette licence a été mise en place pour la plateforme Eclipse, permettant ainsi à IBM d’en commercialiser une version propriétaire.

EPL Eclipse Public License : La différence essentielle avec la GPL est la liberté offerte aux personnes ayant apporté des évolutions majeure au produit d’attribuer la licence de leur choix sur ces évolutions.

Elle est dérivée de la CPL (Common Public License) originelle qui comportait certaines mentions favorables à IBM.

MPL Mozilla Public License : Grandes similitudes avec la licence GPL. Elle est cependant un peu moins restrictive quant à sa compatibilité avec d’autres licences (dans les cas de mixité de programme). La notion de copyleft demeure mais seulement sur la partie MPL de l’assemblage

LGPL Lesser General Public License Grandes similitudes avec la licence GPL. Elle est cependant un peu moins restrictive quant à sa compatibilité avec d’autres licences (dans les cas de mixité de programme). La notion de copyleft demeure mais seulement sur la partie LGPL de l’assemblage

NB : rappelons qu’en droit français, seules les licences rédigées en français sont reconnues valides par le législateur. Or il n’existe pas de traduction « officielle » de la GNU GPL. Mais, un jugement du 28 mars 2007 (TGI Paris, 3ème chambre, 1ère section, 28 mars 2007, Educaffix c/ CNRS, Université Joseph Fourier et autres) expose un premier cas de jurisprudence relative à une licence GNU GPL v2. On lira avec intérêt l’analyse faite de ce jugement par le cabinet CAPRIOLI à l’URL : http://www.caprioli-avocats.com/pages/publications/edocs/management-juridique-de-l-innovation/edocs-management-juridique-de-l-innovation-premiere-jurisprudence-francaise-relative-a-une-licence-GNU-GPL.htm En Allemagne, la loi allemande a validée en 2004 les principales clauses de la GNU GPL Pour l’Europe, notons que s’est tenue la conférence « EOLE » (European Opensource Lawyers Event) le 24 septembre 2008, organisée dans le cadre de la manifestation « Paris, Capitale du libre »

Ce document est sous licence GNU Free Documentation Licence. Page 7/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

4 LES SOLUTIONS SPECIFIQUES DE RESTITUTION Plus exactement, le terme restituer représente un moyen plutôt qu’un usage. Il est le moyen technique, applicatif qui permet la consommation d’information à valeur décisionnelle (i.e., le client consommateur doit être en mesure de définir (ou choisir) l’action appropriée à la lecture de l’information qui lui est fournie). Il est cependant commun de synthétiser sous ce seul terme les usages représentés par la consommation d’informations statiques, pré paramétrées ou encore ad hoc.

4.1 RAPPORTS STATIQUES OU DYNAMIQUES Pour rendre disponibles des rapports statiques ou dynamiques auprès des utilisateurs, il faut des outils offrant des fonctions de conception et de production de rapports. Pour cet usage, l’open source propose deux composants majeurs que sont Birt et Ireport couplé avec JasperReport. Les plateformes BI que nous détaillons au sein du § 7 sur l’industrialisation des Systèmes d’Information Décisionnelle mettent généralement en œuvre IReport ou BIRT. La plateforme Pentaho intègre en plus une solution dédiée, alternative à Birt et JasperReport. Les critères permettant d’évaluer des services BI sont nombreux et peuvent être déclinés sur un niveau de précision tel qu’il ne contribuerait pas à leur lisibilité dans le cadre de ce livre blanc. Nous nous satisferons d’un niveau de présentation agrégé de ces critères afin de positionner chacune des offres de manière claire. Pour les rapports statiques ou dynamiques, les fonctions importantes sont listées dans le tableau suivant Fonction majeure Description

Capacité à intégrer des fonctions de traitement des données (arithmétiques, statistiques, date, texte, numériques …)

Les données brutes ainsi que des données valorisées (issues de calculs sur les données brutes) peuvent être stockées en BDD. Ceci implique une anticipation par les utilisateurs finaux sur les données à restituer, ainsi qu’une intervention de la MOE.

Pour d’autres types d’indicateurs (indicateurs non linéaires) ou pour répondre à un besoin immédiat, les outils de restitutions doivent intégrer des fonctions de traitement de données.

Mise en forme (rupture, groupement, saut de page, tri, mise en forme conditionnelle, entête et pied de page)

Pour rendre l’information visible, s’assurer qu’elle sera perçue à sa juste valeur, celle-ci doit être lisible. De même pour être partagée, communiquée vers des tiers, le rendu doit être structuré. Il est donc important de considérer les capacités de mise en forme des outils. Aérer l’information, mettre en évidence les groupements, professionnaliser l’aspect sont autant de points importants

Vision de l’information (Liste, Tableau croisé, Graphes à barre, radar, histogramme …)

La représentation de l’information impacte considérablement la rapidité d’appréhension et de digestion d’une information. Selon ce que sont censées illustrer les données, ou encore le nombre d’entrées qu’elles présentent, le

Ce document est sous licence GNU Free Documentation Licence. Page 8/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Fonction majeure Description

choix d’un format de restitution adapté doit être possible.

Mise à disposition (formats d’exports, mail, portail web, envoi en masse, planification…) –

La disparité des environnements accessibles aux utilisateurs nécessite de prévoir une distribution selon plusieurs formats ou moyens

Sécurité (droits sur les rapports, droits sur les données avec filtre data en fonction de l’utilisateur permettant de distribuer un même rapport avec des périmètres données différents…)

Le caractère confidentiel des données pour des raisons de management, de concurrence ou autre nécessite d’apporter des moyens pour restreindre les informations offertes selon les prérogatives du consommateur

Paramétrabilité (invites utilisateurs - saisie libre/ référentiel, invite en cascade,..) –

Coupler un rapport statique avec des paramètres permet de le rendre dynamique. L’utilisateur n’est pas contraint à consulter un périmètre figé mais peut jouer sur les paramètres pour afficher un périmètre différent (en terme de période, produit, zones de marché etc…)

Fonctions avancées (filtre récapitulatif, indicateurs en ligne, accès multisource, audit d’utilisation…)

Sans être primordiales, un certain nombre de fonctions avancées peuvent rendre de grands services aux MOE ou MOA

Capitalisation (enregistrement de requêtes, de modèles, de vues réutilisables…) –

Utile pour augmenter la productivité des ressources et ainsi favoriser les personnels (MOE ou MOA) à consacrer leur temps à des tâches à plus forte valeur ajoutée

Les outils présentés sont articulés autour de deux besoins différenciés : • La conception du rapport (format, logo, présentation des données, extraction des données,…) qui

implique une connaissance technique du format de stockage des informations. • La production du rapport qui sera généré à la demande (avec éventuellement une précision

apportée au périmètre ou au format de sortie) ou bien automatisée (le périmètre est définitivement déterminé, ainsi que les destinataires et le format de sortie)

Conception du rapport Dans le reporting statique, cette tâche de conception est assignée à une équipe technique qui va mettre en place la connexion à la base, élaborer les requêtes SQL, concevoir graphiquement le canevas du rapport. Cette première étape va être réalisée au moyen d’un outil graphique déployé sur le poste client, au moyen d’une interface graphique Java. Les outils présentés produisent un fichier au format « xml » contenant les éléments nécessaires à l’extraction des données, leur transformation éventuelle avant le positionnement dans le document à produire. Production du rapport La production du rapport final met en œuvre des librairies Java qui vont parcourir le fichier au format « xml » produit par l’outil d’élaboration. A la rencontre d’un champ à remplir, l’outil de production exécute la requête SQL associée, puis l’alimente avec les données extraites. Il est possible de planifier l’exécution de ce rapport, ou bien de l’intégrer à un portail BI, permettant à l’utilisateur de définir des paramètres.

Ce document est sous licence GNU Free Documentation Licence. Page 9/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

4.1.1 iReport – JasperReport La conception du rapport se fera au moyen de l’outil iReport, une interface dédiée à la conception de rapports JasperReport. La restitution, se fera depuis JasperReport, sous forme de librairies intégrées dans un portail BI. Cette intégration permet la définition d’accès aux bases de données dans le portail et donne la capacité à l’utilisateur final de compléter la définition du périmètre des données du rapport à produire.

4.1.1.1 Conception par IReport iReport permet la composition du rapport. Les éléments graphiques, les zones de données, sont définis simplement par « glisser-déposer ». L’utilisateur indique les paramètres de connexion à la base de données pour valider les données et le rendu final du rapport. L’interface est simple et intuitive. Elle intègre un « query designer » qui permet de construire graphiquement une requête. Les clés sont automatiquement reconnues et les jointures s’opèrent sous forme de lien automatique. Lorsque que la requête est constituée, les champs remontés peuvent être placés dans les zones de restitution avec la souris. On choisit les paramètres de mise en page, puis on lance la compilation. Dans un premier temps, celle-ci produit un fichier « .java » à partir du descripteur « .jrxml ». Ensuite, ce « programme » est exécuté en utilisant les librairies JasperReport et les paramètres d’accès aux bases de données. L’exécution de ce programme génère le rapport final. Il est possible d’ajouter du code Java dans le document pour produire la conversion de type de données ou pour ajouter des opérateurs sur des champs remontés. Cette capacité permet l’optimisation de la mise en forme ou l’ajout de champs calculés. Un plugin permet un interfaçage direct avec JasperServer, la plateforme BI de JasperSoft dont iReport et JasperReport sont deux outils. Grâce à ce plugin, le déploiement du format du rapport validé est immédiat depuis iReport. Un autre plugin permet de consulter les rapports installés dans la plateforme BI SpagoBI. Il en permet la modification, à partir du moment où le fichier « .jrxml » a été déployé précédemment dans la plateforme. iReport ne peut gérer qu’une seule source de données SQL pour toutes les requêtes du rapport. Une deuxième requête peut être utilisée pour produire le graphe, indépendamment de la première utilisée pour la restitution de données sous forme de tableau.

Ce document est sous licence GNU Free Documentation Licence. Page 10/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 11/97

Ci-dessous une copie d’écran de conception sous iReport.

L’interface iReport est un client « lourd » sous Java. Aucune compétence technique complexe n’est requise pour cette installation, il faudra juste veiller à disposer d’une Java Virtual Machine installée sur le poste de développement.

Les connexions aux bases de données se feront au moyen de drivers JDBC (pendant Java des connecteurs ODBC sur les plates formes Microsoft), qui devront être installés dans le répertoire des librairies de l’outil. Pour aller plus loin dans la conception de rapports, des compétences en langage Java pourront être utiles, afin de développer des méthodes de remplissage de champs ou de transtypage de données.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Item CONCEPTION

iReport v3.0.0

Permet la conception graphique d’un rapport. Produit un fichier de définition au format « jrxml »

Public

- MOE : Permet la conception de reporting généré par les librairies JasperReport - Utilisateurs : Il est possible de l’utiliser comme outil de production de rapports.

Pré-requis

- Client « lourd » supposant une JVM - Paramètres de connexion à la base de données - Langage SQL (pour la conception de requêtes) - Langage Java (pour affiner la conception) - Langage XML (pour comprendre le fichier « jrxml »

produit)

DESCRIPTION

- Interface graphique sous Java, indépendante de la plate forme. Elle permet de produire un rapport et/ou un fichier de

description au format « jrxml », utilisable dans une plate forme. o Interface intuitive o Mode visualisation permettant de pré visualiser le rapport final

- Conception en mode « drag & drop » o Les outils et les champs de formats différents se glissent et se dépose sur la page de conception La définition de la connexion à la base de données est extérieure au fichier de conception produit.

Licence Licence LGPL Documentation et exemples accessibles depuis le site de JasperForge Librement téléchargeable sans coût de licence Supports et formations payants (proposés par les SSLL)

Notes Les paramètres de connexion à la base de données sont extérieurs à la définition du rapport.

Ce document est sous licence GNU Free Documentation Licence. Page 12/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

4.1.1.2 Production par JasperReport JasperReport se présente sous forme de librairies Java, accessible depuis une application ou un projet J2EE. Le fonctionnement est « transparent » pour l’utilisateur final, l’interface intègre les librairies d’exécution. Elles présupposent l’usage d’une interface (outil Java, portail ou plateforme BI) qui va permettre la définition des paramètres de connexion aux données et le mode de production du rapport.

Item PRODUCTION

JasperReport v3.0.0

Librairie de production du rapport défini au moyen de « iReport » (cf. ci-dessus)

Public

- Utilisateurs : Génère le rapport à partir du fichier de conception « jrxml » transmis en paramètre

Pré-requis

- JVM - Paramètres de connexion à la base de données - Langage SQL (pour la conception de requêtes) - Langage Java (pour affiner la conception) - Langage XML (pour comprendre le fichier « jrxml »

utilisé)

DESCRIPTION

- La librairie JasperReport permet de produire les fichiers de reporting conçu depuis iReport. o Intégrée dans un portail ou une plateforme BI :

celui-ci fournit les paramètres de connexion à la base de données il est possible de planifier l’exécution de la production il est possible de permettre à l’utilisateur d’affiner le périmètre sur lequel construire le rapport

- Exécution transparente pour l’utilisateur final, leur mise en œuvre ne demande aucune connaissance particulière. Elles doivent être accessibles (dans le chemin des librairies) à l’application qui les utilise.

o Les rapports sont d’un niveau de qualité correct, le rendu graphique s’améliorant à chaque évolution de la librairie

Licence Il existe une version GPL et une version commerciale.

Notes - Les librairies ne sont accessibles à l’utilisateur final qu’au travers une interface java, sous forme

d’une application ou d’un portail BI. - Pas d’utilisation en mode « stand alone » - Production des graphes gérée par une librairie externe JFreeChart sous licence LGPL

Ce document est sous licence GNU Free Documentation Licence. Page 13/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 14/97

Schématisation des composants mis en œuvre dans la production du fichier « jrxml »

4.1.1.3 Restitution

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 15/97

4.1.2 BIRT L’interface BIRT (Business Intelligence Reporting Tools) est conçue sous Eclipse. A l’origine projet de la fondation Eclipse, la société ACTUATE en est maintenant co-sponsor. La solution permet, par « glisser-déposer », de composer un rapport. Tous les composants graphiques sont présents et comme avec iReport, le rapport se construit de manière intuitive.

4.1.2.1 Conception sous BIRT Cette solution n’intègre pas de « query designer », outil permettant de construire graphiquement les requêtes. Elle permet par contre d’ajouter des filtres sur les données Le transtypage de données y est plus intuitif. Il n’est pas nécessaire de produire du code Java pour obtenir ce résultat. Il peut être obtenu par choix de fonctions aux noms explicites, à appliquer sur les données insérées dans le rapport. La solution permet l’usage de plusieurs sources de données, l’utilisation de plusieurs requêtes différentes, autant pour des données restituées sous forme de tableau que sous forme de graphiques.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Item CONCEPTION

BIRT v2.3.0

Interface graphique sous Eclipse, permettant la conception de rapports au format BIRT

Public

MOE : conception de reporting au format BIRT Utilisateurs : Il est possible de l’utiliser comme outil de production de rapports.

Pré-requis

- Client Eclipse en Java, nécessitant l’installation d’une JVM

- Paramètres de connexion à la base de données - Langage SQL (pour la conception de requêtes) - Langage Java (pour affiner la conception)

DESCRIPTION

- Interface graphique sous Eclipse, indépendante de la plate forme. Elle produit un fichier de description au format

« rptdesign » o Interface intuitive o Mode visualisation permettant de pré visualiser le rapport final

- Conception en mode « drag & drop » o Les outils et les champs de formats différents se glissent et se déposent sur la page de conception o Les images (logo,…) ainsi que la définition de la connexion à la base de données sont inclus dans le fichier

de conception produit

Licence EPL (Eclipse Public Licence) Librement téléchargeable sans coût de licence

Notes - Tous les éléments sont inclus dans le fichier « rptdesign » - La librairie de génération du graphe est propre à BIRT

La société ACTUATE est co-sponsor du projet BIRT sous Eclipse. Cette société participe activement aux développements de BIRT Report et propose des produits non OpenSource additionnels suivants : Actuate BusinessReport Studio : Portail décrit par Actuate comme permettant la conception de rapports « adhoc » et leur visualisation. Actuate BIRT Designer & BIRT Designer Professional : Version « professionnelle » de BIRT Report Actuate Information Objects : Permet la conception de vues métiers par la MOE, mis à disposition des utilisateurs de données fonctionnelles.

Ce document est sous licence GNU Free Documentation Licence. Page 16/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 17/97

4.1.2.2 Production sous BIRT Report La production se fait par l’usage de librairies paramétrées dans le fichier de description du rapport final. Les images, les accès aux bases de données étant définies dans ce fichier de description, la conception d’une application Java autonome exploitant les librairies et le fichier est simplifiée.

Item PRODUCTION

BIRT v2.2.0

Affichage du rapport final et production de différents types d’export

Public

Utilisateurs : Affichage du rapport généré dans l’outil de conception ou dans le portail

Pré-requis

- JVM - Paramètres de connexion à la base de données - Langage SQL (pour la conception de requêtes) - Langage Java (pour affiner la conception) - Langage XML (pour comprendre le fichier «

rptdesign » utilisé)

DESCRIPTION

- Les librairies BIRT permettent de produire les fichiers de reporting conçu depuis BIRT.

o Intégrée dans un portail ou une plateforme BI :

il est possible de planifier l’exécution de la production il est possible de permettre à l’utilisateur d’affiner le périmètre sur lequel construire le rapport

- Exécution transparente pour l’utilisateur final, leur mise en œuvre ne demande aucune connaissance particulière. Elles

doivent être accessibles (dans le chemin des librairies) à l’application qui les utilise. Les rapports sont d’un niveau de qualité correct, le rendu graphique dans certains formats d’export pourrait être amélioré

Licence EPL (Eclipse Public License)

Notes Rapport figé ou pré paramétré Rapports dynamiques permettant des interactions avec l’utilisateur

Schématisation des composants mis en œuvre dans la production du fichier « rptdesign »

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 18/97

4.1.2.3 Restitution

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

4.1.3 Synthèse des outils de restitution

La solution JasperReport fait partie des premiers composants BI. Il a bénéficié d’apports de toute la communauté depuis l’année 2000. Sa conception en deux parties distinctes, d’un côté l’interface de conception iReport, de l’autre les librairies de production, le rendent flexible et intégrable dans de nombreux projets. On le retrouvera donc dans toutes les plateformes BI, de SpagoBI à Pentaho en passant par JasperServer. Une des limitations est qu’il est nécessaire de lui fournir les images et logos décrit dans le fichier de conception, ainsi que l’accès aux bases de données. BIRT est lui aussi architecturé autour de librairies de production, mais son interface de conception et la production d’un descripteur autonome en permettent un usage autonome. Pour BIRT, seul le fichier de description est nécessaire, les images et le paramétrage d’accès aux données étant inclus dans celui-ci. Le choix des outils entre BIRT et JasperReport sera donc guidé par l’usage :

• Pour un rendu comparable, BIRT sera privilégié comme outil autonome. • Pour l’intégration dans un portail ou un développement spécifique, on préférera Jasper,

dont les paramétrages sont plus accessibles. • Si de multiples sources de données doivent être agrégées dans le même rapport, on

utilisera la solution BIRT, Jasper n’intégrant pas cette fonctionnalité. • S’il est nécessaire d’avoir des rapports dynamiques contenant des interactions avec

l’utilisateur, la solution BIRT sera plus adaptée. D’un point de vue des critères, le tableau suivant présente les points forts des deux solutions Fonction majeure iReport / JasperReport Birt

Capacité à intégrer des fonctions de traitement des données (arithmétiques, statistiques, date, texte, numériques …)

Les fonctions disponibles sont celles offertes par la BDD sous jacente – peu de limite

La programmation procédurale est aussi intégrable

Les fonctions disponibles peuvent être gérées par Birt indépendamment des fonctions fournis par la BDD.

La programmation procédurale est aussi intégrable

Mise en forme (rupture, groupement, saut de page, tri, mise en forme conditionnelle, entête et pied de page) –

Toutes ces caractéristiques de mise en forme sont prises en compte nativement dans iReport.

Toutes ces caractéristiques de mise en forme sont prises en compte nativement dans Birt

Un rapport Birt peut être conçu de manière dynamique pour un usage sous forme de dashboard.

Vision de l’information (Liste, Tableau croisé, Graphes à barre, radar, histogramme …)

La vision de l’information est totalement paramétrable lors de la conception du rapport.

La vision de l’information est totalement paramétrable lors de la conception du rapport.

Mise à disposition (formats d’exports, mail, portail web, envoi en masse, planification…) –

Export possible en PDF, HTML, XLS, CSV, Txt, RTF, ODF.

Export possible en PDF, HTML, XLS, DOC, PPT, POSTSCRIPT.

Parfaitement intégrable à un portail pour la

Ce document est sous licence GNU Free Documentation Licence. Page 19/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Fonction majeure iReport / JasperReport Birt

Parfaitement intégrable à un portail pour la diffusion de masse.

Un simple remplacement de la librairie JasperReport permet de prendre en charge les nouvelles fonctionnalités.

diffusion de masse.

La mise à jour au sein d’un portail n’est pas un modèle de simplicité.

Sécurité (droits sur les rapports, droits sur les données avec filtre data en fonction de l’utilisateur permettant de distribuer un même rapport avec des périmètres données différents…)

Essentiellement gérée par le portail, dans la conception il faudra simplement spécifier les éléments paramétrables.

Essentiellement gérée par le portail, dans la conception il faudra simplement spécifier les éléments paramétrables.

Paramétrabilité (invites utilisateurs - saisie libre/ référentiel, invite en cascade,..)

La gestion des paramètres est intégrée à iReport ce qui permet, à l’exécution du rapport, de proposer un invite pour sélectionner le ou les paramètre(s).

Pour une gestion des paramètres encore plus poussée il faudra utiliser les fonctions du portail.

La gestion des paramètres est intégrée à BIRT et dispose de plusieurs options comme la saisie libre, la liste déroulante, la sélection multiple et la gestion des paramètres en cascade. La gestion des paramètres sert également à rendre le rapport dynamique à l’image des dashboards.

Intégré dans un portail, une autre dimension de paramétrabilité peut être utilisée.

Fonctions avancées (filtre récapitulatif, indicateurs en ligne, accès multisource, audit d’utilisation…)

Beaucoup de points sont déjà gérés par le portail. iReport pêche tout de même quand il s’agit de l’accès multi source ou plutôt multi requête.

Les rapports secondaires peuvent éventuellement palier à ce problème.

Beaucoup de points étant déjà gérés par le portail, Birt offre la capacité d’accès multi source, les jointures entre plusieurs source de données et des fonctions de calcule entre des champs de base de données différentes, et tout ceci au sein du même rapport en plus de la gestion des rapports secondaires.

Capitalisation (enregistrement de requêtes, de modèles, de vues réutilisables…) –

Essentiellement géré par le portail.

Essentiellement géré par le portail.

Ce document est sous licence GNU Free Documentation Licence. Page 20/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

4.2 RAPPORTS AD HOC Pour qu’un utilisateur puisse créer son propre rapport, en supposant (ce qui représente la majorité des cas) qu’il n’a pas la connaissance pratique des modalités d’interrogation SQL des données, il a besoin qu’une représentation métier de ces données lui soit présentée. Concrètement, stockage relationnel ne veut souvent pas dire grand-chose pour un utilisateur métier. Pourquoi aurais je besoin de comprendre les contraintes techniques, de volumétrie, d’atomicité, de cardinalité et pleins d’autres bonnes raisons qui ont poussé les MOE à répartir les données dans des tables distinctes ? Surtout quand cette répartition signifie que je dois comprendre la notion de jointure entre les tables afin d’associer mes données entre elles… Donc pour permettre une certaine liberté aux utilisateurs quant à leur besoin en terme de reporting, les couches métiers sont une réponse efficace (pour faire une analogie avec les éditeurs historiques, on parlera anciennement de « catalogue » chez Cognos puis de « framework », d’ « univers » pour Business Objects ou encore d’ « infomap » chez Sas) Ce genre de service n’est pas offert à tous les utilisateurs, il n’est pas forcément non plus mis en place au sein de toutes les entreprises, certaines préférant que la DSI contrôle l’ensemble de la production des rapports mis à disposition des utilisateurs. Les critères déterminants pour qualifier la pertinence des technologies des éditeurs sur cet aspect sont globalement les mêmes que ceux déterminés pour les rapports statiques. Sauf qu’ils s’appliquent différemment. Par exemple, la présence de fonctions de calculs nécessaire pour travailler les données, s’adressant à des utilisateurs ne peut plus être implémentée à l’aide de requêtes SQL ou de procédures type pgSQL (spécifique base PostgreSQL). Elle doit devenir graphique, c'est-à-dire permettre à l’utilisateur de sélectionner une fonction présentée de manière littérale pour qu’il l’applique sur la donnée choisie. La couche métier, dont la conception est assurée par la MOE, doit offrir des fonctionnalités élémentaires et d’autres de confort

Ce document est sous licence GNU Free Documentation Licence. Page 21/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Outillage Critères Description

Outil de conception de la vue métier

Fonctions de design métier de la BDD Importation des tables, renommage des champs techniques, classement de l’information en dossiers, création de jointure libre ou semi automatisé, gestion des boucles

Capacité à créer de nouvelles données calculées (à partir de celles importées de la base et offertes ensuite aux utilisateurs) – présence de fonctions de traitement des données (arithmétiques, statistiques, date, texte, numériques …)

Les données brutes, une partie des données valorisées peuvent être stockées en BDD mais tout ne peut être reporté sur la base. Pour des raisons d’anticipation (le process de modélisation et d’alimentation demeurant peu flexible) comme pour des contraintes naturelles (indicateurs non linéaires). Il est donc vital que la valorisation des données, leur préparation puisse aussi être prise en charge par les outils de restitution. Ainsi les fonctions de traitement de données ont leur utilité dans les outils

Sécurité (droits sur les données) Le caractère confidentiel des données pour des raisons de management, de concurrence ou autre nécessite d’apporter des moyens pour restreindre les informations délivrées

Fonction de contrôle des utilisateurs Afin de préserver la disponibilité des infrastructures, il est important de limiter certaines actions utilisateurs. Notamment les produits cartésiens ou les requêtes trop complexes.

Outil de création des rapports Ad hoc

Capacité à intégrer des fonctions de traitement des données (arithmétiques, statistiques, date, texte, numériques …)

Mise en forme (rupture, groupement, saut de page, tri, mise en forme conditionnelle, entête et pied de page)

pour rendre l’information visible, s’assurer qu’elle sera perçue à sa juste valeur, celle-ci doit être lisible. De même pour être partagée, communiquée vers des tiers, le rendu doit être structuré. Il est donc important de considérer les capacités de mise en forme des outils. Aérer l’information, mettre en évidence les groupements, professionnaliser l’aspect sont autant de points importants

Vision de l’information (Liste, Tableau croisé, Graphes à barre, radar, histogramme …)

La représentation de l’information impacte considérablement la rapidité d’appréhension et de digestion d’une information. Selon ce que sont censées illustrer les données, ou encore le nombre d’entrées qu’elles présentent, il convient mieux de sélection un format de vision différent. Les outils doivent donc être dotés de modes de représentation différents

Mise à disposition (formats d’exports, mail, portail web, envoi en masse, planification…) –

L’utilisateur créant son rapport peut souhaiter le mettre à disposition des autres utilisateurs. La disparité des environnements accessibles aux utilisateurs nécessite de prévoir une distribution selon plusieurs formats ou moyens

Ce document est sous licence GNU Free Documentation Licence. Page 22/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Outillage Critères Description

Paramétrabilité (invites utilisateurs - saisie libre/ référentiel, invite en cascade,..) –

De même, l’utilisateur peut souhaiter rendre dynamique le rapport qu’il vient de créer. Il y ajoute alors des paramètres permettant de faire varier le périmètre de consultation des données affichées dans le rapport.

Fonctions avancées (état d’avancement de la requête, annulation de requête, application d’une mise en forme différente sur le résultat d’une requête

Sans être primordiales, un certain nombre de fonctions avancées peuvent rendre de grands services aux utilisateurs.

Capitalisation (enregistrement de requêtes, de modèles, de vues réutilisables…)

Utile pour augmenter la productivité des ressources et ainsi favoriser les personnels à consacrer leur temps à des tâches à plus forte valeur ajoutée

Il n’existe pas de composants dédiés au reporting ad hoc. Ce service est offert de manière intégré par les différentes plates formes BI, Pentaho », « SpagoBI », « JasperServer » et « BPM Conseil » que nous présentons à partir du chapitre 7 sur l’industrialisation des SID.

Ce document est sous licence GNU Free Documentation Licence. Page 23/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

5 LES SOLUTIONS SPECIFIQUES D’ANALYSE MULTIDIMENSIONNELLE

5.1 DEFINITIONS Les cubes OLAP permettent à un utilisateur de « naviguer » au travers de ses données. Pour ce faire, un axe d’analyse, appelé « mesure » va être défini, puis analysé suite à un croisement avec des données organisées sous forme de dimensions. Par exemple, on souhaite produire une analyse sur les coûts de transport de produits. Ceci constituera la « mesure » du cube. Les pays expéditeurs et destinations seront deux dimensions possibles. La période de temps (en mois ou années) constituera une autre dimension. On pourra alors étudier l’évolution des coûts de transports sur une période en mois pour tous les pays. Ou bien produire une analyse de ces coûts entre deux pays, entre deux continents (résultat d’une agrégation des dimensions unitaires de pays). Ou bien, en mixant les deux dimensions d’analyse, entre plusieurs continents sur plusieurs périodes. Cet exemple sera repris et commenté dans nos études des solutions. Les cubes sont classés en deux grandes familles :

• les cubes ROLAP dont l’implémentation en OpenSource est la solution MONDRIAN • les cubes MOLAP dont l’implémentation en OpenSource est la solution PALO

Les cubes ROLAP (OLAP basé sur une structure Relationnelle) permettent d’accéder directement aux données physiques contenues dans les tables relationnelles. Les outils présentent les données regroupées selon des vues métier, organisées autour des mesures et des dimensions. Il devient possible de passer d’une vue « globalisée » par les axes, présentant des résultats agrégés, à une vue unitaire des données. Cette navigation, d’une vision globale à une vision unitaire, s’appelle le « drill through » ou le « drill down ». La limite d’usage de cette méthode apparaît lors de sa mise en œuvre sur une base de volumétrie importante. L’outil interroge la base à chaque demande d’analyse. Les cubes MOLAP (OLAP optimisé pour l'analyse Multidimensionnelle) accèdent à des données préalablement agrégées selon les mesures et les dimensions. Il n’est donc pas possible à priori de descendre vers les données unitaires. Sa mise en œuvre implique au préalable une extraction des données selon les axes de mesure et de dimensions définis par les besoins d’analyse. Cette méthode d’analyse, basé sur un sous ensemble de données limité, permet des temps de réponses élevés sur une base de volumétrie importante. Il existe aussi des solutions Hybrides (HOLAP) permettant une première analyse optimisée des données par un cube MOLAP, puis en cas de besoin d’analyse plus fine, d’accéder aux données au travers d’un cube ROLAP. A notre connaissance, aucune solution de ce type n’est représentée dans le monde de l’Open Source. Utiliser une solution multidimensionnelle implique deux types d’outils : Un composant permettant le design du cube (définition des axes, des indicateurs, des modalités d’alimentation, de la sécurité…) Un client permettant à l’utilisateur d’exploiter les données fournies au travers du cube. (client web ou lourd, add in excel …)

Ce document est sous licence GNU Free Documentation Licence. Page 24/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Dans la suite du document nous vous présentons les deux solutions opensource éligibles au titre de moteur OLAP :

la solution Mondrian : les différents composants pour le design du cube et les différents composants clients permettant sa lecture,

la solution Palo et ses différents clients. Pour l’analyse au moyen de cubes OLAP, les fonctions importantes sont listées dans le tableau suivant. Nous indiquerons en fin de chacune des études sur les deux grandes solutions OpenSource, l’avancée des réalisations sur les fonctions majeures. Outillage Type Fonction majeure Description

Outil de design (conception) du moteur OLAP

Tout type OLAP Déclaration des sources de données, des axes et indicateurs, de colonnes calculées supplémentaires

Fonctions bien évidemment primordiales. C’est surtout le confort apporté à ces fonctions de conception que nous évaluons au travers de ce critère

Tout type OLAP Sécurité – gestion des accès aux données

Toujours la même problématique de confidentialité des données. Elle peut être implémentée par des filtres relatifs aux profils des utilisateurs ou par la constitution de vues sur les cubes

Tout type OLAP Mode de consolidation des indicateurs

Selon la nature de l’indicateur, sa consolidation sur l’axe temps ne prend pas la même forme. Au-delà de la simple somme, Il peut être nécessaire d’agréger la dernière valeur disponible sur la période (notamment pour les indicateurs de type stock), la valeur minimale ou maximale de l’indicateur sur la période

Gestion des dimensions récursives

Permet de traiter un axe d’analyse dont le nombre de niveau hiérarchique n’est pas fixe (les filiations sont déclarées au sein d’une même table de manière récursive). Cela reste cependant une fonctionnalité avancée présente dans peu de solutions OLAP

Gestion avancée de la dimension temps

Capacité native à comparer les indicateurs d’une période de temps à la même période précédente (que ce soit sur un pas mensuel, annuel, en cumul depuis le début de l’année – YTD - , en cumul depuis le début du trimestre – QTD – etc…)

Elaboration d’un rapport Avec les possibilités de mises en forme classiques des rapports, formats d’exports disponibles, canaux de diffusion etc…

MOLAP Modalités d’alimentation full ou différentiel

Un cube MOLAP stockant les données, les modalités d’alimentation deviennent primordiales. Avoir le choix entre les deux modes est utile selon le contexte d’utilisation de ces cubes, la volumétrie, et la fenêtre de chargement disponible. On distinguera l’alimentation full (à chaque alimentation du cube, l’intégralité des données sont rechargées) et le mode différentiel (mécanisme permettant de n’alimenter que les nouvelles données ou celles modifiées depuis la dernière extraction) -

Ce document est sous licence GNU Free Documentation Licence. Page 25/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Outillage Type Fonction majeure Description

MOLAP Accès au détail Le cube MOLAP stockant ses données, il est courant de ne pas intégrer les données de niveau de détail issues de la BDD. Dans certains contextes métier il est intéressant de pouvoir naviguer dans des indicateurs agrégés puis d’obtenir les enregistrements unitaires constitutifs de la valeur de l’indicateur sur un croisement donné.

Exemple marketing classique : Les équipes utilisent le cube MOLAP pour naviguer et identifier une population spécifique sur laquelle ils souhaitent positionner une offre. Dans le cadre du mailing ils ont besoin des clients sous jacent avec leur coordonnées. Il faut pouvoir à partir de la cellule sélectionnée dans le cube accéder à la population qui a permis de construire cette valeur.

Implémentation des normes XML/A ou MDX

MDX est le langage de requête multidimensionnel, comme SQL l’est pour les bases relationnelles.

XML/A est une norme d'échange au format XML/SOAP permettant d'interroger un cube au travers d'un WebService sur le protocol HTTP. Elle permet de changer de fournisseur OLAP sans modification de l'interface de navigation.

Outil de consultation Navigation (drill down, slice and dice)

Un aspect essentiel d’un cube pour l’utilisateur, à la découverte d’information, est la fluidité. Il faut donc aisément pouvoir inverser des axes, les imbriquer entre eux, descendre d’un clic dans la hiérarchie, remonter dans l’agrégation aussi simplement etc…

Vision de l’information (Liste, Tableau croisé, Graphes à barre, radar, histogramme …)

– La représentation de l’information impacte considérablement la rapidité d’appréhension et de digestion d’une information. Selon ce que sont censées illustrer les données, ou encore le nombre d’entrées qu’elles présentent, il convient mieux de sélection un format de vision différent. Les outils doivent donc être dotés de modes de représentation différents

Filtre, couche Un rapport, même issu de la consultation d’un cube, ne présente que deux dimensions. L’ajout d’une couche permet d’obtenir une superposition du rapport en couches déclinées sur les valeurs d’un axe d’analyse permettant un effet « 3eme » dimension.

La notion de filtre est primordiale pour permettre de délimiter le périmètre des autres axes non affichés à l’écran

Ajout de calcul Possibilité d’ajouter des colonnes calculées dans le rapport à l’écran dans le but entre autres de comparer les données entre elles.

Mise en forme de rapports

pour rendre l’information visible, s’assurer qu’elle sera perçue à sa juste valeur, celle-ci doit être lisible. De même pour être partagée, communiquée vers des tiers, le rendu doit être structuré. Il est donc important de considérer les capacités de mise en forme des outils. Aérer l’information, mettre en évidence les groupements, professionnaliser l’aspect sont autant de points importants

Ce document est sous licence GNU Free Documentation Licence. Page 26/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

5.2 LA SOLUTION MONDRIAN La solution MONDRIAN est développée en OpenSource depuis 2001 sous licence CPL et se présente sous la forme d’un ensemble de librairies Java. Elles permettent la représentation de données relationnelles dans un cube ROLAP, grâce à un fichier XML décrivant les axes de mesures et les dimensions. La mise en œuvre du serveur intègre la conception de ce fichier de description, préalable à l’interrogation des données grâce à un outil client.

Item ANALYSE

Mondrian v3.0

La solution MONDRIAN est une implémentation Java de cubes ROLAP

Public MOE : Définition d’un

cube ROLAP grâce à des librairies JAVA

Pré-requis - JVM - XML (configuration)

DESCRIPTION

- La solution MONDRIAN se présente sous la forme d’un ensemble de librairies Java qui permettent la représentation de

données relationnelles dans un cube ROLAP o La configuration de l’accès aux données relationnelles se fait depuis un fichier .xml o La définition de la structure du cube (axes, indicateurs) peut se faire au moyen des outils de modélisation «

CubeDesignor », « Schema workbench» ou « FreeAnalysis Schema Designer »

Licence Common Public License - v 1.0

Notes Depuis la version 1.2 un système d’agrégation de tables à fait son apparition pour l’optimisation du temps de réponse des requêtes mais sa mise en place reste complexe

5.2.1 Mise en œuvre du serveur Comme explicité plus haut, le serveur MONDRIAN repose sur l’implémentation ROLAP. Il permet donc d’interroger directement une base relationnelle, au travers de la définition d’un « schéma » précisant les axes de mesures et les dimensions. Ce schéma se présente sous forme d’un fichier « .xml », configurant le mode d’accès aux données. Ce fichier peut être modélisé au moyen des outils suivants : « CubeDesignor », outillage conçu par Pentaho, mais désormais abandonné « Schema Workbench », outillage conçu conjointement par Pentaho et Jasper. Remplaçant de « CubeDesignor » « FreeAnalysis Schema Designer », outillage conçu par BPM Un cube Mondrian peut également être implémenté dans une plate-forme telle que Jasper, Pentaho ou SpagoBI. L’interrogation se fera alors à travers l’outil « JPivot », en mode web.

Ce document est sous licence GNU Free Documentation Licence. Page 27/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 28/97

Ci-dessous le schéma d’architecture nous permet de comprendre les mécanismes mis en œuvre :

1. l’outil client transmet une requête au format MDX au serveur MONDRIAN 2. après validation du format de la requête, celui-ci utilise le schéma XML correspondant aux

données à traiter afin de transmettre une demande formatée à la couche de requêtage SQL 3. la couche de requêtage accède à la base physique et extrait les données correspondantes

à la requête 4. les résultats sont transmis à l’outil client.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

5.2.2 Outils de design du fichier « schema XML »

5.2.2.1 Schema Workbench Aussi appelé « Jasper Workbench », cet outil permet de définir les axes du cube ROLAP dans le fichier de description XML. Il se connecte via des drivers JDBC aux bases relationnelles et permet de définir les mesures, les dimensions.

Item ANALYSE

Schema Workbench v3.0.3

Interface graphique sous Eclipse, permettant de concevoir l’interrogation d’un cube OLAP Mondrian

Public

MOE : Définition du cube, ajout de mesures pré calculées, export de la définition du cube en XML

Pré-requis

- JVM - Paramètres de connexion à la base de données - Langage SQL (pour la conception de requêtes) - Langage Java (pour affiner la conception) - Langage XML (pour comprendre le fichier « xml »

utilisé) - Langage MDX (pour la conception de la requête)

DESCRIPTION

- Schema Workbench est une application JAVA permettant de construire des cubes ROLAP Mondrian

o Définition et visualisation de la connexion, des mesures, des dimensions et des cubes o Ajout de colonnes pré calculées (manuelle) o Ajout de fonctions définis par l’utilisateur (manuelle) o Gestion de cubes virtuels permettant une limitation du périmètre de données observées. o Importation et exportation de cube Mondrian o Publication directement dans la plateforme Pentaho avec cette version

- Mis en œuvre par la MOE, demande des connaissances en base de données et en cube OLAP

o Connexion à la base et construction du cube

Licence CPL (Common Public License) v 1.0

Notes Anciennement appelé Jasper Workbench le projet est soutenu par Pentaho.

Ci-dessous une copie d’écran de l’interface de « Schema Workbench ». Des icônes permettent de positionner facilement les axes et mesures. Une fois l’outil connecté à la base relationnelle (ici PostgreSQL), celui-ci intègre automatiquement les méta données de la base, rendant disponibles dans l’interface les noms des tables physiques et leurs colonnes.

Ce document est sous licence GNU Free Documentation Licence. Page 29/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 30/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

5.2.2.2 Pentaho CubeDesigner Pentaho possédait sa propre interface de définition d’un cube ROLAP, « Pentaho Cube Designer ».

Item ANALYSE

Pentaho CubeDesigner v0.7.2.0

Interface graphique sous Eclipse, permettant de concevoir un cube OLAP Mondrian

Public

MOE : Construction du cube, publication du cube sur la plateforme ou export XML

Pré-requis

- JVM - Paramètres de connexion à la base de données - Langage SQL (pour la conception de requêtes) - Langage Java (pour affiner la conception) - Langage XML (pour comprendre le fichier « xml »

utilisé) - Langage MDX (pour la conception de la requête)

DESCRIPTION

- Pentaho CubeDesigner est un client lourd JAVA permettant de construire un cube ROLAP Mondrian.

Tout se regroupe en un gigantesque assistant de création de cubes simples o Gestion des jointures supplémentaires de façon transparente o Publication du cube directement dans la plateforme Pentaho ou export en fichier XML

- Exécution pour l’utilisateur final, demande des connaissances en base de données et en cube OLAP o Connexion à la base, choix des tables, créations des mesures et des dimensions, publication sur la plateforme

Pentaho

Licence NC

Notes Utilisation en mode « stand alone » sauf pour la publication Plus simple que Schema Workbench ou FreeAnalysis Schema Designer pour la création de cube OLAP Mondrian il est aussi plus limité. Ce projet a été abandonné au profit de « Schema Workbench » décrit plus haut.

Ce document est sous licence GNU Free Documentation Licence. Page 31/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

5.2.2.3 FreeAnalysis Schema designer Conçu par la société BPM Conseil « FreeAnalysis Schéma designer » assiste la démarche de définition des axes et des mesures du cube. Dédié principalement à leur plateforme BI Portal que nous illustrons plus bas il permet également d’exporter le schéma ainsi créé au format Mondrian (fichier XML). Notons également qu’une extension vers les cubes MOLAP est déjà prévue, mais non totalement implémentée actuellement.

Item ANALYSE

Free Analysis Schema Designer v0.80

Interface graphique sous Eclipse, permet de définir l’accès à un cube ROLAP ou MOLAP

Public

MOE : Construction du cube, ajout de mesures pré calculées, publication du cube sur la plateforme ou export XML

Pré-requis

- Client « lourd » supposant une JVM - Paramètres de connexion à la base de données - Langage XML (pour comprendre le fichier « fasd »

produit) - Langage MDX (pour édition de requête MDX

manuelle ex colonne calculé)

DESCRIPTION

- Free Analysis Schéma Designer est un client lourd JAVA permettant de construire un cube OLAP

o Définition et visualisation de la connexion, des mesures, des dimensions et des cubes o Ajout de colonnes pré calculées (assistant dédié) o Ajout d’agrégations sur les colonnes (assistant dédié) o Gestion des cubes virtuels o Importation et exportation de cube Mondrian o Publication du cube directement dans la plateforme FreeAnalysisWeb o Gestion des agrégations

- L’exécution par le concepteur, demande des connaissances en base de données et en cube OLAP o Connexion à la base, choix des tables, créations des dimensions et des mesures, enregistrement et publication

sur la plateforme BPM. o Possibilité de « drag and drop » pour certains éléments

Licence Free Analysis Schema Designer Public License (licence MPL avec des clauses supplémentaires)

Notes Utilisation en mode « stand alone » sauf pour la publication Plus conviviale que Workbench pour la création de cube OLAP Mondrian Certains éléments sont encore en phase de développement surtout concernant les cubes MOLAP.

Ce document est sous licence GNU Free Documentation Licence. Page 32/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ci dessous un exemple de l’interface de construction du cube

Ce document est sous licence GNU Free Documentation Licence. Page 33/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

5.2.2.4 FreeAnalysis Schema designer Web FreeAnalysis Schéma designer Web est le pendant web de « FreeAnalysis Schema Designer ». Cet outil est dédié à la plateforme BI Portal de BPM et permet de définir le schéma d’interrogation d’un cube Mondrian, puis de l’exporter dans le référentiel de la plateforme.

Item ANALYSE

Free Analysis Schema Designer Web

Interface graphique Web, permet la construction d’un cube ROLAP

Public

MOE : Construction du cube, ajout de mesures pré calculées, publication du cube sur la plateforme

Pré-requis

- Paramètres de connexion à la base de données - Langage XML (pour comprendre le fichier « fasd »

produit) - Langage MDX (pour édition de requête MDX

manuelle ex colonne calculé)

DESCRIPTION

- Free Analysis Schema Designer Web est le pendant Web du client lourd Free Analysis Schema Designer

o Définition et visualisation de la connexion, des mesures, des dimensions et des cubes o Publication du cube directement dans la plateforme FreeAnalysisWeb

- L’exécution par l’utilisateur final, demande des connaissances en base de données et en cube OLAP

o Connexion à la base, choix des tables, créations des dimensions et des mesures, publication sur la plateforme BPM.

o Drag and drop des dimensions et des mesures pour créer le cube

Licence NC

Notes Permet la définition du schéma d’accès à un cube Mondrian, depuis la plateforme FreeAnalysis

Ce document est sous licence GNU Free Documentation Licence. Page 34/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

5.2.3 Outillage d’interrogation et de restitution La solution « JRubik » permet, à l’instar des librairies JPivot en mode web, de présenter les axes et les dimensions d’analyse, afin que l’utilisateur puisse les combiner depuis une interface. L’outillage sert essentiellement à l’analyse, l’intégration dans un tableau de bord n’étant possible que suite à un export des données vers Excel. Une présentation graphique « simplifiée » permet une représentation des données plus synthétique. L’export de ce graphique se fait de la même manière que les données du cube travaillées par l’utilisateur. « FreeAnalysis » va plus loin et propose également l’ajout de colonnes calculées avec outre les opérateurs classiques les fonctions valeur absolue (« absolute »), moyenne (« average »), max et min disponibles.

5.2.3.1 JPivot Cette librairie permet d’extraire et de présenter les données d’une base relationnelle au travers d’une représentation sous forme de cube OLAP. La présentation se fait en mode web, intégrable dans un portail ou des pages dédiées.

Item ANALYSE

JPivot

Librairie java permettant l’accès aux données d’un cube ROLAP depuis une interface web

Public

Utilisateur : Extraire les données d’un cube OLAP au moyen de requête MDX

Pré-requis - Langage MDX (pour le requêtage manuel) - Navigateur Web

DESCRIPTION

- JPivot est une librairie Java permettant la connexion et l’interrogation d’un cube Mondrian

o A partir d’une définition d’accès à un cube existant o L’utilisateur dispose d’une interface web lui permettant d’effectuer des analyses sur les « mesures » définies

dans le « schéma XML » o Fonctions de choix des axes à afficher o Fonctions de slice et dice, drill down

Licence GPL

Notes L’interface est simplifiée et statique. Il y manque nativement quelques fonctions de type « tableur » (ajout de colonnes calculées). Malgré tout, cette interface est présente dans pratiquement toutes les solutions proposant les analyses de données sur cubes ROLAP.

Ce document est sous licence GNU Free Documentation Licence. Page 35/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 36/97

Ci-dessous une copie d’écran de données restituées sous forme de cube. On distingue les icônes permettant l’accès à la définition des axes à afficher, ainsi que les fonctions de graphes simplifiés. Les exports Excel permettent de compléter les informations produites par l’ajout de colonnes calculées.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

5.2.4 JRubik JRubik est une interface Java permettant la manipulation de données représentées sous forme de cube ROLAP. L’interface reprend la présentation offerte par JPivot, en ajoutant une ergonomie plus aboutie par la gestion d’onglets. Il devient possible d’avoir une représentation des données au format « tableur », complétée par la visualisation de la requête MDX générée.

Item ANALYSE

JRUBIK v0.9.4

Application permettant l’accès aux données d’un cube ROLAP depuis le poste de travail

Public Utilisateurs : Extraire les

données d’un cube OLAP au moyen de requête MDX

Pré-requis - JVM - Langage MDX (pour le requêtage manuel)

DESCRIPTION

- JRubik est une application Java autonome permettant la connexion et l’interrogation d’un cube Mondrian

o A partir d’un cube existant o L’utilisateur dispose d’une interface graphique lui permettant d’effectuer des analyses sur les « mesures »

définies dans le « schéma XML » o Fonctions de choix des axes à afficher o Fonctions de slice & dice, drill down

- La complexité réside dans l’installation et la mise en œuvre du cube Mondrian

Licence GPL

Notes Cet outil est le pendant « client lourd » des librairies JPivot vues plus haut. Nous ferons donc les mêmes remarques que celles indiquées alors.

Ce document est sous licence GNU Free Documentation Licence. Page 37/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 38/97

Ci-dessous, un exemple de mise en œuvre de l’application sur notre cube de données.

Les données fonctionnelles sont présentées dans la vue hiérarchique de gauche. Le choix des axes et mesures se fait par « glisser-déposer ». L’outil permet lui aussi un export graphique et sous Excel.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

5.2.5 FreeAnalysis FreeAnalysis est la solution développée par BPM Conseil pour accéder au cube. Nous avons vu précédemment l’outillage dédié « FreeAnalysis Schéma designer » de la solution. Il s’agit maintenant d’interroger le cube et de produire les analyses correspondantes.

Item ANALYSE

FreeAnalysis v1.25

Interface graphique sous Eclipse, permet d’interroger un cube

Public

Utilisateurs : Navigation dans le cube, « drag and drop » des dimensions, ajout de colonnes calculées, génération de graphes et export sous forme de rapports

Pré-requis - Client « lourd » supposant une JVM - Paramètres de connexion à la base de données - Langage MDX (pour édition de requête MDX

manuelle)

DESCRIPTION

- FreeAnalysis est un client lourd JAVA permettant de naviguer dans un cube OLAP

o Visualisation du cube, des mesures et des dimensions (assistant de connexion dédié) o Gestion des dimensions et des mesures en « drag and drop » o Filtrage des dimensions avant présentation des données du cube o Visualisation des dimensions sous forme d’organigramme o Edition de requêtes MDX manuelles o Gestion des graphes automatiques o Export sous forme de rapports aux formats HTML, PDF, Excel o Ajout des colonnes calculées mais limité en nombre de fonctions

- Exécution pour l’utilisateur final, ne demande aucune connaissance particulière. o Ouverture d’un fichier « *.freeanalysis » ou « *.fasd » mais aussi importation depuis le référentiel et accès direct

au cube et aux fonctionnalités

Licence Freeanalysis public License (licence MPL avec des clauses supplémentaires)

Notes Utilisation en mode « stand alone »

Ce document est sous licence GNU Free Documentation Licence. Page 39/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 40/97

Ci-dessous une copie d’écran réalisée sur la mise en œuvre de l’outil d’analyse sur notre définition de cube Mondrian :

On notera les accès immédiats aux grandes fonctionnalités au moyen d’icones dédiées.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

5.3 LA SOLUTION PALO Après avoir étudié les solutions pour le cube ROLAP Mondrian, nous abordons maintenant le cube MOLAP OpenSource « Palo ». Cette solution est éditée par la société allemande « JEDOX ». Rappelons ici que les cubes MOLAP permettent la représentation de données relationnelles, mises en forme spécifiquement pour répondre à une problématique d’analyse croisée sous plusieurs axes. Un cube MOLAP existe donc physiquement (à l’inverse d’un cube ROLAP qui n’est qu’une représentation fonctionnelle de données réelles) et nécessite une première étape de construction (par son alimentation).

Item ANALYSE

PALO OLAP Server v2.5

PALO est un cube MOLAP, optimisé pour une visualisation sous un tableur

Public

MOE : Agréger dans un cube MOLAP les données d’une base relationnelle, afin d’en permettre l’analyse en mode tableur.

Pré-requis - JVM - Serveur Windows ou Linux - XML (configuration des données à extraire)

DESCRIPTION

- PALO est un serveur de cube, optimisé pour un tableur. Il ne dispose donc pas d’outil de visualisation.

Pour ce faire, on utilisera « web-palo » et « Palo client » ou bien les plugins Excel et OpenOffice. o Le serveur étant installé, il doit être l’alimenté o Un ETL dédié est fourni avec la solution o Il est possible de mettre en œuvre des jobs Talend ou Kettle pour l’alimenter.

- Le serveur alimenté, on connectera les clients mentionnés pour produire les analyses.

Licence GPL

Notes Le serveur est sous licence GPL, mais pas le plugin Excel. La version 1.0 limitait l’usage à un seul utilisateur Pour rester dans le domaine OpenSource, il reste la solution du plugin OpenOffice.

Suite à l’installation du serveur, celui-ci doit être alimenté par extraction et mise en forme des données. Cette étape est assurée au choix par un ETL fourni par JEDOX ou par les ETL génériques Talend ou Kettle. Notons que cette étape structurante nécessite une bonne connaissance du cube attendu et produit. La documentation reste actuellement limitée, malgré la richesse fonctionnelle de la solution.

Ce document est sous licence GNU Free Documentation Licence. Page 41/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 42/97

5.3.1 Roadmap, évolutions futures Une des grandes originalités de cette solution OpenSource, réside dans sa fonction write back : L’utilisateur a la possibilité de renseigner ses propres valeurs dans le cube au croisement des occurrences d’axes qu’il a sélectionnées. Cela permet donc de mettre en perspective des valeurs prévisionnelles avec la réalisation de la société dans le temps. On pense donc naturellement au processus d’élaboration budgétaire. C’est d’ailleurs ce qu’affirme la société JEDOX, qui se positionne clairement sur cet aspect métier du contrôle de gestion. Enfin, La solution de JEDOX est utilisée par SAP pour l’élaboration du reporting sur les données gérées par l’ERP. JEDOX est donc devenu un « partenaire naturel » de SAP. Le cube se transforme alors en un cube HOLAP, permettant une première analyse sur les données agrégées dans un cube MOLAP, puis une analyse plus fine par accès direct aux données sources. Cet aspect est actuellement réservé à l’intégration dans SAP. Sa disponibilité en OpenSource ne nous a pas été communiquée La société JADOX travaille également sur une interface utilisateur pour la conception du processus d’alimentation. Cette évolution, ainsi que quelques autres sont attendues pour la fin de l’année 2008.

5.3.2 Mise en œuvre du serveur Ci-dessous un exemple de représentation graphique de l’extraction effectuée sous Talend Open Studio afin de répondre au besoin d’analyse de l’évolution des coûts de transports :

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 43/97

Une alternative à l’utilisation de Talend est de définir un « schéma d’alimentation », à l’instar du « schéma d’interrogation » produit au chapitre précédent pour le cube MONDRIAN. Le schéma d’alimentation produit va être mis en œuvre par l’ETL fournit par la société JEDOX. A son lancement, « ETL-client » va lire ce fichier d’extraction, se connecter à la base relationnelle et alimenter le cube PALO. L’alimentation peut être planifiée et ainsi alimenter le cube PALO. Cependant ce procédé nécessite de manipuler un fichier XML. L’évolution de la structure du cube impliquera une définition de plus en plus complexe par le fichier XML. La même fonctionnalité pourrait être obtenue plus aisément en utilisant les capacités d’alimentation de cubes PALO par les ETL KETTLE ou TALEND. L’outil « IMP :Palo » de la société Cubeware offre une interface utilisateur sous Windows, permettant l’accès aux données relationnelles, leur extraction et agrégation afin d’alimenter le cube MOLAP. Par contre, cet outil ne permet pas de produire un « schéma d’extraction » autonome. Les procédures d’alimentation devront être exécutées par cet outil. Schéma fonctionnel de l’ETL Client

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

5.3.3 Outillage d’interrogation et de simulation La société JEDOX fournit un plugin Excel avec le serveur PALO. Ce plugin est complété par un serveur de publication web de feuilles Excel compilées, accessibles ensuite depuis l’intranet de l’entreprise. Cette solution ne nécessite pas l’installation du plugin sur les postes utilisateurs. La société « Tensegrity Software GmbH » fournit un ensemble d’outils et une API, nécessaires à l’interrogation des cubes PALO. Cet ensemble est dénommé JPalo.

5.3.3.1 Plugin Excel et OpenOffice JEDOX fournit un plugin Excel, complément du tableur permettant l’extraction des données et leur mise en forme pour la production du rapport final. Il existe un plugin OpenSource pour le tableur de la suite OpenOffice Ces plugins permettent l’interrogation et la construction de rapport depuis un tableur.

Item ANALYSE

Plugins Excel et OpenOffice

Suite à l’installation des plugins dans les tableurs, il est possible de manipuler le cube PALO directement

Public

Utilisateurs : Analyse des données agrégées depuis un tableur Excel ou OpenOffice.

Ces outils permettent de produire des représentations graphiques depuis les données extraites

Pré-requis - Connaissance des tableurs

DESCRIPTION

- Depuis un tableur, permet alimenter les cellules avec les données agrégées présentes dans le cube.

o La gestion des droits est faite sur le serveur (voir outillage Eclipse décrit précédemment) o Poste de travail ou mode partagé (mode web)

- Après définition du login/mot de passe, l’utilisateur alimente les cellules depuis le cube o Possibilité de modifier les axes en utilisant les fonctions « copier-coller »

Licence Propriétaire pour le plugin Excel, GPL pour le plugin OpenOffice

Notes Les plugins ont le même usage et les mêmes propriétés Les limitations sont liées aux différences des tableurs La migration de Microsoft Office vers la suite OpenOffice est à étudier plus globalement que pour ce seul usage.

5.3.3.2 Palo Worksheet Server « Worksheet Server » est une solution de publication de documents Excel. Le serveur peut s’installer sous Linux comme sous Windows, et permet de publier les feuilles et classeurs produits sous Excel dans un intranet. L’installation sous Windows 2003 Server est simple.

Ce document est sous licence GNU Free Documentation Licence. Page 44/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 45/97

Lors du premier accès aux pages Excel compilées et déployées, il est nécessaire de définir les utilisateurs autorisés à y accéder. Ci-dessous un exemple d’analyse des marges, limitée à l’année 2007 pour les Pays-Bas. Il est possible de définir des zones modifiables par l’utilisateur, afin de permettre une prévision.

5.3.3.3 Excel Designer « Excel Designer » est la feuille Excel permettant la compilation (au format XML) du classeur Excel à publier. Suite à la compilation du classeur, le fichier XML généré sera déployé sur « Worksheet Server » pour permettre la visualisation et les analyses prévisionnelles. Le lien avec le serveur PALO, présent dans la feuille Excel, est conservé dans la page générée et publiée. La fonction « write back » est intégrée, permettant les analyses prévisionnelles.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

5.3.3.4 web-palo La société Tensegrity fournit « web-palo », interface web qui permet de visualiser mais aussi de modifier les données pour réaliser des simulations dans une vue du cube PALO. Cette interface permet aussi d’accéder à d’autres cubes accessibles par le protocole XMLA. On peut donc visualiser les cubes de SAP BW, de MS SQL Server 2000/2005 et de Mondrian.

Item ANALYSE

WEB-PALO v2.0

Permet la consultation en mode web des données agrégées dans le cube MOLAP Palo Server

Public

Utilisateurs : L’accès en mode web au serveur PALO permet la consultation et la modification (fonction « write-back ») des données

Pré-requis - Serveur TOMCAT - Serveur PALO - Navigateur internet

DESCRIPTION

- L’installation se compose d’une application java J2EE à déployer dans un serveur Tomcat

o Les droits d’accès à l’interface se configurent directement sur le serveur web o Les cubes (PALO, Mondrian, SAP ou Microsoft Analysis Services) peuvent être accédés o Le poste de travail ne nécessite qu’un navigateur pour accéder aux données

- Navigation dans le cube à partir de l’interface web o Permet de modifier les axes et les mesures d’analyse par simple « drag & drop »

Licence A clarifier par l’éditeur Tensegrity Software

Notes L’interface ne permet pas l’ajout de colonnes calculées à l’instar d’un véritable tableur Il est possible de modifier ou de filtrer les valeurs des cellules afin de faire des analyses prévisionnelles

Par « glisser-déposer », il est possible de modifier les axes d’analyse de nos coûts de transport. L’interface permet aussi (suivant les droits attribués à l’utilisateur connecté) de modifier les données affichées.

Ce document est sous licence GNU Free Documentation Licence. Page 46/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 47/97

5.3.3.5 Palo client La société Tensegrity fournit « Palo client », application sur plate-forme Eclipse permettant d’interroger les cubes PALO ainsi que les bases accessibles par le protocole XMLA, soit SAP BW, MS SQL Server 2000/2005 et Mondrian.

Item ANALYSE

PALO Client v2.0

Permet la consultation en mode « client lourd » des données agrégées dans un cube par le langage MDX

Public

Utilisateurs : L’accès au serveur PALO permet la consultation et la modification (fonction « write-back ») des données

Pré-requis - JVM - Serveur PALO

DESCRIPTION

- L’application réalisée se compose d’une application Eclipse

o Les cubes (PALO, Mondrian, SAP ou Microsoft Analysis Services) sont accessibles o Le poste de travail ne nécessite que l’installation d’une JVM

- Navigation dans le cube à partir de l’application o En accès « administrateur » permet de gérer les droits d’accès o Permet de modifier les axes et les mesures d’analyse par simple « drag & drop »

Licence A clarifier par l’éditeur Tensegrity Software

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 48/97

Item ANALYSE

Notes L’interface ne permet pas l’ajout de colonnes calculées à l’instar d’un véritable tableur Il est possible de modifier ou de filtrer les valeurs des cellules afin de faire des analyses prévisionnelles

On obtient une vue du cube, identique à sa visualisation en mode web :

5.3.3.6 Palo Java API La solution de Tensegrity est complétée par les API « Palo Java API » permettant le développement d’application Java.

5.3.3.7 myBIQ, solution de CPM « myBIQ » est une solution OpenSource dédiée aux cubes PALO pour l’élaboration budgétaire et plus vastement le CPM (Corporate Performance Management). Elle permet la consolidation de données et se présente sous forme de tableaux de bord adressables à une direction générale. La société éponyme fournit des cubes PALO pré structurés pour l’extraction des axes et indicateurs nécessaires dans une interface dédiée. Depuis celle-ci, il est alors possible de comparer des évolutions de marges, des volumes, des résultats de filiales, …. L’alimentation des cubes se fait au moyen de « Pentaho Data Integration », l’ETL anciennement nommé Kettle qui possède lui aussi un connecteur PALO.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

5.4 SYNTHESE DES CUBES OLAP Les deux familles de cubes ROLAP et MOLAP représentées par Mondrian et par Palo possèdent toutes deux leur propre outillage d’interrogation. Le choix de l’une ou l’autre solution doit être fait selon les besoins des utilisateurs finaux et la capacité d’intégration des équipes techniques. Pour Mondrian, un gros effort doit être fait par celles-ci pour appréhender les mécanismes de fonctionnement et d’intégration ainsi que l’écriture de schéma de description. Des solutions de modélisation de ces schémas existent, mais restent encore peu intuitives. On verra plus bas que « BPM Conseil » et « Pentaho » ont axé des efforts de développement dans ce sens. Pour Palo, l’effort se situe dans la création de scripts d’alimentation, l’usage étant simplifié par les interfaces, en mode web ou en mode tableur. Fonction majeure MONDRIAN (JPalo, JRubik) PALO (web-palo, plugins Excel et

OOffice)

Déclaration des sources de données, des axes et indicateurs, de colonnes calculées supplémentaires

La conception du « schema XML » se fait avec l’un des outils dédiés présentés plus haut.

La définition des sources de données se fait dans l’ETL utilisé. Soit fourni par Jedox, soit Talend ou Kettle.

Sécurité – gestion des accès aux données

Cette fonctionnalité n’existe pas dans les outils clients. Elle sera gérée par le portail et permettra de donner un accès à l’intégralité d’un cube.

Il est possible de définir le périmètre d’accès aux données à un utilisateur au moyen d’un cube virtuel. Ce dernier est un sous élément d’un cube sur un périmètre plus large, limité au choix des dimensions et des mesures.

Un cube virtuel ne peut actuellement pas proposer un sous-ensemble de données dans une dimension ou une mesure.

Un cube virtuel peut par contre proposer une vue agrégée de plusieurs cubes.

Les outils clients doivent se connecter au serveur Palo par identifiant/mot de passe limitant l’accès à un périmètre autorisé.

Mode de consolidation des indicateurs Les fonctions d’agrégation « sum », « count », « distinct-count », mathématiques « min », « max » et de statistiques « avg », sont disponibles.

Les fonctions d’agrégation « sum » et « count » sont disponibles

Gestion des dimensions récursives Cette fonctionnalité n’existe pas Cette fonctionnalité n’existe pas

Gestion avancée de la dimension temps Ces fonctions sont disponibles à condition d’être conçues à l’origine dans le cube lors de sa définition.

Par son ETL dédié, PALO propose un mode d’agrégation automatisé lors de l’extraction des données.

Elaboration d’un rapport Mise en forme succincte directement depuis les outils clients.

Peut être amélioré en passant par un tableur externe.

Aucune mise en forme par défaut. Doit être assurée par l’utilisateur après export dans un outil tiers (tableur, document texte)

Ce document est sous licence GNU Free Documentation Licence. Page 49/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Fonction majeure MONDRIAN (JPalo, JRubik) PALO (web-palo, plugins Excel et

OOffice)

Modalités d’alimentation full ou différentiel

Uniquement alimentation « full » dans la version 1.5 du serveur

Accès au détail Le détail est limité à la « profondeur » de l’extraction. Le serveur en version 1.5 n’accède jamais directement aux données de la base relationnelle. (sauf sur SAP depuis l’implémentation du connecteur)

Implémentation des normes XML/A ou MDX

Les deux modes sont disponibles :

soit le cube est interrogé directement en MDX,

soit on y accède au travers d’un webservice en XML/A

Le client « web-palo » utilise le protocole XML/A pour se connecter aux différents cubes, dont PALO.

Navigation (drill down, slice and dice) Fonctionnalité fournie par les clients JPivot, JRubik.

Fonctionnalité fournie par les clients et depuis un tableur.

Vision de l’information (Liste, Tableau croisé, Graphes à barre, radar, histogramme …)

Les outils clients proposent la représentation des données au moyen de quelques graphiques de base.

Aucune sortie possible depuis le client web.

Toutes les fonctionnalités offertes par les tableurs Excel et OOffice sont disponibles.

Filtre, couche L’outillage client propose l’application de filtres

L’outillage client propose l’application de filtres

Ajout de calcul Uniquement lors de la définition du schéma d’un cube. Pas à l’usage, sauf si l’utilisateur l’exporte dans Excel (il perd cependant le côté dynamique de la consultation)

Fonctionnalité des tableurs

Mise en forme de rapports Simplifiée depuis JPivot

Ce document est sous licence GNU Free Documentation Licence. Page 50/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

6 LES SOLUTIONS SPECIFIQUES DE PILOTAGE Les tableaux de bord permettent à une direction métier d’avoir accès à des données totalement agrégées, lui présentant des tendances, des écarts par rapport aux objectifs fixés. Suite à la remontée de ces indicateurs, une analyse plus fine pourra être élaborée par des opérationnels plus impliqués localement. Les mots clés rencontrés dans cette forme de reporting sont « KPI » (Key Performance Indicators), « dashboards », « tableaux de bord synthétiques ». Dans les plateformes SpagoBI, JasperServer et Pentaho décrites au chapitre suivant, des tableaux de bord synthétiques sont implémentés au moyen de développements spécifiques. Pentaho propose ainsi des pages JSP configurées au moyen de fichiers en XML. SpagoBI produit des tableaux de bord en flash à partir de script « groovy » JasperServer dans sa version Pro intègre un designer de dashboard dynamique interne au portail facilitant la mise en place de ceux-ci. BPM Conseil propose une solution dédiée au suivi des indicateurs clés. On se reportera avec intérêt au chapitre présentant cette plateforme et son outil dédié aux KPI, « FreeMetrics ». Ces solutions ne comportent pas d’outillage dédié à la production de tableau de bord. L’outillage dédié est obtenu par la mise en œuvre des outils OpenI ou de MarvelIT. BPM Conseil propose un outil dédié à la gestion des KPI, solution la plus aboutie actuellement en OpenSource dans ce domaine. MarvelIT est une solution volontairement simplifiée, n’ayant pas d’autre fonction que de remonter des données synthétiques sous forme de graphiques, à des utilisateurs qui ne souhaitent pas connaître le détail des données. OpenI va plus loin en présentant les résultats de requêtes XMLA sous forme de graphiques. L’utilisateur pourra également poursuivre l’analyse grâce à JPivot. Pour une plateforme plus complète, il faudra mettre en œuvre les solutions décrites au chapitre 7

Ce document est sous licence GNU Free Documentation Licence. Page 51/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 52/97

6.1 MARVELIT MarvelIT est une société américaine basée sur la côte ouest d’Amérique du Nord, à Poway non loin de San Diego. Elle édite une solution Open Source qui permet depuis une interface web, de consulter des tableaux de bord sous forme de graphique. Les graphismes peuvent être imbriqués, permettant ainsi une navigation au travers des données agrégées graphiquement. Les graphes sont basés sur JasperReport/JFreeReport et permettent les types de restitution compris dans la librairie.

Dans le graphe de gauche présenté en exemple, la jauge illustre que le volume de marge, indicateur stratégique, est en avance par rapport aux objectifs. Dans le graphe de droite présenté en exemple, les volumes de ventes sont répartis par tranches d’âge. Il est possible, en cliquant sur un segment en couleur, d’obtenir un nouveau graphique présentant, pour cette tranche d’âge, la répartition des produits vendus en sous catégories. Les utilisateurs finaux n’ont accès qu’à une visualisation et à la navigation au travers des graphiques.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

A un autre niveau d’utilisation, il est possible de changer de base de données, permettant ainsi de produire des comparaisons d’indicateurs sur des SID (Système d’information décisionnel) différents. Pour les développeurs, tous les paramètres de configuration sont accessibles en mode web, une fonctionnalité fort appréciée pour la maintenance et le développement. Cela permet d’éviter l’accès direct au serveur, nécessaire à la modification des divers fichiers de configuration au format XML.

Item PILOTAGE

Dash v2.12

Présentation graphique d’indicateurs

Public

Utilisateurs : Accès à des données agrégées, présentées sous forme de graphiques

Pré-requis - Plate forme Tomcat 5 - Langage SQL

DESCRIPTION

- La solution repose sur un portail de type JSR168, permettant la gestion de portlets

o Déploiement de l’archive sur le portail o Définition des formats graphiques et des requêtes d’extraction des données nécessaires o Administration simplifiée directement depuis les portlets

- Utilisation o Accès en mode web aux indicateurs et graphiques o Couvre les besoins de reporting synthétique o Semblable à un reporting de masse, accessible à la demande en mode web

Licence GPL

Notes Parmi les évolutions attendues, il y a le portage sur les autres portails JSR 168 tels que Liferay et WebSphere. Il manque à la solution, une capacité d’export vers le format PDF ou HTML afin de permettre l’impression des graphiques souhaités.

6.1.1 « Roadmap », évolutions futures Les évolutions prévues intègrent une interface de configuration des rapports, qui se formatent actuellement avec du code « xml » saisi manuellement. Il est prévu également d’utiliser d’autres moteurs de rendu graphique que JFreeChart utilisé actuellement. Les développeurs ont également prévus de valider l’intégration de MarvelIT avec tous les portails compatibles à la norme JSR168. Enfin, MarvelIT a prévu de créer une version payante, sans faire disparaître toutefois la version librement téléchargeable.

6.1.2 Outils disponibles dans la plateforme Les outils « JasperReport » et « JFreeChart » sont les composants techniques de la solution. Pour aller plus loin, voir leur analyse individuelle en supra.

Ce document est sous licence GNU Free Documentation Licence. Page 53/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

6.2 OPENI « OpenI » est une solution légère, facilement déployable sous Tomcat ou JBoss, pour peu que l’on sache administrer ce type de serveur. L’objectif de la solution est de présenter un portail simplifié, présentant les résultats de requêtes XMLA (accès aux données du cube Mondrian ou Microsoft Analysis Services) sous forme de graphiques dans la page d’accueil de l’utilisateur. Un « clic » sur un graphique permet d’accéder aux données extraites du cube et de poursuivre l’analyse grâce à JPivot. La gestion des utilisateurs se fait au moyen des « projets », pour lesquels deux profils sont définis, l’administrateur du projet qui pourra gérer les sources de données et les utilisateurs, l’autre profil concernant les utilisateurs. Un « super administrateur » permet de gérer l’ajout, la suppression des projets.

Item PILOTAGE

OPENI v2.0

Présentation graphique d’analyses sur hyper cubes

Public

Utilisateurs : Présentation graphique des résultats de requêtes XMLA

Pré-requis - Plate forme Tomcat 5 - Langage SQL - Langage XMLA - Langage XML

DESCRIPTION

- La solution repose sur un portail de type JSR168, présentant les résultats de requêtes XMLA sur les hyper cubes

implémentant cette technologie : o SAP o Mondrian o Microsoft Analysis Services

- Utilisation o Accès en mode web aux résultats graphiques o Par sélection, accès aux données et à un navigateur JPivot pour parcourir l’ensemble des données remontées

Licence Licence OPLv1.0 (Licence Mozilla adaptée par la société Loyalty Matrix )

Notes Projet « à surveiller », qui redémarre suite à une longue période d’inactivité.

Le projet « OpenI » a été lancé en 2005. Sponsorisé par la société « Loyalty Matrix », il a été repris par la société « Responsys » lors de l’absorption de la société à l’origine du projet. En aout 2008, le projet reprend après une année d’interruption. A noter que ce projet est la première intégration de JPivot avec Mondrian. De part sa « simplicité », il reste une solution simple et élégante, mais malgré tout limitée à la restitution de données extraites d’un cube OLAP.

Ce document est sous licence GNU Free Documentation Licence. Page 54/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 55/97

Ci-dessous une copie d’écran de l’interface de visualisation d’un cube Mondrian depuis la plateforme.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 56/97

L’onglet « chart » permet d’avoir accès à une représentation graphique de l’extraction de données souhaitée par l’utilisateur.

6.2.1 Outils disponibles dans la plateforme Les outils « JasperReport », « JFreeChart » et « JPivot » sont les composants techniques de la solution. Pour aller plus loin, voir leur analyse individuelle en supra.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

6.3 SYNTHESE DES TABLEAUX DE BORD Les solutions proposée par MarvelIT et d’OpenI se différencient dans les besoins qu’elles adressent et les solutions qu’elles proposent. MarvelIT s’est surtout intéressée aux « dashboards » permettant d’obtenir des graphiques imbriqués dynamiquement ou l’accès aux données sous jacentes aux représentations. Le principal intérêt de cette solution est sa légèreté. Son autre avantage est de simplifier la création de ce type de rapports, complexes sous Pentaho ou SpagoBI. OpenI propose une solution simple d’accès aux cubes OLAP grâce au langage XMLA. L’émergence du langage JBDC4Olap remettra peut être en cause l’intérêt pour cette solution légère. On verra plus bas que BPM Conseil propose un outil dédié à la gestion des KPI « FreeMetrics ». On a vu que les autres solutions ne proposent pas la gestion de workflow autour des indicateurs, ni de créer des alertes en cas d’atteinte d’un seuil.

Ce document est sous licence GNU Free Documentation Licence. Page 57/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7 LES SUITES BI OPENSOURCE - INDUSTRIALISER LES SID Les Systèmes d’Informations Décisionnelles (abrégées SID) seront industrialisés au moyen de plateforme. Ces solutions complètent les outils vus précédemment individuellement ou les portails dédiés aux « dashboards ». Elles sont plus lourdes à mettre en œuvre mais permettent une industrialisation de la production et de la consommation. L’accès aux différents outils et aux périmètres de données peut être défini par utilisateur ou par groupes utilisateurs. L’accès à la plateforme s’intègre généralement dans un processus d’authentification partagé par d’autres applications permettant ainsi l’implémentation du SSO. La plateforme comprendra souvent une interface de gestion de l’ETL, la configuration d’accès aux données, le paramétrage des destinataires avec la mise en place de tâches planifiées.

Les plateformes s’articulent autour de portails permettant une centralisation des accès et un niveau plus fin de définition des périmètres de données accédées. Le portail peut s’intégrer dans l’intranet de l’entreprise et permettre un accès centralisé aux différentes applications web.

Les accès centralisés rendent possible la gestion du SSO et agrègent des outils complémentaires à la conception et la production de rapports. Représentation des données au travers d’une couche d’abstraction permettant la conception de reporting « adhoc » Planification de la production des rapports, indépendamment des mécanismes de planification de l’infrastructure.

La consommation des rapports passant par une interface centralisée, le suivi de cette consommation pourra être mesuré. Cela renseignera les équipes techniques sur l’usage des outils et pourra permettre la mise en place d’une facturation sur le volume consommé.

Ce document est sous licence GNU Free Documentation Licence. Page 58/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.1 LA SUITE PENTAHO Pentaho est une plateforme BI, éditée par la société éponyme basée à Orlando, créée par des consultants ayant évolués précédemment autour des solutions BI proposées par IBM, Business Objects, Oracle, Cognos, SAS et Hyperion. La plateforme regroupe les briques OpenSource nécessaires à l’extraction des données (ETL par Kettle), leur mise en forme et leur restitution.

Item INDUSTRIALISER

PENTAHO v1.7.0

La plate forme Pentaho permet d’agréger les outils BI de restitution et d’analyse exposés plus haut. Elle permet nativement de définir les accès aux bases de données pour JFreeReport et de permettre la planification et l’envoi de rapport. Pour les autres types de rapport, quelques fichiers de configuration restent à modifier.

Public

MOE : Gestion des accès, répartition en profils « concepteur » ou « utilisateur »

Planification de la diffusion des rapports pré paramétrés

Utilisateurs : Conception simplifiée de rapports pré paramétrés

Conception de rapports « ad-hoc »

Analyse par JPivot de cubes ROLAP Mondrian

Pré-requis - JVM - Serveur Tomcat ou JBoss - Mécanisme d’authentification centralisé (LDAP,

lemonLDAP,…)

DESCRIPTION

- A partir d’un seul environnement web, avoir accès aux composants BI les plus aboutis :

o Dans l’extraction des données (pilotage de Kettle) o Dans la conception et la production de rapports o Dans l’analyse des données en ROLAP (Mondrian) o Dans l’exécution d’algorithmes de data mining (Weka)

Licence

Pentaho BI Platform -> GPLv2 Pentaho Data Integration (Kettle) -> LGPL JFreeReport -> LGPL Pentaho Analysis Services (Mondrian) -> CPL Pentaho Data Mining (WEKA) -> GPL

Notes Utilise le portail JBoss Portal essentiellement

Ce document est sous licence GNU Free Documentation Licence. Page 59/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.1.1 Intégration dans un portail La plateforme Pentaho est nativement intégrée dans « JBoss Portal ». Une intégration dans « Liferay », autre portail répondant à la norme JSR168 existe apparemment, mais sans documentation explicite de mise en œuvre.

7.1.2 Gestion des accès et des utilisateurs Les utilisateurs sont répartis en deux groupes de « concepteurs » et d’ « utilisateurs ». L’authentification se fait directement dans la plateforme Pentaho, sans reposer sur les fonctionnalités apportées par le portail. Dans la version commerciale, il est fourni une console d’administration des utilisateurs. En mode « Communauté », la gestion se fait au moyen d’un fichier de configuration.

7.1.3 Outillage dédié

7.1.3.1 Conception de rapports La conception de rapport se fait depuis une interface graphique dédiée, « Pentaho Report Designer ».

Item CONCEPTION

Pentaho Report Designer v1.7.0

Client Java permettant la conception graphique d’un rapport de type JFreeReport pour Pentaho. Produit un fichier de description au format « *.report » ou « *.xaction + *.xml »

Public

MOE : Permet la conception de reporting généré par les librairies JFreeReport

Pré-requis

- Client « lourd » supposant une JVM - Paramètres de connexion à la base de données - Langage SQL (pour la conception de requêtes) - Langage Java (pour affiner la conception) - Langage XML (pour comprendre les fichiers « xml

», « report », « xaction » produit)

DESCRIPTION

- Interface graphique sous Java, indépendante de la plate forme. Elle produit un fichier de type « *.report » (résultat de

l’agrégation d’un fichier « *.xaction » et d’un fichier « xml ») o Interface simpliste o Positionnement des éléments en X-Y o Mode visualisation permettant de pré visualiser le rapport final sous plusieurs formats o Publication direct sur la plateforme Pentaho

- Conception en mode « drag & drop » o Les outils et les champs de formats différents se glissent et se déposent sur la page de conception o La définition de la connexion à la base de données est interne au fichier de conception produit

Licence MPL (Mozilla Public License) v1.1

Ce document est sous licence GNU Free Documentation Licence. Page 60/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 61/97

Item CONCEPTION

Notes

Les paramètres de connexion à la base de données sont internes à la définition du rapport dans le fichier report ou xaction. Les images ne sont pas intégrées dans le « report » ou dans le « xaction » (chemin indiqué dans le fichier) Production des graphes gérée par la librairie JFreeChart sous licence LGPL

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.1.3.2 Conception des fichiers « xaction » Les fichiers « xaction » vont compléter les fichiers de définition du format et des données du rapport à produire. Le fichier « xaction » contient en effet des actions qui vont se dérouler lors de la création du rapport. On peut alors voir ce dernier comme un « patron » décrit dans le « xml », complété lors de sa génération par des éléments provenant d’une extraction de données, réalisées avant la diffusion. Pentaho Design Studio est l’environnement de « développement » de Pentaho. Cet outil permettra la mise en place complète des actions à effectuer via la configuration avancée des fichiers « xaction ». Item ENVIRONNEMENT DE DEVELOPPEMENT

Pentaho Design Studio 1.7.0

Interface graphique sous Eclipse, permet la configuration avancée des fichiers « xaction »

Public

MOE : Configuration des actions à effectuer, paramétrage avancée des éléments à exécuter

Pré-requis

- Client « lourd » supposant une JVM - Paramètres de connexion à la base de données - Langage SQL (pour le requêtage SQL) - Langage JavaScript (pour affiner la conception) - Langage MDX (pour le requêtage MDX) - Langage XML (pour comprendre le fichier «

xaction »)

DESCRIPTION

- Suite à l’accès à la liste des éléments du serveur :

o Visualisation de l’ensemble des fichiers et plus particulièrement des fichiers « xaction » paramétrable au travers de quatre onglets

Onglet « General », première phase du paramétrage permet de donner entre autre un titre, une description, une icône et de gérer le niveau de log

Onglet « Define Process », cœur de la configuration du « xaction ». Permet de gérer les valeurs d’entrées sorties, le paramétrage et la succession des processus ainsi que la planification et l’envoi de masse.

Onglet « XML Source », permet de visualiser le contenu du fichier XML paramétré. La modification manuelle du fichier dans cet onglet est possible.

Onglet « Test », permet de tester le processus créé - Aspect MOE :

o Solution nécessitant une bonne connaissance de l’outil et du mécanisme des fichiers « xaction »

Licence EPL

Notes Outil très complet permettant un paramétrage très poussé des actions au sein de la plateforme Pentaho.

Ce document est sous licence GNU Free Documentation Licence. Page 62/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 63/97

Ci dessous un exemple de l’interface de configuration des fichiers « xaction »

Cette fonctionnalité est employée lors de la « diffusion de masse » permettant ainsi de redéfinir le périmètre d’une requête selon le profil d’un utilisateur. Cela permet aussi de personnaliser le rapport définitif avec un entête, un pays … selon le destinataire. On retrouvera ces fichiers « xaction » dans toutes les formes de reporting gérées par Pentaho. Pour compléter les méthodes qu’il contient, il est nécessaire d’utiliser le client lourd « Designer Studio ». Les fichiers produits au format « xml » décrivent divers actions telles que la planification, les requêtes à produire lors de la mise en œuvre, la personnalisation. Il est ainsi possible de définir un seul rapport, puis de le diffuser à différents utilisateurs, chacun de ceux-ci recevant par mail un rapport executé sur un périmètre de données différent. On planifiera l’exécution du fichier « xaction », qui comprendra par exemple, à partir d’un rapport générique :

► Extraction des données spécifiques au destinataire ► Intégration de ces données dans le rapport ► Ajout d’une personnalisation par un entête ► Diffusion ► Prise en compte d’un nouveau destinataire, retour à l’étape 1

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 64/97

Schématisation des composants mis en œuvre dans la production du fichier « xaction »

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 65/97

7.1.4 Rapports « ad hoc » La conception des rapports « ad hoc » depuis la plateforme met en œuvre la solution dédiée « AdHoc Reporting ». Un outil dédié et externe à la plateforme « Pentaho Metadata Editor » permet aussi cette conception. Nous le détaillerons par la suite, dans le chapitre des outils complémentaires offerts par la suite Pentaho.

Dans un premier temps, l’interface permet la visualisation des vues métiers disponibles, puis le choix parmi des gabarits de présentation. La construction de ces gabarits est réalisée via des fichiers XML et AdHoc Reporting ne propose qu’une restitution sous forme de liste. A l ‘étape suivante (sélection des objets) la visualisation des champs fonctionnels des différentes tables permet de sélectionner les colonnes à croiser entre elle afin d’extraire les données à mesurer. Il est possible de choisir les colonnes de regroupement, les colonnes du corps du rapport, les colonnes qui ne seront utilisées que pour le filtrage de données au moyen d’un glisser déposer ou d’une affectation par icônes (flèches).

L’étape personnalisation donne accès à un panel d’éléments dédiés à chaque champ en fonction de leur type.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Outre la fonction de comptage propre à tous types de champs, les champs de type date bénéficient de quatre différents formats. Les champs numériques sont complétés par des fonctions de calcul et de statistiques telles que « somme », « minimum », « maximum » et « moyenne ». Il est également possible d’ajouter des contraintes sur les colonnes visualisables et sur les colonnes de filtrage ainsi que de faire des classements par ordres croissants ou décroissants. La dernière étape de personnalisation est la première phase de l’étape de mise en page permettant de choisir un alignement spécifique pour chaque champ. La mise en page en elle même regroupe les options suivantes:

Orientations en mode portrait ou paysage Description du rapport Gestion de l’en-tête et pied de page

Par un bouton accessible, on peut générer le rapport définit pour valider son aspect et son contenu. Plusieurs formats d’exportations sont disponibles :

PDF HTML Excel CSV

L’enregistrement du rapport se fait dans une des rubriques de la plateforme Pentaho. Les utilisateurs autorisés peuvent ensuite le générer directement ou l’éditer pour modifications, suivant leurs droits attribués.

Ce document est sous licence GNU Free Documentation Licence. Page 66/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.1.5 Outils disponibles dans la plateforme Les outils « JasperReport », « Birt », « JPivot » et « Mondrian » sont les composants techniques de la solution. Pour aller plus loin, voir leur analyse individuelle en supra. Elle intègre de plus les composants « Weka » pour le datamining et « Quartz » pour la planification. L’étude de ces composants n’est pas réalisée dans ce livre blanc.

7.1.6 Outils complémentaires Kettel est intégré dans la plate forme. Ceci permet d’en gérer les tâches directement dans l’environnement BI.

7.1.6.1 Pentaho Metadata Editor L’outil « Pentaho Metadata Editor » permet de configurer les « vues métiers » nécessaires au reporting Ad Hoc de Pentaho. Un utilisateur « technique » ayant les droits d’accès aux données physiques, élabore des sous ensemble de données fonctionnelles. Cette conception se fait, suite à la définition de la connexion ainsi qu’après avoir renommé les champs techniques en champs fonctionnels, par glisser/déposer dans l’espace de travail. Item CONCEPTION DE VUES METIER

Pentaho Metadata Editor 1.7.0

Conception graphique des vues métier

Public MOE : Conception de

vues métier, pour mise à disposition d’utilisateurs

Pré-requis - JVM - Accès aux données physiques - Langage SQL

DESCRIPTION

- Depuis une interface graphique

o L’utilisateur se connecte à plusieurs sources de données o Les vues sont nommées fonctionnellement o Un descripteur « xmi» est généré, contenant les paramètres de connexion aux bases, les données à extraire et

le nom fonctionnel à employer. o Il est possible d’ajouter un filtrage des données pour restreindre le périmètre suivant l’utilisateur.

- Solution simple à mettre en œuvre. o Le déploiement se fait par remplacement du précédent fichier de configuration de la plateforme pour une mise à

disposition automatique. Le redémarrage n’est pas nécessaire mais il faudra disposer des droits d’administration pour rafraîchir la configuration.

Licence MPL

Notes La vue métier produite peut être directement déployée dans la plateforme Pentaho

Ce document est sous licence GNU Free Documentation Licence. Page 67/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 68/97

Ci dessous un exemple de l’interface de définition des metadatas

7.1.7 « Roadmap », évolutions futures En fin d’année 2008, il est prévu par l’éditeur que le développement de Pentaho intègre la conception d’interfaces orientées utilisateur pour la conception de reporting « ad hoc », sans compétence SQL. Plusieurs sources de données différentes devraient aussi pouvoir être intégrées dans le même rapport (voir plus haut les limitations de JasperReport sur ce point). Pour les équipes techniques, il est aussi prévu des interfaces plus évoluées permettant la conception plus aisée de vues métiers et de « dashboard ». Concernant l’administration, les cubes OLAP ne sont pas oubliés car ils devraient être plus facilement déployés et interrogeables dans les futurs versions. Toutes ces évolutions sont indiquées par Pentaho, sans précision sur la date de sortie.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.2 LA SUITE SPAGOBI SpagoBI est édité par la SSII italienne « Engineering Ingegneria Informatica » basée à Milan. La solution se présente comme l’agrégation de composants BI et groupware sur le middleware Spago. Cette solution présente l’avantage d’être totalement LGPL et de s’affranchir d’un portail particulier. On peut ainsi déployer la solution sur Liferay, eXoPortal, JBoss Portal. Elle intègre une gestion des droits utilisateurs évoluée, comprenant les développeurs, les testeurs et les utilisateurs finaux (voir § 7.2.2) Les documents (reporting, dashboard, …) peuvent être versionnés en attendant une validation de leur publication.

Item INDUSTRIALISER

SpagoBI v1.94

La démarche de la société EII est d’agréger des composants BI sur leur middleware SpagoBI

Public

MOE : Gestion des accès, répartition en profils « concepteur », « testeur » ou « utilisateur »

Planification de la diffusion des rapports pré paramétrés

Utilisateurs : permet - l’analyse OLAP, - la visualisation de rapports pré paramétrés,

- la construction de reporting adhoc

Pré-requis - JVM - Compétences Java, J2EE - Langage XML (pour configuration) - Langage SQL (pour conception des rapports)

DESCRIPTION

- A partir d’un seul environnement web, avoir accès aux composants BI les plus aboutis :

o Dans l’extraction des données (pilotage de Talend) o Dans la conception et la production de rapports o Dans l’analyse des données en ROLAP (Mondrian) o Dans l’exécution d’algorithmes de data mining (Weka)

Licence LGPL

Notes SpagoBI se présente comme une interface BI intégrant le meilleur des composants de la communauté. Le versionning et la gestion avancée des utilisateurs est un plus La « non adhérence » à un portail spécifique rend cette solution plus souple dans son intégration à un existant.

Ce document est sous licence GNU Free Documentation Licence. Page 69/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.2.1 Portail SpagoBI peut s’intégrer dans un portail d’entreprise répondant aux normes JSR 168 (intégration des applicatifs BI dans des « portlets », permettant la customisation poussée de l’interface utilisateur.)

7.2.2 Gestion des accès et des utilisateurs SpagoBI propose trois niveaux d’utilisateurs, « développeurs », « testeurs » et « utilisateurs ». Ceci permet de concevoir et de tester des rapports, en incluant la gestion de numéros de version dans les documents en cours de validation et/ou de développement. L’authentification se fait dans le portail, avec « mapping » de l’utilisateur et de son rôle dans la plateforme. Ceci permet un point d’authentification unique pour toutes les applications intégrées dans le portail et de s’appuyer sur un mécanisme validé et déporté.

7.2.3 Outillage dédié « QBE » (acronyme de Query By Example) est l’outillage spécifique à SpagoBI. Il permet la conception de reporting « adhoc ». L’outillage « QBE » (Query By Example) a pour objectif de permettre à un utilisateur non technique de générer une requête. Suite à la sélection des données, l’outil génère un rapport sous forme de tableau uniquement. L’interface de QBE se compose de différents onglets regroupant les fonctionnalités suivantes :

Sélection des champs Gestion des conditions Gestion des classements Gestion des regroupements Visualiser la requête Sauvegarder la requête Exécuter la requête Générer un template

Outre la sélection des champs qui s’effectue en un simple clic sur chacun d’eux, SpagoBI introduit un mécanisme de visualisation des champs permettant de valider fonctionnellement les données extraites.

Ce document est sous licence GNU Free Documentation Licence. Page 70/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 71/97

Là où Pentaho dissocie chaque table, SpagoBI permet de visualiser les données de la « table de fait » et d’avoir accès aux données de chaque table liée. L’accès (non recommandé) aux tables unitaires reste possible néanmoins au moyen de jointures. Lorsque la sélection des champs est effectuée, on peut ensuite :

Attribuer à chaque champ des fonctions de calcul et de statistiques tels que : Somme, Minimum, Maximum et Moyenne.

Renommer les champs Utiliser le mot clé « distinct » (langage SQL) Changer leur positionnement

Dans la gestion des conditions tous les champs sont accessibles afin d’effectuer des filtrages ou des jointures si cela est nécessaire. Le tri sur les colonnes sélectionnées peut se faire en ordre croissant ou décroissant. La gestion des regroupements (mot clé « group by » en langage SQL) ne sera réellement nécessaire que si il existe des fonctions de calcul affectés à certaines colonnes. La partie « visualisation de la requête » permet de visualiser la requête mais aussi de l’éditer manuellement pour des profils techniques connaissant le langage SQL. Le mode « par défaut » utilise la requête générée automatiquement, le mode expert permet d’éditer la gérée et de la modifier. La sauvegarde de la requête permet de l’éditer ultérieurement au sein de QBE. La partie « exécuter » de la requête donne un aperçu du rendu final de la requête.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

L’export est possible suivant les formats suivants :

PDF HTML Excel CSV RTF XML TXT

La dernière option est la création d’une vue. Cette vue regroupe l’ensemble des champs sélectionnés et est accessible dans l’arborescence de l’onglet « Sélection des champs ». Elle peut être utilisée pour générer d’autres rapports. Le menu de génération des template permet de visualiser le rapport en PDF et de le sauvegarder sous forme de fichier « jrxml ». Ceci permet une éventuelle reprise sous iReport. SpagoBI n’intègre pas la gestion de multiple template comme Pentaho. La configuration du seul template disponible se fait directement en XML et est réservée aux utilisateurs « experts ».

Ce document est sous licence GNU Free Documentation Licence. Page 72/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.2.4 Outils disponibles dans la plateforme Les outils « JasperReport », « Birt », « JPivot » et « Mondrian » sont les composants techniques de la solution. Pour aller plus loin, voir leur analyse individuelle en supra. Elle intègre de plus les composants « Weka » pour le datamining et « Quartz » pour la planification. L’étude de ces composants n’est pas réalisée dans ce livre blanc.

7.2.5 « Roadmap », évolutions futures La version 2.0 est diffusée en version Alpha depuis la mi mai 2008 et met en avant une ergonomie améliorée, ainsi qu’une simplification d’accès aux fonctions. Du coté des nouveautés on notera : Item Nouveautés

Architecture Certification Exo WebOS et Liferay

Certification JSR 168 / 286

Utilisation de SpagoBI comme une application Web non intégrée à un portail

Serveur QbE Multi-schema

Gestion des Alertes

Moteur de recherche

Nouveau moteur GEO

Intégration de FreeAnalysis

Intégration de PALO/JPALO

Nouveau dashboards

Support de KPIs/Scorecards

Nouveau moteur de Data Mining

Outillage externe SpagoBI Studio (plateforme de gestion et de déploiement de document BI)

SpagoBI Meta (constructeur de Meta données)

SpagoBI SDK

Ce document est sous licence GNU Free Documentation Licence. Page 73/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.3 LA SUITE JASPER SERVER La plateforme JasperServer est architecturée autour des librairies JasperReport. Elle offre la configuration nécessaire (voir § 4.1.1.2 et la configuration externe d’accès aux bases de données) à la production d’un rapport. Une gestion des accès et des périmètres utilisateurs est également implémentée. Il est possible de déployer directement sur la plateforme les rapports conçus sous iReport. C’est une plateforme dédiée à la gestion et à la production de rapports JasperReport, ainsi qu’à la gestion des cubes OLAP Mondrian avec JPivot. Cette plateforme n’intègre pas de capacité de datamining.

Item INDUSTRIALISER

JASPER SERVER v3.0

Plateforme décisionnelle permettant la conception et la visualisation de rapports JasperReport exclusivement.

Public

MOE : Conception de rapports depuis la plateforme en version Pro

Conception de « dashboard » en version Pro Utilisateurs : Visualiser des rapports JasperReport. Visualisation de cubes OLAP

Visualisation de « dashboard »

Pré-requis - Tomcat, JBoss - Navigateur web

DESCRIPTION

- Solution intégrée permettant la mise à disposition centralisée de rapport JasperReport

o Accès simplifié par périmètre accessible par utilisateur

- Après authentification o L’utilisateur peut créer (version Pro) des rapports ou des dashboard o Chaque utilisateur accède à ses propres tableaux de bord

Licence Deux types de licence. Une version « communauté », en GPL et une version commerciale.

Notes La solution n’intègre pas d’outil de datamining Les rapports sont limités au format JasperReport

Ce document est sous licence GNU Free Documentation Licence. Page 74/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.3.1 Portail Le portail adopté est dédié à la plateforme. Il n’intègre pas la norme JSR 168, ce qui ne permet pas d’utiliser les composants dans les « portlets » d’un autre portail. Il existe un « plug in » d’intégration à LifeRay dans la version pro.

7.3.2 Gestion des accès et des utilisateurs La gestion des utilisateurs se fait depuis la plateforme. Les utilisateurs peuvent être associés à cinq groupes différents qui définissent les droits d’accès suivants :

• No access • Admin • Read Only • Delete + Read • Write + Delete + Read

Il est également possible d’octroyer ces droits directement à un utilisateur ce qui permet une administration plus fine des accès.

7.3.3 Outillage dédié « Ad Hoc editor » est l’outil dédié à la conception de rapports par des utilisateurs ne possédant pas de connaissance du langage SQL. Cet outillage est réservé à la solution commerciale.

Item CONCEPTION

ADHOC Editor

Outil web de conception de reporting « adhoc » sur la plateforme commerciale

Public Utilisateurs : Permet la

conception de rapports « adhoc »

Pré-requis - Tomcat, JBoss - Navigateur web

DESCRIPTION

- Par « glisser-déposer », l’utilisateur conçoit son rapport :

o Les sources de données ont été définies au préalable sous forme de « vues métier » o Suite à l’extraction, au-delà de la présentation sous forme de tableaux classiques, il lui est possible de produire

les résultats sous forme graphique o Permet de produire des « tableaux croisés » (calcul automatique du contenu des cellules, après choix des lignes

et des colonnes)

Licence Open source Commerciale

Notes Seule solution à permettre de générer un graphique sur un reporting « adhoc » Les « tableaux croisés » s’apparentent aux tableaux croisés dynamiques d’Excel, sans capacité d’export graphique.

Ce document est sous licence GNU Free Documentation Licence. Page 75/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.3.4 Outils disponibles dans la plateforme L’outil « JasperReport », est le composant technique de la solution. Pour aller plus loin, voir son analyse individuelle en supra. Elle intègre de plus le composant « Quartz » pour la planification. L’étude de ce composant n’est pas réalisée dans ce livre blanc.

7.3.5 Outils complémentaires « Jasper ETL », version OEM de Talend

7.3.6 « Roadmap », évolutions futures La version 3.1 prévue fin 2008 devrait intégrer des outils d’analyse, la mise à disposition de la plateforme sous forme de Saas (acronyme de l’expression « Software as a service »), une construction de reporting ad-hoc sur des couches de données métier, un outillage différent permettant une autre définition du rapport. La version 3.2, prévue mi 2009, devrait approfondir les outils mis en place dans la version 3.1

Ce document est sous licence GNU Free Documentation Licence. Page 76/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.4 OPENREPORTS OpenReports est édité par Erik Swenson, développeur à Enfield, en Amérique du nord. Le support reste limité à l’accès au blog http://oreports.com/blog/ où Erik donne quelques détails de configuration avancée. OpenReports est une solution web de publication de rapports pré configuré depuis les outils de conception iReport ou Birt. Ceci permet d’adresser simplement à des utilisateurs finaux, des tableaux de bord pré paramétrés. Il n’est pas possible de gérer un paramétrage dépendant du profil afin par exemple, de réduire le périmètre du tableau de bord suivant l’utilisateur. L’avantage est sa simplicité de mise en œuvre, à partir du moment où une solution de conception des rapports pré existe dans la chaîne décisionnelle.

Item INDUSTRIALISER

OpenReport v3.0.1

Interface web de diffusion et de consultation de tableaux de bord pré paramétrés.

Public

Diffusion paramétrable de tableaux de bord

Consultation des rapports attribués au profil

Accès à des analyses ROLAP (Mondrian)

Pré-requis

- Serveur Tomcat - Langage SQL - Langage XML - Conception sous JasperReport - Conception sous Birt - Conception de cubes Mondrian

DESCRIPTION

- La solution est simple dans ses usages et dans sa mise en œuvre :

o Conception des rapports sous Birt ou iReport o Déploiement sur la plate forme o Attribution des droits de production selon l’utilisateur o Définition des paramètres de diffusion (liste d’utilisateur, période, …)

Licence Licence GPL Une version « pro » avec des fonctionnalités supplémentaires est accessible pour un coût de 495$ (juillet 2008) Cette version inclus un planificateur, les tableaux de bord et la gestion des alertes

Notes Solution simple à mettre en œuvre, pour compléter une chaîne de production de rapports existante. Limitée en version OpenSource

Ce document est sous licence GNU Free Documentation Licence. Page 77/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 78/97

7.4.1 Gestion des accès et des utilisateurs La gestion des utilisateurs est simplifiée et répartie entre le rôle d’administration (ajout/suppression d’utilisateurs, de rapports,…) et le rôle « utilisateur », destinataire des rapports ou consommateur des rapports générés et accessibles depuis l’interface web.

7.4.2 Outils disponibles dans la plateforme Les outils « JasperReport », « Birt », « JFreeReport » (reporting Pentaho) et « JPivot » sont les composants techniques de la solution. Pour aller plus loin, voir leur analyse individuelle en supra. Elle intègre de plus le composant « Quartz » pour la planification. L’étude de ce composant n’est pas réalisée dans ce livre blanc.

7.4.3 « Roadmap » et évolutions futures La version 3.1 est sortie le 3 aout 2008. Elle intègre les nouvelles librairies JasperReports 3.0, BIRT 2.3, JXLS 0.9.6, JPivot 1.8, and Mondrian 3.0. Nous l’avons testée, sans y trouver l’apport de fonctionnalités supplémentaires. La plate forme fonctionne maintenant avec un JDK 1.6 qui possède nativement des fonctions étendues dans la gestion des nombres décimaux.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.5 LA SUITE VANILLA 1.2 (BPM CONSEIL) La suite d’outils éditée par la société Lyonnaise BPM Conseil, fournie une alternative aux plateformes BI majeures que représentent SpagoBI, Pentaho et JasperServer. La plateforme fédère l’outillage propre de BPM Conseil. Quelques outils restent sous forme de « clients lourds », essentiellement pour les tâches d’administration et de conception avancée (comme la conception de vues métier).

Item INDUSTRIALISER

BPM BI Portal v0.59

La plateforme de BPM Conseil prend forme, intégrant progressivement les outils spécifiques de la société

Public

MOE : Conception de rapports JasperReport (FreeWebReport)

Conception de dashboard (FreeDashboardWeb)

Utilisateurs : visualisation de rapports, visualisation de cubes ROLAP et MOLAP (FreeAnalysisWeb)

visualisation de dashboard (FreeDashboardWeb)

Visualisation de Balanced Score Card (FreeMetricsWeb)

Pré-requis - Tomcat, JBoss - Navigateur web

DESCRIPTION

- Déploiement de plusieurs applications Java J2EE dans un serveur web

o Configuration par fichier « xml » pour les périmètres utilisateurs o Configuration centralisée pour les référentiels applicatifs o Gestion des droits d’accès depuis une interface

- Conception et visualisation depuis l’interface web o Interfaces intuitives permettant la couverture fonctionnelle

Licence MPL (Mozilla Public License) v1.1

Notes

- Seule solution à proposer des rapports sur les KPI (ou Balanced Score Card) - Doit parfois être complétée par l’utilisation de clients lourds

o FreeMetaData pour la conception des vues métier (automatiquement déployées dans le référentiel de la plateforme)

o FreeAnalysisDesigner pour produire le fichier descripteur d’interrogation du cube Mondrian (fichier « schema » cf. § V.B.2.2)

o FreeDashBoardDesigner permet la définition du « dictionnaire de données » déployé automatiquement dans le référentiel de FreeDashboardWeb

o FreeMetrics se décompose en « FreeMetricsAdmin », « FreeMetricsAlert », « FreeMetricsDesigner », « FreeMetricsLoader » qui permettent une gestion plus fine des Balanced Score Card. Les configurations sont automatiquement disponibles pour FreeMetricsWeb.

Ce document est sous licence GNU Free Documentation Licence. Page 79/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.5.1 Portail Le portail est un portail spécifique, non compatible avec les normes JSR168. Chaque application intégrée est une application autonome qui se trouve agrégée dans le portail « BPM BI Portal ».

7.5.2 Gestion des accès et des utilisateurs La gestion des utilisateurs est centralisée. L’agrégation des applications dans le portail permet une forme de SSO n’obligeant pas la ressaisie des identifiants à chaque accès à une application autorisée.

7.5.3 Outillage dédié Ce chapitre présente le détail des « clients lourds ». Ils sont tous développés sur la plateforme Eclipse. Les solutions web correspondent aux clients lourds, modulo quelques aménagements nécessités par l’interface.

7.5.3.1 FreeMetaData (Reporting Ad Hoc) La solution « FreeMetaData » de BPM Conseil permet de configurer les « vues métiers ». Un utilisateur « technique » ayant les droits d’accès aux données physiques, élabore des sous ensemble de données fonctionnelles. Cette conception se fait par choix dans des listes présentant les colonnes de données physiques. Les jointures ne sont pas réalisées automatiquement.

Item CONCEPTION DE VUES METIER

FREEMETADATA v0.40

Conception graphique des vues métier

Public MOE : Conception de

vues métier, pour mise à disposition d’utilisateurs

Pré-requis - JVM - Accès aux données physiques - Langage SQL

DESCRIPTION

- Depuis une interface Eclipse

o L’utilisateur se connecte à plusieurs sources de données qu’il agrège selon des règles fonctionnelles o Les vues sont nommées fonctionnellement o Un descripteur « xml » est généré, contenant les paramètres de connexion aux bases, les données à extraire et

le nom fonctionnel à employer. o Il est possible d’ajouter un filtrage des données pour restreindre le périmètre suivant l’utilisateur.

- Solution simple à mettre en œuvre. o Le déploiement se fait par accès au référentiel de la plateforme pour une mise à disposition automatique, sans

nécessiter le redémarrage de cette dernière.

Licence FreeMetaData Public Licence (MPL + clauses spécifiques)

Notes Avec « Pentaho MetaDataEditor », autre solution « évoluée » de conception des vues métier

Ce document est sous licence GNU Free Documentation Licence. Page 80/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.5.3.2 FreeDashboardDesigner L’outil dédié permet la définition de tableaux de bord s’appuyant sur la technologie Pentaho des fichiers « xaction ». BPM Conseil envisage à terme de développer sa propre technologie support des tableaux de bord, leur permettant ainsi plus de fonctionnalités et une meilleure intégration de l’outil « FreeDashboardWeb » dans leur plateforme.

Item PILOTAGE

Free DashBoard Designer v0.61

Interface graphique sous Eclipse permettant de construire des dashboards

Public

Construction de dashboard à partir de fichier « *.xaction » pré paramétrés (technologie Pentaho)

Pré-requis

- Client « lourd » supposant une JVM - Paramètres de connexion à la base de données - Connaissance du mécanisme des fichiers «

*.xaction » de Pentaho - Langage XML (pour comprendre le fichier

«freedashboard» produit) - Langage SQL (pour le requêtage)

DESCRIPTION

- Free Dashboard Designer est un client lourd JAVA permettant de construire des dashboards

o Graphes de types JFreeChart et FusionChart (Flash) o Insertion de tous les composants de FreeAnalysis et de reporting dans le dashboard (Cubes OLAP, Graphes,

JasperReport, BIRT report, JFreeReport, FreeMetrics) o Publication du dashboard directement dans la plateforme FreeDashboardWeb et Pentaho

- Exécution pour l’utilisateur final, demande la connaissance des « xaction » et de FreeMetaData o Configuration du dictionnaire et construction du dashboard

Licence Freedashboard Public License (licence MPL avec des clauses supplémentaires)

Notes Utilisation en mode « stand alone » sauf pour la publication Construction des dashboards sur la technologie Pentaho facilité L’ergonomie de l’interface s’améliore au fil des versions

Ce document est sous licence GNU Free Documentation Licence. Page 81/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 82/97

La copie d’écran ci-dessous présente l’interface et ses principales fonctionnalités. A elle seule, elle permet de concevoir et de produire un regroupement de graphes présentant des indicateurs clés. Ensuite, le tableau de bord peut être directement déployé dans la plateforme, comme en utilisant l’outil web « FreeDashboardWeb ». La différence entre les 2 modes de conception réside dans la capacité du client lourd à gérer un dictionnaire de données, absent actuellement de la version web.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.5.3.3 FreeDashBoardWeb FreeDashboardWeb est le pendant web de l’outil « Free Dashboard Designer ». Cette version n’intègre pas encore de dictionnaire de données. Son intégration est prévue dans les versions ultérieures.

Item PILOTAGE

FreeDashBoardWeb v0.61

Interface web, permet de créer et visualiser des dashboards

Public Utilisateurs :

Visualisation et création des dashboards

Pré-requis - Tomcat, JBoss - Navigateur Internet

DESCRIPTION

- FreeDashboardWeb est l’interface Web de visualisation et de construction de dashboards

o Visualisation et interaction avec les dashboards o Export en PDF o Graphes de types JFreeChart et FusionChart (Flash) o Insertion de tous les composants de FreeAnalysis et de reporting dans le dashboard (Cubes OLAP, Graphes,

JasperReport, BIRT report, JFreeReport, FreeMetrics)

- Exécution pour l’utilisateur final, ne demande aucune connaissance particulière. o Affichage des dashboards, figés et paramétrés o L’ergonomie est en cours d’amélioration pour être encore plus intuitive

Licence Freedashboard Public License (licence MPL avec des clauses supplémentaires)

Notes Sur la version utilisée, quelques incompatibilités entre navigateurs Internet sont apparues. Les corrections ont été rapidement implémentées. Utilisation en mode « client/serveur»

Ce document est sous licence GNU Free Documentation Licence. Page 83/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 84/97

Ci-dessous une copie d’écran de l’interface sous Firefox. Celle-ci reprend les fonctionnalités de la solution sous Eclipse intitulée « Free Dashboard Designer » et étudiée au chapitre précédent. Le tableau de bord produit est déployé automatiquement dans la plateforme et son exécution peut alors être planifiée pour une liste de destinataires.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.5.3.4 FreeAnalysisWeb Au sein de la plateforme BPM Conseil, la navigation dans les cubes ROLAP a été totalement revue. L’interface de « FreeAnalysisWeb » remplace totalement les interfaces produites par la librairie JPivot. Des colonnes calculées ont été ajoutées, permettant une représentation des données en mode tableur.

Item ANALYSE

FreeAnalysisWeb

Interface web, permet de naviguer dans le cube Mondrian

Public

Utilisateurs : Navigation dans le cube, « drag and drop » des dimensions, génération de graphes, export sous forme de rapports

Pré-requis - Tomcat, JBoss - Langage MDX (pour édition de requête MDX

manuelle) - Navigateur Internet

DESCRIPTION

- FreeAnalysisWeb est la version web du client lourd JAVA permettant de naviguer dans un cube OLAP

o Visualisation du cube et des mesures o Gestion des dimensions et des mesures en « drag and drop » o Filtrage des dimensions avant insertion au sein du cube o Edition de requêtes MDX manuelles o Gestion des graphes o Export sous forme de rapports aux formats HTML, PDF, Excel o Ajout des colonnes calculées (addition et soustraction)

- Exécution pour l’utilisateur final, ne demande aucune connaissance particulière. o Ouverture de la plateforme web et accès direct aux cubes et aux fonctionnalités o L’évolution de l’interface vers une plus grande ergonomie est en cours.

Licence Freeanalysis public license (licence MPL avec des clauses supplémentaires)

Notes La version de l’outil testé n’était pas totalement finalisée.

Ce document est sous licence GNU Free Documentation Licence. Page 85/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 86/97

Ci-dessous l’interface, présentant une vue en « mode tableur » des données du cube. On note la capacité d’ajout de colonnes calculées.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.5.3.5 FreeAnalysis4Excel FreeAnalysis4Excel est un plugin Excel destiné à interroger un cube Mondrian directement depuis une dans une feuille du tableur.

Item ANALYSE

FreeAnalysis4Excel

Suite à l’installation des plugins dans Excel, il est possible d’interroger un cube Mondrian

Public Utilisateurs : Réalisation

de « drill-down » depuis Excel

Pré-requis - Connaissance d’Excel

DESCRIPTION

- Depuis Excel, permet d’alimenter les cellules avec les données agrégées présentes dans le cube.

o L’alimentation est réalisé via une connexion sécurisé à la plateforme BPM (recommandé) ou via l’utilisation du fichier de description, soit d’un cube « fasd », soit d’une metadata « freemetadata ».

o Le choix des dimensions est pour l’instant très limité o Les fonctions principales sont le drill-down et le drill-up o La feuille Excel est recréée à chaque utilisation des fonctions principales

- L’utilisateur visualise les données du cube dans les cellules o Il peut réaliser un drill-down ou un drill-up pour visualiser l’ensemble des données agrégées dans le cube.

Licence NC

Notes Sur un cube Mondrian, permet une analyse des données depuis Excel.

Ce document est sous licence GNU Free Documentation Licence. Page 87/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.5.3.6 FreeWebReport La conception de rapports « adhoc » est l’élément différenciant les plateformes BI OpenSource. Pour BPM Conseil, cette conception est réalisée par l’outil « FreeWebReport », directement intégré dans la plateforme. L’outil permet la conception et le déploiement du rapport « adhoc » dans le référentiel commun.

Item CONCEPTION

FreeWebReport

Permet la conception d’un rapport « ad hoc » depuis la plate forme BI

Public

Utilisateurs : Permet la conception de rapport sans connaissance approfondie du langage SQL

Pré-requis - Tomcat, JBoss - Navigateur Internet

DESCRIPTION

- Choix du gabarit de restitution - Choix des champs ou colonnes à croiser entre elles, afin d’extraire les données à mesurer - Interface simplifiée

o Affectation au moyen d’icônes sous forme de flèches

- Pas de capacité graphique, rapport uniquement sous forme de tableaux de données ou de tableaux croisés o Les fonctions de calculs «count », « sum », « avg », « min », « max », « first », « deviation » et « variance » sont

disponibles

Licence NC

Notes Les « tableaux croisés » s’apparentent aux tableaux croisés dynamiques d’Excel, sans capacité d’export graphique.

Ce document est sous licence GNU Free Documentation Licence. Page 88/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 89/97

Ci-dessous l’interface de « FreeWebReport ». On distingue la représentation de la couche d’abstraction des données physique dans la colonne de gauche. Le choix de ses colonnes permet à l’utilisateur de concevoir des requêtes SQL sans connaissance de ce langage et du mode d’implémentation physique des données.

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.5.3.7 FreeMetrics L’ensemble FreeMetrics, se composant de FreeMetricsAdmin, FreeMetricsDesigner, FreeMetricsLoader sert à alimenter la base dédiée pour la conception de KPI ou indicateurs clés, nécessaires au pilotage d’une direction métier. .

Item PILOTAGE

FreeMetrics

Interface web, permet de naviguer de visualiser des métriques sous forme de tableaux de bord

Public

Visualisation des objectifs stratégique, gestion de la performance et satisfaction client

Pré-requis - Tomcat, JBoss - Navigateur Internet

DESCRIPTION

- FreeMetricsWeb, la version web du client lourd JAVA FreeMetricsUser, permet de visualiser des métriques

o Visualisation des tendances o Visualisation du statut actuel des indicateurs de l’entreprise o Détails des données pour chaque métrique o Visualisation de diagrammes et de jauges o Gestion des alertes o Export sous forme de rapports

Licence NC

Notes

Cet outil est spécifique et possède sa base de données propre Plusieurs outils sont mis à disposition pour la configuration et l’importation de données au sein de la base. Le peuplement de la base est possible par import des données d’un fichier Excel. Utilisation en mode « client/serveur »

Ce document est sous licence GNU Free Documentation Licence. Page 90/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 91/97

FreeMetrics est la seule implémentation OpenSource de gestion des indicateurs clés. Cette gestion complexe fait l’objet par BPM Conseil de session de formations aux entreprises qui mettent en place ce mode de gestion. Elles aboutissent à la mise en place d’indicateurs, gérés et remontés vers les utilisateurs finaux au travers de l’interface présentée ci-dessous.

7.5.4 Outils disponibles dans la plateforme Les outils « JasperReport », « Birt », « JFreeReport » (reporting Pentaho) et « JPivot » sont les composants techniques de la solution. Pour aller plus loin, voir leur analyse individuelle en supra. Elle intègre de plus les composants « Weka » pour le datamining et « Quartz » pour la planification. L’étude de ces composants n’est pas réalisée dans ce livre blanc.

7.5.5 « Roadmap », évolutions futures Pas d’indications à l’heure actuelle

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

7.6 SYNTHESE DES PLATEFORMES Pentaho qui est dans notre livre blanc la première solution présentée, intègre les fichiers « xaction », permettant la personnalisation lors du reporting de masse. La société éponyme a d’ailleurs absorbé les projets Mondrian et Kettle, en en faisant partie intégrante de la solution. SpagoBI se présente comme un challenger très intéressant par les choix technologiques adoptés. Chaque composant est intégré comme une portlet selon la norme JSR 168 au sein d’un portail entièrement modulable, ce qui en simplifie l’administration et l’intégration. La gestion des versions et des utilisateurs est l’autre point fort de cette solution. La société JasperSoft édite la suite d’outils constituée autour de JasperReport. Les composants intégrés excluent donc Birt comme outil de conception et de production de rapports. La version commerciale intègre seule la capacité de production de rapports « adhoc ». OpenReports est limité à la consommation de rapports figés. Cette plateforme n’offre pas toute la richesse des autres présentées. BPM Conseil est une plateforme riche, en progression constante. Quelques défauts de jeunesse sont rapidement rattrapés. Elle rejoint rapidement les trois grandes solutions présentées plus haut. Au-delà de leur apport dans l’industrialisation, de l’unification de l’accès aux outils, le principal caractère différenciant des plateformes se concentre dans leur outil de conception du reporting « adhoc ». La plateforme BPM Conseil intègre en plus le composant FreeMetrics permettant le BSC. La synthèse suivante présente les différences de conception et d’implémentation du reporting « adhoc ». On notera l’absence d’OpenReports qui n’inclue pas de conception de reporting « adhoc ». Fonction majeure Pentaho

(adHoc Reporting)

SpagoBI

(QBE)

JasperSoft

(ADHOC Editor)

BPM Conseil

(FreeWebReport)

Fonctions de design métier de la BDD

« MetaData Editor» permet de définir une couche métier indépendante de la couche de données physique

Un fichier « datamart.jar » permettant la gestion de cette couche d’abstraction doit être généré au moyen d’une plateforme Eclipse incorporant un plugin « hibernate »

La version commerciale intègre un outil baptisé « semantic layer Designer » permettant la conception de la couche d’abstraction.

La version OpenSource ne permet pas la gestion de reporting « adhoc »

« FreeMetaData » est l’outil de conception de la vue métier, indépendante de la couche physique des données.

Capacité à créer de nouvelles données calculées

Le formatage des dates et des champs numériques est prévu, les fonctions arithmétiques « comptage », « somme », « moyenne », « minimum », « maximum » sont

Les fonctions arithmétiques « comptage », « somme », « moyenne », « minimum », « maximum » sont intégrées

Les fonctions arithmétiques classiques sont intégrées. AdHoc Editor permet également l’ajout de colonnes calculées.

Les fonctions arithmétiques « comptage », « somme », « moyenne », « minimum », « maximum », « premier » sont intégrées.

Ce document est sous licence GNU Free Documentation Licence. Page 92/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Fonction majeure Pentaho SpagoBI JasperSoft BPM Conseil

(adHoc Reporting) (QBE) (ADHOC Editor) (FreeWebReport)

intégrées

Les fonctions statistiques « variance », « déviation » sont présentes

Sécurité Les droits sont attribués globalement par utilisateur sur la couche d’abstraction créée.

Les droits sont attribués par utilisateurs et par profils sur la couche d’abstraction créée.

Les droits sont attribués par utilisateurs et par groupes sur la couche d’abstraction créée.

Les droits sont attribués par utilisateurs, par groupes et par sous ensemble de données sur la couche d’abstraction créée.

Fonction de contrôle des utilisateurs

Le contrôle des actions des utilisateurs se limite aux groupes possédant des rôles figés.

Le périmètre d’actions possible est défini au niveau du groupe auquel appartient l’utilisateur.

Le périmètre d’actions est défini par les rôles affectés aux d’utilisateurs où à leurs groupes d’appartenance.

Le périmètre d’actions possibles est affecté au groupe auquel appartient l’utilisateur.

Mise en forme Un template peut être utilisé, permettant une personnalisation.

Ce template est défini par un fichier « xml »

Les formats « portrait » et « paysage », l’alignement du contenu des colonnes et la gestion de l’entête et pied de page est aussi possible

La mise en forme est limitée au regroupement.

La présentation de sortie est figée.

La version commerciale permet d’utiliser un template de personnalisation.

Un template peut être utilisé, permettant une personnalisation.

Les formats « portrait » et « paysage », ainsi que la gestion et pied de page est aussi possible

Vision de l’information

L’information est restituée sous forme de liste uniquement.

L’information est restituée sous forme de liste uniquement.

L’information peut être restituée au choix sous forme de liste, tableau croisé et graphe.

L’information peut être restituée sous forme de liste ou tableau croisé.

Mise à disposition Les formats d’export possibles sont : PDF HTML Excel CSV

Les formats d’export possibles sont : PDF HTML Excel CSV RTF XML TXT L’export en « jrxml »est aussi possible afin de permettre une reprise sous iReport.

Les formats d’export possibles sont : PDF Excel RTF CSV Flash

Les formats d’export possibles sont : PDF HTML Excel CSV RTF

Paramétrabilité Aucun paramétrage possible.

Aucun paramétrage possible.

Aucun paramétrage possible.

Possibilité de paramètre saisi par l’utilisateur.

La configuration de cette fonction sera réalisée lors de la création de la vue métier avec FreeMetaData.

Ce document est sous licence GNU Free Documentation Licence. Page 93/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Fonction majeure Pentaho SpagoBI JasperSoft BPM Conseil

(adHoc Reporting) (QBE) (ADHOC Editor) (FreeWebReport)

Fonctions avancées La seule action possible sur la couche d’abstraction est le filtrage des données avant restitution.

La seule action possible sur la couche d’abstraction est le filtrage des données avant restitution.

La seule action possible sur la couche d’abstraction est le filtrage des données avant restitution.

La seule action possible sur la couche d’abstraction est le filtrage des données avant restitution.

Capitalisation (enregistrement de requêtes, de modèles, de vues réutilisables…)

Seule la couche d’abstraction peut être mutualisée.

La vue créée par un utilisateur sur cette couche ne peut être sauvegardée.

La vue créée par un utilisateur sur la couche d’abstraction peut être sauvegardée et partagée par plusieurs utilisateurs.

Seule la couche d’abstraction peut être mutualisée.

La vue créée par un utilisateur sur cette couche ne peut être sauvegardée.

Seule la couche d’abstraction peut être mutualisée.

La vue créée par un utilisateur sur cette couche ne peut être sauvegardée.

Ce document est sous licence GNU Free Documentation Licence. Page 94/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

8 L’INTEGRATION DES COMPOSANTS OPEN SOURCE Suite à notre parcours des solutions individuelles présentées dans ce document, nous avons ensuite indiqué le bénéfice que pouvait apporter leur agrégation au sein d’une plateforme décisionnelle. Celle-ci va apporter la gestion de la configuration centralisée, un mode d’authentification et de définition de périmètre par utilisateur. Les plateformes existantes vont plus loin que la simple agrégation de composants, puisqu’elles permettent en plus de concevoir des sous-ensembles de données et du reporting « ad-hoc », avec les limitations et les spécificités que nous avons exposées plus haut pour chaque solution. Pour aller plus loin, il est possible d’appréhender une réponse à des besoins venus de l’usage, en adoptant au sein de l’entreprise un portail compatible JSR 168 tel que Liferay, d’y construire et d’y intégrer différentes « portlets » qui vont chacune offrir des solutions des reporting et d’analyse. Nous avons ainsi intégré avec succès JasperReport, BIRT, web-Palo ou JPivot dans un portail commun et adaptée à l’intranet de l’entreprise. La gestion des utilisateurs existante (au moyen d’un annuaire LDAP OpenSource tel qu’OpenLDAP ou propriétaire tel qu’ActiveDirectory) permet de définir les outils et les périmètres accessibles à chaque utilisateur. Les outils BI propriétaires tels que Business Objects et SAS peuvent aussi, sous réserve d’interface d’accès spécifiques, s’intégrer dans des « portlets » et venir compléter l’offre BI OpenSource. On peut donc, sous réserve d’avoir une expertise approfondie sur les outils BI OpenSource et propriétaires, adapter une solution BI personnalisée à l’entreprise et à ses besoins.

Ce document est sous licence GNU Free Documentation Licence. Page 95/97

Restituer, Analyser et Piloter : Evaluer les opportunités Open Source

Ce document est sous licence GNU Free Documentation Licence. Page 96/97

9 POUR CONCLURE… Nous avons parcouru tout au long de ce livre blanc, un large périmètre de l’outillage BI disponible dans le monde de l’Open Source. A l’inverse de l’édition propriétaire qui relève plus d’un marketing de l’offre que de l’usage, l’édition Open Source prend son inspiration dans les attentes utilisateurs. En ce sens il s’agit d’une approche pragmatique de la prestation informatique. Il apparaît clairement que l’offre Open Source associée à une expertise BI (tant conseil que mise en œuvre) est pertinente pour répondre à une large gamme de services attendus par les directions métiers et leur DSI : Que ce soit pour du reporting de masse (diffusion de rapports statiques ou dynamique à un large périmètre d’utilisateurs par tous les canaux disponibles), Que ce soit pour des services d’analyse de l’activité à destination des managers (analyse multidimensionnelle), Que ce soit pour supporter les processus d’élaboration budgétaire, Que ce soit pour fournir des tableaux de bord synthétiques à destination des directions, leur offrant ainsi un visuel ergonomique sur l’avancement de leurs objectifs, Ou encore pour permettre l’agrégation de composants BI distincts dans un portail web. Ce qui rend possible le déploiement d’outils adaptés et ciblés au sein de l’entreprise, sans recourir à des développements spécifiques conséquents. Il est vrai, la partie Ad hoc (permettre aux utilisateurs finaux la construction personnalisée d’un rapport à partir d’une vue métier des données) présente encore une limitation chez la majeure partie des éditeurs. Mais elle peut être compensée par une conception en amont tenant compte de cette limitation ou encore relever de choix d’organisation (contrôler la production de rapport par la DSI en l’intégrant dans un cycle projet) – Cependant les efforts actuels des éditeurs se portent tous sur ce point. D’un point de vue technique, une attention particulière devra être portée aux pré-requis techniques, concernant l’intégration et la configuration nécessaire des plateformes décisionnelles. De même, certaines compétences SQL et/ou Java permettront une meilleure adoption de solutions demandant parfois un haut niveau de technicité. Nos retours d’expérience clients et nos liens avec l’écosystème nous amènent à considérer que la réussite d’un projet métier repose dans l’association d’éditeurs Open Source et d’un intégrateur fédérateur. Ce dernier, par son savoir faire et son expérience autour de ces technologies est le rouage essentiel dans l’assemblage qui détermine le caractère innovant de la solution.