Faq Business Intelligence

download Faq Business Intelligence

of 12

Transcript of Faq Business Intelligence

  • 7/23/2019 Faq Business Intelligence

    1/12

    F.A.Q. Business Intelligence

    Date de publication : 3 octobre 2013

    Cette F.A.Q. a t ralise partir des questions frquemment poses sur

    le forum Approche thorique du dcisionnel de www.developpez.com et

    de l'exprience personnelle des auteurs. Elle pourra traiter de tout type de

    questions portant sur la conception, la modlisation, l'alimentation, le reporting

    et l'analyse d'un systme dcisionnel.

    Un grand merci ClaudeLELOUPpour sa relecture avise.

    Nous esprons que cette F.A.Q. saura rpondre un maximum de vos

    questions. Nous vous souhaitons une bonne lecture.

    Et si vous voulez participer n'hsitez pas nous faire part de vos

    propositions.

    L'quipe BI de Developpez.

    http://www.developpez.net/forums/d1383006/logiciels/solutions-entreprise/business-intelligence/approche-theorique-du-decisionnel/faq-business-intelligence-vos-propositions/http://www.developpez.net/forums/d1383006/logiciels/solutions-entreprise/business-intelligence/approche-theorique-du-decisionnel/faq-business-intelligence-vos-propositions/http://www.developpez.net/forums/u124512/claudeleloup/http://www.developpez.net/forums/f1727/logiciels/solutions-entreprise/business-intelligence/approche-theorique-du-decisionnel/http://www.developpez.com/
  • 7/23/2019 Faq Business Intelligence

    2/12

    Ont contribu cette FAQ :

    doc malkovich

    http://blog.developpez.com/jmalkovich/http://localhost/var/www/apps/conversion/tmp/scratch_4/Dans%20la%20t%EA%B4%A5%20de%20doc%20malkovichhttp://www.developpez.net/forums/u248020/doc-malkovich/http://www.developpez.com/
  • 7/23/2019 Faq Business Intelligence

    3/12

    F.A.Q. Business Intelligence

    - 3 -

    Les sources prsentes sur cette page sont libres de droits et vous pouvez les utiliser votre convenance. Par contre, la page de prsentation

    constitue une uvre intellectuelle protge par les droits d'auteur. Copyright 2013 Developpez LLC. Tous droits rservs Developpez LLC.

    Aucune reproduction, mme partielle, ne peut tre faite de ce site et de l'ensemble de son contenu : textes, documents et images sans l'autorisation

    expresse de Developpez LLC. Sinon vous encourez selon la loi jusqu' trois ans de prison et jusqu' 300 000 de dommages et intrts.

    htt ://business-intelli ence develo ez com/fa /fa -business-intelli ence/

    1. Conception/Modlisation (14) .................................................................................................................................4

    1.1. Datawarehouse et datamarts (6) ...................................................................................................................5

    1.2. Modlisation (8) ............................................................................................................................................. 7

    1.2.1. Modles en toile ou flocons (4) ...........................................................................................................8

    1.2.2. Tables de faits et dimensions (4) .......................................................................................................... 9

    2. Alimentation (3) .................................................................................................................................................... 10

    3. Restitution et analyse (3) .....................................................................................................................................11

    4. Statistiques et datamining (0) .............................................................................................................................. 12

    http://business-intelligence.developpez.com/faq/faq-business-intelligence/http://www.developpez.com/
  • 7/23/2019 Faq Business Intelligence

    4/12

    F.A.Q. Business Intelligence

    - 4 -

    Les sources prsentes sur cette page sont libres de droits et vous pouvez les utiliser votre convenance. Par contre, la page de prsentation

    constitue une uvre intellectuelle protge par les droits d'auteur. Copyright 2013 Developpez LLC. Tous droits rservs Developpez LLC.

    Aucune reproduction, mme partielle, ne peut tre faite de ce site et de l'ensemble de son contenu : textes, documents et images sans l'autorisation

    expresse de Developpez LLC. Sinon vous encourez selon la loi jusqu' trois ans de prison et jusqu' 300 000 de dommages et intrts.

    htt ://business-intelli ence develo ez com/fa /fa -business-intelli ence/

    Sommaire > Conception/Modlisation

    http://business-intelligence.developpez.com/faq/faq-business-intelligence/http://www.developpez.com/
  • 7/23/2019 Faq Business Intelligence

    5/12

    F.A.Q. Business Intelligence

    - 5 -

    Les sources prsentes sur cette page sont libres de droits et vous pouvez les utiliser votre convenance. Par contre, la page de prsentation

    constitue une uvre intellectuelle protge par les droits d'auteur. Copyright 2013 Developpez LLC. Tous droits rservs Developpez LLC.

    Aucune reproduction, mme partielle, ne peut tre faite de ce site et de l'ensemble de son contenu : textes, documents et images sans l'autorisation

    expresse de Developpez LLC. Sinon vous encourez selon la loi jusqu' trois ans de prison et jusqu' 300 000 de dommages et intrts.

    htt ://business-intelli ence develo ez com/fa /fa -business-intelli ence/

    Sommaire > Conception/Modlisation > Datawarehouse et datamarts

    Quelle est la diffrence entre un datawarehouse et un datamart ?Auteur : doc malkovich

    Le datamart est un sous-ensemble du datawarehouse. Le datawarehouse concentre toutes les donnes de

    l'entreprise, alors que le datamart est spcialis pour une direction, un mtier ou un thme prcis.

    On peut par exemple trouver des datamarts Marketing, RH comme des datamarts Ventes, Stock, etc.

    Quelle est la diffrence entre un datawarehouse et un cube ?

    Auteur : doc malkovich

    Un datawarehouse est l'endroit o on va stocker et consolider toutes les informations de l'entreprise. C'est

    gnralement une base de donnes classique.Un cube est un stockage spcifique des donnes pour rpondre aux problmatiques OLAP, notamment sur

    les temps de rponse. Le cube va stocker en fait tous les prcalculs d'agrgation sur une table de faits,

    en totalit (MOLAP) ou partiellement.

    Par exemple, si on a une table de faits lie uniquement aux dimensions villeetjour, le cube va stocker les

    rsultats tous les niveaux possibles : (avec une ville est rattache une rgion qui est rattache un

    pays et un jour appartient une semaine qui appartient un mois qui appartient une anne)

    ville x jour

    ville x semaine

    ville x mois

    ville x anne

    rgion x jour rgion x semaine

    rgion x mois

    rgion x anne

    pays x jour

    pays x semaine

    pays x mois

    pays x anne

    L o dans le datawarehouse on ne stockait que le dtail des donnes, le cube va stocker tous les

    agrgats et les prcalculs possibles. Cela permet de donner des temps de rponse instantans, car tout

    est prcalcul.

    Quel est le lien entre le datawarehouse, les datamarts et le cube ?

    Auteur : doc malkovich

    Le cube est un stockage des donnes spcifique pour rpondre aux problmatiques OLAP. Il vient en

    aval du datawarehouse et du datamart stocks et gnrs dans une base de donnes classique ; une fois

    http://www.developpez.net/forums/u248020/doc-malkovich/http://www.developpez.net/forums/u248020/doc-malkovich/http://www.developpez.net/forums/u248020/doc-malkovich/http://www.developpez.net/forums/u248020/doc-malkovich/http://business-intelligence.developpez.com/faq/faq-business-intelligence/http://www.developpez.com/
  • 7/23/2019 Faq Business Intelligence

    6/12

    F.A.Q. Business Intelligence

    - 6 -

    Les sources prsentes sur cette page sont libres de droits et vous pouvez les utiliser votre convenance. Par contre, la page de prsentation

    constitue une uvre intellectuelle protge par les droits d'auteur. Copyright 2013 Developpez LLC. Tous droits rservs Developpez LLC.

    Aucune reproduction, mme partielle, ne peut tre faite de ce site et de l'ensemble de son contenu : textes, documents et images sans l'autorisation

    expresse de Developpez LLC. Sinon vous encourez selon la loi jusqu' trois ans de prison et jusqu' 300 000 de dommages et intrts.

    htt ://business-intelli ence develo ez com/fa /fa -business-intelli ence/

    constitu le datamart sera dcharg dans un cube. Ainsi les utilisateurs pourront analyser rapidement les

    donnes en OLAP via le cube, ce qu'ils n'auraient pu faire dans une base de donnes classique.

    Un datamart contient-il une seule table de faits ?

    Auteur : doc malkovich

    Non, un datamart peut contenir plusieurs tables de faits.

    Une seule table de faits est prfrable pour ne pas avoir grer plusieurs requtes SQL lors de

    l'interrogation des donnes, mais ce n'est pas obligatoire.

    L'uf et la poule - Que faire en premier, le datawarehouse ou le datamart ?

    Auteur : doc malkovich

    Cela dpend des auteurs !

    Si on coute les gourous en la matire, Ralph Kimball prconise de commencer par les datamarts, qui

    assembls formeront le datawarehouse (approche bottom-up). Bill Inmon lui dfinit le datawarehouse

    d'abord et le prend comme base pour construire les datamarts (approche top-down).

    Un datamart est-il en toile ? Agrg ?

    Auteur : doc malkovich

    Le datamart est modlis en toile ou en flocons, ce qui est la modlisation classique en dcisionnel.

    Par contre le fait qu'il soit agrg ou non dpend des auteurs. Selon Ralph Kimball, il contient des tables au

    dtail et des tables agrges pour une question de performance. Selon Bill Inmon, c'est une vue agrge

    du datawarehouse.

    http://www.developpez.net/forums/u248020/doc-malkovich/http://www.developpez.net/forums/u248020/doc-malkovich/http://www.developpez.net/forums/u248020/doc-malkovich/http://business-intelligence.developpez.com/faq/faq-business-intelligence/http://www.developpez.com/
  • 7/23/2019 Faq Business Intelligence

    7/12

    F.A.Q. Business Intelligence

    - 7 -

    Les sources prsentes sur cette page sont libres de droits et vous pouvez les utiliser votre convenance. Par contre, la page de prsentation

    constitue une uvre intellectuelle protge par les droits d'auteur. Copyright 2013 Developpez LLC. Tous droits rservs Developpez LLC.

    Aucune reproduction, mme partielle, ne peut tre faite de ce site et de l'ensemble de son contenu : textes, documents et images sans l'autorisation

    expresse de Developpez LLC. Sinon vous encourez selon la loi jusqu' trois ans de prison et jusqu' 300 000 de dommages et intrts.

    htt ://business-intelli ence develo ez com/fa /fa -business-intelli ence/

    Sommaire > Conception/Modlisation > Modlisation

    http://business-intelligence.developpez.com/faq/faq-business-intelligence/http://www.developpez.com/
  • 7/23/2019 Faq Business Intelligence

    8/12

    F.A.Q. Business Intelligence

    - 8 -

    Les sources prsentes sur cette page sont libres de droits et vous pouvez les utiliser votre convenance. Par contre, la page de prsentation

    constitue une uvre intellectuelle protge par les droits d'auteur. Copyright 2013 Developpez LLC. Tous droits rservs Developpez LLC.

    Aucune reproduction, mme partielle, ne peut tre faite de ce site et de l'ensemble de son contenu : textes, documents et images sans l'autorisation

    expresse de Developpez LLC. Sinon vous encourez selon la loi jusqu' trois ans de prison et jusqu' 300 000 de dommages et intrts.

    htt ://business-intelli ence develo ez com/fa /fa -business-intelli ence/

    Sommaire > Conception/Modlisation > Modlisation > Modles en toile ou flocons

    Quel outil prendre pour un modle en toile ?Auteur : doc malkovich

    Il n'y a pas besoin d'outil spcifique !

    Pour modliser un modle en toile dans une base classique comme Oracle, on peut s'appuyer sur les

    outils de modlisation traditionnels comme PowerAmc, Oracle Designer, etc.

    On modlise gnralement uniquement le MPD, et non le MCD, car le modle est dnormalis.

    Dois-je choisir un modle en toile ou en flocons ?

    Auteur : doc malkovich

    Il n'y a pas vraiment de recommandation en la matire. Le modle en toile est le plus rpandu, car ilconomise des jointures et serait donc plus performant.

    Comment passer d'un modle OLTP ou entits

    relations de ma source un modle OLAP / en toile ?

    Auteur : doc malkovich

    Il n'existe pas de mthode automatise pour passer d'un modle OLTP un modle OLAP, comme ce qu'il

    existe sous Merise pour passer d'un MCD un MPD.

    Il faut analyser le modle en source et dfinir un modle cible en fonction des besoins utilisateur.

    On pourra s'inspirer du process de Kimball :

    1 Choisir le business process ;

    2 Spcifier le grain ;

    3 Identifier les dimensions ;

    4 Identifier les faits.

    Qu'est-ce qu'une constellation ?

    Auteur : doc malkovich

    Une constellation est un ensemble de plusieurs tables de faits qui ont des dimensions communes.

    http://www.developpez.net/forums/u248020/doc-malkovich/http://www.developpez.net/forums/u248020/doc-malkovich/http://www.developpez.net/forums/u248020/doc-malkovich/http://www.developpez.net/forums/u248020/doc-malkovich/http://business-intelligence.developpez.com/faq/faq-business-intelligence/http://www.developpez.com/
  • 7/23/2019 Faq Business Intelligence

    9/12

    F.A.Q. Business Intelligence

    - 9 -

    Les sources prsentes sur cette page sont libres de droits et vous pouvez les utiliser votre convenance. Par contre, la page de prsentation

    constitue une uvre intellectuelle protge par les droits d'auteur. Copyright 2013 Developpez LLC. Tous droits rservs Developpez LLC.

    Aucune reproduction, mme partielle, ne peut tre faite de ce site et de l'ensemble de son contenu : textes, documents et images sans l'autorisation

    expresse de Developpez LLC. Sinon vous encourez selon la loi jusqu' trois ans de prison et jusqu' 300 000 de dommages et intrts.

    htt ://business-intelli ence develo ez com/fa /fa -business-intelli ence/

    Sommaire > Conception/Modlisation > Modlisation > Tables de faits et dimensions

    Quelles informations trouve-t-on dans une table de faits ?Auteur : doc malkovich

    La table de faits contient les cls trangres (identifiants) sur les tables de dimension et des mesures qui

    sont des valeurs numriques sur les faits.

    Quel est le lien entre une table de faits et une table de dimension ?

    Auteur : doc malkovich

    La table de faits contient les identifiants (PK) des tables de dimension. Elle n'a pas de PK propre, sa PK

    est constitue de ces identifiants.

    Y a-t-il besoin de crer une table de dimension pour chaque dimension ?

    Auteur : doc malkovich

    Pas forcment. Si la table apporte peu d'informations, on peut avoir la valeur de la dimension directement

    dans la table de faits. On parle de dimension dgnre.

    Une table de dimension est-elle historise ?

    Auteur : doc malkovichCela dpend des besoins.

    On peut ne garder que la dernire situation, qui crase la photo prcdente.

    Sinon on peut historiser les donnes. Ces dernires voluent gnralement lentement. Il y a plusieurs

    faons de les historiser.

    On appelle ce type de dimension SCD (Slowly Changing Dimension).

    lien : Article sur les SCD

    http://grim.developpez.com/articles/concepts/slow-changing-dimension/http://www.developpez.net/forums/u248020/doc-malkovich/http://www.developpez.net/forums/u248020/doc-malkovich/http://www.developpez.net/forums/u248020/doc-malkovich/http://www.developpez.net/forums/u248020/doc-malkovich/http://business-intelligence.developpez.com/faq/faq-business-intelligence/http://www.developpez.com/
  • 7/23/2019 Faq Business Intelligence

    10/12

    F.A.Q. Business Intelligence

    - 10 -

    Les sources prsentes sur cette page sont libres de droits et vous pouvez les utiliser votre convenance. Par contre, la page de prsentation

    constitue une uvre intellectuelle protge par les droits d'auteur. Copyright 2013 Developpez LLC. Tous droits rservs Developpez LLC.

    Aucune reproduction, mme partielle, ne peut tre faite de ce site et de l'ensemble de son contenu : textes, documents et images sans l'autorisation

    expresse de Developpez LLC. Sinon vous encourez selon la loi jusqu' trois ans de prison et jusqu' 300 000 de dommages et intrts.

    htt ://business-intelli ence develo ez com/fa /fa -business-intelli ence/

    Sommaire > Alimentation

    Comment alimenter ma table de faits uniquement partir des lignes modifies en amont ?Auteur : doc malkovich

    Il y a plusieurs solutions ... Soit on a en source un identifiant incrmental ou une date de modification.

    Dans ce cas on peut distinguer les nouvelles lignes en filtrant sur les dernires valeurs. On peut grer ces

    identifiants dans l'application source ou via un trigger. Mais cela ne donne pas les suppressions et les

    corrections manuelles en base source ne mettent pas forcment jour ces colonnes. Soit on utilise les

    traitements diffrentiels de masse de bases de donnes. Il s'agit de faire un MINUS mais c'est un traitement

    trs coteux, proscrire dans le cas de volumtries trs importantes. Soit on met en place du CDC (Change

    Data Capture), un procd automatique pour consigner les changements dans des tables spcifiques. Ce

    procd est gnralement inclus dans les ETL et les bases de donnes. C'est certainement la meilleure

    mthode, la plus sre et la plus performante.

    lien : Variations dans les dimensions

    Doit-on toujours utiliser un ETL ?

    Auteur : doc malkovich

    Pas forcment. Si c'est pour alimenter quelques tables, il n'est pas conseill d'utiliser un nouvel outil

    comme un ETL ; mme s'ils sont simples d'utilisation ils demandent du temps pour les matriser. Par contre

    ils deviennent vite indispensables pour alimenter un datawarehouse o on trouve toutes les donnes de

    l'entreprise ! Surtout qu'il existe maintenant des versions gratuites d'ETL comme Talend.

    Quelle est la diffrence entre ETL et ELT ?

    Auteur : doc malkovich

    Cela concerne le mode et l'endroit de transformation. Dans l'ELT l'tape de transformation (le T) se fait dans

    la base de donnes via du SQL gnr alors que dans l'ETL elle se fait par un moteur (engine) spcifique

    externe la base. On trouve des composants ELT dans des ETL comme Talend. On pourra choisir au cas

    par cas d'avoir des traitements en mode ETL ou en mode ELT.

    http://www.developpez.net/forums/u248020/doc-malkovich/http://www.developpez.net/forums/u248020/doc-malkovich/http://grim.developpez.com/articles/concepts/slow-changing-dimension/http://www.developpez.net/forums/u248020/doc-malkovich/http://business-intelligence.developpez.com/faq/faq-business-intelligence/http://www.developpez.com/
  • 7/23/2019 Faq Business Intelligence

    11/12

    F.A.Q. Business Intelligence

    - 11 -

    Les sources prsentes sur cette page sont libres de droits et vous pouvez les utiliser votre convenance. Par contre, la page de prsentation

    constitue une uvre intellectuelle protge par les droits d'auteur. Copyright 2013 Developpez LLC. Tous droits rservs Developpez LLC.

    Aucune reproduction, mme partielle, ne peut tre faite de ce site et de l'ensemble de son contenu : textes, documents et images sans l'autorisation

    expresse de Developpez LLC. Sinon vous encourez selon la loi jusqu' trois ans de prison et jusqu' 300 000 de dommages et intrts.

    htt ://business-intelli ence develo ez com/fa /fa -business-intelli ence/

    Sommaire > Restitution et analyse

    Quel outil de restitution choisir ?Auteur : doc malkovich

    Cela dpend des besoins.

    Il y a des outils pour faire du reporting dfini l'avance, d'autres qui laissent la possibilit un utilisateur

    lambda de faire soi-mme ses requtes (reporting adhoc). Si on veut une interactivit pousse, on se

    tournera vers des outils OLAP qui permettront de naviguer entre les donnes.

    Il existe maintenant de nombreux outils gratuits couvrant ces domaines, comme BIRTou PALO.

    Quel outil utiliser pour faire du reporting dans mon application ?

    Auteur : doc malkovich

    Certains outils sont propritaires et sont difficilement intgrables dans une application.

    Par contre il existe des solutions open source qui sont simples mettre en uvre, comme BIRTqui est

    intgr dans Eclipse.

    Quelle est la diffrence entre un outil de reporting classique et un outil d'analyse OLAP ?

    Auteur : doc malkovich

    Un outil de reporting classique donne une certaine vision des donnes, dfinie au dpart par le concepteur

    du reporting. Cette vision est souvent fige et peu interactive.

    Un outil d'analyse OLAP va permettre l'utilisateur de naviguer dans les donnes travers ce qu'on appelle

    le cube. Il permettra par exemple partir du chiffre d'affaires par pays et par anne de descendre auxdonnes par rgion puis par ville (drill-down), et cela facilement, intuitivement et presque instantanment.

    http://www.developpez.net/forums/u248020/doc-malkovich/http://www.eclipse.org/birt/http://www.developpez.net/forums/u248020/doc-malkovich/http://www.palo.net/http://www.eclipse.org/birt/http://www.developpez.net/forums/u248020/doc-malkovich/http://business-intelligence.developpez.com/faq/faq-business-intelligence/http://www.developpez.com/
  • 7/23/2019 Faq Business Intelligence

    12/12