Modele en Etoile

6
 DATAWAREHOUSES Conception de modèles en étoile.

Transcript of Modele en Etoile

Page 1: Modele en Etoile

5/11/2018 Modele en Etoile - slidepdf.com

http://slidepdf.com/reader/full/modele-en-etoile 1/6

DATAWAREHOUSES

Conception de modèles en étoile.

Page 2: Modele en Etoile

5/11/2018 Modele en Etoile - slidepdf.com

http://slidepdf.com/reader/full/modele-en-etoile 2/6

Page 2

Bases de données analytiques

Une base de données Analy-tique représente les informationsde manière hiérarchique, cen-trée sur les faits, en général parun schéma en étoile.

Les faits, largement numériques,sont stockés dans une table defait, alors que toutes lesdimensions hiérarchiques, com-me les informations sur un pro-duit par exemple, sont stockéesdans différentes tables de di-mension. Cette base de données contient la même information mais utilise 5

tables au lieu de 9 et 4 jointures au lieu de 8.

Avantages du schéma en étoile

Les schémas en étoileutilisent beaucoup moins de  jointures que les bases dedonnées normalisées. Lestemps de réponse des re-

quêtages sont d’autant plusrapides.

Les tables de faits servent de références croisées entre toutes les dimensions, en jouant un rôlede jointure de plusieurs à plusieurs globale.

Concevoir un modèle en étoile

Pour créer un schéma enétoile il faut éclater lesrelations normalisées endimensions modélisées.

Page 3: Modele en Etoile

5/11/2018 Modele en Etoile - slidepdf.com

http://slidepdf.com/reader/full/modele-en-etoile 3/6

Page 3

Les tables de dimension fournissent les informationsde description.

Elles contiennent :• Les différentes hiérarchies de la dimension,• Les propriétés complémentaires des niveaux

• Une clé primaire (plus une date de validité en cas dedonnées historisées)

Les tables de faits contiennent les données parlesquelles une entreprise se « mesure ».• Prix,• Ventes,• Salaires...On les appelle indifféremment faits, métriques, mesures,indicateurs...Les tables de faits sont le point central des schémas enétoile, ce sont elles qui contiennent en général le plus de

lignes.

Les tables de faits contiennent :• Les mesures• Les clés étrangères qui les lient aux tables de dimension

Cahier des charges de projet

Il est très difficile, en partant uniquement d’une structure relationnelle, de concevoir un

modèle en étoile. 

En effet, un modèle relationnel comporte potentiellement un nombre indéfini de modèlesdécisionnels, dépendants de la vue métier du demandeur.

Il est nécessaire de conduire des interviews auprès des référents fonctionnels comme préalableà la conception. Ces interviews ont pour but d’obtenir les informations suivantes :

• Identification des évènements à analyser• Identification des axes d’analyse hiérarchique de ces évènements

• Identification des informations complémentaires, nécessaires à l’analyse• Identification de la conservation des données historiques

Page 4: Modele en Etoile

5/11/2018 Modele en Etoile - slidepdf.com

http://slidepdf.com/reader/full/modele-en-etoile 4/6

Page 4

1) Quels sont les Faits*/évènements/flux qui produisent les indicateurs à analyser ?* Un Fait, dans ce contexte, représente un évènement réel, arrivé à l’entreprise, pour lequel on dispose

d’une trace informatique datée.

Pour chaque fait, l’analyse doit comporter :• Le nom du fait• La ou les dates significatives du fait

• Les mesures à extraire du fait ainsi que leur mode de calcul.

2) Pour chaque fait, Quels sont les axes d’analyse servant à décliner les mesuresobtenues ?

Parmi les axes d’analyse les plus fréquents, on peut donner pour exemple :• Temps :

Hiérarchies de temps basées sur les dates significatives des faits,

ces axes existent dans tous les modèles.• Tiers :Hiérarchies représentant les personnes impliquées dans le fait (Ex:

pour des ventes, les clients, les fournisseurs etc…)

• Géographiques :Hiérarchies de localisation, se connectant aux autres axes et

permettant une analyse géographique.

• Ressources :Hiérarchies représentant les éléments matériels impliqués dans le

fait (Ex. pour des ventes : les articles vendus …)

• Organisation :Hiérarchies représentant l’organisation interne de l’entreprise (Ex : Société – Service – Équipe – Employé …)

3) Pour chaque axe d’analyse, Quels niveaux de regroupement hiérarchique proposer ?

Dans un système décisionnel, les informations doivent pouvoir être consultées avec différentsniveaux d’agrégation selon le contexte et la demande de l’utilisateur et se présentent del’agrégation la plus générale à l’analyse la plus détaillée utile.Remarque : Il est à noter que le niveau hiérarchique le plus fin de l’ensemble des axes détermine le niveau d’agrégation de base de la table de fait, une 

augmentation de la précision de ce niveau entraîne donc une refonte concomitante de la table de faits.

Exemple de hiérarchie : l’axe de temps.

Page 5: Modele en Etoile

5/11/2018 Modele en Etoile - slidepdf.com

http://slidepdf.com/reader/full/modele-en-etoile 5/6

Page 5

4) Pour chaque niveau ainsi que pour les faits, quelles sont les informationscomplémentaires (non hiérarchiques) nécessaires à l’analyse ?

Les restitutions et les analyses ne peuvent pas se contenter des niveaux hiérarchiques, il y ades informations qui ne peuvent pas être représentées en tant que niveau bien qu’elles soientutilisées dans les tableaux (Par exemple le N° de téléphone d’un client ou le mode de paiementet la devise d’une facture).

Côté base de données, ces informations sont stockées directement dans la table de fait et dansles dimensions concernées, la véritable différence se situe au niveau de leur représentationdans les outils de restitution (Par exemple : propriétés de niveau dans les cubes OLAP ouobjets de type Information sous BO)

Exemple avec l’axe de temps :

5) Pour chaque axe d’analyse, conserve-t-on l’historique et avec quelle date d’effet ?

Pour certains axes, il est nécessaire de conserver la situation historique au moment du fait, ilfaut dans ce cas identifier dans les données source la date d’effet déterminant le changement.Cette date, scindée en date de début et date de fin d’effet fera alors partie de la clé primaire dela table de dimension associée à l’axe.

Dans le cas où il n’y a pas de date d’effet disponible dans les données source, il est toujours

possible, en détectant les changements sur les données, de la remplacer par la dated’intégration des données modifiées.

Modélisation à partir de l'interview

La table de faits n’a pas de clé primaire mais une contrainte d’unicité sur les clés étrangères etles informations complémentaires.

Les relations sont toujours

de 1 à plusieurs vers latable de faits

Les mesures sont agré-gées en fonction de lacontrainte d’unicité de latable de faits

Les clés étrangères de latable de faits sont déduites

des clés primaires destables de dimension

Page 6: Modele en Etoile

5/11/2018 Modele en Etoile - slidepdf.com

http://slidepdf.com/reader/full/modele-en-etoile 6/6

Page 6

Tableau de correspondance

Rédaction du cahier des charges :

- Un document de spécifications, servant à réaliser un modèle en étoile et sa restitution doitcomporter les chapitres et les points suivants :

- Description fonctionnelle : Transcription directe de l’interview, ordonnée par fait puis par dimen-sions.

- Modèle de données : Représentation du modèle physique de données en étoile.

- Cartographie des données : Détail de l’alimentation du modèle par table et par champ.

- Cartographie de la restitution : Selon les outils de restitution utilisés, correspondance entre lemodèle en étoile et les objets proposés dans le requêteur.