Université Batna 2 Faculté de Mathématiques et ...

Post on 19-Jun-2022

6 views 0 download

Transcript of Université Batna 2 Faculté de Mathématiques et ...

Université Batna 2Faculté de Mathématiques et Informatique

Département de MathématiqueAnnée universitaire 2019-2020

Informatique décisionnelle

Master 1 SAD Saadna yassmina

Itroduction

• Pourquoi le décisionnel ?

• le décisionnel ne concerne souvent que les entreprises qui gèrent un historique de leurs événements passés.

• L’informatique décisionnelle est utilisée dans le BI.

2

Architecture

3

Extract Transform Load (ETL)

4

Datawarehouse

• Collection de données orientées sujets, intégrées, non volatiles et historisées, organisées pour le support du processus d’aide à la décision.

• Base de données dans laquelle sont déposées après nettoyage et homogénéisation les informations en provenance des différents systèmes de production de l’entreprise OLTP

5

Datawarehouse

6

Datawarehouse

• L'entrepôt est organisé sur le modèle multidimensionnel évoqué précédemment. Il y a néanmoins deux types de stockage :

L'entrepôt (data warehouse), qui concentre toutes les données ;

Le marché de données (data mart) focalise sur une partie du métier, comme les relations clients, par exemple.

7

Datawarehouse

• Caractéristiques des données d'un DW

1 •Orientées sujet

2 •Intégrées

3 •Historisées

4 •Non volatiles

8

Datawarehouse

• Orientées sujet :

– Organisées autour de sujets majeurs de l’entreprise

– Données pour l’analyse et la modélisation en vue de l’aide à la décision, et non pas pour les opérations et transactions journalières

– Vue synthétique des données selon les sujets intéressant les décideurs

9

Datawarehouse

• Intégrées :

– Construit en intégrant des sources de données multiples et hétérogènes

• BD relationnelles, fichiers, enregistrements de transactions

– Les données doivent être mises en forme et unifiées afin d’avoir un état cohérent

– Phase la plus complexe (60 à 90 % de la charge totale d’un projet DW)

10

Datawarehouse

• Historisées :

– Fournies par les sources opérationnelles

– Matière première pour l'analyse

– Stockage de l'historique des données, pas de mise à jour

– Un référentiel temps doit être associé aux données

11

Datawarehouse

• Non volatiles :

– Conséquence de l’historisation

– Une même requête effectuée à intervalle de temps, en précisant la date référence de l’information donnera le même résultat

– Stockage indépendant des BD opérationnelles

– Pas de mises à jour des données dans le DW

12

• Notion de Datamart

• « C'est un sous-ensemble de données dérivées du DW ciblé sur un sujet unique»

• Orienté vers un sujet unique

• Données fortement agrégées

• Organisation multidimensionnelle (cubique)

• Lien dynamique avec le DW

13

Données multidimensionnelles

14

Données multidimensionnelles

Graphique 3D

15

Données multidimensionnelles

Hyper cube

16

Online Analytical Processing OLAP

• Une catégorie de logiciels axés surl’exploration et l’analyse rapide des donnéesselon une approche multidimensionnelle àplusieurs niveaux d’agrégation.

• faciliter l’exploration des données.

17

Vue multidimensionnelle

18

Agrégation des données

19

Opérations OLAP

• Pivot (Rotation)

20

Opérations OLAP

• Switch (Permutation)

21

Opérations OLAP

• Split (Décomposition

22

Opérations sur le contenu des cubes

• Roll-up /Drill-down

23

Opérations sur le contenu des cubes

• Slice (Restriction)

24

Opérations sur le contenu des cubes

• Dice (Projection)

25

Opérations entre cubes

•Jointure

26

Opérations entre cubes

• Union

27

Modélisation et Conception d’un DW

1• L’étude préalable

2• L’étude du modèle de données

3

• L’étude de l’alimentation du Datawarehouse

28

• Etude préalable

1) les objectifs du DW

1) le contenu du DW et son organisation.

1) les dimensions (temps, client, magasin..)

2) les mesures de fait (numérique)

3) la granularité des faits (niveau de détails)

4) Coûts de déploiement

Modélisation et Conception d’un DW

29

Modélisation et Conception d’un DW

• Modélisation

a) Niveau conceptuel

• Un DW est basé sur une modélisation multidimensionnelle.

• Un cube permet de voir les données suivant plusieurs dimensions

a) Niveau logique• Schéma en étoile;

• Schéma en flocon;

30

Schéma en étoile

31

Schéma en flocons

32

Restitution des informations

33

Data mining

34

Exercice 1

• Une entreprise de fabrication de vaisselle jetablesouhaite mettre en place un systèmed’information décisionnel sous la forme d’un datamart pour observer son activité de ventes auniveau des différents lieux de distributions de sesarticles et cela dans plusieurs villes.

35

Exercice 1• Ces lieux de distributions sont renseignés par leur

enseigne, leur type (en fonction de leur surface),leur adresse (code postal et ville), leurdépartement, leur région. Les ventes sontrenseignées selon une période qui se décline enmois, en trimestre et année. Les ventes sontobservées par le nombre d’articles selon le type,et le chiffre d’affaire.

36

Solution 1

37

Solution 2

38

Exercice 2• Concevoir un modèle en étoile qui permet

d’analyser les ventes d’une entreprise de restauration rapide. Le principe est de mesurer les ventes grâce aux quantités vendues et aux bénéfices, en fonction des ventes réalisées par jour, dans un restaurant donné, pour un aliment donné. L’objectif est de pouvoir analyser les ventes par jour, par semaine, par mois et par année. Les restaurants peuvent être regroupés en fonction de leur ville et de leur pays.

39

Solution

40

Modèle en flocon de neige

41

•On souhaite à présent mesurer le nombre decommandes qui est donné par jour et parrestaurant. Etendre le modèle précédent afin deprendre en compte cet aspect.

Exercice 2

42

43

44