Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle:...

38
Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté par : Encadré par : OUAZZANI TOUHAMI Raouya Mr. HACHMOUD

Transcript of Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle:...

Page 1: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Université Mohammed Ben AbdellahÉcole Supérieure d Technologie

Fès

Licence Professionnelle: Management International

Et NTICExposé sous thème:

Présenté par : Encadré par :

OUAZZANI TOUHAMI Raouya Mr. HACHMOUD

LAMRABET Betissam Année universitaire: 2007/2008

Page 2: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Plan

I- Qu’est ce que le DW ?II- Concept du DWIII- Mise en œuvre d’un DW IV- Les aspects techniquesV- Exploitation des entrepôts de données

I- Qu’est ce que le Data Mining?II- Quel sont les techniques principales du Data

Mining ?III- Domaines d'application du DATA MININGIV- Le Data Mining dans l'architecture du Data

WAREHOUSEV- Les différents modules du Data Mining

IntroductionIntroduction

ConclusionConclusion

Partie 1 : Data WAREHOUSEPartie 1 : Data WAREHOUSE

Partie 2 : Data MININGPartie 2 : Data MINING

Page 3: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

On qualifie d'informatique décisionnelle (en anglais

« Business intelligence », parfois appelé tout simplement

« le décisionnel ») l'exploitation des données de l'entreprise

dans le but de faciliter la prise de décision par les

décideurs, c'est-à-dire la compréhension du fonctionnement

actuel et l'anticipation des actions pour un pilotage éclairé

de l'entreprise.

Les outils décisionnels comme le Data Warehouse et

le Data Mining sont basés sur l'exploitation d'un système

d'information décisionnel alimenté grâce à l'extraction de

données diverses à partir des données de production,

d'informations concernant l'entreprise ou son entourage et

de données économiques.

Introduction

Page 4: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

1- Définition 1- Définition Data WarehouseData Warehouse

Ensemble de données historisées variant dans le temps, organisé

par sujets, consolidé dans une base de données unique, géré dans

un environnement de stockage particulier, aidant à la prise de

décision dans l’entreprise.

PartiePartie 1 : Data WAREHOUSE1 : Data WAREHOUSE

I- Qu’est ce que le I- Qu’est ce que le DW ?DW ?

Page 5: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

2 -2 -Le schéma général d'un DATA WAREHOUSELe schéma général d'un DATA WAREHOUSE

Page 6: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

3- Objectifs

intégrer différentes bases de données opérationnelles;intégrer différentes bases de données opérationnelles;

donner l ’accès aux informations du passé;donner l ’accès aux informations du passé;

fournir des outils d ’analyse sur ces données;fournir des outils d ’analyse sur ces données;

résumer les données;résumer les données;

réconcilier des données inconsistantes.réconcilier des données inconsistantes.

Page 7: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

4- La structure du DATA WAREHOUS

Les donnéesLes données agrégéesagrégées Les méta- donnéesLes méta- données

Les données historiséesLes données historiséesLes donnéesLes données détailléesdétaillées

DATA WAREHOUSEDATA WAREHOUSE

Page 8: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Données détailléesDonnées détaillées

- Données se représentant aux événement les plus récent;

- données issues des systèmes de production qui se réalisent à ce

niveau de classe.

Données agrégéesDonnées agrégées

- données issues d’analyse et de synthétisation au préalable des

informations provenant des applications décisionnelles;

- Elles représentent les informations ciblant directement les besoins

des utilisateurs;

- Elles sont sous une forme facilement accessible par l’utilisateur et

sémantiquement cohérente pour la bonne compréhension des

utilisateurs.

Page 9: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Méta donnéesMéta données

- elles permettent de connaître le contenu du DW ;

- ainsi de faciliter la recherche de données;

- elles contiennent les informations sur l’ensemble du DW;

Données historiséesDonnées historisées

- propres, validées et proprement agrégées.

- en harmonie avec la stratégie de l’entreprise.

- elles ne sont ni écrasées, ni modifiées, ni supprimées.

Page 10: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

II- Concept du DATAWARHOUSE

Orientée sujet Données intégréesDonnées intégrées

Données non volatilesDonnées non volatiles

DATA WAREHOUSE

Page 11: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

III- Mise en œuvre d’un DATA

WAREHOUSEUn DATA WAREHOUSE fait partie du domaine

stratégique de l’entreprise, d’où l’implication nécessaire de la direction.

1- Bien connaître le métier des utilisateurs

2- Assurer une conduite de projet adapté

3- Critère de réussite

Page 12: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

1- Bien connaître le métier des utilisateurs

Les utilisateurs doivent s’approprier le projet pour que

celui-ci puisse répondre pleinement à leurs attentes, et pour

cela il faut :

- les informer très tôt, leur présenter le projet, la démarche

et leur implication dans celui-ci.

- Les informer de l’état d’avancement.

- Leur présenter une version de pré production afin qu’ils

puissent se faire une idée de la « solution finale ».

Page 13: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

2- Assurer une conduite de projet adapté

La spécification, puis la qualification des besoins que l’on

chiffre pour donner naissance à une réalisation faisant l’objet

d’une recette finale.

Cette démarche est inapplicable dans le cas des DWH, car les

utilisateurs sont incapables d’exprimer l’intégralité de leur

besoin en une seule fois, parce qu’ils n’imaginent pas les

possibilités offerte par ce type d’outil.

Il faut donc construire son DWH par itérations successives

Page 14: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

3- Critère de réussite

Pour que la mise en place et la pérennité d’un DWH se fasse, il

faut:

- une implication forte des utilisateurs;

- un soutien convaincu de la direction générale;

- un domaine d’activité et des objectifs clairs;

- un effectif compétent;

- un prototypage par itérations rapprochées;

- un chef de projet expérimenté.

Page 15: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

IV- Les aspects techniques1-Les bases de données

OLAP (On-Line Analitical Processing)- C’est un mode de stockage prévu

pour l’analyse statistique des données contenues dans la base;

- Il est appliqué à un modèle virtuel de représentation de donnée appelé cube ou hypercube OLAP.

OLTP (On-Line Transactional Processing)- C’est un mode de stockage fait pour

les systèmes opérationnels;- Ils supportent très bien une

utilisation transactionnelle de la base de données;- À ce mode de stockage est associé

des requêtes type sont courtes et ne demandant pas beaucoup de ressource du côté du serveur de la base de données.

Page 16: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Les tables de dimensions:- Elles contiennent les données qui permettent de définir un axe d’une étude. - Ce type de tables joue le rôle de référentiel au DATA WAREHOUSE

Les tables de faits:

- Comme leur nom l’indique, Ces tables contiennent uniquement les données factuelles du DATA WAREHOUSE.

Les tables d'agrégats:- Ces tables sont spéciales, elles permettent de simplifier le travail de restitution des logiciels d’analyse;- Elles contiennent des données à un niveau de granularité plus grand que dans les tables de faits;

2- Modélisation

Page 17: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

3.Les types de modéle

Modèle en étoile Modèle en flocon

Page 18: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

V- Exploitation des entrepôts de données

1)1)Outils d’alimentation Outils d’alimentation

« ETL« ETL » »

2) Outils de restitution et d’analyse2) Outils de restitution et d’analyse

Page 19: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

1)Outils d’alimentation « ETL »Les ETL (Extract, Transform, load) sont des outils qui ont

pour but de transformer les données primaires en informations stockées dans le DATA WAREHOUSE.

Pour cela il est nécessaire de réaliser les fonctions suivantes :

- Recherche et identification des données;

- Contrôle de qualité (épuration et validation);

- Extraction;

- Transformation;

- Chargement.

Page 20: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Figure : Le système d'alimentation

Page 21: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

2- Outils de restitution et d’analyse

Source : Business & Decision

Page 22: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Il s’agit des outils qui se branchent sur le DATA

WAREHOUSE.

Il existe des logiciels de datamining qui permettent de trouver

des corrélations entre les données, des tableurs et des requêteurs;

Ces derniers créent la requête en fonction des paramètres que

vous leur donnez.

Page 23: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

- les grands acteurs du décisionnel:

Page 24: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

I I Qu’est ce que le Data Mining?Qu’est ce que le Data Mining?

1- Définition Data MiningLe Data Mining, ou feuille de données, est l'ensemble des

méthodes et techniques destinées à l'exploration et l'analyse de bases de données informatiques, afin d'en tirer des connaissances ,des règles, des associations, des structures particulières restituant l'essentiel de l'information utile en réduisant la quantité de données.

Entrepôt desdonnées

DATA MINING

Connaissances(décision)

CompréhensionPrédiction

Découverte demodèles

Partie 2 : le Data MiningPartie 2 : le Data Mining

Page 25: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

2- Le Data Mining est un processus

Formaliser un problème que l'organisation cherche à résoudre en terme de données

Accéder aux données qu'elles en soient

Préparer les données en vue des traitements et utilisations futurs

Modéliser les données en leur appliquant des algorithmes d'analyse

Évaluer et valider les connaissances ainsi extraites des analyses

Déployer les analyses dans l'entreprise pour une utilisation effective

Page 26: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Les outils de data mining Technique utilisée

Knowledgeseeker Arbres de décision

Forecast Pro Prévision

Intelligent Miner Prévision

Alice Arbres de décision

Saxon Réseaux neuronaux

SAS System Statistiques, arbres de décision, réseaux neuronaux

Mine Set Arbres de décision, découverte de règles

STATlab Statistiques

SPSS Réseaux neuronaux

Arbres de décision

3- Les outil de Data Mining

Page 27: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

4- Les principales qualités d'un outil de Data Mining

doivent offrir des richesses analytiques d'un niveau équivalent aux outils statistiques traditionnels.

doivent offrir une ergonomie, une convivialité, une facilité de mise en oeuvre et d'interprétation les rendant accessibles à des utilisateurs non statisticiens.

Les résultats fournis par l'outil doivent être clairs et compréhensibles

il ne doivent pas contenir trop de termes techniques statistiques

Ils ne doivent pas être dédiés à un domaine particulier et doivent pouvoir résoudre différents problèmes provenant de contextes différents.

Page 28: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

les techniques les techniques du Data Mining du Data Mining

Fractales

Découverte des règles

Arbres de décision

Signal Processing

Réseaux neuronaux

II- Quel sont les techniques du II- Quel sont les techniques du Data Mining ?Data Mining ?

Page 29: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Signal Processing

Cette technique consiste à positionner les données et les filtrer à travers une hypothèse pour essayer de faire apparaître un lien entre ces données.

Découverte de règles

Cette technique consiste à demander au système d’aller chercher dans les données une validation d’une règle connue ou de découvrir lui-même une règle.

Arbres de décision

Cette technique consiste à formaliser un arbre qui va procéder à une analyse critère par critère.

Page 30: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Fractales

Cette technique consiste à Composer des segmentations à partir de modèles mathématiques basés sur des regroupements irréguliers de données.

Réseaux neuronaux

Cette technique consiste à l’utilisation des technologies d’intelligence artificielle afin de découvrir par l’apprentissage du moteur des liens non procéduraux.

Page 31: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

III Domaines d'application du DATA MINING

Domaines d'application Domaines d'application du DATA MININGdu DATA MINING

Secteur Secteur bancairebancaire

La grandeLa grandedistributiondistribution

GestionGestion du risquedu risque

Secteur médicalSecteur médical

Gestion deGestion dela relation clientla relation client

Marketing Marketing stratégiquestratégique

Assurance Assurance de biens etde biens et

de personnesde personnes

Vente parVente parCorrespondanceCorrespondance

(VPC)(VPC)

Page 32: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Data WarehouseData Warehouse

Bases deproduction

Bases externes

Outilsd’alimentation

DataData MartsMarts

IV- Le Data Mining dans l'architecture du Data WareHouse

Meta données (DictionnaireMeta données (Dictionnaire))

Utilisateurs SIADUtilisateurs SIAD

Utilisateurs EISUtilisateurs EIS

Utilisateurs requêteursUtilisateurs requêteurs

OLAP

OLAP

Data MiningData Mining

Data MiningData Mining

Page 33: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

V- Les différents modules du Data Mining

Le Data Mining utilise la technique de la modélisation pour faire des découvertes ou des prévisions.

l’outil Data Mining est en mesure de proposer une technique différente correspondant à des algorithmes et une méthode d’approche des données adéquates a fin de répondre à des problématiques concernant :

Page 34: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

La segmentation permet de fragmenter la base de données en segments ayant des caractéristiques similaires et des comportements homogènes.

2- Classification Il se propose de caractériser des groupes de

populations homogènes en rapprochant des paramètres possédés par chacun des membres.

Ainsi, la classification permet de développer des profils de groupe à partir des critères des enregistrements.

1- Segmentation1- Segmentation

Page 35: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

La prévision permet de mesurer l’influence d'un paramètre présent dans une population sur l’ensemble des autres paramètres de cette population.

4- AssociationL’association permet d’analyser la présence simultanée

de valeur de paramètres sur un même critère ou sur deux paramètres différents.

5-Modèle SéquentielLe modèle séquentiel induit des découvertes liées à

l’axe temporel. Il permet de trouver des modèles de comportement qui présupposent des enchaînements systématiques qui suivront sur une période de temps.

3-Prévision3-Prévision

Page 36: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Conclusion

L’utilisation des DATAWAREHOUSE est aujourd’hui très demandé dans le monde de l’entreprise, demande qui répond

au besoin toujours plus présent des utilisateurs d’avoir les bonnes informations au bon moment. Ainsi que le Data

Mining participant dès lors à une meilleur compréhension de l'activité des entreprises , et à une rationalisation avancée du stockage de l'information. Autrement dit, le Data Mining ne

consiste pas en une succession d'études ad hoc mais doit bien permettre à l'organisation de capitaliser sur les connaissances

acquises. C'est sa raison d'être.

Page 37: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Webographie

www.wikipédia.org

www.supinfo.com Introdution au DataWareHouse.htm l’auteur Nicolas GUILLOT

www.ultrafluide.com

www.journaldunet.com

www.lincoln.fr

Page 38: Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté