Les entrepôts de données pour les nuls. . . ou pas
Transcript of Les entrepôts de données pour les nuls. . . ou pas
Cécile FavreFadila Bentayeb
Atelier Atelier aIdeaIde à la Décision à tous les Etagesà la Décision à tous les EtagesAIDE@EGC2013AIDE@EGC2013
Toulouse Toulouse
Mardi 29 janvier 2013Mardi 29 janvier 2013
Fadila Bentayeb
Omar Boussaid
Jérôme Darmont
Gérald Gavin
Nouria Harbi
Nadia Kabachi
Sabine Loudcher
Les entrepôts de données
pour les nuls. . .
ou pas !
Préambule
Travail collectif des permanents de l’équipe SID (Systèmes d’Information Décisionnels) du laboratoire ERIC
Une manière d’appréhender le futur proche pour
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al.
Une manière d’appréhender le futur proche pour notre recherche
Positionnement par rapport au domaine de l’aide à la décision (d’autres courants représentés au sein du laboratoire)
2/14
Positionnement d’ERIC
Sources Entrepôt de Entrepôt de
Analyse en ligne (OLAP)D
é
c
i
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al. 3/14
Sources
de
données
Entrepôt de
données
Connaissance
Fouille de données
i
s
i
o
n
Apprentissage automatique
Fouille de graphes, fouille d’opinion
Agrégation
multicritère
Plan
L’informatique décisionnelle : les concepts
Des données à tous les niveaux
Environnements de stockage
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al.
Environnements de stockage
Des entrepôts pour tous : utilisateurs à tous les étages
Sécurité
Conclusion
4/14
Architecture d’un système décisionnel
DonnéesConcepts Environnements de Stockage DiscussionSécuritéUtilisateurs
Gestion des données Aide à la décision
Bases de
Données
Bases de
Données
A ------
---------
---------
---------
A ------
---------
---------
---------
Tables, tableaux
Data Mining
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al. 5/14
---------
Texte
---------
Texte
Multimédia
Web
ImagesImages
�
BDDBDD
Data Marts
Cubes
multidimensionnelsData warehouses
Grandes bases
de données
OLAP
Analyses statistiques,
Reporting
Construction SélectionSélection AnalyseAnalyse
L’informatique décisionnelle
Naissance dans les entreprises
Entrepôt de données : collection de données orientée sujets, intégrée,
non volatile et en mode de lecture seule, importée à partir de sources de
données hétérogènes et stockée à différents niveaux de granularité
dans un but de prise de décision (Inmon, 1996)
DonnéesConcepts Environnements de Stockage DiscussionSécuritéUtilisateurs
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al.
Aide à la décision :
Déploiement d’un entrepôt de données
Outils de navigation dans les données pour les utilisateurs
6/14
L’informatique décisionnelle : concepts
Modélisation multidimensionnelle
DonnéesConcepts Environnements de Stockage DiscussionSécuritéUtilisateurs
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al.
AlimentationPhase ETL (Extract – Transform – Load) : 80% du temps
Implémentation en relationnel possible
7/14
L’informatique décisionnelle : concepts
Analyse en ligne
Processus de navigation dans les données par les décideurs
Cubes de données
Opérateurs OLAP (On Line Analytical Processing) :
DonnéesConcepts Environnements de Stockage DiscussionSécuritéUtilisateurs
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al.
navigation selon différents niveaux de détails
• ROLL UP
• DRILL DOWN
8/14
Des données à tous les niveaux
Complexité et volume des données
Données du Web, Flux de données …
Texte, Images, …
DonnéesConcepts Environnements de Stockage DiscussionSécuritéUtilisateurs
Web
�
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al.
Spatial OLAP / XML OLAP
Big Data : peta-octets, zeta-octets…
Problématiques
• Analyse
• Performance
9/14
Web
Environnements de stockage
Au-delà du relationnel, les entrepôts continuent
NOSQL
Jusque dans les nuages
Externalisation des services
DonnéesConcepts Environnements de Stockage DiscussionSécuritéUtilisateurs
Cloud
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al.
Externalisation des services
Environnement d’hébergement « virtuel »
Puissance de calcul
Facturation à l’utilisation
Délocalisation des soucis…
Des adaptations spécifiques
10/14
Utilisateurs à tous les étages
Généralisation de l’usage des entrepôts de données
(contexte : Open Source et Cloud)
Implication de l’utilisateur dans le processus décisionnel
Phase de modélisation
Personnalisation des analyses
DonnéesConcepts Environnements de Stockage DiscussionSécuritéUtilisateurs
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al.
Personnalisation des analyses
Démarche d’analyse collaborative
Business Intelligence « à la demande »
Visualisation pour aider l’utilisateur à décider
Travaux sur la visualisation : améliorer les visualisations classiques
(3D)
Travaux liés aux nouveaux supports de communication (outils
mobiles)
11/14
Sécurité
De nouvelles vulnérabilités
Surveillance et réactivité
Accessibilité : par rapport aux utilisateurs (profil)
DonnéesConcepts Environnements de Stockage DiscussionSécuritéUtilisateurs
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al.
Accessibilité : par rapport aux utilisateurs (profil)
Disponibilité et confidentialité des données : de
nouveaux problèmes liés à l’informatique dans le
nuage
Stratégie de stockage des données sensibles
Cryptage de données
12/14
Discussion
DonnéesConcepts Environnements de Stockage DiscussionSécuritéUtilisateurs
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al. 13/14
Conclusion
Aide à la décision : prisme des entrepôts de données et de l’analyse en
ligne.
Concepts fondateurs et 4 aspects structurants : données,
environnements de stockage de ces données, utilisateurs, sécurité
Synthèse des problèmes ouverts dans un nouveau contexte économique
et technologique : corrélation avec l’émergence du Cloud, des outils
DonnéesConcepts Environnements de Stockage DiscussionSécuritéUtilisateurs
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al.
et technologique : corrélation avec l’émergence du Cloud, des outils
Open Source
Modification profonde du rapport des utilisateurs aux données et à leur
analyse, posant de réels problèmes de sécurité.
Développement de l’activité dans le monde socio-économique
Avenir scientifique prometteur avec nombreux verrous scientifiques
14/14
Espace pub…
EDA 2013… à Blois
9èmes Journées francophones
sur les Entrepôts de Données
et l'Analyse en ligne
13 et 14 Juin 2013
Les entrepôts de données pour les nuls. . . ou pas ! – C. Favre et al.
13 et 14 Juin 2013
Date importante
Soumission des articles :
vendredi 22 Février 2013
Merci
de Questions ?
Atelier Atelier aIdeaIde à la Décision à tous les Etagesà la Décision à tous les Etages
AIDE@EGC2013AIDE@EGC2013Toulouse Toulouse
Mardi 29 janvier 2013Mardi 29 janvier 2013
de
votre
attention!
Questions ?