Mastère ASIG / Projet Bibliographique 2008
1
P7 : Projet Bibliographique
Dans le cadre du Mastère ASIG
Le Géodécisionnel
Les SIG au service du géodécisionnel
Thierry Lallemant
15 Mai 2008
Mastère ASIG / Projet Bibliographique 2008
2
TABLE DES MATIERES
1 INTRODUCTION 7
1.1 CONTEXTE 7
1.2 SIG + DECISIONNELLE = MARIAGE DIFFICILE 7
1.3 OBJECTIF RAPPORT 9
2 LES BESOINS SPECIFIQUES DU GEODECISIONNEL 10
2.1 COMPOSANTE SPATIALE INDISPENSABLE 10
2.2 SIG : 1ER CANDIDAT POTENTIEL 12
3 TECHNOLOGIE OU APPLICATION SOLAP 14
3.1 EXEMPLES D’APPLICATION SOLAP AVEC DIFFERENTES TECHNOLOGIES 15 3.1.1 Les applications réalisées par l’équipe de l’Université de l’Aval [Yvan Bédard] 15
3.2 VOCABULAIRE DU MONDE SOLAP 20 3.2.1 Dimensions spatiales 20 3.2.2 Mesures spatiales 21 3.2.3 Opérateurs spatiaux de navigation 22 3.2.4 Synchronisation de navigation 24 3.2.5 La symbologie SOLAP 26 3.2.6 Données spatiales contextuelles 27 3.2.7 Légende interactive 28
4 APPROCHES POUR LE DEVELOPPEMENT D’APPLICATION SOLAP 29
4.1 OLAP DOMINANT 30 4.1.1 Avantages 30 4.1.2 Inconvénients 30
4.2 SIG DOMINANT 30 4.2.1 Avantages 31 4.2.2 Inconvénients 31
4.3 SOLAP INTÉGRÉ 31 4.3.1 Avantages 31 4.3.2 Inconvénients 31
5 NOTIONS ET ARCHITECTURES DES BASES DE DONNEES OLAP/SOLAP 32
5.1 INTRODUCTION OLAP 32
5.2 VOCABULAIRE OLAP 32 5.2.1 Dimensions ou axes 32 5.2.2 Mesures 33 5.2.3 Faits 33 5.2.4 Cubes 33
5.3 EXEMPLES CONCRETS DE CUBE MULTIDIMENSIONNEL 34 5.3.1 EXEMPLE 1: 34 5.3.2 EXEMPLE 2: 34
Mastère ASIG / Projet Bibliographique 2008
3
5.4 ARCHITECTURE OLAP 35
5.5 MOLAP (OLAP MULTIDIMENSIONNEL) 36
5.6 ROLAP (OLAP RELATIONNEL) 36
5.7 HOLAP (OLAP HYBRIDE) 37
5.8 BILAN MOLAP/ROLAP/HOLAP 38
5.9 STRUCTURE MULTIDIMENSIONNELLE 38 5.9.1 Modèle en étoile 38 5.9.2 Modèle en flocon 39 5.9.3 Modèle Mixte 40 5.9.4 Modèle en constellation 40
5.10 LA CAS JMAP SPATIAL OLAP 41
CONCLUSION 42
Mastère ASIG / Projet Bibliographique 2008
4
TABLE DES ILLUSTRATIONS
Figure 1 : OLTP & OLAP___________________________________________________________________ 8
Figure 2 : La visualisation spatiale améliore la compréhension d’un phénomène_______________________ 11
Figure 3 : SOLAP = combinaison de différents outils ____________________________________________ 13
Figure 4 : Une application de gestion du réseau routier (ProClarity et GeoMedia WebMap) : Visualisation de
l’état de la chaussée au niveau des segments de route. ___________________________________________ 16
Figure 5 : Une application sur les accidents sur le réseau routier (JMap Spatial OLAP Extension et Oracle
10g) : Visualisation de la fréquence des accidents par découpage territorial (en haut) et selon les types
d’accidents (en bas). ______________________________________________________________________ 16
Figure 6 : une application en santé environnementale. Visualisation des cas de décès de maladies respiratoire.
Interface1 avec Visual Basic et librairie SoftMap (à gauche) et interface 2 avec ProClarity et KMapx (à droite).
______________________________________________________________________________________ 17
Figure 7 : Une application sur la cohorte d’étudiants (JMap Spatial OLAP Extension) : Visualisation des
étudiants par provenance géographique. ______________________________________________________ 18
Figure 8 : Une application sur les performances des athlètes de patinage de vitesse (JMap Spatial OLAP
Extension) : Visualisation de la vitesse moyenne des patineurs sur la piste (gauche) et par segments de parcours
(droite). ________________________________________________________________________________ 18 Figure 9 : Une application tridimensionnelle en archéologie (ESRI ArcGIS et ProClarity) : Visualisation des
lots fouillés sous la forme de volume. _________________________________________________________ 19
Figure 10 : Une application tridimensionnelle pour la gestion des forêts (ESRI ArcGIS et ProClarity) :
Visualisation des chablis sur le modèle 3D. ____________________________________________________ 19
Figure 11 : Les trois types de dimensions spatiales supportées par le SOLAP _________________________ 20
Figure 12 : 2 types de mesures : descriptive numérique et spatiale __________________________________ 21
Figure 13 : Opérateur DRILL-DOWN ________________________________________________________ 22 Figure 14 : Opérateur DRILL-UP ___________________________________________________________ 23 Figure 15 : Opérateur DRILL-ACROSS _______________________________________________________ 23 Figure 16 : Opérateur PIVOT_______________________________________________________________ 24 Figure 17 : Gestion de différents types d’affichage : Carte multi-temporelle ou statistique _______________ 25 Figure 18 : Synchronisation de la collection suite à une opération de forage spatial ____________________ 26 Figure 19 : Synchronisation de la symbologie __________________________________________________ 27 Figure 20 : La carte source d’informations contextuelles _________________________________________ 28 Figure 21 : Modélisation UML d’un exemple de cube ____________________________________________ 33 Figure 22 : Architecture MOLAP ____________________________________________________________ 36 Figure 23 : Architecture ROLAP ____________________________________________________________ 37 Figure 24 : Architecture HOLAP ____________________________________________________________ 37 Figure 25 : Modèle en étoile________________________________________________________________ 39 Figure 26 : Modèle en flocon _______________________________________________________________ 39 Figure 27 : Modèle Mixte __________________________________________________________________ 40 Figure 28 : Modèle en constellation __________________________________________________________ 40 Figure 29 : architecture JMap Spatial ________________________________________________________ 41
Mastère ASIG / Projet Bibliographique 2008
5
GLOSSAIRE
SIG = Un système d'information géographique est un outil informatique permettant
d'organiser et présenter des données alphanumériques spatialement référencées, ainsi que
de produire des plans et cartes.
Datawarehouse = entrepôt de données
Datamart = petit entrepôt de données à l'échelle d'un département ou succursale d'une
grande société. Généralement un datamart déverse ses données chez sa mère qui est le
datawarehouse.
OLTP = OnLine Transactonal Processing. Il s'agit des traitements transactionnels. Par
exemple, les logiciels des caisses enregistreuses des chaines de magasins font du OLTP.
OLAP = OnLine Analytical Processing. Opposé à l'OLTP, faire de l'OLAP signifie faire de
l'analyse de données. Analyser les ventes, détecter les fraudes, prospecter des clients font
partie du processus OLAP.
Base de données multidimensionnelle = une base de données multidimensionnelle par
opposition à une base de donnée relationnelle est une base dénormalisée ou il existe une
table centrale (table de fait) liée à toutes les autres tables (tables de dimension).
Table de fait = comme son nom l'indique, une table de fait est une table contenant tous
les faits du SI et dont dépendent toutes les autres tables. Cette table ne contient que des
clés étrangères venant des tables de dimension et des valeurs numériques appelées
mesure. Exemple de table de fait : table des Ventes
Tables de dimension = les tables de dimension sont des tables servant d'axes d'analyse. On
peut par exemple analyser les ventes (table de fait) suivant l'axe des temps (table de
dimension) pour indiquer par exemple pendant quel trimestre de l'année les ventes ont
explosé.
Mesure = une mesure est une quantité présente dans la table de fait qui permet de
mesurer les faits. Par exemple, nombre de vente ou prix unitaire sont des exemples de
mesures.
Mastère ASIG / Projet Bibliographique 2008
6
Cube = un cube de données est une structure dimensionnelle comme une table est une
structure relationnelle. Un cube est constitué d'un ou plusieurs tables de faits avec leurs
tables de dimension. On peut par exemple considérer un cube vente contenant sa table de
fait " vente " et ses tables de dimensions " clients ", " région " et " temps ".
Niveau de hiérarchie = un niveau de hiérarchie se définit au niveau des tables de
dimensions. Cela permet d'agréger les données. Par exemple, supposons qu'on ait la
dimension région contenant la liste des villes, on pourrait faire un niveau de hiérarchie
(niveau 1) classant les villes en région, ensuite un niveau plus bas qui les classerait en
département (niveau 2).
Drill-down = faire un drill-down, c'est avoir un niveau de détails sur les données. Par
exemple Supposons qu'on veuille voir le détail des ventes pour le premier trimestre de
l'année 1997.On dit qu'on fait un drill-down sur l'axe (ou dimension) temps. C'est à dire
qu'on ne veut pas voir seulement les données de l'année 1997 mais descendre à un niveau
de détail plus bas.
Roll-up (Drill-up)= rollup est le contraire de drill-down. C'est donc faire de l'agrégation (ou
résumé) des données.
Mastère ASIG / Projet Bibliographique 2008
7
1 INTRODUCTION
1.1 CONTEXTE
Partout dans le monde, de nombreuses organisations dépensent des sommes colossales en
acquisition de données localisées sur le territoire.
La production cartographique, l'établissement de relations avec les bases de données
internes à l’organisation et l'analyse spatiale de ces données relèvent du domaine de la
géomatique qui représente un marché annuel de plusieurs dizaines de milliards d'euros.
Cependant, les données ainsi produites sont surtout de nature opérationnelle et difficile à
exploiter à des fins décisionnelles, fins qui demandent des informations multisources,
agrégées, des comparaisons dans l'espace et le temps, des synthèses, des mesures de
tendances, des réponses rapides à des requêtes imprévues, etc.
1.2 SIG + DECISIONNELLE = MARIAGE DIFFICILE
D'importants efforts sont déployés depuis une quinzaine d'années pour mettre en place des
systèmes d'aide à la décision géospatiale, mais ces systèmes reposent sur les systèmes
d'information géographique (SIG) et les approches transactionnelles habituelles (OLTP*)
pour produire l'information géodécisionnelle, souvent avec des délais inacceptables, voire
des coûts prohibitifs au point d'en laisser tomber la production. Cette situation nuit à la
prise de décision tactique/stratégique (ex. déploiement des ressources, de nouvelles
infrastructures) et devient particulièrement problématique en situation d'urgence où tout
retard peut avoir des impacts majeurs.
Cette difficulté de produire l'information géospatiale décisionnelle provient de cinq
problèmes:
(1) des méthodes inadéquates de conception de bases de données géospatiales à fins
décisionnelles,
(2) la difficulté d'agréger et synthétiser des données cartographiques hétérogènes,
(3) la difficulté d'évaluer la qualité de l'information géospatiale agrégée,
(4) une sous-exploitation des technologies de l'information et des communications, et
(5) un manque de technologies décisionnelles géospatiales efficaces.
Le présent rapport traite de ce dernier point, particulièrement des nouvelles tendances
d'analyse spatiale en ligne (Spatial OLAP* ou SOLAP).
Mastère ASIG / Projet Bibliographique 2008
8
Il est déjà reconnu que pour soutenir leurs processus décisionnels, les organismes déploient
des entrepôts de données et utilisent des outils clients spécifiques afin d'accéder,
visualiser et analyser leurs données intégrées. Puisqu'une grande partie de ces données
peut avoir une composante spatiale (ex. adresse civique), de nouveaux outils sont
nécessaires pour profiter pleinement de la position et la forme des phénomènes analysés.
Il a été démontré [Caron 1998] que les technologies OLAP sans visualisation et navigation
cartographiques présentent d'importantes limitations pour l'analyse de phénomènes
géographiques et spatio-temporels comme on en rencontre en environnement, foresterie,
agriculture, urbanisme, sécurité, transport, etc. Par conséquent, la géodécisionnelle
pourra pallier à ces limitations et pour y parvenir différentes possibilités existent
aujourd’hui, plus ou moins bien efficace.
Figure 1 : OLTP & OLAP
Mastère ASIG / Projet Bibliographique 2008
9
1.3 OBJECTIF RAPPORT L'objectif de ce rapport est de présenter ces différentes possibilités tout en mettant
l'accent sur la solution la plus évoluée: la "technologie SOLAP*". Ainsi, la prochaine partie
résume les besoins spécifiques au monde géodécisionnel et présente les opportunités qui
ont conduit depuis 1997, au développement d’applications SOLAP avec différentes
solutions (ex. combinaisons SIG + OLAP, technologie SOLAP). La deuxième section définit
la technologie SOLAP et présente certains concepts spécifiques aux données spatiales
accompagnés d'exemples d’applications. La troisième partie présente les différentes
méthodes de développement d’applications SOLAP, incluant l'utilisation de la technologie
SOLAP. Et en conclusion, une approche des avenues innovatrices pour le développement
d’applications SOLAP.
Mastère ASIG / Projet Bibliographique 2008 10
2 LES BESOINS SPECIFIQUES DU GEODECISIONNEL
2.1 COMPOSANTE SPATIALE INDISPENSABLE
Les données emmagasinées dans les entrepôts de données* forment la base des analyses
et guident l’organisation dans sa prise de décision. Cependant, les données ne sont pas
toujours exploitées selon leur plein potentiel et une partie de leur richesse, c'est-à-dire,
leur composante spatiale, est souvent inutilisée. " Cacher dans la plupart des données, se
trouve une composante spatiale lié à une localisation: une adresse, un code postal, une
localisation GPS, une Région ou un pays " [ESRI 2000].
En effet, il est estimé qu’environ 80% des données stockées dans les bases de données
corporatives possèdent une référence spatiale [Franklin 1992], laquelle référence peut
inclure, en plus de la position, une forme, une orientation et une taille. La simple
visualisation de cette composante spatiale permet de répondre à un premier besoin, soit
de mieux comprendre le phénomène en question en voyant sa position dans un cadre de
référence géographique, en voyant son étendue sur le territoire, en voyant sa distribution
sur le territoire (concentrée, dispersée, par groupes, aléatoire, régulière, etc.). Une telle
visualisation permet de découvrir des informations non disponibles dans les outils OLAP
traditionnels, soit des modes de distribution géographique du phénomène ne suivant pas
les découpages territoriaux prédéfinis comme membres d'une dimension (ex. nom du pays,
nom de la région, nom de la ville).
Mastère ASIG / Projet Bibliographique 2008 11
Figure 2 : La visualisation spatiale améliore la compréhension d’un phénomène
L'utilisation de la composante spatiale permet également de répondre à un deuxième
besoin, soit de découvrir des relations spatiales entre différents phénomènes
géographiques (ex. corrélation spatiale entre une fréquence d’une maladie X et un taux
d'émission d'un polluant Y).
Cette découverte peut se faire par visualisation même si une corrélation ne suit pas la
hiérarchie de la dimension territoriale telle que définie dans le cube de données* (i.e.
dont la délimitation géographique est uniquement identifiée par un nom de lieu, comme
pays – province - région administrative).
Cette découverte peut également se faire par l'ajout de plusieurs découpages territoriaux
ou l'ajout de dimensions d'analyse spatiale.
Souvent, l’affichage cartographique révèle des informations (ex. proximité entre deux
phénomènes isolés, étendu d’un phénomène, forme d’un phénomène longeant une rive,
orientation des phénomènes selon un flanc de montagne) qui n’auraient pas été
soupçonnées en faisant appel à d’autres méthodes de représentation telles que les
tableaux et les graphiques.
Un troisième besoin majeur dans un contexte d'analyse spatiale en ligne est celui de
pouvoir naviguer dans une carte aussi librement que ce que permet un outil OLAP dans les
tableaux et graphiques statistiques. Ainsi, l'utilisateur a besoin de pouvoir regarder les
détails d'une région d'intérêt grâce à un forage spatial (Drill down*), comparer ces détails
avec ceux d'une autre région qui n'est pas adjacente (Drill across*), découvrir s'il y a des
caractéristiques communes entre les distributions spatiales du phénomène dans ces deux
Mastère ASIG / Projet Bibliographique 2008 12
régions, remonter à une vision plus globale pour comparer un phénomène local avec un
phénomène national (Roll up*), voir l'évolution du phénomène sur le territoire sans être
restreint au découpage géographique de la dimensions spatiale utilisée, obtenir des valeurs
statistiques spatiales et temporelles sur l'évolution de ce phénomène, etc. Beaucoup de
connaissances géographiques peuvent être obtenues par l'utilisation appropriée de la
visualisation et de la navigation cartographique à la OLAP, et ceci même pour des
références spatiales non prévues dans le cube de données.
L'utilisation de la carte comme médium d'exploration de données permet d'avoir un modèle
informatisé se rapprochant davantage de la réalité de l'utilisateur et conséquemment lui
demandant un moins grand effort d'abstraction, ce qui accroît son efficacité. Les cartes se
prêtent mieux que les tableaux et graphiques statistiques à l'ajout de codes, symboles et
couleurs significatifs permettant de mieux supporter l'exploration interactive des données.
La possibilité de naviguer dans la carte permet de chercher des associations, favorisant la
découverte de relations spatiales insoupçonnées et potentiellement la construction d'un
nouveau cube de données avec un découpage différent du territoire.
Une application SOLAP, comparativement à une application OLAP, réveille davantage notre
capacité de visualisation exceptionnelle car la capacité de perception et de réflexion du
cerveau humain, tout comme sa mémoire, relèvent du domaine de l'image.
Plusieurs études ont démontré que les images sont souvent plus évocatrices que les mots,
plus précises et plus aptes à déclencher un vaste éventail d'associations. Ainsi, l'effet
stimulant que procurent les cartes incite à une meilleure exploration des données par
notre cerveau.
2.2 SIG : 1ER CANDIDAT POTENTIEL
Pour obtenir une telle efficacité avec les données géospatiales, plusieurs défis doivent être
surmontés. De toute évidence, les outils client actuellement utilisés pour exploiter les
entrepôts ne sont pas adaptés aux entrepôts de données géospatiales, car ils n’exploitent
pas la structure géométrique des données [Han et Kamber 2001]. Certes, ils peuvent être
utilisés, mais sans la capacité de manipuler la composante cartographique, ils ne peuvent
pas supporter d’analyses ni d'explorations avancées.
De nouveaux outils client sont requis pour exploiter le plein potentiel de cette composante
cartographique. Les systèmes d’information géographique (SIG) qui permettent
d'assembler, stocker, manipuler et afficher l'information à référence spatiale représentent
Mastère ASIG / Projet Bibliographique 2008 13
un premier candidat potentiel. Par contre, malgré ses capacités d’analyse spatiale
poussées, il est reconnu que le SIG seul, avec son architecture OLTP limitée, souffre d'un
interface de requête complexe et de temps de réponse lents aux requêtes agrégatives, en
plus de ne pas offrir les fonctions temporelles et navigationnelles nécessaires pour soutenir
l’aide à la décision.
Figure 3 : SOLAP = combinaison de différents outils
Des solutions alternatives doivent être développées [Bédard 2001].
• Dans un premier temps, l'utilisateur doit pouvoir se concentrer sur l'information
recherchée (le "quoi") et non pas sur les opérations nécessaires pour y parvenir (le
"comment").
• Dans un deuxième temps, pour être efficace, le processus de prise décision doit suivre le
flux de pensée de l’utilisateur. Il ne doit pas être interrompu par des manipulations
complexes et des temps de réponse trop longs. Les requêtes spatiales, la navigation,
l'affichage des cartes avec niveau de détail et la sémiologie graphique appropriée, ainsi
que la synchronisation entre les vues cartographiques, tabulaires et graphiques doivent
s'effectuer à l'intérieur de 10 secondes, soit à l'intérieur de la bande cognitive identifiée
par [Newell 1990]. Enfin, le tout représente en soi un défi majeur pour les SIG lorsqu’ils
sont utilisés seuls.
Ainsi, parmi les solutions potentielles, le couplage des technologies spatiales et non-
spatiales, comme SIG et OLAP, semble être une bonne option et a été expérimenté par
l’équipe de Laval de M. Yvan Bédard.
Mastère ASIG / Projet Bibliographique 2008 14
3 TECHNOLOGIE OU APPLICATION SOLAP
La technologie SOLAP peut être définie comme "un type de logiciel qui permet la
navigation rapide et facile dans les bases de données spatiales et qui offre plusieurs
niveaux de granularité d'information, plusieurs thèmes, plusieurs époques et plusieurs
modes d'affichage synchronisés ou non : cartes, tableaux et diagrammes " [Bédard 2004].
La technologie SOLAP supporte la structure multidimensionnelle telle qu'utilisée en
informatique décisionnelle, ce qui lui confère un immense avantage sur les logiciels de
déploiement d’application cartographique sur le Web (ex : ArcIMS, GeoMedia WebMap),
même lorsque ceux-ci offrent des opérations appelées forage, car ces derniers sont basés
sur une structure transactionnelle. La technologie SOLAP offre aussi de nouvelles fonctions
d’aide à la décision non disponibles dans les SIG traditionnels ni dans les outils OLAP.
Une technologie SOLAP permet la visualisation cartographique des données, la navigation
cartographique dans la carte elle-même ou dans les symboles affichés sur cette carte et
ceci selon différents types de forage. Dans une technologie SOLAP la création des cartes
résultantes des analyses est dynamique, contrairement à certains logiciels de visualisation
OLAP (ex. Visualizer de Cognos) où chacune des opérations de navigation spatiales (ex.
forage) doit être prédéfinie dans l’application et associée à une carte. Cette limitation
complexifie la mise à jour des données géométriques en répartissant l’information sur
plusieurs cartes. De plus, un tel outil SOLAP gère adéquatement les règles de
représentation cartographique des résultats des analyses sur les cartes.
Par conséquent, l’utilisation d’un tel outil ne nécessite pas le support d’un expert en
cartographie même s'il permet à l'utilisateur de créer des centaines de milliers de cartes
différentes par quelques cliques de souris. Dans la présentation des résultats, la
technologie SOLAP utilise les mêmes règles sémiologiques (ex. couleur, trame, contour)
pour l'ensemble des affichages, i.e. tableaux, graphiques et cartes. Cela permet d’avoir
une synchronisation visuelle entre les différents modes de présentation de l’information et
d'avoir un panorama homogène. La sémiologie graphique utilisée pour les différents types
d’affichage (i.e. tableaux, graphiques et cartes) demeure synchronisée lors d’un forage ou
lors d’autres opérations, conservant ainsi une continuité perceptuelle nécessaire à la
découverte de corrélations.
Mastère ASIG / Projet Bibliographique 2008 15
Enfin, il faut distinguer les applications SOLAP des technologies SOLAP. Une technologie
SOLAP est une technologie générique construite spécialement pour offrir des fonctions
SOLAP de base ou plus avancées sans nécessiter d’efforts de programmation. Le premier
produit commercial SOLAP est le résultat des travaux de M. Yvan Bédard et son équipe et
est commercialisé sous le nom de JMap Spatial OLAP Extension [KHEOPS 2005].
Une application SOLAP est une application métier qui fournit à l'utilisateur un certain
nombre de fonctionnalités de type SOLAP et qui peut être construite soit avec la
technologie SOLAP, soit avec des combinaisons de technologies non-SOLAP (ex. SIG et
OLAP) et du code de programmation maison, ou soit avec d'autres technologies (ex.
librairies en Java).
Exemple : solution de nombreuses sociétés comme Galigeo, Décision Geobs,…
3.1 EXEMPLES D’APPLICATION SOLAP AVEC DIFFERENTES TECHNOLOGIES
Les outils SOLAP peuvent être utilisés pour déployer une multitude d’applications dans de
nombreux domaines.
La première technologie consiste à faire appel à deux produits fonctionnant en parallèle
sans interface commune.
3.1.1 Les applications réalisées par l’équipe de l’Université de l’Aval [Yvan Bédard]
Exemple 1 (sans la technologie SOLAP):
Une application fut développée pour aider les gestionnaires à distribuer les budgets de
maintenance du réseau routier en se basant sur les périodes budgétaires, les conditions
routières, la classification des routes, le flux de circulation, etc. En plus de croiser,
visualiser et explorer les informations requises, le cube permet de simuler la dégradation
de la chaussée et de calculer les coûts de différents types de maintenance. La figure 1
présente cette application qui fut développée avec l’outil OLAP ProClarity, SQL-Server
Analysis Services de Microsoft et l’API de GeoMedia WebMap avec une interface commune
développée en Visual Basic.
Mastère ASIG / Projet Bibliographique 2008 16
Figure 4 : Une application de gestion du réseau routier (ProClarity et GeoMedia
WebMap) : Visualisation de l’état de la chaussée au niveau des segments de route.
Exemple 2 (avec la technologie SOLAP):
Une autre application en transport permet d'analyser les données relatives aux différents
types d'accidents en fonction de leur position sur le réseau routier et des caractéristiques
de celui-ci, le tout en fonction de différentes périodes. La figure 2 illustre cette
application cette fois-ci déployée avec une technologie SOLAP, soit JMap Spatial OLAP
Extension et Oracle 10g. Contrairement aux autres solutions, celle-ci ne nécessitait pas de
développement d'interface à l'usager supplémentaire puisque cette technologie SOLAP
inclut l'interface. Les détails des différentes méthodes utilisées pour ces applications
SOLAP sont donnés plus loin dans le rapport cf...
Figure 5 : Une application sur les accidents sur le réseau routier (JMap Spatial OLAP
Extension et Oracle 10g) : Visualisation de la fréquence des accidents par découpage
territorial (en haut) et selon les types d’accidents (en bas).
Mastère ASIG / Projet Bibliographique 2008 17
Exemple 3 (sans la technologie SOLAP):
Une application en santé environnementale permet d’explorer les relations entre les états
de santé et les phénomènes environnementaux, comme l’incidence des maladies
respiratoires en fonction de la qualité de l’air pour rapidement valider ou invalider une
hypothèse. L’interface 1 présente cette application développée par programmation en
Visual Basic, MS Access et la librairie du logiciel de visualisation cartographique SoftMap et
la même application pour l’interface 2 développée avec ProClarity, SQL-Server Analysis
Services de Microsoft et KMapX et une interface commune développée en VBScript.
Figure 6 : une application en santé environnementale. Visualisation des cas de décès
de maladies respiratoire. Interface1 avec Visual Basic et librairie SoftMap (à gauche)
et interface 2 avec ProClarity et KMapx (à droite).
Exemple 4 (avec la technologie SOLAP):
Une application sur la cohorte d’étudiants inscrits ces 15 dernières années à l'Université de
Laval permet une analyse par programmes d’étude, provenances géographiques,
institutions de provenance, etc. afin de mieux planifier les prochains efforts de
recrutement.
Une application relative aux sports de haut niveau permet d'analyser les performances
(vitesse, vitesse maximale, durée, constance) atteintes par des athlètes de patinage de
vitesse sur différentes sections de la piste et selon différents facteurs techniques (ex. type
de départ), mécaniques (ex. type de patin) et météorologiques (ex. vitesse et direction du
vent), le tout à partir de mesures prises par système de positionnement satellitaire GPS.
Les figures 4 et 5 illustrent ces deux applications déployées avec la technologie JMAP
Spatial OLAP Extension et Oracle 10g.
Mastère ASIG / Projet Bibliographique 2008 18
Figure 7 : Une application sur la cohorte d’étudiants (JMap Spatial OLAP Extension) :
Visualisation des étudiants par provenance géographique.
Figure 8 : Une application sur les performances des athlètes de patinage de vitesse
(JMap Spatial OLAP Extension) : Visualisation de la vitesse moyenne des patineurs sur
la piste (gauche) et par segments de parcours (droite).
Plusieurs autres domaines d’applications peuvent être étudiés, telle la sécurité publique et
le transport maritime.
Récemment, des applications en SOLAP 3D sur la gestion des forêts et les fouilles
archéologiques mettent à profit l’aspect tridimensionnel de l’espace, c’est-à-dire les
volumes. Dans l’application en archéologie, il est possible de naviguer dans les différentes
unités stratigraphiques fouillées afin de comparer les lots de fouille entre eux en fonction
Mastère ASIG / Projet Bibliographique 2008 19
de leur couleur, de leur granulométrie, de leur consistance, de leur position géographique
et stratigraphique et du type d’artéfacts (ex. céramique) trouvés dans le lot.
• La figure 6 illustre l’application d’archéologie où les lots sont représentés comme des
volumes (i.e. en trois dimensions).
• La figure 7 présente une application sur la gestion des forêts qui permet de visualiser sur
un modèle tridimensionnel, les volumes de bois, les perturbations naturelles, les essences
végétales, etc.
Ces deux projets ont utilisé une interface développée en Visual Basic utilisant le SIG ESRI
ArcGIS, le client OLAP ProClarity et le serveur OLAP SQL-Server Analysis Services de
Microsoft.
Figure 9 : Une application tridimensionnelle en archéologie (ESRI ArcGIS et
ProClarity) : Visualisation des lots fouillés sous la forme de volume.
Figure 10 : Une application tridimensionnelle pour la gestion des forêts (ESRI ArcGIS
et ProClarity) : Visualisation des chablis sur le modèle 3D.
Mastère ASIG / Projet Bibliographique 2008 20
3.2 VOCABULAIRE DU MONDE SOLAP
Comme c'est le cas pour toute technologie et norme géospatiale moderne, les concepts
apportés ici reposent sur les concepts informatiques standards et apportent les extensions
nécessaires pour effectuer de nouvelles fonctions ou pour améliorer l'exécution des
fonctions existantes. Ainsi, en comparaison au modèle multidimensionnel conventionnel, le
modèle multidimensionnel spatial comprend aussi des faits et des dimensions non-
spatiales. Par contre, comme nous le décrivons ci-après, il existe aussi des dimensions
spatiales de différents types, des mesures spatiales et des opérations spatiales.
3.2.1 Dimensions spatiales
Le SOLAP possède des capacités de manipulation de données spatiales qui lui permettent
de supporter des dimensions spatiales non-géométriques, géométriques et mixtes en plus
des dimensions non-spatiales. La dimension spatiale non-géométrique utilise la référence
spatiale nominale seulement (ex. les noms des lieux) et aucune représentation
cartographique n’est associée aux membres de la dimension. Ce type de dimension spatiale
est couramment utilisé dans les outils OLAP conventionnels. Les deux autres types de
dimension spatiale incluent des formes géométriques référencées spatialement sur une
carte qui permettent aux membres de la dimension d’être visualisés et interrogés
cartographiquement. Ces géométries existent pour tous les niveaux de la dimension
spatiale géométrique ou pour seulement certains niveaux dans le cas d’une dimension
spatiale mixte. La figure 9 présente les trois types de dimensions spatiales.
Figure 11 : Les trois types de dimensions spatiales supportées par le SOLAP
Mastère ASIG / Projet Bibliographique 2008 21
3.2.2 Mesures spatiales
Dans un contexte multidimensionnel spatial, il n’y a pas que les dimensions qui possèdent
une composante géométrique, mais aussi les mesures. Par conséquent, en plus des mesures
conventionnelles supportées dans les systèmes OLAP, il existe les mesures spatiales.
Le pointeur spatial est le type de mesure spatiale le plus connu. C’est la méthode utilisée
par les technologies SIG pour gérer la composante géométrique des objets spatiaux. Il
s’agit d’un ensemble de pointeurs (stockés dans le cube de données) vers la géométrie
d’un objet spatial stockée dans une autre structure que la structure multidimensionnelle.
Le second type de mesure spatiale est la transposition au monde spatial de la mesure
conventionnelle du OLAP. Elle permet de dériver des valeurs à l’aide d’un opérateur
métrique ou topologique d'analyse spatiale dont le résultat sera ensuite stocké dans le
cube de données (ex. surface d’un objet, distance minimale avec l'objet le plus proche,
cumul de longueurs sur un réseau).
Finalement, la dernière mesure spatiale consiste à générer des données géométriques sous
la forme d’un ou plusieurs objets spatiaux obtenus par la combinaison de dimensions
spatiales géométriques (ou mixtes en utilisant les niveaux où les membres possèdent une
géométrie). Il s’agit d’un ensemble de coordonnées obtenu à partir des opérateurs
d’analyses spatiaux d’un SIG, par exemple les coordonnées d'un point, ligne ou polygone
résultant de l’intersection spatiale des membres de plusieurs dimensions. Ainsi en est-il
des polygones résultant de l’intersection des polygones délimitant les membres des
dimensions spatiales frontières politiques et bassins versants.
Figure 12 : 2 types de mesures : descriptive numérique et spatiale
Mastère ASIG / Projet Bibliographique 2008 22
3.2.3 Opérateurs spatiaux de navigation
Les outils SOLAP possèdent des opérateurs de navigation pour explorer via la carte
l'ensemble des données spatiales. Dans une interface de client SOLAP, les variantes des
opérateurs OLAP sont utilisées pour profiter de la structure de données
multidimensionnelle spatiale et des différents niveaux de détail des données spatiales. Les
opérateurs sont: DRILL-DOWN, ROLL-UP (ou drill-up), DRILL-ACROSS, SWAP (or pivot), SLICE
and DICE
Pour manipuler les données contenues dans le géométrique ou mélanger les dimensions
spatiales, les trois opérateurs de forage peuvent être appelés : le forage spatial
descendant (roll-down), le forage spatial de remontage (roll-up) et le forage spatial latéral
(drill accros). Ils sont exécutés directement en cliquant sur les éléments (des membres de
dimension) montrés sur les cartes ou sur une sélection de groupe d'éléments (sur le même
ou à des niveaux différents de détail d'une dimension)
• L’opérateur de forage spatial (DRILL-DOWN) permet à l’usager de naviguer d’un niveau
général à un niveau plus détaillé à l’intérieur d’une dimension spatiale géométrique (ex.
cartographier les régions sous-jacentes composant un pays).
•
Figure 13 : Opérateur DRILL-DOWN
Mastère ASIG / Projet Bibliographique 2008 23
• L’opération de remontage (DRILL-UP) permet la navigation inverse, c'est-à-dire de
remonter d’un niveau détaillé des données vers un niveau le plus général (ex.
cartographier les données nationales sus-jacentes à une région).
Figure 14 : Opérateur DRILL-UP
• L’opérateur de forage latéral permet de visualiser les différents membres du même
niveau de détail d’une dimension spatiale (ex. cartographier pour mieux comparer les
mesures de la région sud par rapport à celles de la région nord). Ces opérateurs sont
utilisés directement sur la carte.
Figure 15 : Opérateur DRILL-ACROSS
Mastère ASIG / Projet Bibliographique 2008 24
• Le pivot : Une opération utile sur des données multidimensionnelles est le pivot.
Appliqué sur une carte, le pivot peut permettre de changer l'orientation des dimensions
montrées pour produire un type différent de carte. Cependant, des règles précises sont
nécessaires pour produire le pivot de la carte qui correspond aux dimensions active de
sélections. Par exemple, une multicarte temporelle basée sur trois ans d'intérêt peut être
pivoté comme une carte avec des diagrammes basés sur des années.
Figure 16 : Opérateur PIVOT
Les opérateurs spatiaux de navigation peuvent s’appliquer sur un objet individuel (ex.
visualiser les régions composant l’objet Canada) ou s’appliquer à l’ensemble des objets
d’un niveau de détail (ex. visualiser l’ensemble des régions composant le niveau Pays).
Différentes variantes des opérateurs spatiaux existent également mais leur explication
déborde le cadre de ce rapport.
3.2.4 Synchronisation de navigation
L'outil SOLAP doit tenir compte de la synchronisation d'opérations d'un affichage à un
autre. Il est important qu'une sélection dans un type d'affichage doit être efficace pour
tous les autres types. Par exemple, la visualisation d'analyse temporelle rend facile la
comparaison de données sur des cartes multi-temporelles ou sur la carte statistique.
Mastère ASIG / Projet Bibliographique 2008 25
Figure 17 : Gestion de différents types d’affichage : Carte multi-temporelle ou
statistique
Cette synchronisation permet à l'utilisateur de visualiser la même information, mais d'une
perspective différente : une table pour une vue détaillée d'un phénomène, un diagramme
pour des comparaisons rapides et une carte pour visualisation efficacement des tendances
spatiales ou corrélations. Des comparaisons temporelles sont d'habitude analysées par les
diagrammes, mais l'outil SOLAP offre aussi la possibilité de montrer plusieurs cartes
(appelé des multicartes), des diagrammes et des tables pour différentes époques, ou pour
les différentes membres des autres dimensions et même une analyse rapide par
configuration de simulations dynamiques. Une opération SOLAP exécutée sur un affichage
peut être, si ce type de synchronisation est activé par l'utilisateur, être reflété
immédiatement et automatiquement dans toutes les autres visualisations de la même
collection (une collection étant un jeu d’affichages liées qui sont synchronisées
ensemble).
Mastère ASIG / Projet Bibliographique 2008 26
Figure 18 : Synchronisation de la collection suite à une opération de forage spatial
3.2.5 La symbologie SOLAP
La symbologie qui est utilisée pour représenter les mesures différentes dans les types
divers de vues peut être définie par l'administrateur du système. Un outil SOLAP doit offrir
à l’administrateur de la symbologie une flexibilité graphique qui tient compte de la
définition des différents types de catégories de données, de cartes thématiques, ainsi que
l'utilisation de variables visuelles diverses. Les utilisateurs peuvent aussi créer leur propre
symbologie afin d’être appliqué à leur propre collection d’analyse.
Cependant, cela peut mener à des collisions potentielles de règles de symbologie
graphique puisque les mêmes règles ne s'appliquent pas toujours aux cartes, aux
camemberts, aux graphiques en barres, aux tables, etc. Il est alors nécessaire de garder
une homogénéité visuelle permettant une bonne relation d'une exposition à une autre et
d'une opération de navigation à l'autre.
De plus, La nature des différents types de vues (cartes, diagrammes et tables) affecte sans
aucun doute la quantité ou la qualité des informations qui peuvent être représentées par
chacun. Ainsi, sur une carte par exemple, il est important de limiter le nombre de thèmes
pouvant être représenté et visualisé dans la limite du visible. A cause de conflits possibles
Mastère ASIG / Projet Bibliographique 2008 27
entre les vues, il devient alors nécessaire de définir des priorités dans l'utilisation de
variables visuelles. Un manager de règles graphique doit être mis en œuvre dans un outil
SOLAP pour réduire au minimum les collisions potentielles et facilement créer des
multicartes, des cartes thématiques complexes et des cartes supportées par diagramme.
Enfin, La synchronisation de la symbologie graphique d'une vue à une autre facilite
cognitivement l'identification et l'interprétation des données. En utilisant même
symbologie dans toutes les expositions, il devient plus facile de découvrir et mettre en
évidence des informations appropriées.
Figure 19 : Synchronisation de la symbologie
3.2.6 Données spatiales contextuelles
Un des avantages d'utiliser des cartes consiste dans l’utilisation d’informations
contextuelles afin d’aider les utilisateurs à se localiser. Ces informations contextuelles
sont essentielles pour l'analyse dans beaucoup de situations. Les types différents
d'informations sur le secteur délimitant le phénomène étudié sont souvent aussi importants
dans la construction de la connaissance que le phénomène lui-même.
Dans une vue de carte, il est possible d'ajouter les différents types de données à l'arrière-
plan de la carte pour réaliser ce but (réseaux, hydrographie, limites administratives,
photographies aériennes). Un outil SOLAP doit ainsi permettre de montrer des données
contextuelles en plus des données spatiales étant utilisées pour la représentation
thématique.
Mastère ASIG / Projet Bibliographique 2008 28
Figure 20 : La carte source d’informations contextuelles
3.2.7 Légende interactive
Dernièrement, de la même façon, la légende répond à cette interactivité SOLAP et tient
compte dynamiquement des opérations spatiales de forage. Ainsi, on peut voir la légende
interactive comme une vue graphique spécifique à la sémantique des données analysées.
Mastère ASIG / Projet Bibliographique 2008 29
4 APPROCHES POUR LE DEVELOPPEMENT D’APPLICATION SOLAP
Il existe trois familles de solutions technologiques pour le développement et l’implantation
d’une application SOLAP, basées sur les technologies utilisées et les fonctionnalités
disponibles. Les fonctions du volet descriptif peuvent évidemment être supportées par un
serveur OLAP conventionnel ou par un SGDB relationnel ou objet-relationnel avec
structure en étoile, en flocon ou en constellation*. Les avantages d'un serveur OLAP pour
le volet descriptif incluent les fonctionnalités d’agrégation de données et les capacités
optimisées d’accès aux données, ce qui augmente la rapidité d’analyse pour les grands
volumes de données. Les fonctions du volet cartographique peuvent, quant à elles, être
supportées par un logiciel de visualisation cartographique, un logiciel de cartographie
assistée par ordinateur (CAO) ou un SIG.
Les trois familles de solutions basées sur les technologies et fonctionnalités disponibles
sont : (1) les solutions OLAP dominant, (2) les solutions SIG dominant, et (3) les
solutions intégrées ou hybrides qui font appel autant aux fonctions OLAP que SIG.
Au sein de cette classification, c'est l’outil dominant qui offre ou qui fait appel à certaines
fonctionnalités minimales de l’autre outil. Parfois, l'outil dominant fournit l’unique
interface graphique de l’application SOLAP, parfois l'interface unique peut être
développée avec un langage de programmation (ex. Java, VB, C++). Pour les deux
premières familles, un groupe de fonctionnalités domine largement l'autre groupe et
l'application est développée autour de l'outil dominant. Inversement, dans le cas de la
solution intégrée, les fonctionnalités tant OLAP que SIG sont offertes à un niveau
supérieur, l'interface graphique principale est unique et construite au-dessus des
technologies sous-jacentes (i.e. OLAP et SIG) et l'application SOLAP est développée pour
tirer profit de l'intégration des fonctions OLAP et SIG. Dans ce dernier cas, lorsque ces
fonctionnalités et l'interface principale forment un produit logiciel autonome (ex. JMap
Spatial OLAP Extension [KHEOPS 2005]), nous parlons d'une technologie SOLAP. Les trois
familles de solutions répondent à des besoins différents. Dans le premier cas, le volet
cartographique n'est qu'accessoire. Dans le deuxième cas, c'est le volet OLAP qui est
accessoire. Dans le dernier cas, les deux volets sont jugés importants et leur coordination
ou synchronisation est une particularité clé de cette technologie.
Mastère ASIG / Projet Bibliographique 2008 30
4.1 OLAP DOMINANT
Application développée autour d’un serveur OLAP.
Les fonctions OLAP sont dominantes et les fonctions SIG sont minimales.
Ex. zoom, déplacement, sélection, gestion des couches actives.
Parfois, forage spatial minimal.
4.1.1 Avantages
• Supporte l’exploration et la visualisation OLAP.
• Utilise les capacités d’un serveur OLAP.
• Adéquat pour des besoins d’exploration et de visualisation cartographiques simples.
4.1.2 Inconvénients
• Nécessite des analyses complexes pour fournir une interface, à l’usager, élégante et
efficace.
• Requiert des mois de programmation (Les alliances récentes entre les fournisseurs OLAP
et SIG simplifient grandement ces développements).
• Nombre limité de dimensions spatiales et d’analyses.
• Interactions limitées.
• S’intègre mal au processus complexe de mise à jour des données spatiales.
L’application de santé environnementale (cf. figures 5) développée avec ProClarity et le
plugiciel KMapX, ainsi que l’application sur la gestion du réseau routier (cf. figure 3)
développée avec ProClarity et GeoMedia WebMap d’Intergraph font partie de la catégorie
des OLAP dominant. Quoiqu’intéressantes, ces applications auraient nécessité beaucoup
plus de programmation pour atteindre les niveaux de fonctionnalité et de flexibilité offerts
par les solutions intégrées.
4.2 SIG DOMINANT
Applications développées autour d’un SIG et d’un SGBD.
Fonctions SIG prédominantes et fonctions OLAP minimales.
Ex. Forage et remontage sur un tableau
Mastère ASIG / Projet Bibliographique 2008 31
4.2.1 Avantages
• Supporte la cartographie thématique propre aux SIG.
• Utilise des capacités d’analyses spatiales.
• Adéquat lorsque les cartes ont une importance principale et que les tableaux et
graphiques restent simples.
4.2.2 Inconvénients
• Nécessite des analyses complexes pour fournir une interface, à l’usager, élégante et
efficace.
• Requiert des mois de programmation (Les alliances récentes entre les fournisseurs OLAP
et SIG simplifient grandement ces développements).
• Interactions limitées.
L’application de santé environnementale (cf. figures 5) développées par programmation
Visual Basic à partir du SGBD MS Access et du logiciel de visualisation cartographique
SoftMap fait partie de la famille des SIG dominant. Cette application va exigée davantage
d’efforts de programmation que les solutions OLAP dominant précédentes étant donné
l’absence de serveur OLAP pour la gestion des données multidimensionnelles.
4.3 SOLAP INTÉGRÉ
Haut niveau de fonctionnalités pour les vues et données spatiales et non-spatiales.
Intégration sophistiquée et synchronisée des fonctions OLAP et SIG.
4.3.1 Avantages
• Interface à l’usager plus efficace.
• Fonctions plus riches (Ex. exploration synchronisée des cartes, tableaux et graphiques).
• S’intègre bien au processus complexes de mises à jour des données spatiales.
• Requiert ou non des SIG ou OLAP (peut exploiter directement les données).
4.3.2 Inconvénients
• Nécessite des analyses complexes pour fournir une interface à l’usager efficace.
• Requiert passablement de développement
Les applications des figures 4, 6, 7 et 9 ont nécessité très peu d’effort de développement,
puisqu’elles ont été déployées dans une solution SOLAP intégrée toute prête(JMap Spatial).
Mastère ASIG / Projet Bibliographique 2008 32
5 NOTIONS ET ARCHITECTURES DES BASES DE DONNEES OLAP/SOLAP
5.1 INTRODUCTION OLAP OLAP (Online Analytical Processing)
Il s’agit d’une catégorie de logiciels axés sur l’exploration et l’analyse rapide des données
selon une approche multidimensionnelle à plusieurs niveaux d’agrégation.
Il existe plusieurs déclinaisons sur le marché qui permettent d’adapter le stockage des
données sur différents types de base de données pour implémenter le concept OLAP :
• R-OLAP (Relational OLAP)
• D-OLAP (Dynamic ou Desktop OLAP)
• M-OLAP (Multidimensionnel OLAP)
• H-OLAP (Hybrid OLAP = ROLAP + MOLAP)
• S-OLAP (Spatial OLAP)
OLAP est très simple car l’usager n’a pas à maitriser des langages d’interrogation de bases
comme le SQL et des interfaces complexes. De plus OLAP est très rapide car il exploite une
dénormalisation maximale des données, sous la forme d’une pré-agrégation stockée.
L’usager devient donc opérationnel en très peu de temps.
OLAP est structuré avec une approche multidimensionnelle, basé sur des thèmes d’analyse
(dimensions*), beaucoup plus intuitive.
De plus, les données peuvent être groupées à différents niveaux de granularité* (les
regroupements sont pré-calculés, par exemple, le total des ventes pour le mois dernier
calculé à partir de la somme de toutes les ventes du mois).
5.2 VOCABULAIRE OLAP
5.2.1 Dimensions ou axes Une dimension peut être définie comme un thème, ou un axe (attributs), selon lequel les
données seront analysées (en fonction de…)
Ex : Temps, Découpage Administratif, Produits
Une dimension contient des membres organisés en hiérarchie, chacun des membres
appartenant à un niveau hiérarchique (ou niveau de granularité) particulier.
Mastère ASIG / Projet Bibliographique 2008 33
Ex : Pour la dimension Temps : les années, les mois et les jours peuvent être des exemples
de niveau hiérarchiques. 1998 est un exemple de membre du niveau Année.
5.2.2 Mesures Une mesure est un élément de données sur lequel portent les analyses, en fonction des
différentes dimensions.
Ex : coût des travaux, nombre d’accidents, ventes, dépenses.
5.2.3 Faits Un fait représente la valeur d’une mesure, mesurée ou calculée, selon un membre de
chacune des dimensions (ce qui est recueilli par les systèmes transactionnels).
Ex : « le coût des travaux en 1995 pour la région 02 est de 250000€ » est un fait qui
exprime la valeur de la mesure « coût des travaux » pour le membre « 1995 » du niveau
« année » de la dimension « temps » et le membre « 02 » du niveau « région » de la
dimension « découpage administratif ».
5.2.4 Cubes Un ensemble de mesures organisées selon un ensemble de dimensions (aussi hypercube).
Ex : Un cube de ventes qui comprend :
• Les dimensions Temps, Produit, Magasin
• La mesure Ventes en €
Figure 21 : Modélisation UML d’un exemple de cube
Mastère ASIG / Projet Bibliographique 2008 34
5.3 EXEMPLES CONCRETS DE CUBE MULTIDIMENSIONNEL
5.3.1 EXEMPLE 1: Le cube multidimensionnel suivant présente les profits d’entreprises agricoles par
‘propriété’, par ‘exploitation’ et par ‘année’.
• CAS 1 : visualisation des profits des propriétés >= 0.05 km² pour toutes les exploitations
durant les 4 années.
• CAS 2 : visualisation des profits des propriétés >= 1.5 km² pour l’exploitation de légumes
pour l’année 1993.
5.3.2 EXEMPLE 2:
Au départ nous avons une table ‘vente’ constituée de colonnes comme présenté dans des
bases de données relationnelles (figure suivante).
L’analyse s’avère complexe car une feuille de papier ne possède que deux dimensions. Si
l’on veut faire une sélection sur celui-ci. Mais si on s’intéresse ensuite à ce qui s’est passé
en février sur tous les magasins, il faut repartir des données de départ et faire une autre
sélection.
Mastère ASIG / Projet Bibliographique 2008 35
Chaque case du cube représente une valeur. Les dimensions sont indiquées sur les arêtes
du cube. Un plan du cube correspond à toutes les valeurs pour une seule position d’une des
trois dimensions. Par exemple, la face avant est celle du magasin ‘Paris Bastille’. Enfin, le
cube complet représente une mesure, parfois appelé population d’analyse, concernant ici
le nombre de chaussures vendues.
En ajoutant la mesure ‘Total HT’, on obtient un nouvel objet à 4 dimensions : Mois,
Modèle, Magasin, plus une dimension Indicateur, dont les positions correspondent aux
mesures existantes. Ce nouvel objet est appelé Hypercube*.
5.4 ARCHITECTURE OLAP
L’architecture OLAP consiste en trois services :
Base de données :
• Doit supporter les données agrégées ou résumées
• Peut provenir d’un entrepôt ou d’un marché de données*
• Doit posséder une structure multidimensionnelle (SGDB multidimensionnel ou relationnel)
Serveur OLAP :
• Gère la structure multidimensionnelle dans le SGBD
• Gère l’accès aux données de la part des usagers
Module client :
• Permet aux usagers de manipuler et d’explorer les données
Mastère ASIG / Projet Bibliographique 2008 36
• Affiche les données sous forme de graphiques statistiques et de tableaux
• Selon le type de base de données accédé, plusieurs configurations sont possibles :
multidimensionnelle, relationnelle ou hybride.
5.5 MOLAP (OLAP MULTIDIMENSIONNEL) • Les données détaillées de base ainsi que les données agrégées de l’entrepôt sont
stockées dans une base de données multidimensionnelle (souvent appelée cube ou
hypercube).
• Une base de données multidimensionnelle utilise une structure propriétaire au logiciel
utilisé (≈ matrice)
• Le serveur MOLAP extrait les données de l’hypercube et les présente directement au
module client
Base de données multidimensionnelle (hypercube)
Serveur MOLAP Client OLAP
Figure 22 : Architecture MOLAP
5.6 ROLAP (OLAP RELATIONNEL)
• Les données détaillées de base ainsi que les données agrégées de l’entrepôt sont
stockées sous forme de tables dans une base de données relationnelle
• La base de données relationnelle doit être structurée selon un modèle particulier (étoile,
flocon, …)
• Le serveur extrait les données par des requêtes SQL et interprète les données selon une
vue multidimensionnelle avant de les présenter au module client
Mastère ASIG / Projet Bibliographique 2008 37
Base de données relationnelle (étoile ou flocon)
Serveur ROLAP
Vue multidimensionnelle
Client OLAP
Figure 23 : Architecture ROLAP
5.7 HOLAP (OLAP HYBRIDE)
• Architecture qui consiste en un croisement des architectures MOLAP et ROLAP
• Les données détaillées de base de l’entrepôt sont stockées dans une base de données
relationnelle et les données agrégées sont stockées dans une base de données
multidimensionnelle
• Le serveur HOLAP accède deux bases de données et les présente au module client, selon
une vue multidimensionnelle dans le cas des données de la BD relationnelle
Figure 24 : Architecture HOLAP
Mastère ASIG / Projet Bibliographique 2008 38
5.8 BILAN MOLAP/ROLAP/HOLAP
5.9 STRUCTURE MULTIDIMENSIONNELLE
Pour une configuration ROLAP ou HOLAP, il est nécessaire de simuler une structure
multidimensionnelle dans un SGBD relationnel à l’aide de modèles particuliers qui
permettent de mieux répondre aux besoins multidimensionnels :
• Modèle en étoile (Star Schema)
• Modèle en flocon (Snowflake Schema)
• Modèle mixte (Mixed Schema)
• Modèle en constellation (Fact Constellation Schema)
5.9.1 Modèle en étoile Le schéma en étoile tire son nom de sa configuration:
• Objet central, nommé table des faits
• Connecté à un certain nombre d’objets de manière radiale, les tables de dimension
La table des faits, comme son nom l’indique, contient les faits
Les tables de dimensions contiennent les attributs définissant chacun des membres des
dimensions. Elles sont dénormalisées.
Mastère ASIG / Projet Bibliographique 2008 39
Figure 25 : Modèle en étoile
5.9.2 Modèle en flocon
• Le schéma en flocon est dérivé du schéma en étoile où les tables de dimension sont
normalisées (la table des faits reste inchangée)
• Avec ce schéma, chacune des dimensions est décomposée selon sa ou ses hiérarchie(s)
Figure 26 : Modèle en flocon
Mastère ASIG / Projet Bibliographique 2008 40
5.9.3 Modèle Mixte Il s’agit d’une structure qui résulte de la meilleure combinaison des deux types de modèles
précédents
Seules quelques dimensions seront normalisées, souvent il s’agit des plus grandes tables et
celles contenant le plus de redondance
Figure 27 : Modèle Mixte
5.9.4 Modèle en constellation Le schéma en constellation est en fait composé de plusieurs schémas en étoile qui
partagent des tables de dimension.
Figure 28 : Modèle en constellation
Mastère ASIG / Projet Bibliographique 2008 41
Plusieurs architectures possibles (SGBDM, SGBDR, SIG, serveur OLAP, client OLAP, logiciel
de visualisation, DAO, logiciel statistique, …)
Exemples :
• ICEMSE = Access + SoftMap + VB
• MSSS = SQL Server + JMap + Java
• MTQ routier = SQL Server (Analysis Services) + ProClarity + Geomedia + VB
5.10 LA CAS JMAP SPATIAL OLAP La solution logicielle JMap Spatial OLAP (SOLAP) est basée sur une architecture ROLAP, ne
présentant pas encore de serveur multidimensionnel. Les données sont stockées dans une
base de données relationnelle, structurée selon un schéma multidimensionnel (schéma en
étoile, flocon ou constellation).
Les agrégations doivent être calculées et stockées dans la base de données
Figure 29 : architecture JMap Spatial
Mastère ASIG / Projet Bibliographique 2008 42
CONCLUSION
Le SIG est devenu un support important dans l’information décisionnelle et dans le
domaine de la business intelligence. C’est devenu un réel besoin et un réel apport dans
l’ajout d’une composante spatiale dans une interface BI.
Actuellement, les outils traditionnels utilisés pour exploiter les entrepôts de données
spatiaux ne peuvent facilement exploiter le plein potentiel de la composante spatiale.
Leur couplage avec un outil SIG est courant lorsque la visualisation cartographique des
données est requise. Mais malgré ses capacités d’analyse spatiale poussées, le SIG n'est pas
bien adapté, dans sa forme actuelle, pour soutenir l’aide à la décision car il s’agit d’un
système de type transactionnel.
OLAP est l’outil premier en matière de solution décisionnelle. Et cependant, grâce aux
recherches de M. Yvan Bédard, OLAP et SIG ont pu se combiner et ont enrichi
considérablement le domaine de la BI. Ils ont ainsi créé une nouvelle déclinaison SOLAP.
Cette technologie SOLAP permet de supporter efficacement la prise de décision
stratégique de manière facile et rapide, à différents niveaux de hiérarchie, à différentes
époques, selon différentes vues (tabulaires, graphiques et cartographiques).
Le développement d’applications SOLAP a permis l'enrichissement des méthodes de
conception, l'optimisation et la mise à jour des bases de données géospatiales
décisionnelles, l’intégration et l’agrégation de données multidimensionnelles géospatiales,
le contrôle de leur qualité ainsi que l'amélioration des technologies existantes.
L'usager peut manipuler et naviguer dans ses données plus facilement que dans le SIG. Pour
toutes ces raisons, une partie de l'avenir du domaine de l'aide à la décision géospatiale
repose sur l'approche multidimensionnelle et celle-ci s'impose dorénavant pour le
développement d'applications spatio-temporelles.
Mastère ASIG / Projet Bibliographique 2008 43
BIBLIOGRAPHIE
http://decigeo.over-blog.com/
Décigéo ; c’est le blog discutant des dernières nouveautés ou manifestations des systèmes
d’information Géographique et de la Business Intelligence. Il a pour but de regrouper
toutes les informations sur la convergence entre la Business Intelligence et la cartographie
automatisée.
http://www.scg.ulaval.ca/
Site du département des sciences géomatiques de l’université de Laval
http://sirs.scg.ulaval.ca/YvanBedard/enewindex.asp
Site personnel du professeur Yvan Bédard exposant toutes ses publications concernant la
recherche de données géospatiales décisionnelles. (Technologie SOLAP : combinaison
SIG/OLAP)
http://www.spatialbi.com/
Portail sur le décisionnel spatial SOLAP, combinant SIG et OLAP.
http://www.kheops-tech.com/
Site de l’éditeur du logiciel JMap SOLAP
http://www.esrifrance.fr/sig2005/pageLibre00010340.htm
Page contenant les Comptes rendus de présentations de la conférence Francophone ESRI
concernant le décisionnel et le géomarketing.
http://fr.wikipedia.org/wiki/Accueil
-L’informatique décisionnelle (Business Intelligence)
- OLAP
- Business Object
Top Related