Représentation et indexation d’objets mobiles dans un entrepôt de données

19
Représentation et Représentation et indexation d’objets indexation d’objets mobiles dans un mobiles dans un entrepôt de données entrepôt de données Tao Wan, Karine Zeitouni EDA 2006 Université de Versailles

description

Université de Versailles. Représentation et indexation d’objets mobiles dans un entrepôt de données. Tao Wan, Karine Zeitouni EDA 2006. Contexte. Objet Mobile (OM) Objet dont la localisation change continuellement dans le temps Objet Mobile Contraint par le réseau (OMC) - PowerPoint PPT Presentation

Transcript of Représentation et indexation d’objets mobiles dans un entrepôt de données

Page 1: Représentation et indexation d’objets mobiles dans un entrepôt de données

Représentation et Représentation et indexation d’objets indexation d’objets mobiles dans un mobiles dans un entrepôt de donnéesentrepôt de données Tao Wan, Karine Zeitouni

EDA 2006

Université de Versailles

Page 2: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

2

Contexte

Objet Mobile (OM) Objet dont la localisation change continuellement dans le temps

Objet Mobile Contraint par le réseau (OMC) Objet se déplaçant dans un espace restreint (ex : couloirs, réseau) Ex: voiture, train, avion…

Recherche active en gestion de bases d'objets mobiles

Problème posé ici : Exploitation d’historiques d’objets mobiles dans un but décisionnel

Page 3: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

3

Sommaire

Exemples et motivation

Conception et représentation de l’entrepôt

Implémentation optimisée des requêtes OLAP

Résultats d’expérimentation

Conclusion & Perspectives

Page 4: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

4

Exemples et motivation Application réelle: étude sur l’exposition de la population

aux facteurs de risques

Requêtes typiques : “Combien de personnes sont exposées au cours du temps au champ

de pollution ?”

“Combien de personnes par catégorie d'âge sont exposées au cour du

temps au champ de pollution ?”

SELECT p.loc, p.temps, COUNT(DISTINCT m.id_personne) AS nb_personnesFROM mobilité m, pollution pWHERE m.trajectoire INTERSECT (p.loc, p.temps)GROUP BY p.loc, p.temps

SELECT p.loc, p.temps, COUNT(DISTINCT m.id_personne) AS nb_personnesFROM mobilité m, pollution pWHERE m.trajectoire INTERSECT (p.loc, p.temps)GROUP BY m.âge, p.loc, p.temps

Ces requêtes sont des agrégats multidimensionnels – type OLAP

Page 5: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

5

Sommaire

Exemples et motivation

Conception et représentation de l’entrepôt

Implémentation optimisée des requêtes OLAP

Résultats d’expérimentation

Conclusion & Perspectives

Page 6: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

6

Spécificités de la modélisation multidimensionnelle d’objets mobiles Spécificités

Trajectoires d’objets mobiles forment une variation

continue dans le temps et l’espace Or, les modèles multidimensionnels conventionnels sont basés sur

des faits discrets ou discrétisés

Les critères de regroupement ne sont pas forcément connus

à l’avance et implique une recherche spatio-temporelle.

Il faut intégrer les dimensions discrètes comme les attributs

de l’objet mobiles

Page 7: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

7

Travaux liés Entrepôts de données spatiales ou spatiotemporelles

Entrepôts de données spatiales : [Stefanovic & Han 2000] Entrepôts de données spatiotemporelles : [Bédard & Marchand 2004]

Entrepôts d’objets mobiles aRB-tree, double comptage : [Papadias et al. 2002] Estimation probabiliste : [Tao et al. 2004]

Problèmes: Objets mobiles agrégés à l’origine; ne permet pas de représenter d’autres dimensions que l’espace et le temps; résultats basés sur des statistiques approximatives

Intégrer les propriétés d’OMs dans l’analyse : [Wan & Zeitouni 2005]

Problèmes:

Se basant sur des découpages de référence pour l’espace et le temps

=> Limite aux agrégations spatiotemporelles à cheval

Aucune véritable approche existe pour l’analyse en ligne d’objets mobiles !

Page 8: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

8

Dimension continue Est une dimension variant dans un domaine continu sans limite

de granularité

Fait continu Comprend une mesure résultat d’une fonction continue qui

dépend d’une ou de plusieurs dimensions continues

Fait mobile Est un fait continu dépendant de l’objet OMC et défini par une

fonction FOMC(t) = s continue du temps dans l’espace

Modèle logique

Page 9: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

9

Préliminaires - Modèle d’objets mobiles contraints par le réseau

Réseau routier Composé de : tronçon et nœuds

OMC (Objet Mobile Contraint par le réseau) OMC(id_obj, attributs, #trajectoires) Hypothèse : vitesse constante par tronçon Trajectoire T :

Représentée par une séquence de tronçons ri, traversés dans un sens donné pendant un intervalle de temps donné [ti ti+1].

r1r2

r3

r4r5

r7r9r10

r12r13 r14

r15

r16

Page 10: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

10

Modèle multidimensionnel logique Réduction de dimensionnalité

[Pfoser 03] Avantages

simplification de la représentation de l’espace optimisation de l’espace de stockage optimisation des temps de réponses aux requêtes

TR

Tt2 t3 tend

TT’

p1

pend

t1

p2

p3Tr1

Tr2

Tr3

Temps

MO_ID

Jack

Tao

Fred

TR

Trid1

Trid2

Trid3

Marie

Trid4

0.2 1.1 2.2 3.0 4.8

1.1 2.0 3.1 3.5

Modèle multidimensionnel logique

FOMC(t) = s

r2

r1

r3

Page 11: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

11

Sommaire

Exemples et motivation

Conception et représentation de l’entrepôt

Implémentation optimisée des requêtes OLAP

Résultats d’expérimentation

Conclusion & Perspectives

Page 12: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

12

Index proposé – TTR-tree (Transformed Trajectories R-tree)

0101

1101

R1 R2 R3 R4

TR

TempsTrid1

QS

R1

Trid2

Trid3

Trid4 R2

R3

1001

Marie Fred Tao Jack

Avantages Recherche similaire au R-tree, plus efficace

Si QS contient x, on retourne directement le bitmap pointé par x

Bitmap évite le double comptage Permet la combinaison avec les attributs de l’objet

Page 13: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

13

Optimisations

Problèmes : Coût de stockage pour les index bitmap Coût de la réduction de dimensionnalité

Transformation du réseau Transformation de requêtes spatiales

Solutions : Appliquer une technique de bitmap compressé sur les index

bitmap : WAH: Word-Aligned Hybrid Code Zhang et al. (2004) Appliquer l’ordre des tronçons dans un index spatial pour

numéroter par proximité ces tronçons et les intervalles de l’axe TR correspondant.

Page 14: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

14

Sommaire

Exemples et motivation

Conception et représentation de l’entrepôt

Implémentation optimisée des requêtes OLAP

Résultats d’expérimentation

Conclusion & Perspectives

Page 15: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

15

Résultats d’expérimentation (1) Méthodes comparées

Indexation Pfoser [Pfoser & Jensen 2003] 3DR-tree

Configuration d’expérimentation Réseaux routier: Oldenburg 7035 tronçons, San Joaquin 24123 tronçons Données d’entrée : générées par le générateur Brinkhoff Jeux de données

Jeux de données

Réseausous-jacent

Nombre d’objets

Taille des données

nombre de tronçons traversés

(=segments indexés)

DS1 Oldenburg 10 000 24.1 Mo 407 419

DS2 Oldenburg 20 000 49.4 Mo 829 103

DS3 San Joaquin 10 000 57.4 Mo 804 660

DS4 San Joaquin 20 000 114.1 Mo 1 640 815

Page 16: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

16

Coût de stockage

Requêtes d’agrégation Facteur « espace » qs : 0.5 %, 2 %, 8 %, 16 % et 32% Facteur « temps » qt : 1 %, 5 %, 10 %, 30 % et 50 %

Résultats d’expérimentation (2)

Jeux de données Pfoser 3DR-tree TTR-tree TTR-treeavec compression de bitmaps

DS1 8 925 K 34 753 K 9 025 K 8 790 K

DS2 18 020 K 71 351 K 18 884 K 17 899 K

DS3 18 251 K 67 616 K 18 221 K 17 771 K

DS4 36 849 K 138 601 K 38 399 K 36 397 K

Page 17: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

17

Résultats d’expérimentation (4)

DS2 qt=10%

0

10000

20000

30000

40000

50000

60000

0.5% 2% 8% 16% 32%qs

E/S

Index P foser

3D R-tree

TTR-tree

DS1 qt=10%

0

5000

10000

15000

20000

25000

30000

35000

0.5% 2% 8% 16% 32%qs

E/S

Index P foser

3D R-tree

TTR-tree

DS3 qt=10%

0

1000

2000

3000

4000

5000

6000

0.5% 2% 8% 16% 32%qs

E/S

Index P foser

3D R-tree

TTR-tree

DS4 qt=10%

0

2000

4000

6000

8000

10000

12000

0.5% 2% 8% 16% 32%qs

E/S

Index P foser

3D R-tree

TTR-tree

Coût en faisant varier l’extension de la requête selon l’espace

Page 18: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

18

Résultats d’expérimentation (5)

DS1 qs=16%

0

10000

20000

30000

40000

50000

60000

70000

80000

1% 5% 10% 30% 50%qt

E/S

Index P foser

3D R-tree

TTR-tree

DS2 qs=16%

0

20000

40000

60000

80000

100000

120000

140000

160000

1% 5% 10% 30% 50%qt

E/S

Index P foser

3D R-tree

TTR-tree

DS3 qs=16%

0

1000

2000

3000

4000

5000

6000

7000

1% 5% 10% 30% 50%qt

E/S

Index P foser

3D R-tree

TTR-tree

DS4 qs=16%

0

2000

4000

6000

8000

10000

12000

1% 5% 10% 30% 50%qt

E/S

Index P foser

3D R-tree

TTR-tree

Coût en faisant varier l’extension de la requête selon le temps

Page 19: Représentation et indexation d’objets mobiles dans un entrepôt de données

EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données

19

Contributions et perspectives

Contributions Modèle multidimensionnel pour objets mobiles contraints par le

réseau Implémentation optimisée pour des requêtes OLAP Prototype développé et bons résultats expérimentaux

Travaux futurs Test de la combinaison avec des dimensions discrètes Extension aux agrégats complexes (spatiotemporels) Extension aux mesures continues (capteurs embarqués) Extension à d’autres types de « faits continus »