Treillis Relationnel : Une Structure Algébrique pour le Data Mining Multidimensionnel
date post
23-Jan-2016Category
Documents
view
32download
0
Embed Size (px)
description
Transcript of Treillis Relationnel : Une Structure Algébrique pour le Data Mining Multidimensionnel
Treillis Relationnel : Une Structure Algbrique pour le Data Mining MultidimensionnelAlain Casali, Rosine Cicchetti, Lotfi LakhalLaboratoire dInformatique FondamentaleMarseille
PlanNcessit dun espace de recherche pour le data mining multidimensionnelTreillis relationnelTreillis relationnel contraintTreillis relationnel vs DatacubePerspectivesCasali, Cicchetti, Lakhal : Treillis Relationnel 2
1. Ncessit dun espace de recherche pour le data mining multidimensionnel
Problme de la transformation dune relation dattributs catgories en une relation binaire Treillis des parties : une structure mal adapte au contexte multidimensionnelNon prservation de la complexit des algorithmes par niveaux
Casali, Cicchetti, Lakhal : Treillis Relationnel 3
Exemple:
Casali, Cicchetti, Lakhal : Treillis Relationnel 4
Treillis des attributs binaires :
Mais toutes les solutions ne sont pas validesCasali, Cicchetti, Lakhal : Treillis Relationnel 5
S
0
SJMAB
JMAB
SMAB
SJAB
SJMB
SJMA
MAB
JAB
JMB
JMA
SAB
SMB
SMA
SJB
SJA
SJM
AB
MB
MA
JB
JA
JM
SB
SA
SM
SJ
B
A
M
J
PlanNcessit dun espace de recherche pour le data mining multidimensionnelTreillis relationnelTreillis relationnel contraintTreillis relationnel vs DatacubePerspectivesCasali, Cicchetti, Lakhal : Treillis Relationnel 6
2. Treillis relationnel
2.1 Espace multidimensionnel tuple = lment de space(r) = motif multidimensionnelex: et 2.2 Ordre de gnralisationOn munit space(r) de lordre de gnralisation g
ex: g
Casali, Cicchetti, Lakhal : Treillis Relationnel 7r : relation de schma
Casali, Cicchetti, Lakhal : Treillis Relationnel 8? ALL
Treillis de la relation exemple
Casali, Cicchetti, Lakhal : Treillis Relationnel 9(b) Le Produit
Treillis de la relation exemple
2.4 Caractrisation du treillis relationnelThorme: soit r une relation dattributs catgories sur .Lensemble ordonn (space(r), g) est un treillis complet, atomique, co-atomique et gradu, appel treillis relationnel et not RL(r), dans lequel :Casali, Cicchetti, Lakhal : Treillis Relationnel 10
2.5 Treillis relationnel vs Treillis des partiesCasali, Cicchetti, Lakhal : Treillis Relationnel 11
Feuil1
Treillis RelationnelTreillis des Parties
Hauteur|D|+1
Nombre d'lments
Oprateurs Sup. & Inf.Produit et SommeUnion et Intersection
Caractristiquesnon distributifdistributif
Feuil2
Feuil3
PlanNcessit dun espace de recherche pour le data mining multidimensionnelTreillis relationnelTreillis relationnel contraintTreillis relationnel vs DatacubePerspectivesCasali, Cicchetti, Lakhal : Treillis Relationnel 12
3. Treillis relationnel contraint3.1 Dfinition des contraintesUne contrainte cont est anti-monotone w.r.t. g ssi
Une contrainte cont est monotone w.r.t. g ssi
Casali, Cicchetti, Lakhal : Treillis Relationnel 13
3.2 Structure convexe garantie Thorme: le treillis relationnel contraint est un espace convexe (reprsentable par bordures) dans lequel la borne maximale S+cont et la borne minimale G+cont sont:1. Si cont = cmc, G+ = min ({t RL(r) : cmc(t)} )et S+=2. Si cont = camc, G+= et S+ = max({t RL(r) : camc(t)})3. Si cont = chc, G+ = min({t RL(r) :chc(t)}) et S+ = max({t RL(r) : chc(t)})
Casali, Cicchetti, Lakhal : Treillis Relationnel 14
3.3 Exemples de contraintes(a) Frquence
Freq(t) minfreq est une contrainte anti-monotone et Freq(t) maxfreq est une contrainte monotone.(b) Frquence de la disjonction
Freq(vt) minfreq est une contrainte monotone et Freq(vt) maxfreq est une contrainte anti-monotone.
Casali, Cicchetti, Lakhal : Treillis Relationnel 15
3.4 Exactitude des solutions(a) freq(t) 3/11 (contrainte anti-monotone)
Casali, Cicchetti, Lakhal : Treillis Relationnel 16Algorithme par niveau binaire donne le mme rsultat ?
11
4
7
9
5
4
11
7
9
4
11
7
9
5
4
4
5
(b) freq(t) 4/11 (contrainte monotone)
Casali, Cicchetti, Lakhal : Treillis Relationnel 17 Si algorithme (cadre binaire) => SJ fait partie des rsultats. Solution possible: ajouter la contrainte freq(t)>0. Mais freq()=0 et vrifie la contrainte.
1
4
11
7
9
1
4
11
7
9
1
1
5
4
4
11
7
9
1
1
5
4
1
4
11
7
9
1
(c) freq(Vt) 6/11 (contrainte anti-monotone)
Casali, Cicchetti, Lakhal : Treillis Relationnel 18Freq(V) = 5/11 mais Freq() = 0Donc la contrainte Freq(t) > 0 ne permet pas dobtenir lensemble des solutions dun problme de data mining multidimensionnel en utilisant les techniques de data mining binaire.
EPPDQSAG3SBG2SAF2SBF2JAG1MAG1
4
0
1
1
5
5
5
5
PlanNcessit dun espace de recherche pour le data mining multidimensionnelTreillis relationnelTreillis relationnel contraintTreillis relationnel vs DatacubePerspectivesCasali, Cicchetti, Lakhal : Treillis Relationnel 19
4. Treillis relationnel vs DatacubeDatacube est un problme de data mining multidimensionnel dont lespace de recherche est le treillis relationnel.RL(r) = Datacube( )+ ordre de gnralisation + oprateurs Produit et Somme
Ordre de gnralisation et oprateurs de base permettent la navigation dans le DatacubeCasali, Cicchetti, Lakhal : Treillis Relationnel 20
Projet similaire Laksmanan, Pei, Han pour lextraction des connaissances (smantiques) dans le Datacube.Premiers rsultats (VLDB02) :Cube Quotient : Treillis des classes dquivalences selon des fonctions agrgatives. Ce cube (rduit) permet la navigation comme dans le Datacube.Casali, Cicchetti, Lakhal : Treillis Relationnel 21
PlanNcessit dun espace de recherche pour le data mining multidimensionnelTreillis relationnelTreillis relationnel contraintTreillis relationnel vs DatacubePerspectivesCasali, Cicchetti, Lakhal : Treillis Relationnel 22
5. PerspectivesTreillis relationnel fermEspace de versionEspace de version mergent ( 2 Datacubes)Reprsentations concises/condenses du treillis relationnel contraint
Casali, Cicchetti, Lakhal : Treillis Relationnel 23