Treillis Relationnel : Une Structure Algébrique pour le Data Mining Multidimensionnel

Click here to load reader

download Treillis Relationnel : Une Structure Algébrique pour le Data Mining Multidimensionnel

of 23

  • date post

    23-Jan-2016
  • Category

    Documents

  • view

    32
  • download

    0

Embed Size (px)

description

Treillis Relationnel : Une Structure Algébrique pour le Data Mining Multidimensionnel. Alain Casali, Rosine Cicchetti, Lotfi Lakhal Laboratoire d’Informatique Fondamentale Marseille. Plan. Nécessité d’un espace de recherche pour le data mining multidimensionnel Treillis relationnel - PowerPoint PPT Presentation

Transcript of Treillis Relationnel : Une Structure Algébrique pour le Data Mining Multidimensionnel

  • Treillis Relationnel : Une Structure Algbrique pour le Data Mining MultidimensionnelAlain Casali, Rosine Cicchetti, Lotfi LakhalLaboratoire dInformatique FondamentaleMarseille

  • PlanNcessit dun espace de recherche pour le data mining multidimensionnelTreillis relationnelTreillis relationnel contraintTreillis relationnel vs DatacubePerspectivesCasali, Cicchetti, Lakhal : Treillis Relationnel 2

  • 1. Ncessit dun espace de recherche pour le data mining multidimensionnel

    Problme de la transformation dune relation dattributs catgories en une relation binaire Treillis des parties : une structure mal adapte au contexte multidimensionnelNon prservation de la complexit des algorithmes par niveaux

    Casali, Cicchetti, Lakhal : Treillis Relationnel 3

  • Exemple:

    Casali, Cicchetti, Lakhal : Treillis Relationnel 4

  • Treillis des attributs binaires :

    Mais toutes les solutions ne sont pas validesCasali, Cicchetti, Lakhal : Treillis Relationnel 5

    S

    0

    SJMAB

    JMAB

    SMAB

    SJAB

    SJMB

    SJMA

    MAB

    JAB

    JMB

    JMA

    SAB

    SMB

    SMA

    SJB

    SJA

    SJM

    AB

    MB

    MA

    JB

    JA

    JM

    SB

    SA

    SM

    SJ

    B

    A

    M

    J

  • PlanNcessit dun espace de recherche pour le data mining multidimensionnelTreillis relationnelTreillis relationnel contraintTreillis relationnel vs DatacubePerspectivesCasali, Cicchetti, Lakhal : Treillis Relationnel 6

  • 2. Treillis relationnel

    2.1 Espace multidimensionnel tuple = lment de space(r) = motif multidimensionnelex: et 2.2 Ordre de gnralisationOn munit space(r) de lordre de gnralisation g

    ex: g

    Casali, Cicchetti, Lakhal : Treillis Relationnel 7r : relation de schma

  • Casali, Cicchetti, Lakhal : Treillis Relationnel 8? ALL

    Treillis de la relation exemple

  • Casali, Cicchetti, Lakhal : Treillis Relationnel 9(b) Le Produit

    Treillis de la relation exemple

  • 2.4 Caractrisation du treillis relationnelThorme: soit r une relation dattributs catgories sur .Lensemble ordonn (space(r), g) est un treillis complet, atomique, co-atomique et gradu, appel treillis relationnel et not RL(r), dans lequel :Casali, Cicchetti, Lakhal : Treillis Relationnel 10

  • 2.5 Treillis relationnel vs Treillis des partiesCasali, Cicchetti, Lakhal : Treillis Relationnel 11

    Feuil1

    Treillis RelationnelTreillis des Parties

    Hauteur|D|+1

    Nombre d'lments

    Oprateurs Sup. & Inf.Produit et SommeUnion et Intersection

    Caractristiquesnon distributifdistributif

    Feuil2

    Feuil3

  • PlanNcessit dun espace de recherche pour le data mining multidimensionnelTreillis relationnelTreillis relationnel contraintTreillis relationnel vs DatacubePerspectivesCasali, Cicchetti, Lakhal : Treillis Relationnel 12

  • 3. Treillis relationnel contraint3.1 Dfinition des contraintesUne contrainte cont est anti-monotone w.r.t. g ssi

    Une contrainte cont est monotone w.r.t. g ssi

    Casali, Cicchetti, Lakhal : Treillis Relationnel 13

  • 3.2 Structure convexe garantie Thorme: le treillis relationnel contraint est un espace convexe (reprsentable par bordures) dans lequel la borne maximale S+cont et la borne minimale G+cont sont:1. Si cont = cmc, G+ = min ({t RL(r) : cmc(t)} )et S+=2. Si cont = camc, G+= et S+ = max({t RL(r) : camc(t)})3. Si cont = chc, G+ = min({t RL(r) :chc(t)}) et S+ = max({t RL(r) : chc(t)})

    Casali, Cicchetti, Lakhal : Treillis Relationnel 14

  • 3.3 Exemples de contraintes(a) Frquence

    Freq(t) minfreq est une contrainte anti-monotone et Freq(t) maxfreq est une contrainte monotone.(b) Frquence de la disjonction

    Freq(vt) minfreq est une contrainte monotone et Freq(vt) maxfreq est une contrainte anti-monotone.

    Casali, Cicchetti, Lakhal : Treillis Relationnel 15

  • 3.4 Exactitude des solutions(a) freq(t) 3/11 (contrainte anti-monotone)

    Casali, Cicchetti, Lakhal : Treillis Relationnel 16Algorithme par niveau binaire donne le mme rsultat ?

    11

    4

    7

    9

    5

    4

    11

    7

    9

    4

    11

    7

    9

    5

    4

    4

    5

  • (b) freq(t) 4/11 (contrainte monotone)

    Casali, Cicchetti, Lakhal : Treillis Relationnel 17 Si algorithme (cadre binaire) => SJ fait partie des rsultats. Solution possible: ajouter la contrainte freq(t)>0. Mais freq()=0 et vrifie la contrainte.

    1

    4

    11

    7

    9

    1

    4

    11

    7

    9

    1

    1

    5

    4

    4

    11

    7

    9

    1

    1

    5

    4

    1

    4

    11

    7

    9

    1

  • (c) freq(Vt) 6/11 (contrainte anti-monotone)

    Casali, Cicchetti, Lakhal : Treillis Relationnel 18Freq(V) = 5/11 mais Freq() = 0Donc la contrainte Freq(t) > 0 ne permet pas dobtenir lensemble des solutions dun problme de data mining multidimensionnel en utilisant les techniques de data mining binaire.

    EPPDQSAG3SBG2SAF2SBF2JAG1MAG1

    4

    0

    1

    1

    5

    5

    5

    5

  • PlanNcessit dun espace de recherche pour le data mining multidimensionnelTreillis relationnelTreillis relationnel contraintTreillis relationnel vs DatacubePerspectivesCasali, Cicchetti, Lakhal : Treillis Relationnel 19

  • 4. Treillis relationnel vs DatacubeDatacube est un problme de data mining multidimensionnel dont lespace de recherche est le treillis relationnel.RL(r) = Datacube( )+ ordre de gnralisation + oprateurs Produit et Somme

    Ordre de gnralisation et oprateurs de base permettent la navigation dans le DatacubeCasali, Cicchetti, Lakhal : Treillis Relationnel 20

  • Projet similaire Laksmanan, Pei, Han pour lextraction des connaissances (smantiques) dans le Datacube.Premiers rsultats (VLDB02) :Cube Quotient : Treillis des classes dquivalences selon des fonctions agrgatives. Ce cube (rduit) permet la navigation comme dans le Datacube.Casali, Cicchetti, Lakhal : Treillis Relationnel 21

  • PlanNcessit dun espace de recherche pour le data mining multidimensionnelTreillis relationnelTreillis relationnel contraintTreillis relationnel vs DatacubePerspectivesCasali, Cicchetti, Lakhal : Treillis Relationnel 22

  • 5. PerspectivesTreillis relationnel fermEspace de versionEspace de version mergent ( 2 Datacubes)Reprsentations concises/condenses du treillis relationnel contraint

    Casali, Cicchetti, Lakhal : Treillis Relationnel 23