Download - Logique et Compression

Transcript
Page 1: Logique et Compression

30 Avril 2001 1

Logique et Compression

Université Paris II

Michel de Rougemont

[email protected]

http://www.lri.fr/~mdr

Compression de structure finies : mots, graphes.Définissabilité sur les structures compressées.

Page 2: Logique et Compression

30 Avril 2001 2

Définissabilité

• Représentation d’un objet influe sur la complexité d’un problème. A. Wigderson, 1988

• Informatique : schémas de compression : .zip, .jpeg, .mpeg, .mp3 (recherche par le contenu).

• Approche logique pour ces schémas?

• Nouveaux schémas?

Compression

Page 3: Logique et Compression

30 Avril 2001 3

Thèmes et résultats

• Compression de mots– Lempel-Ziv: F.O. n’est pas conservé. Caractérisation

logique.– Run-length, Antidictionnaire, Aléatoire

• Compression de graphes– Programme, OBDDs, Aléatoire– Abstraction et compression

Page 4: Logique et Compression

30 Avril 2001 4

Définissabilité

• Logique – FO

– SO

• Complexité– L, , P– NP, PH

• Classes de structures– Mots– GraphesFO (TC)

NL

Page 5: Logique et Compression

30 Avril 2001 5

Compression

• Schéma de compression

Compresion Decompression

• Comparaisons : codage, cryptologie

A AB

Page 6: Logique et Compression

30 Avril 2001 6

Schémas de Compression

• Universels– Indépendants de la distribution– Lempel-Ziv– ….

• Dépendants du type de signal– JPEG– MPEG– MP3

Page 7: Logique et Compression

30 Avril 2001 7

Famille Lempel-Ziv

• Universels– LZ77, LZ78,….

• Problèmes Algorithmiques:– Rechercher un sous-mot (Farach,…)– Rechercher une expression régulière

Page 8: Logique et Compression

30 Avril 2001 8

Famille Lempel-Ziv

0 10 1 0

A=({1,2,…,11},<, U)

B=({1,2,…5}, <, U, E ) U unaire

E binaire

0 00 01 001 010

B :

A :

Page 9: Logique et Compression

30 Avril 2001 9

Définissabilité sur Lempel-Ziv

• Propriété de mots:

L = 00 11

U(j))]. j (i j imax[1i i

+ +

Page 10: Logique et Compression

30 Avril 2001 10

Définissabilité sur Lempel-Ziv

0 00 1 1

0 00 000 0001 1 11 111

11

Page 11: Logique et Compression

30 Avril 2001 11

Définissabilité sur Lempel-Ziv

• Sur la structure B, on peut écrire:

U est faux sur le 1er ordre linéaire et vrai sur le 2ième ordre linéaire

+ +i..max] linéaire ordre 1...i linéaire ordre[,, 21 iii

max)max()(1 2211 EiiiEiiii

Page 12: Logique et Compression

30 Avril 2001 12

Non-Définissabilité

• Propriété de mots: L=

0.1.00.10.000.100.0000.1000.00000.1000a.000000

0.1.00.10.000.100.0000.1000.0000a.10000

+ +

L w2

L w1

**.a.O)1,0(

0 01 0 00

Page 13: Logique et Compression

30 Avril 2001 13

Versions compressées

• B1 et B2 sont k-équivalentes

01 a 00 0

a 000 010

Page 14: Logique et Compression

30 Avril 2001 14

Résultats

• Négatif: Théorème : il existe une propriété de mots

définissable au 1er ordre qui n’est pas définissable au 1er ordre sur Lempel-Ziv.

• Caractérisation logiqueThéorème : toute propriété de mots définissable au 1er ordre définissable dans le langage FO(TC) sur Lempel-Ziv.

Page 15: Logique et Compression

30 Avril 2001 15

Translation simple

• Sur les mots :

• Sur Lempel-Ziv : i est déterminé par 2 blocks j,k

....)( iUi

).....)(),(.(, jUjkETCkj

0 01 0 00

kj

Page 16: Logique et Compression

30 Avril 2001 16

Autres Schémas de Compression

• Mots– Run-length 000000011111100000 représenté par

(0,7)(1,6)(0,5) ou

– Antidictionnaire (mots les plus courts qui n’apparaissent pas dans un langage). Approche de Crochemore.

567 010

Page 17: Logique et Compression

30 Avril 2001 17

Résultats sur Run-length

• Mots– Propriétés au 1er ordre inchangées

• Images (Mots en 2 dimension)– Il existe une propriété du 1er ordre qui n’est pas

définissable sur la structure compressée. (Forme géométrique comme un carré).

Page 18: Logique et Compression

30 Avril 2001 18

Résultats sur les antidictionnaires

• Motivation : algorithmique de mots

• Recherche linéaire d’un motif. Génomique.

• Approche Shibata, Takeda, Shonohara, Arikawa, 1999 : recherche O(n) ?

Page 19: Logique et Compression

30 Avril 2001 19

Compression approximative

• JPEG, MPEG : facteur de résolution

• JPEG : précision des coefficients de Fourier

• Utilisation : marquage des données

Page 20: Logique et Compression

30 Avril 2001 20

Compression aléatoire

• Comment conserver des propriétés de mots avec grande probabilité?

• Testeur de N. Alon, Krivelevich, Newman, Szegedy, FOCS99

• Property testing : Goldreich, Goldwasser, Ron, FOCS96, JACM 2001

Page 21: Logique et Compression

30 Avril 2001 21

Testeur

• Soit P une propriété de mot ( langage régulier)

• Algorithme randomisé tel que:– Si P(w) alors Proba (Accept ) > 2/3– Si w est de P alors Proba(Reject) >2/3

• Minimiser le nombre de requêtes de U(i).

loin

Page 22: Logique et Compression

30 Avril 2001 22

Testeur AKNS et compression

• Echantillonner des sous-mots de longueur m

• Une structure finie permet de décider avec grande probabilité si :– P(w) ou– w est de Ploin

Page 23: Logique et Compression

30 Avril 2001 23

II. Compression de graphes

• Schéma Universel?

• Programme P(x1,x2,…xn) définit un système de transition:

• S : états et R sont les transitions• P non déterministe/probabiliste

),...,,( 1 kPPRSU

Page 24: Logique et Compression

30 Avril 2001 24

Vérification par modèle

• OBDD (Ordered binary Decision Diagram)

• U,G |= true U Accept => G |= F

• Spécification O1

• Programme

• Vérifier : comparer les OBDDs

2O

Page 25: Logique et Compression

30 Avril 2001 25

• Branching programs• Succinct representation

of relations

• Intractable for:– Multiplication– Connectivity, Bipartition

OBDD : Oriented Binary Decision Diagram

v1

v2

0 1

R(v1,v2,….vn)

vn

Page 26: Logique et Compression

30 Avril 2001 26

Communication Complexity

• Communication Complexity

• Examples:– Avg ( X, Y) where X={x1,….xn} and

Y={y1,….yn}– Equality(x,y)

A B

Page 27: Logique et Compression

30 Avril 2001 27

Communication Complexity

• Communication Complexity of a boolean function : bipartite(x)

• C1,C2 : partition of the input ( n^2 bits)

• P is the protocol for the partition

• COM(bipartite, C1,C2,x ) = #bits exchanged

• CC(bipartite)= Min_(C1,C2,P) Max_x COM

Page 28: Logique et Compression

30 Avril 2001 28

Communication Complexity

•Communication matrix

•M(bipartite, C1,C2) =

•G=(x1,x2) is bipartite

x2

x1 1

Page 29: Logique et Compression

30 Avril 2001 29

Communication Complexity

•CC(f) > log (rank (M))

•M(bipartite,C1,C2) contient une sous matrice de rang élevé.

•M(P,P’): ssi P v P’=1

•N(P,P’):

P

P’

1

si 1,2 dans le meme ensemble de P v P’P

P’

1

Page 30: Logique et Compression

30 Avril 2001 30

Lower bound on the size of OBDDs

v1

v2

0 1

R(v1,v2,….vn)

vn

A

B

OBDD’s width isan instance of 1-waycommunication protocol.

CC(f) < log width

Page 31: Logique et Compression

30 Avril 2001 31

Results

• Theorem : k-bipartiteness has OBDDs of exponential sizes.

• Applications : approximate verification in model-checking.

Page 32: Logique et Compression

30 Avril 2001 32

Probabilistic abstraction• Compressed structure : random subgraphs• Transition system of a program representedby the compressed transition system C(U,G)

• Program correct => C(U,G) |= F’• Program far from correct => Prob [C(U,G) |= not F’]>2/3

• Works for all Sigma_2 formulas (Alon and al. FOCS 99)

Collaboration F. Magniez et S. Laplante

Page 33: Logique et Compression

30 Avril 2001 33

Conclusion

• Schémas de compression K--> K’

• Propriété F définie sur K dans une logique L est aussi définie sur K’ dans une logique L’.

• Complexité descriptive capture un schéma de compression.

• Applications : vérification, recherche par contenu