30 Avril 2001 1
Logique et Compression
Université Paris II
Michel de Rougemont
http://www.lri.fr/~mdr
Compression de structure finies : mots, graphes.Définissabilité sur les structures compressées.
30 Avril 2001 2
Définissabilité
• Représentation d’un objet influe sur la complexité d’un problème. A. Wigderson, 1988
• Informatique : schémas de compression : .zip, .jpeg, .mpeg, .mp3 (recherche par le contenu).
• Approche logique pour ces schémas?
• Nouveaux schémas?
Compression
30 Avril 2001 3
Thèmes et résultats
• Compression de mots– Lempel-Ziv: F.O. n’est pas conservé. Caractérisation
logique.– Run-length, Antidictionnaire, Aléatoire
• Compression de graphes– Programme, OBDDs, Aléatoire– Abstraction et compression
30 Avril 2001 4
Définissabilité
• Logique – FO
– SO
• Complexité– L, , P– NP, PH
• Classes de structures– Mots– GraphesFO (TC)
NL
30 Avril 2001 5
Compression
• Schéma de compression
Compresion Decompression
• Comparaisons : codage, cryptologie
A AB
30 Avril 2001 6
Schémas de Compression
• Universels– Indépendants de la distribution– Lempel-Ziv– ….
• Dépendants du type de signal– JPEG– MPEG– MP3
30 Avril 2001 7
Famille Lempel-Ziv
• Universels– LZ77, LZ78,….
• Problèmes Algorithmiques:– Rechercher un sous-mot (Farach,…)– Rechercher une expression régulière
30 Avril 2001 8
Famille Lempel-Ziv
0 10 1 0
A=({1,2,…,11},<, U)
B=({1,2,…5}, <, U, E ) U unaire
E binaire
0 00 01 001 010
B :
A :
30 Avril 2001 9
Définissabilité sur Lempel-Ziv
• Propriété de mots:
L = 00 11
U(j))]. j (i j imax[1i i
+ +
30 Avril 2001 10
Définissabilité sur Lempel-Ziv
0 00 1 1
0 00 000 0001 1 11 111
11
30 Avril 2001 11
Définissabilité sur Lempel-Ziv
• Sur la structure B, on peut écrire:
U est faux sur le 1er ordre linéaire et vrai sur le 2ième ordre linéaire
+ +i..max] linéaire ordre 1...i linéaire ordre[,, 21 iii
max)max()(1 2211 EiiiEiiii
30 Avril 2001 12
Non-Définissabilité
• Propriété de mots: L=
0.1.00.10.000.100.0000.1000.00000.1000a.000000
0.1.00.10.000.100.0000.1000.0000a.10000
+ +
L w2
L w1
**.a.O)1,0(
0 01 0 00
30 Avril 2001 13
Versions compressées
• B1 et B2 sont k-équivalentes
01 a 00 0
a 000 010
30 Avril 2001 14
Résultats
• Négatif: Théorème : il existe une propriété de mots
définissable au 1er ordre qui n’est pas définissable au 1er ordre sur Lempel-Ziv.
• Caractérisation logiqueThéorème : toute propriété de mots définissable au 1er ordre définissable dans le langage FO(TC) sur Lempel-Ziv.
30 Avril 2001 15
Translation simple
• Sur les mots :
• Sur Lempel-Ziv : i est déterminé par 2 blocks j,k
....)( iUi
).....)(),(.(, jUjkETCkj
0 01 0 00
kj
30 Avril 2001 16
Autres Schémas de Compression
• Mots– Run-length 000000011111100000 représenté par
(0,7)(1,6)(0,5) ou
– Antidictionnaire (mots les plus courts qui n’apparaissent pas dans un langage). Approche de Crochemore.
567 010
30 Avril 2001 17
Résultats sur Run-length
• Mots– Propriétés au 1er ordre inchangées
• Images (Mots en 2 dimension)– Il existe une propriété du 1er ordre qui n’est pas
définissable sur la structure compressée. (Forme géométrique comme un carré).
30 Avril 2001 18
Résultats sur les antidictionnaires
• Motivation : algorithmique de mots
• Recherche linéaire d’un motif. Génomique.
• Approche Shibata, Takeda, Shonohara, Arikawa, 1999 : recherche O(n) ?
30 Avril 2001 19
Compression approximative
• JPEG, MPEG : facteur de résolution
• JPEG : précision des coefficients de Fourier
• Utilisation : marquage des données
30 Avril 2001 20
Compression aléatoire
• Comment conserver des propriétés de mots avec grande probabilité?
• Testeur de N. Alon, Krivelevich, Newman, Szegedy, FOCS99
• Property testing : Goldreich, Goldwasser, Ron, FOCS96, JACM 2001
30 Avril 2001 21
Testeur
• Soit P une propriété de mot ( langage régulier)
• Algorithme randomisé tel que:– Si P(w) alors Proba (Accept ) > 2/3– Si w est de P alors Proba(Reject) >2/3
• Minimiser le nombre de requêtes de U(i).
loin
30 Avril 2001 22
Testeur AKNS et compression
• Echantillonner des sous-mots de longueur m
• Une structure finie permet de décider avec grande probabilité si :– P(w) ou– w est de Ploin
30 Avril 2001 23
II. Compression de graphes
• Schéma Universel?
• Programme P(x1,x2,…xn) définit un système de transition:
• S : états et R sont les transitions• P non déterministe/probabiliste
),...,,( 1 kPPRSU
30 Avril 2001 24
Vérification par modèle
• OBDD (Ordered binary Decision Diagram)
• U,G |= true U Accept => G |= F
• Spécification O1
• Programme
• Vérifier : comparer les OBDDs
2O
30 Avril 2001 25
• Branching programs• Succinct representation
of relations
• Intractable for:– Multiplication– Connectivity, Bipartition
OBDD : Oriented Binary Decision Diagram
v1
v2
0 1
R(v1,v2,….vn)
vn
30 Avril 2001 26
Communication Complexity
• Communication Complexity
• Examples:– Avg ( X, Y) where X={x1,….xn} and
Y={y1,….yn}– Equality(x,y)
A B
30 Avril 2001 27
Communication Complexity
• Communication Complexity of a boolean function : bipartite(x)
• C1,C2 : partition of the input ( n^2 bits)
• P is the protocol for the partition
• COM(bipartite, C1,C2,x ) = #bits exchanged
• CC(bipartite)= Min_(C1,C2,P) Max_x COM
30 Avril 2001 28
Communication Complexity
•Communication matrix
•M(bipartite, C1,C2) =
•G=(x1,x2) is bipartite
x2
x1 1
30 Avril 2001 29
Communication Complexity
•CC(f) > log (rank (M))
•M(bipartite,C1,C2) contient une sous matrice de rang élevé.
•M(P,P’): ssi P v P’=1
•N(P,P’):
P
P’
1
si 1,2 dans le meme ensemble de P v P’P
P’
1
30 Avril 2001 30
Lower bound on the size of OBDDs
v1
v2
0 1
R(v1,v2,….vn)
vn
A
B
OBDD’s width isan instance of 1-waycommunication protocol.
CC(f) < log width
30 Avril 2001 31
Results
• Theorem : k-bipartiteness has OBDDs of exponential sizes.
• Applications : approximate verification in model-checking.
30 Avril 2001 32
Probabilistic abstraction• Compressed structure : random subgraphs• Transition system of a program representedby the compressed transition system C(U,G)
• Program correct => C(U,G) |= F’• Program far from correct => Prob [C(U,G) |= not F’]>2/3
• Works for all Sigma_2 formulas (Alon and al. FOCS 99)
Collaboration F. Magniez et S. Laplante
30 Avril 2001 33
Conclusion
• Schémas de compression K--> K’
• Propriété F définie sur K dans une logique L est aussi définie sur K’ dans une logique L’.
• Complexité descriptive capture un schéma de compression.
• Applications : vérification, recherche par contenu
Top Related