Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes...
Transcript of Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes...
Mes histoires d’amour avec les travaux de MaximeCrochemore
Gregory KucherovLIFL/CNRS/INRIA, Lille, France
Marne-la-Vallee, 26 octobre 2007
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
travaux de Maxime (donnees du 2/11/2006)
59 articles de revue
53 communications a des colloques
34 livres, chapitres de livres et de recueils
2 theses et 13 rapports de recherche
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Histoire 1 (vers 1993)
Automate des suffixes
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Recherche de motifs multiples avec jokers non-bornes
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Recherche de motifs multiples avec jokers non-bornes
recherche d’expressions regulieres⋃k
i=1 A∗wi1A∗ · · ·A∗wi`i
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Recherche de motifs multiples avec jokers non-bornes
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Recherche de motifs multiples avec jokers non-bornes
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Recherche de motifs multiples avec jokers non-bornes
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Recherche de motifs multiples avec jokers non-bornes
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Premieres amours
Maxime Crochemore, Transducers and repetitions, TheoreticalComputer Science 45, 63-86, 1986
Maxime Crochemore, String matching with constraints, InProc. Internat. Symp. on Mathematical Foundations ofComputer Science, Lecture Notes in Computer Science, Vol.324 (Springer, Berlin, 1988) p. 44-58
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Automate des suffixes
u, v facteurs de w
u ≡w v ssi les positions de fin de u et de v coincident
V = {[u]≡w |u facteur de w}E = {[u]≡w
a→ [ua]≡w |u, ua facteurs de w , a ∈ A}
. (V ,E ) est l’automate minimal qui reconnait tous les suffixes dew. (V ,E ) est un automate (generalement non-minimal) quireconnait tous les facteurs de w. (V ,E ) est de taille bornee par 2|w | et peux etre construit entemps O(|w |) !
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Automate des suffixes
u, v facteurs de w
u ≡w v ssi les positions de fin de u et de v coincident
V = {[u]≡w |u facteur de w}E = {[u]≡w
a→ [ua]≡w |u, ua facteurs de w , a ∈ A}
. (V ,E ) est l’automate minimal qui reconnait tous les suffixes dew. (V ,E ) est un automate (generalement non-minimal) quireconnait tous les facteurs de w. (V ,E ) est de taille bornee par 2|w | et peux etre construit entemps O(|w |) !
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Automate des suffixes
u, v facteurs de w
u ≡w v ssi les positions de fin de u et de v coincident
V = {[u]≡w |u facteur de w}E = {[u]≡w
a→ [ua]≡w |u, ua facteurs de w , a ∈ A}
. (V ,E ) est l’automate minimal qui reconnait tous les suffixes dew
. (V ,E ) est un automate (generalement non-minimal) quireconnait tous les facteurs de w. (V ,E ) est de taille bornee par 2|w | et peux etre construit entemps O(|w |) !
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Automate des suffixes
u, v facteurs de w
u ≡w v ssi les positions de fin de u et de v coincident
V = {[u]≡w |u facteur de w}E = {[u]≡w
a→ [ua]≡w |u, ua facteurs de w , a ∈ A}
. (V ,E ) est l’automate minimal qui reconnait tous les suffixes dew. (V ,E ) est un automate (generalement non-minimal) quireconnait tous les facteurs de w
. (V ,E ) est de taille bornee par 2|w | et peux etre construit entemps O(|w |) !
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Automate des suffixes
u, v facteurs de w
u ≡w v ssi les positions de fin de u et de v coincident
V = {[u]≡w |u facteur de w}E = {[u]≡w
a→ [ua]≡w |u, ua facteurs de w , a ∈ A}
. (V ,E ) est l’automate minimal qui reconnait tous les suffixes dew. (V ,E ) est un automate (generalement non-minimal) quireconnait tous les facteurs de w. (V ,E ) est de taille bornee par 2|w | et peux etre construit entemps O(|w |) !
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
DAWG : Directed Acyclic Word Graph
A.Blumer, J.Blumer, D.Haussler,A.Ehrenfeucht, M.T.Chen,J.Seiferas, The smallest automatonrecognizing the subwords of a text,Theoretical Computer Science 40,31-55, 1985
A.Blumer, J.Blumer, D.Haussler,R.McConnell, A.Ehrenfeucht,Complete inverted files for efficienttext retieval and analysis, Journalof the ACM 34, 578-595, 1987
a
a
aa
a
a
b
b
DAWG pour l’ensembleD = {ba, bbaa}
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Les vertus du DAWG
Le DAWG se prete bien a l’ajout/suppression de mots de sonsupport
Recherche de motifs multiples avec jokers non-bornes :O((|T |+ |P|) log |P|) [Kucherov&Rusinowitch 95]
Dynamic Dictionary Matching [Amir&Farach 91, Amir et al94, Idury&Schaffer 94] ajout/suppression d’un mot p dedictionnaire en O(|p| log |D|), recherche enO((|T |+ occ) log |D|)
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Les vertus du DAWG
Le DAWG se prete bien a l’ajout/suppression de mots de sonsupport
Recherche de motifs multiples avec jokers non-bornes :O((|T |+ |P|) log |P|) [Kucherov&Rusinowitch 95]
Dynamic Dictionary Matching [Amir&Farach 91, Amir et al94, Idury&Schaffer 94] ajout/suppression d’un mot p dedictionnaire en O(|p| log |D|), recherche enO((|T |+ occ) log |D|)
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Les vertus du DAWG
Le DAWG se prete bien a l’ajout/suppression de mots de sonsupport
Recherche de motifs multiples avec jokers non-bornes :O((|T |+ |P|) log |P|) [Kucherov&Rusinowitch 95]
Dynamic Dictionary Matching [Amir&Farach 91, Amir et al94, Idury&Schaffer 94] ajout/suppression d’un mot p dedictionnaire en O(|p| log |D|), recherche enO((|T |+ occ) log |D|)
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Halte au monopole de l’arbre des suffixes ! Vive lepluralisme des structures !
google scholar sort 3230 articles en reponse de la requete "suffixtree" et de l’ordre de 200 en reponse de "acyclic word graph"ou "suffix automaton"
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
D’autres structures d’index
Compact Directed Acyclic Word Graph
M.Crochemore, R.Verin. On Compact Directed Acyclic
Word Graphs. Structures in Logic and Computer Science.
Springer. 1997. pp. 192-211
Factor oracleC.Allauzen, M.Crochemore, M.Raffinot. Factor oracle : anew structure for pattern matching. In : SOFSEM’99, vol.1725. LNCS. 1999. pp. 291-306. Springer-Verlag
M. Crochemore, L. Ilie, and E. Seid-Hilmi, Factor Oracles,
Proc. of CIAA’06, LNCS 4094, Springer, 2006, 78 – 89
Subsequence automaton
J.-J.Hebrard, M.Crochemore. Calcul de la distance par les
sous-mots. Informatique Theorique et Applications. 20
(4). 1986. pp. 441-456
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Histoire 2 (vers 1996)
Morphismes sans carre
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Repetitions
p(w) : periode minimale de w (min{p|∀i w [i + p] = w [i ]})e(w) = |w |
p(w) : exposant de w
acaaca = (aca)2 : carre ; acacac = (ac)3 : cube ;
accacca = (acc)73 , accaac = (acca)
32
w sans puissance α ∈ R si w n’a pas de facteur u tel quee(u) ≥ α
il existe un mot infini sans carre sur un alphabet de 3 lettres(abacabcacb . . .) [Thue ≈1905]
[Dejean 1972] : sur un alphabet de 3 lettres, il existe un mot
infini sans puissance 74
+
sur un alphabet de 2 lettres, il existe un mot infini sanspuissance 2+ (overlap-free) ; Thue-Morse morphismµ(a) = ab, µ(b) = ba
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Repetitions
p(w) : periode minimale de w (min{p|∀i w [i + p] = w [i ]})e(w) = |w |
p(w) : exposant de w
acaaca = (aca)2 : carre ; acacac = (ac)3 : cube ;
accacca = (acc)73 , accaac = (acca)
32
w sans puissance α ∈ R si w n’a pas de facteur u tel quee(u) ≥ α
il existe un mot infini sans carre sur un alphabet de 3 lettres(abacabcacb . . .) [Thue ≈1905]
[Dejean 1972] : sur un alphabet de 3 lettres, il existe un mot
infini sans puissance 74
+
sur un alphabet de 2 lettres, il existe un mot infini sanspuissance 2+ (overlap-free) ; Thue-Morse morphismµ(a) = ab, µ(b) = ba
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Repetitions
p(w) : periode minimale de w (min{p|∀i w [i + p] = w [i ]})e(w) = |w |
p(w) : exposant de w
acaaca = (aca)2 : carre ; acacac = (ac)3 : cube ;
accacca = (acc)73 , accaac = (acca)
32
w sans puissance α ∈ R si w n’a pas de facteur u tel quee(u) ≥ α
il existe un mot infini sans carre sur un alphabet de 3 lettres(abacabcacb . . .) [Thue ≈1905]
[Dejean 1972] : sur un alphabet de 3 lettres, il existe un mot
infini sans puissance 74
+
sur un alphabet de 2 lettres, il existe un mot infini sanspuissance 2+ (overlap-free) ; Thue-Morse morphismµ(a) = ab, µ(b) = ba
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Repetitions
p(w) : periode minimale de w (min{p|∀i w [i + p] = w [i ]})e(w) = |w |
p(w) : exposant de w
acaaca = (aca)2 : carre ; acacac = (ac)3 : cube ;
accacca = (acc)73 , accaac = (acca)
32
w sans puissance α ∈ R si w n’a pas de facteur u tel quee(u) ≥ α
il existe un mot infini sans carre sur un alphabet de 3 lettres(abacabcacb . . .) [Thue ≈1905]
[Dejean 1972] : sur un alphabet de 3 lettres, il existe un mot
infini sans puissance 74
+
sur un alphabet de 2 lettres, il existe un mot infini sanspuissance 2+ (overlap-free) ; Thue-Morse morphismµ(a) = ab, µ(b) = ba
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Morphismes sans puissance
morphisme µ sans puissance α : w est sans puissance α ⇒µ(w) est sans puissance α
il est tres difficile de decider si un morphisme donne est sanspuissance α
Des conditions necessaires et suffisantes (etendant celles de JeanBerstel de 1979) qu’un morphisme soit sans carre ont ete etabliesdans
Maxime Crochemore. Sharp characterization ofsquare-free morphisms. Theoretical Computer Science. 18(2). 1982. pp. 221-226
Corollary 5
Un morphisme µ : {a, b, c} → {a, b, c} est sans carre si etseulement si pour tout mot w ∈ {a, b, c}∗ de longueur ≤ 5, µ(w)est sans carre
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Morphismes sans puissance
morphisme µ sans puissance α : w est sans puissance α ⇒µ(w) est sans puissance α
il est tres difficile de decider si un morphisme donne est sanspuissance α
Des conditions necessaires et suffisantes (etendant celles de JeanBerstel de 1979) qu’un morphisme soit sans carre ont ete etabliesdans
Maxime Crochemore. Sharp characterization ofsquare-free morphisms. Theoretical Computer Science. 18(2). 1982. pp. 221-226
Corollary 5
Un morphisme µ : {a, b, c} → {a, b, c} est sans carre si etseulement si pour tout mot w ∈ {a, b, c}∗ de longueur ≤ 5, µ(w)est sans carre
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Morphismes sans puissance
morphisme µ sans puissance α : w est sans puissance α ⇒µ(w) est sans puissance α
il est tres difficile de decider si un morphisme donne est sanspuissance α
Des conditions necessaires et suffisantes (etendant celles de JeanBerstel de 1979) qu’un morphisme soit sans carre ont ete etabliesdans
Maxime Crochemore. Sharp characterization ofsquare-free morphisms. Theoretical Computer Science. 18(2). 1982. pp. 221-226
Corollary 5
Un morphisme µ : {a, b, c} → {a, b, c} est sans carre si etseulement si pour tout mot w ∈ {a, b, c}∗ de longueur ≤ 5, µ(w)est sans carre
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Frequence limite d’une lettre dans les mots binaires sanspuissance α
Question : que peut-on dire de ρmin(α), la proportion minimalelimite d’une lettre dans un mot sans puissance α ?
Cas d’alphabet binaire, α > 2 [Kolpakov&Kucherov 97,K&K&Tarannikov 98, Ochem 05]
ρmin(α) = 12 for α ∈ (2, 7
3 ] et ρmin(73
+) < 1
2
infinite de points de discontinuite :73 , 17
7 , 52 , . . . , 41
16 , 187 , . . . , 3, 4, . . . et tous α ∈ N
un autre intervalle constant : (4116 , 18
7 ]
estimations pour ρmin(α) et ρmin(α+) pour tous les points de
discontinuite α (mais aucune valeur exacte n’est connue !)
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Frequence limite d’une lettre dans les mots binaires sanspuissance α
Question : que peut-on dire de ρmin(α), la proportion minimalelimite d’une lettre dans un mot sans puissance α ?
Cas d’alphabet binaire, α > 2 [Kolpakov&Kucherov 97,K&K&Tarannikov 98, Ochem 05]
ρmin(α) = 12 for α ∈ (2, 7
3 ] et ρmin(73
+) < 1
2
infinite de points de discontinuite :73 , 17
7 , 52 , . . . , 41
16 , 187 , . . . , 3, 4, . . . et tous α ∈ N
un autre intervalle constant : (4116 , 18
7 ]
estimations pour ρmin(α) et ρmin(α+) pour tous les points de
discontinuite α (mais aucune valeur exacte n’est connue !)
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Frequence limite d’une lettre dans les mots binaires sanspuissance α
Question : que peut-on dire de ρmin(α), la proportion minimalelimite d’une lettre dans un mot sans puissance α ?
Cas d’alphabet binaire, α > 2 [Kolpakov&Kucherov 97,K&K&Tarannikov 98, Ochem 05]
ρmin(α) = 12 for α ∈ (2, 7
3 ] et ρmin(73
+) < 1
2
infinite de points de discontinuite :73 , 17
7 , 52 , . . . , 41
16 , 187 , . . . , 3, 4, . . . et tous α ∈ N
un autre intervalle constant : (4116 , 18
7 ]
estimations pour ρmin(α) et ρmin(α+) pour tous les points de
discontinuite α (mais aucune valeur exacte n’est connue !)
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Frequence limite d’une lettre dans les mots binaires sanspuissance α
Question : que peut-on dire de ρmin(α), la proportion minimalelimite d’une lettre dans un mot sans puissance α ?
Cas d’alphabet binaire, α > 2 [Kolpakov&Kucherov 97,K&K&Tarannikov 98, Ochem 05]
ρmin(α) = 12 for α ∈ (2, 7
3 ] et ρmin(73
+) < 1
2
infinite de points de discontinuite :73 , 17
7 , 52 , . . . , 41
16 , 187 , . . . , 3, 4, . . . et tous α ∈ N
un autre intervalle constant : (4116 , 18
7 ]
estimations pour ρmin(α) et ρmin(α+) pour tous les points de
discontinuite α (mais aucune valeur exacte n’est connue !)
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Frequence limite d’une lettre dans les mots binaires sanspuissance α
Question : que peut-on dire de ρmin(α), la proportion minimalelimite d’une lettre dans un mot sans puissance α ?
Cas d’alphabet binaire, α > 2 [Kolpakov&Kucherov 97,K&K&Tarannikov 98, Ochem 05]
ρmin(α) = 12 for α ∈ (2, 7
3 ] et ρmin(73
+) < 1
2
infinite de points de discontinuite :73 , 17
7 , 52 , . . . , 41
16 , 187 , . . . , 3, 4, . . . et tous α ∈ N
un autre intervalle constant : (4116 , 18
7 ]
estimations pour ρmin(α) et ρmin(α+) pour tous les points de
discontinuite α (mais aucune valeur exacte n’est connue !)
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Frequence limite d’une lettre dans les mots de 3 lettressans carre
Cas d’alphabet de 3 lettres, α = 2
[Tarannikov 02] :0, 274648... = 1780
6481 ≤ ρmin ≤ 64233 = 0, 274678...
[Ochem 05] :0, 27464897... = 1000
3641 ≤ ρmin ≤ 8833215 = 0, 27465007...,
ρmax = 255653 = 0.3905...
(en utilisant les criteres de Crochemore !)
[Khalyavin 07] : ρmin = 8833215 ! !
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Frequence limite d’une lettre dans les mots de 3 lettressans carre
Cas d’alphabet de 3 lettres, α = 2
[Tarannikov 02] :0, 274648... = 1780
6481 ≤ ρmin ≤ 64233 = 0, 274678...
[Ochem 05] :0, 27464897... = 1000
3641 ≤ ρmin ≤ 8833215 = 0, 27465007...,
ρmax = 255653 = 0.3905...
(en utilisant les criteres de Crochemore !)
[Khalyavin 07] : ρmin = 8833215 ! !
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Frequence limite d’une lettre dans les mots de 3 lettressans carre
Cas d’alphabet de 3 lettres, α = 2
[Tarannikov 02] :0, 274648... = 1780
6481 ≤ ρmin ≤ 64233 = 0, 274678...
[Ochem 05] :0, 27464897... = 1000
3641 ≤ ρmin ≤ 8833215 = 0, 27465007...,
ρmax = 255653 = 0.3905...
(en utilisant les criteres de Crochemore !)
[Khalyavin 07] : ρmin = 8833215 ! !
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Frequence limite d’une lettre dans les mots de 3 lettressans carre
Cas d’alphabet de 3 lettres, α = 2
[Tarannikov 02] :0, 274648... = 1780
6481 ≤ ρmin ≤ 64233 = 0, 274678...
[Ochem 05] :0, 27464897... = 1000
3641 ≤ ρmin ≤ 8833215 = 0, 27465007...,
ρmax = 255653 = 0.3905...
(en utilisant les criteres de Crochemore !)
[Khalyavin 07] : ρmin = 8833215 ! !
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Histoire 3 (vers 1998)
Recherche de repetitions
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Genese
Maxime Crochemore. An optimal algorithm for computing therepetitions in a word. Information Processing Letters. 12 (5).1981. pp. 244-250
recherche de tous les puissances entieres non-extensibles enO(n log n)optimalite de la borne (mots de Fibonacci)
Maxime Crochemore. Recherche lineaire d’un carre dans unmot. C. R. Acad. Sci. Paris Ser. I Math. 296 (18). 1983. pp.781-784
utilisation des techniques de factorisation a la Lempel-Ziv et defonctions d’extension
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Genese
Maxime Crochemore. An optimal algorithm for computing therepetitions in a word. Information Processing Letters. 12 (5).1981. pp. 244-250
recherche de tous les puissances entieres non-extensibles enO(n log n)optimalite de la borne (mots de Fibonacci)
Maxime Crochemore. Recherche lineaire d’un carre dans unmot. C. R. Acad. Sci. Paris Ser. I Math. 296 (18). 1983. pp.781-784
utilisation des techniques de factorisation a la Lempel-Ziv et defonctions d’extension
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Genese
Maxime Crochemore. An optimal algorithm for computing therepetitions in a word. Information Processing Letters. 12 (5).1981. pp. 244-250
recherche de tous les puissances entieres non-extensibles enO(n log n)optimalite de la borne (mots de Fibonacci)
Maxime Crochemore. Recherche lineaire d’un carre dans unmot. C. R. Acad. Sci. Paris Ser. I Math. 296 (18). 1983. pp.781-784
utilisation des techniques de factorisation a la Lempel-Ziv et defonctions d’extension
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Nombre de repetitions dans un mot
il y a O(n2) de carres dans an
il peut y avoir Θ(n log n) de carres primitifs
Maxime Crochemore and Wojciech Rytter. Squares,cubes and time-space efficient string-searching.Algorithmica. 13 (5). 1995. pp. 405-425
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Repetitions maximales (runs)
Repetitions maximale dans w = facteur de w d’exposant ≥ 2 (pasnecessairement entier) et non-extensible a droite/a gauche
aabaababaaaabaababaa a2 a2 a2
aabaababaa (aab)7/3
aabaababaa (ab)5/2
L’ensemble des repetitions maximales codent toutes les repetitionsdans le mot
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Repetitions maximales (runs)
Repetitions maximale dans w = facteur de w d’exposant ≥ 2 (pasnecessairement entier) et non-extensible a droite/a gauche
aabaababaa
aabaababaa a2 a2 a2
aabaababaa (aab)7/3
aabaababaa (ab)5/2
L’ensemble des repetitions maximales codent toutes les repetitionsdans le mot
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Repetitions maximales (runs)
Repetitions maximale dans w = facteur de w d’exposant ≥ 2 (pasnecessairement entier) et non-extensible a droite/a gauche
aabaababaaaabaababaa a2 a2 a2
aabaababaa (aab)7/3
aabaababaa (ab)5/2
L’ensemble des repetitions maximales codent toutes les repetitionsdans le mot
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Repetitions maximales (runs)
Repetitions maximale dans w = facteur de w d’exposant ≥ 2 (pasnecessairement entier) et non-extensible a droite/a gauche
aabaababaaaabaababaa a2 a2 a2
aabaababaa (aab)7/3
aabaababaa (ab)5/2
L’ensemble des repetitions maximales codent toutes les repetitionsdans le mot
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Repetitions maximales (runs)
Repetitions maximale dans w = facteur de w d’exposant ≥ 2 (pasnecessairement entier) et non-extensible a droite/a gauche
aabaababaaaabaababaa a2 a2 a2
aabaababaa (aab)7/3
aabaababaa (ab)5/2
L’ensemble des repetitions maximales codent toutes les repetitionsdans le mot
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Repetitions maximales (runs)
Repetitions maximale dans w = facteur de w d’exposant ≥ 2 (pasnecessairement entier) et non-extensible a droite/a gauche
aabaababaaaabaababaa a2 a2 a2
aabaababaa (aab)7/3
aabaababaa (ab)5/2
L’ensemble des repetitions maximales codent toutes les repetitionsdans le mot
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Recherche des repetitions maximales
[ Apostoloco&Preparata 83 ] recherche des repetitionsmaximales a droite en O(n log n)
[ Main&Lorentz 84 ] recherche de toutes les repetitionsmaximales en O(n log n)
[ Main 89 ] recherche de toutes les repetitions maximalesdistinctes en O(n)
[ Iliopoulos, Moore, Smyth 97 ] toutes les repetitionsmaximales dans les mots de Fibonacci en O(n)
[ Kolpakov, Kucherov 99 ] il y a O(n) de repetitionsmaximales et on peut les calculer en O(n)
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Recherche des repetitions maximales
[ Apostoloco&Preparata 83 ] recherche des repetitionsmaximales a droite en O(n log n)
[ Main&Lorentz 84 ] recherche de toutes les repetitionsmaximales en O(n log n)
[ Main 89 ] recherche de toutes les repetitions maximalesdistinctes en O(n)
[ Iliopoulos, Moore, Smyth 97 ] toutes les repetitionsmaximales dans les mots de Fibonacci en O(n)
[ Kolpakov, Kucherov 99 ] il y a O(n) de repetitionsmaximales et on peut les calculer en O(n)
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Borne sur le nombre des repetitions maximales
la preuve de [K&K 99] est tres technique et ne permet pasd’extraire une constante multiplicative
or, la conjecture de [K&K 99] est que le nb des repetitionsmaximales est au plus n
la borne inferieure de 32φn a ete prouvee dans
[Franek,Simpson,Smyth 03] et conjecturee etre la borne exacte
objectif : meilleure borne sup et une preuve plus simple
[ Rytter STACS 06 ] ≤ 5n[ Puglisi,Simpson,Smyth 06 ] ≤ 3, 48n[ Rytter 06 ] ≤ 3, 44n[ Crochemore&Ilie 06, MFCS 07] ≤ 1, 6n
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Borne sur le nombre des repetitions maximales
la preuve de [K&K 99] est tres technique et ne permet pasd’extraire une constante multiplicative
or, la conjecture de [K&K 99] est que le nb des repetitionsmaximales est au plus n
la borne inferieure de 32φn a ete prouvee dans
[Franek,Simpson,Smyth 03] et conjecturee etre la borne exacte
objectif : meilleure borne sup et une preuve plus simple
[ Rytter STACS 06 ] ≤ 5n
[ Puglisi,Simpson,Smyth 06 ] ≤ 3, 48n[ Rytter 06 ] ≤ 3, 44n[ Crochemore&Ilie 06, MFCS 07] ≤ 1, 6n
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Borne sur le nombre des repetitions maximales
la preuve de [K&K 99] est tres technique et ne permet pasd’extraire une constante multiplicative
or, la conjecture de [K&K 99] est que le nb des repetitionsmaximales est au plus n
la borne inferieure de 32φn a ete prouvee dans
[Franek,Simpson,Smyth 03] et conjecturee etre la borne exacte
objectif : meilleure borne sup et une preuve plus simple
[ Rytter STACS 06 ] ≤ 5n[ Puglisi,Simpson,Smyth 06 ] ≤ 3, 48n
[ Rytter 06 ] ≤ 3, 44n[ Crochemore&Ilie 06, MFCS 07] ≤ 1, 6n
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Borne sur le nombre des repetitions maximales
la preuve de [K&K 99] est tres technique et ne permet pasd’extraire une constante multiplicative
or, la conjecture de [K&K 99] est que le nb des repetitionsmaximales est au plus n
la borne inferieure de 32φn a ete prouvee dans
[Franek,Simpson,Smyth 03] et conjecturee etre la borne exacte
objectif : meilleure borne sup et une preuve plus simple
[ Rytter STACS 06 ] ≤ 5n[ Puglisi,Simpson,Smyth 06 ] ≤ 3, 48n[ Rytter 06 ] ≤ 3, 44n
[ Crochemore&Ilie 06, MFCS 07] ≤ 1, 6n
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Borne sur le nombre des repetitions maximales
la preuve de [K&K 99] est tres technique et ne permet pasd’extraire une constante multiplicative
or, la conjecture de [K&K 99] est que le nb des repetitionsmaximales est au plus n
la borne inferieure de 32φn a ete prouvee dans
[Franek,Simpson,Smyth 03] et conjecturee etre la borne exacte
objectif : meilleure borne sup et une preuve plus simple
[ Rytter STACS 06 ] ≤ 5n[ Puglisi,Simpson,Smyth 06 ] ≤ 3, 48n[ Rytter 06 ] ≤ 3, 44n[ Crochemore&Ilie 06, MFCS 07] ≤ 1, 6n
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Epilogue
Qui est Maxime Crochemore ?
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue
Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue