Участница:Mariashka — различия между версиями

Версия 23:28, 26 апреля 2015

Определение:

Повтором (англ. repeatition) называется непустая строка вида

Алгоритм Мейна-Лоренца (англ. Main-Lorentz algorithm) — алгоритм на строках, позволяющий найти все повторы в строке [math]s[1..n][/math] за [math]O(n \log n)[/math]

Содержание

1 Алгоритм
- 1.1 Нахождение правых повтров
- 1.2 Нахождение левых повтров
2 Общий алгоритм н

Алгоритм

Данный алгоритм - это алгоритм "разделяй и властвуй":

Разделим строку пополам
Заметим, что повторы делятся на две группы: пересекающие и не пересекающие границу раздела
Рекурсивно запустимся от каждой половинки - так мы найдем повторы, которые не пересекают границу раздела
Нахождение повторов, которые пересекают границу раздела

Повторы, пересекающие границу раздела, можно разделить на две группы по положению центра повтора.

Так как повторов строке [math] \Omega(n^2)[/math], мы не можем хранить их в явном виде. Будем хранить повторы блоками вида [math](length, first, last)[/math], где [math] length [/math] - это длина повтора, а [math] [first, last] [/math] - промежуток индексов, в которых заканчиваются повторы такой длины.

Нахождение правых повтров

Рассмотрим строку [math]t = uv[/math], пусть начало [math]t[/math] в исходной строке [math]s[/math] - [math]shift[/math]

Предподсчитаем следующие массивы:
1. , где [math] lcp [/math] - наибольший общий префикс
2. [math] RS[i] = lcs(v[1..i], u) [/math], где [math] lcs [/math] - наибольший общий суффикс
Переберем длину повтора [math] 2p [/math]. Для каждого [math] p [/math] получим интервал индексов конца повтора в строке [math] v [/math]: [math] [x, y] [/math].
Добавим к ответу, учитывая смещение в исходной строке [math] s [/math] :

Докажем следующее утверждение для нахождения интервала [math] [x, y] [/math]:

Утверждение:

TODO

Нахождение левых повтров

Рассмотрим строку [math]t = uv[/math], пусть начало [math]t[/math] в исходной строке [math]s[/math] - [math]shift[/math]

Предподсчитаем следующие массивы:
1. , где [math] lcp [/math] - наибольший общий префикс
2. [math] LS[i] = lcs(u[1..i], u) [/math], где [math] lcs [/math] - наибольший общий суффикс
Переберем длину повтора [math] 2p [/math]. Для каждого [math] p [/math] получим интервал индексов конца повтора в строке [math] v [/math]: [math] [x, y] [/math].
Добавим к ответу, учитывая смещение в исходной строке [math] s [/math] :

Докажем следующее утверждение для нахождения интервала [math] [x, y] [/math]:

Утверждение:

TODO

@@ Строка 10: / Строка 10: @@
 # Заметим, что повторы делятся на две группы: пересекающие и не пересекающие границу раздела
 # Рекурсивно запустимся от каждой половинки - так мы найдем повторы, которые не пересекают границу раздела
-# Рассмотрим нахождение повторов, которые пересекают границу раздела
+# Нахождение повторов, которые пересекают границу раздела
-=== Нахождение повторов ===
+Повторы, пересекающие границу раздела, можно разделить на две группы по положению центра повтора.
-Повторы, пересекающие границу раздела, можно разделить на две группы по положению центра повтора. Центр в правой половине - правый повтор, в левой части - в левой.
 Так как повторов строке <tex> \Omega(n^2)</tex>, мы не можем хранить их в явном виде. Будем хранить повторы блоками вида <tex>(length, first, last)</tex>, где <tex> length </tex> - это длина повтора, а <tex> [first, last] </tex> - промежуток индексов, в которых заканчиваются повторы такой длины.
 === Нахождение правых повтров ===
-Рассмотрим строку <tex>s = uv</tex>.
+Рассмотрим строку <tex>t = uv</tex>, пусть начало <tex>t</tex> в исходной строке <tex>s</tex> - <tex>shift</tex>
-Переберем длину повтора <tex> 2p </tex>. Для каждого <tex> p </tex> получим неравенство для <tex> i </tex> - индекса конца повтора в строке <tex> v </tex>. Так как мы рассматриваем повторы, пересекающие границу, повтор всегда оканчивается в <tex> v </tex>.
-Для этого предподсчитаем следующие массивы:
-# <tex> RP[i] = lcp(v[i..v.len], v) </tex>, где <tex> lcp </tex> - наибольший общий префикс
-# <tex> RS[i] = lcs(v[1..i], u) </tex>, где <tex> lcs </tex> - наибольший общий суффикс
+# Предподсчитаем следующие массивы:
+## <tex> RP[i] = lcp(v[i..v.len], v) </tex>, где <tex> lcp </tex> - наибольший общий префикс
+## <tex> RS[i] = lcs(v[1..i], u) </tex>, где <tex> lcs </tex> - наибольший общий суффикс
+# Переберем длину повтора <tex> 2p </tex>. Для каждого <tex> p </tex> получим интервал индексов конца повтора в строке <tex> v </tex>: <tex> [x, y] </tex>.
+# Добавим к ответу, учитывая смещение в исходной строке <tex> s </tex> : <tex>(2p, x + shift, y + shift) </tex>
+Докажем следующее утверждение для нахождения интервала <tex> [x, y] </tex>:
 {{Утверждение
 |id=kindscount
@@ Строка 31: / Строка 33: @@
 === Нахождение левых повтров ===
-Рассмотрим строку <tex>s = uv</tex>.
+Рассмотрим строку <tex>t = uv</tex>, пусть начало <tex>t</tex> в исходной строке <tex>s</tex> - <tex>shift</tex>
-Переберем длину повтора <tex> 2p </tex>. Для каждого <tex> p </tex> получим неравенство для <tex> i </tex> - индекса конца повтора в строке <tex> v </tex>.
-Для этого предподсчитаем следующие массивы:
+# Предподсчитаем следующие массивы:
-# <tex> LP[i] = lcp(u[i..u.len], u) </tex>, где <tex> lcp </tex> - наибольший общий префикс
+## <tex> LP[i] = lcp(u[i..u.len], u) </tex>, где <tex> lcp </tex> - наибольший общий префикс
-# <tex> LS[i] = lcs(u[1..i], u) </tex>, где <tex> lcs </tex> - наибольший общий суффикс
+## <tex> LS[i] = lcs(u[1..i], u) </tex>, где <tex> lcs </tex> - наибольший общий суффикс
+# Переберем длину повтора <tex> 2p </tex>. Для каждого <tex> p </tex> получим интервал индексов конца повтора в строке <tex> v </tex>: <tex> [x, y] </tex>.
+# Добавим к ответу, учитывая смещение в исходной строке <tex> s </tex> : <tex>(2p, x + shift, y + shift) </tex>
+Докажем следующее утверждение для нахождения интервала <tex> [x, y] </tex>:
 {{Утверждение
 |id=kindscount
@@ Строка 43: / Строка 48: @@
 }}
-== Общий алгоритм ==
+== Общий алгоритм н==

Участница:Mariashka — различия между версиями

Версия 23:28, 26 апреля 2015

Содержание

Алгоритм

Нахождение правых повтров

Нахождение левых повтров

Общий алгоритм н

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты