Z-функция — различия между версиями
Iloskutov (обсуждение | вклад) м (Определение в шаблон) |
Iloskutov (обсуждение | вклад) (См. также) |
||
| Строка 41: | Строка 41: | ||
'''int''' left = 0, right = 0 | '''int''' left = 0, right = 0 | ||
'''for''' i = 1 .. n - 1 | '''for''' i = 1 .. n - 1 | ||
| − | zf[i] = max(0, min(right - i, zf[i - left])) | + | zf[i] = '''max'''(0, '''min'''(right - i, zf[i - left])) |
'''while''' i + zf[i] < n '''and''' s[zf[i]] == s[i + zf[i]] | '''while''' i + zf[i] < n '''and''' s[zf[i]] == s[i + zf[i]] | ||
zf[i]++ | zf[i]++ | ||
| Строка 60: | Строка 60: | ||
'''if''' zf[i] == m | '''if''' zf[i] == m | ||
'''return''' i | '''return''' i | ||
| + | |||
| + | == См. также == | ||
| + | * [[Префикс-функция]] | ||
| + | * [[Алгоритм Кнута-Морриса-Пратта]] | ||
== Источники информации == | == Источники информации == | ||
Версия 23:24, 25 мая 2015
Примечание: далее в конспекте символы строки нумеруются с нуля.
Содержание
Тривиальный алгоритм
Простая реализация за , где — длина строки. Для каждой позиции перебираем для неё ответ, начиная с нуля, пока не обнаружим несовпадение или не дойдем до конца строки.
Псевдокод
int[] zFunction(string s)
int[] zf = int[n]
for i = 1 .. n - 1
while i + zf[i] < n and s[zf[i]] == s[i + zf[i]]
zf[i]++
return zf
Эффективный алгоритм поиска
Z-блоком назовем подстроку с началом в позиции и длиной .
Для работы алгоритма заведём две переменные: и — начало и конец Z-блока строки с максимальной позицией конца (среди всех таких Z-блоков, если их несколько, выбирается наибольший). Изначально и .
Пусть нам известны значения Z-функции от до . Найдём .
Рассмотрим два случая.
1) :
Просто пробегаемся по строке и сравниваем символы на позициях и .
Пусть первая позиция в строке для которой не выполняется равенство , тогда это и Z-функция для позиции . Тогда . В данном случае будет определено корректное значение в силу того, что оно определяется наивно, путем сравнения с начальными символами строки.
2) :
Сравним и . Если меньше, то надо просто наивно пробежаться по строке начиная с позиции и вычислить значение . Корректность в таком случае также гарантированна.
Иначе мы уже знаем верное значение , так как оно равно значению .
Время работы
Этот алгоритм работает за , так как каждая позиция пробегается не более двух раз: при попадании в диапазон от до и при высчитывании Z-функции простым циклом.
Псевдокод
int[] zFunction(string s)
int[] zf = int[n]
int left = 0, right = 0
for i = 1 .. n - 1
zf[i] = max(0, min(right - i, zf[i - left]))
while i + zf[i] < n and s[zf[i]] == s[i + zf[i]]
zf[i]++
if i + zf[i] >= right
left = i
right = i + zf[i]
return zf
Поиск подстроки в строке с помощью Z-функции
— длина текста. — длина образца.
Образуем строку , где — символ, не встречающийся ни в , ни в . Вычисляем Z-функцию от этой строки.
В полученном массиве, в позициях в которых значение Z-функции равно , по определению начинается подстрока, совпадающая с .
Псевдокод
int substringSearch(string source, string needle)
int[] zf = zFunction(needle + '#' + source)
for i = m + 1 .. n + m
if zf[i] == m
return i