Алгоритм Кнута-Морриса-Пратта — различия между версиями
(→Алгоритм решения) |
|||
| Строка 3: | Строка 3: | ||
==Алгоритм решения== | ==Алгоритм решения== | ||
| + | Построим строку <tex>P = T\#S</tex>, где <tex>\#</tex> — любой символ, не входящий в алфавит <tex>S</tex> и <tex>T</tex>. Посчитаем на ней префикс-функцию <tex>\pi()</tex>. | ||
| + | |||
==Псевдокод== | ==Псевдокод== | ||
| − | Пусть <tex>t = |T|</tex>, <tex>s = |S| | + | Пусть <tex>t = |T|</tex>, <tex>s = |S|</tex>. |
| − | |||
<вычисление префикс-функции для цепочки P> | <вычисление префикс-функции для цепочки P> | ||
count = 0 | count = 0 | ||
Версия 19:02, 15 апреля 2012
Постановка задачи
Дана цепочка и образец . Требуется найти все позиции, начиная с которых входит в .
Алгоритм решения
Построим строку , где — любой символ, не входящий в алфавит и . Посчитаем на ней префикс-функцию .
Псевдокод
Пусть , .
<вычисление префикс-функции для цепочки P>
count = 0
for (i = 0 .. (s - 1)) {
if ((t + i + 1) == t) {
answer[count] = i + 1 - t
count = count + 1
}
}
- Корректность работы
Отметим, что из-за символа значение для всех . По определению , если , то , то есть , то есть входит в , начиная с позиции . Пусть теперь входит в , начиная с позиции . Тогда . Иными словами, , что эквивалентно .
- Время работы
(время подсчета для ) + (последующий ) .
- Оценка по памяти
Предложенная реализация имеет оценку по памяти . Оценки можно добиться за счет незапоминания значений для позиций в меньших (т.е. до начала цепочки )