Алгоритм Шибера-Вишкина — различия между версиями

Версия 19:26, 23 июня 2012

Алгоритм Шибера-Вишкина применяется для нахождения наименьшего общего предка двух вершин в дереве. Он использует [math]O(n)[/math] времени на подготовку и затем отвечает на каждый запрос за [math]O(1)[/math].

Содержание

1 Идея алгоритма
2 Подготовка
3 Обработка запроса
4 Оценка сложности
- 4.1 Построение
- 4.2 Запрос

Идея алгоритма

Основная идея алгоритма следующая.

Если бы дерево, в котором нужно искать [math]LCA[/math] было бы цепочкой, можно было бы найти [math]LCA(u, v)[/math] просто взяв ту вершину, которая находится в дереве ближе к корню.
Если дерево — полное двоичное дерево высоты [math]h[/math], то можно сопоставить каждой вершине битовый вектор длиной [math]h[/math] (целое число от [math]0[/math] до [math]2^h-1[/math]) и с помощью битовых операций над этими векторами найти [math]LCA(u, v)[/math]

Тогда, представив данное дерево как полное двоичное дерево, в некоторых вершинах которого находится цепочка, можно научиться искать [math]LCA(v, u)[/math] в нем за [math]O(1)[/math].

Подготовка

Перенумеруем вершины в порядке префиксного обхода дерева: сначала обрабатывается текущая вершина, затем — поддеревья. Пусть — такой порядок обхода.

Обозначим за [math]\operatorname{size} v[/math] количество вершин в поддереве вершины [math]v[/math]. Здесь и далее считаем, что вершина является и своим предком, и своим потомком.

Определение:

— вершина находится в поддереве вершины

Утверждение:

Пусть . Тогда

По определению [math]\operatorname{order}[/math], [math]\operatorname{order} u[/math] вершин из поддерева [math]v[/math] образуют отрезок натуральных чисел длиной [math]\operatorname{size} v - 1[/math]. Так как этот отрезок начинается с

, то лежит в отрезке .

Покроем дерево путями. А именно, сопоставим каждой вершине [math]v[/math] число [math]\operatorname{inlabel} v[/math] такое, что прообраз каждого [math]\operatorname{inlabel} v[/math] в [math]T[/math] связен и является простым путем от какой-то вершины вниз до листа.

Утверждение:

В качестве можно выбрать , кратное максимальной степени двойки, где .

Пусть , [math]b[/math] — максимально. Пусть есть вершина [math]u' \in S(i)[/math] такая, что . Так как в отрезке, соответствующем вершине [math]v[/math] есть два числа, кратных [math]2^b[/math], то там есть и число, кратное [math]2^{b+1}[/math]. Но тогда [math]\operatorname{inlabel} v[/math] выбран неверно. Значит, в поддереве [math]v[/math] есть только одна такая вершина [math]u[/math], что .

Рассмотрим два случая.

Первый случай Других таких вершин [math]u'[/math], что [math]u'[/math] дает такую же степень двойки, нет. Значит, во всех поддеревьях [math]v[/math] значения [math]\operatorname{inlabel}[/math] отличаются от [math]\operatorname{inlabel} v[/math].

Второй случай , [math]u \in S(v), u \ne v[/math]

Так как в поддереве представлены все -ы из отрезка , то рассмотрим того потомка вершины , что . Тогда, так как степень двойки у максимальна, по утверждению в начале доказательства, других вершин с такой же степенью двойки нет, то — потомок , что в поддереве есть вершина с такой же степенью двойки. Значит, все вершины , у которых находятся в поддереве . Проведя аналогичное доказательство для , получим требуемое.

Утверждение:

, где

Посмотрим на . Посмотрим на позицию самой правой единицы [math]l[/math] в [math]A[/math].

Так как в [math]\operatorname{order} v[/math] там еще [math]0[/math], а в — уже единица, то в отрезке есть число, кратное [math]2^l[/math].

Докажем, что нет чисел, кратных [math]2^{l+1}[/math]. Пусть такое число нашлось. Тогда [math]l[/math]-й бит менялся хотя бы два раза, а значит, менялся [math]l+1[/math]-й бит. А значит, самый значащий отличающийся бит в [math]\operatorname{order} v[/math] и в больше, чем [math]l[/math]-й.

Заметим, что функция просто выделяет номер самого значашего единичного бита.

Функция [math]2^l\frac{a}{2^l}[/math] обнуляет все биты младше [math]l[/math]-го.

Чтобы получить из отрезка число, кратное , будучи уверенными, что оно там есть, достаточно обнулить битов в правой границе отрезка.

Каждое значение [math]\operatorname{inlabel} v[/math] соответствует вершине в полном двоичном дереве высоты [math]h=\lceil\log_2 n\rceil[/math]. В двоичном дереве будем нумеровать вершины в инфиксном порядке: обойдем левое поддерево, занумеруем вершину, обойдем правое поддерево. В двоичном дереве будет ребро между вершинами [math]\operatorname{inlabel} v[/math] и [math]\operatorname{inlabel} u[/math], если в начальном дереве есть ребро [math]v\to u[/math]. Стандартных для двоичного дерева ребер не будет. Они нужны только для того, чтобы занумеровать вершины и для следующего утверждения.

Утверждение:

Если в начальном дереве есть ребро (), то в построенном двоичном дереве

Посчитаем для каждого [math]\operatorname{inlabel} v[/math] множество всех его потомков в двоичном дереве. Заметим, что для хранения одного потомка достаточно хранить только его высоту в дереве. Чтобы восстановить его значение, нужно просто подняться на [math]\Delta h[/math] вверх от вершины [math]v[/math]. Поэтому, все это множество можно уместить в число: [math]i[/math]-й бит будет единицей, если есть потомок на высоте [math]i[/math]. Назовем это число [math]\operatorname{ascendant} v[/math].

В дальнейшем поможет в поиске . Также, нам понадобится еще следующая информация. [math]\operatorname{head} v[/math] — самая не глубокая вершина [math]u[/math] такая, что .

Обработка запроса

Пусть [math]x[/math], [math]y[/math] — вершины в исходном дереве [math]LCA[/math] которых необходимо найти. Если , то они принадлежат одному простому пути, а следовательно ответом на запрос является [math]x[/math], если , и [math]y[/math], в противном случае. Теперь рассмотрим случай, когда , то есть [math]x[/math] и [math]y[/math] принадлежат разным простым путям. Найдем .

Утверждение:

, где

Пусть — индекс самой правой единицы в двоичном представлении . Из того, что общий предок и в полном двоичном дереве следует, что левых бит, совпадающих в и , должны быть такими же и в , а так как наименьший общий предок, то — минимальный такой индекс. То есть самый левый бит, в котором различаются и . А двоичное представление состоит из левых бит (или ), единички и нулей.

Найдем вершину [math]\operatorname{inlabel} z[/math], где [math]z = LCA(x, y)[/math]. На прошлом шаге была найдена вершина . Если бы в двоичном дереве были представлены все вершины, то это и было бы ответом. Но такой вершины может не оказаться. Воспользуемся значениями и . Они характеризуют пути из вершин [math]\operatorname{inlabel} x[/math] и [math]\operatorname{inlabel} x[/math] к корню. С их помощью (с помощью операции логическое и), можно получить список вершин, через которые проходят оба эти пути и взять с пересечения самую низкую посещаемую обоими.

Для этого можно воспользоваться описанным при построении методом для нахождения [math]\operatorname{inlabel} v[/math]. После этих действий нами был получен путь, в котором находится ответ. Осталось посмотреть на точки входа [math]x[/math] и [math]y[/math] на путь . Это можно сделать с помощью посчитанной функции [math]\operatorname{head}[/math]: найти [math]\operatorname{head} v'[/math], где [math]v'[/math] — вершина предпоследнего пути в пути. Тогда, поднявшись от нее на один вверх по начальному дереву, получим искомую точку входа.

Имея две точки входа, можно, как и в первом случае, сравнить их по высоте и выбрать более высокое из них.

Оценка сложности

Построение

Подсчет каждого из массивов занимает [math]O(n)[/math]. Это можно сделать, например, обходом в глубину.

Запрос

Здесь нужно сделать [math]O(1)[/math] действий для ответа на запрос.

@@ Строка 16: / Строка 16: @@
 Обозначим за <tex>\operatorname{size} v</tex> количество вершин в поддереве вершины <tex>v</tex>. Здесь и далее считаем,
 что вершина является и своим предком, и своим потомком.
+{{Определение
+|definition=<tex>u \in S(v)</tex> {{---}} вершина <tex>v</tex> находится в поддереве вершины <tex>v</tex>
+}}
 {{Утверждение
-|statement=Пусть <tex>u</tex> {{---}} вершина из поддерева <tex>v</tex>. Тогда
+|statement=Пусть <tex>u \in S(v)</tex>. Тогда
 <tex>\operatorname{order} u \in [\operatorname{order} v; \operatorname{order}v + \operatorname{size} v - 1]</tex>
 |proof=
 По определению <tex>\operatorname{order}</tex>, <tex>\operatorname{order} u</tex> вершин из поддерева <tex>v</tex> образуют
 отрезок натуральных чисел длиной <tex>\operatorname{size} v - 1</tex>. Так как этот отрезок начинается с
-<tex>\operatorname{order}v + 1</tex>, то <tex>\operatorname{order} u</tex> {{---}} отрезок <tex>[\operatorname{order} v; \operatorname{order} v + \operatorname{size} v - 1]</tex>.
+<tex>\operatorname{order}v + 1</tex>, то <tex>\operatorname{order} u</tex> лежит в отрезке <tex>[\operatorname{order} v; \operatorname{order} v + \operatorname{size} v - 1]</tex>.
 }}
@@ Строка 45: / Строка 49: @@
 '''Второй случай''' <tex>\operatorname{inlabel} v = \operatorname{order} u</tex>, <tex>u \in S(v), u \ne v</tex>
-Так как в поддереве <tex>v</tex> представлены все <tex>\operatorname{order}</tex>-ы из отрезка <tex>[\operatorname{order} v; \operatorname{order} v + \operatorname{size} v - 1]</tex>, то рассмотрим того потомка <tex>w</tex> вершины <tex>v</tex>, что <tex>u \in S(w)</tex>. Тогда, так как степень двойки у <tex>u</tex> максимальна, по утверждению в начале доказательства, других вершин с такой же степенью двойки нет, то <tex>\operatorname{inlabel} w = \operatorname{inlabel} v = \operatorname{order} u</tex>. Так как отрезки, соответствующие поддеревьям сыновей, не пересекаются, не найдется другого <tex>w'</tex> {{---}} потомок <tex>v</tex>, что в поддереве <tex>w'</tex> есть вершина с такой же степенью двойки. Значит, все вершины <tex>v'</tex>, у которых <tex>\operatorname{inlabel} v' = \operatorname{inlabel} v</tex> находятся в поддереве <tex>w</tex>. Проведя аналогичное доказательство для <tex>w</tex>, получим требуемое.
+Так как в поддереве <tex>v</tex> представлены все <tex>\operatorname{order}</tex>-ы из отрезка <tex>[\operatorname{order} v; \operatorname{order} v + \operatorname{size} v - 1]</tex>, то рассмотрим того потомка <tex>w</tex> вершины <tex>v</tex>, что <tex>u \in S(w)</tex>. Тогда, так как степень двойки у <tex>u</tex> максимальна, по утверждению в начале доказательства, других вершин с такой же степенью двойки нет, то <tex>\operatorname{inlabel} w = \operatorname{inlabel} v = \operatorname{order} u</<tex>tex>. Так как отрезки, соответствующие поддеревьям сыновей, не пересекаются, не найдется другого <tex>w'</tex> {{---}} потомок <tex>v</tex>, что в поддереве <tex>w'</tex> есть вершина с такой же степенью двойки. Значит, все вершины <tex>v'</tex>, у которых <tex>\operatorname{inlabel} v' = \operatorname{inlabel} v</tex> находятся в поддереве <tex>w</tex>. Проведя аналогичное доказательство для <tex>w</tex>, получим требуемое.
 }}

Алгоритм Шибера-Вишкина — различия между версиями

Версия 19:26, 23 июня 2012

Содержание

Идея алгоритма

Подготовка

Обработка запроса

Оценка сложности

Построение

Запрос

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты