Алгоритм Балабана — различия между версиями
(Замена темина) |
м (rollbackEdits.php mass rollback) |
||
| (не показано 11 промежуточных версий 4 участников) | |||
| Строка 7: | Строка 7: | ||
Решение задачи по поиску множества пересечений отрезков является одной из главных задач вычислительной геометрии. Рассмотрим несколько самых распространенных алгоритмов: | Решение задачи по поиску множества пересечений отрезков является одной из главных задач вычислительной геометрии. Рассмотрим несколько самых распространенных алгоритмов: | ||
| − | + | # Тривиальный детерминированный алгоритм имеет временную сложность <tex>O(n^2)</tex>, и его суть заключается в проверке попарного пересечения отрезков. | |
| − | + | # Сложнее, но эффективнее алгоритм Бентли-Оттмана <ref>[http://neerc.ifmo.ru/wiki/index.php?title=Алгоритм_Бентли-Оттмана ''Алгоритм Бентли-Оттмана'']</ref> с оценкой сложности <tex>O((n + k) \log n +k)</tex>, в основе которого лежит метод заметающей прямой. | |
| − | + | # Алгоритм, предложенный Чазелле и Едельсбруннером <ref>[http://www.cs.princeton.edu/~chazelle/pubs/IntersectLineSegments.pdf ''An optimal algorithm for intersecting line segments in the plane'']</ref>, имеет лучшую оценку <tex>O(n \log n + k)</tex>, но в отличие от предыдущих методов требует квадратичной памяти. | |
| − | + | # Оптимальный детерминированный алгоритм был предложен Балабаном <ref>[http://www.cs.sfu.ca/~binay/813.2011/Balaban.pdf ''I.J. Balaban. An optimal algorithm for finding segments intersections. In Proceedings of the Eleventh Annual Symposium on Computational Geometry, ACM Press, New York, 1995. - pp. 211–219.'']</ref> с временной оценкой сложности <tex>O(n \log(n) + k)</tex> и <tex>O(n)</tex> памяти, где К - число пересекающихся отрезков. | |
| − | |||
| − | |||
| − | |||
При количестве отрезков от 2000, и большому количеству пересечений целесообразно использовать алгоритм Балабана. Однако в результате громоздкости и высокой сложности реализации алгоритма, в большинстве практических задач используется алгоритм заметающей прямой Бентли-Оттмана. | При количестве отрезков от 2000, и большому количеству пересечений целесообразно использовать алгоритм Балабана. Однако в результате громоздкости и высокой сложности реализации алгоритма, в большинстве практических задач используется алгоритм заметающей прямой Бентли-Оттмана. | ||
| Строка 25: | Строка 22: | ||
{{Определение | {{Определение | ||
|definition= | |definition= | ||
| − | Будем говорить, что отрезок <tex>s</tex>, с вершинами в точках с абсциссами <tex>l</tex> и <tex>r</tex> : | + | Будем говорить, что отрезок <tex>s</tex>, с вершинами в точках с абсциссами <tex>l</tex> и <tex>r</tex> : |
| − | - ''' | + | {{---}} '''охватывает''' (''span'') полосу <tex>\langle a, b \rangle</tex>, если <tex>l \le a \le b \le r</tex>; <br> |
| − | - '''внутренний'''(inner) для полосы <tex>\langle a, b \rangle</tex>, если <tex>a < l < r < b</tex>; <br> | + | |
| − | - '''пересекает'''(cross) полосу <tex>\langle a, b \rangle</tex> в других случаях. | + | {{---}} '''внутренний''' (''inner'') для полосы <tex>\langle a, b \rangle</tex>, если <tex>a < l < r < b</tex>; <br> |
| + | |||
| + | {{---}} '''пересекает''' (''cross'') полосу <tex>\langle a, b \rangle</tex> в других случаях. | ||
}} | }} | ||
| Строка 39: | Строка 38: | ||
[[Файл:Balaban_pic_1.png|280px|thumb|right|<tex>D = ((s_1, s_2, s_3), \langle a, b \rangle)</tex>, <tex>Loc(D, s_4) = 0</tex>, <tex>Loc(D, s_5) = 2</tex> или <tex>3</tex>, <tex>Int(D, \{s_4,\ s_5\}) = \{\{s_3,\ s_5\}\}</tex>]] | [[Файл:Balaban_pic_1.png|280px|thumb|right|<tex>D = ((s_1, s_2, s_3), \langle a, b \rangle)</tex>, <tex>Loc(D, s_4) = 0</tex>, <tex>Loc(D, s_5) = 2</tex> или <tex>3</tex>, <tex>Int(D, \{s_4,\ s_5\}) = \{\{s_3,\ s_5\}\}</tex>]] | ||
| − | Обозначения <tex>Int_{a, b}(S)</tex> и <tex>Int_{a, b}(S, S')</tex> будут использоваться для описания подмножеств <tex>Int(S)</tex> и <tex>Int(S, S')</tex>, состоящих из пересекающихся пар отрезков в пределах полосы <tex>\langle a, b \rangle</tex>. Далее скобки <tex>\{\}</tex> используются для определения неупорядоченных множеств, а скобки <tex>()</tex> используются для определения упорядоченных множеств. | + | Обозначения <tex>Int_{a, b}(S)</tex> и <tex>Int_{a, b}(S, S')</tex> будут использоваться для описания подмножеств <tex>Int(S)</tex> и <tex>Int(S, S')</tex>, состоящих из пересекающихся пар отрезков в пределах полосы <tex>\langle a, b \rangle</tex>. |
| + | |||
| + | Далее фигурные скобки <tex>\{\}</tex> используются для определения неупорядоченных множеств, а круглые скобки <tex>()</tex> используются для определения упорядоченных множеств. | ||
| − | Введем отношение порядка на множестве отрезков <tex>s_1 <_a s_2</tex> если оба отрезка пересекают вертикальную линию <tex>x = a</tex> и | + | {{Определение |
| − | точка пересечения этой прямой с отрезком <tex>s_1</tex> лежит ниже точки пересечения с <tex>s_2</tex>. | + | |neat=neat |
| + | |definition= | ||
| + | Введем отношение порядка на множестве отрезков <tex>s_1 <_a s_2</tex> если оба отрезка пересекают вертикальную линию<br> <tex>x = a</tex> и точка пересечения этой прямой с отрезком <tex>s_1</tex> лежит ниже точки пересечения с <tex>s_2</tex>. | ||
| + | }} | ||
{{Определение | {{Определение | ||
| Строка 48: | Строка 52: | ||
|definition= | |definition= | ||
''Лестница'' <tex>D</tex> — это пара <tex>(Q, \langle a, b \rangle)</tex>, в которой отрезки из множества <tex>Q</tex> удовлетворяют следующим условиям : | ''Лестница'' <tex>D</tex> — это пара <tex>(Q, \langle a, b \rangle)</tex>, в которой отрезки из множества <tex>Q</tex> удовлетворяют следующим условиям : | ||
| − | + | {{---}} любой отрезок из <tex>Q</tex> охватывает полосу <tex>\langle a, b \rangle</tex>; <br> | |
| − | + | {{---}} нет пересечений отрезков внутри лестницы; <br> | |
| − | + | {{---}} <tex>Q</tex> упорядочена по отношению <tex><_a</tex>. | |
Часть отрезков лестницы внутри полосы будем называть '''ступеньками'''. | Часть отрезков лестницы внутри полосы будем называть '''ступеньками'''. | ||
| Строка 57: | Строка 61: | ||
{{Определение | {{Определение | ||
|definition= | |definition= | ||
| − | Будем называть лестницу <tex>D</tex> '''полной''' относительно множества отрезков <tex>S</tex>, если каждый отрезок из <tex>S</tex> либо не | + | Будем называть лестницу <tex>D</tex> '''полной''' относительно множества отрезков <tex>S</tex>, если каждый отрезок из <tex>S</tex> либо не охватывает полосу <tex>\langle a, b \rangle</tex>, либо пересекает хотя бы одну из ступенек из множества <tex>D</tex>. |
}} | }} | ||
| Строка 84: | Строка 88: | ||
===Split=== | ===Split=== | ||
| − | Функция <tex>Split</tex> разделяет входное множество отрезков <tex>L</tex>, | + | Функция <tex>Split</tex> разделяет входное множество отрезков <tex>L</tex>, охватывающих некоторую полосу <tex>\langle a, b \rangle</tex>, на подмножества <tex>Q</tex> и <tex>L'</tex> так, что лестница <tex>(Q, \langle a, b \rangle)</tex> полна относительно множества отрезков <tex>L'</tex>. |
Пусть <tex>L = (s_1 ,..., s_k)</tex>, где <tex>s_i <_a s_{i+1}</tex> | Пусть <tex>L = (s_1 ,..., s_k)</tex>, где <tex>s_i <_a s_{i+1}</tex> | ||
| Строка 93: | Строка 97: | ||
'''if''' отрезок <tex>S_j</tex> не пересекает | '''if''' отрезок <tex>S_j</tex> не пересекает | ||
последний отрезок из <tex>Q</tex> внутри полосы <tex>\langle a, b \rangle</tex> | последний отрезок из <tex>Q</tex> внутри полосы <tex>\langle a, b \rangle</tex> | ||
| − | и при этом | + | и при этом охватывает её '''then''' |
добавить <tex>s_j</tex> в конец <tex>Q;</tex> | добавить <tex>s_j</tex> в конец <tex>Q;</tex> | ||
'''else''' | '''else''' | ||
| − | добавить <tex>s_j</tex> в конец <tex> | + | добавить <tex>s_j</tex> в конец <tex>L';</tex> |
<tex>\}</tex> | <tex>\}</tex> | ||
| Строка 127: | Строка 131: | ||
Давайте разберемся с алгоритмом более подробно: | Давайте разберемся с алгоритмом более подробно: | ||
| − | Не умаляя общности, предположим, что все пересечения и вершины отрезков имеют разные абсциссы (в конечном счете, их можно будет отсортировать введением дополнительных свойств). Будем рассматривать целые координаты на промежутке <tex>[1, 2N]</tex>. | + | Не умаляя общности, предположим, что все пересечения и вершины отрезков имеют разные абсциссы (в конечном счете, их можно будет отсортировать введением дополнительных свойств). Будем рассматривать целые координаты на промежутке <tex>[1, 2N]</tex>. Обозначим через <tex>p_i</tex> слева направо конец отрезка множества <tex>S_0</tex>, а через <tex>s(i)</tex> отрезок, которому он принадлежит соответственно. |
Основная задача нашего алгоритма, это рекурсивная функция <tex>TreeSearch</tex>. Соединим каждый вызов функции с узлом некоего двоичного дерева (далее ''рекурсивное дерево''). Соответствующим узлом отметим все значения, множества и параметры вызова. Обозначим множество внутренних вершин за <tex>V</tex>. | Основная задача нашего алгоритма, это рекурсивная функция <tex>TreeSearch</tex>. Соединим каждый вызов функции с узлом некоего двоичного дерева (далее ''рекурсивное дерево''). Соответствующим узлом отметим все значения, множества и параметры вызова. Обозначим множество внутренних вершин за <tex>V</tex>. | ||
| Строка 158: | Строка 162: | ||
Наша задача показать, что все операции с узлом <tex>v</tex> происходят за <tex>O(|S_v| + |Int(D_v, S_v')| + (a_v - b_v)logN)</tex>, для этого возьмем во внимание, что <tex>\sum_v |S_v| = O(N \cdot logN + K)</tex> (очевидно, что <tex>\sum_v |Int(D_v, S_v')| \le K</tex>). | Наша задача показать, что все операции с узлом <tex>v</tex> происходят за <tex>O(|S_v| + |Int(D_v, S_v')| + (a_v - b_v)logN)</tex>, для этого возьмем во внимание, что <tex>\sum_v |S_v| = O(N \cdot logN + K)</tex> (очевидно, что <tex>\sum_v |Int(D_v, S_v')| \le K</tex>). | ||
| − | [[Файл:Balaban_pic_2.png|280px|thumb|right|<tex>S_v = | + | [[Файл:Balaban_pic_2.png|280px|thumb|right|<tex>S_v = \{s_1, s_2, s_3, s_4, s_5\}</tex>, <tex>L_v = (s_1, s_3)</tex>, <tex>R_v = (s_4, s_3)</tex>, <tex>I_v = \{s_2, s_5\}</tex>]] |
Функция <tex>TreeSearch</tex> похожа на функцию <tex>SearchInStrip</tex>. Основная разница заключается в том, что <tex>SearchInStrip</tex> вызывает себя без изменения полосы, когда <tex>TreeSearch</tex> делит полосу на две части, после чего рекурсивно вызывает себя для них. Другое отличие заключается в том, что множество <tex>S_v</tex> не упорядочено так же, как <tex>L</tex>. В результате мы не можем напрямую использовать функцию <tex>Split</tex> для эффективного деления <tex>S_v</tex>. | Функция <tex>TreeSearch</tex> похожа на функцию <tex>SearchInStrip</tex>. Основная разница заключается в том, что <tex>SearchInStrip</tex> вызывает себя без изменения полосы, когда <tex>TreeSearch</tex> делит полосу на две части, после чего рекурсивно вызывает себя для них. Другое отличие заключается в том, что множество <tex>S_v</tex> не упорядочено так же, как <tex>L</tex>. В результате мы не можем напрямую использовать функцию <tex>Split</tex> для эффективного деления <tex>S_v</tex>. | ||
Текущая версия на 19:05, 4 сентября 2022
Алгоритм Балабана — детерминированный алгоритм, позволяющий по множеству отрезков на плоскости получить множество точек, в которых эти отрезки пересекаются.
Содержание
Введение
Решение задачи по поиску множества пересечений отрезков является одной из главных задач вычислительной геометрии. Рассмотрим несколько самых распространенных алгоритмов:
- Тривиальный детерминированный алгоритм имеет временную сложность , и его суть заключается в проверке попарного пересечения отрезков.
- Сложнее, но эффективнее алгоритм Бентли-Оттмана [1] с оценкой сложности , в основе которого лежит метод заметающей прямой.
- Алгоритм, предложенный Чазелле и Едельсбруннером [2], имеет лучшую оценку , но в отличие от предыдущих методов требует квадратичной памяти.
- Оптимальный детерминированный алгоритм был предложен Балабаном [3] с временной оценкой сложности и памяти, где К - число пересекающихся отрезков.
При количестве отрезков от 2000, и большому количеству пересечений целесообразно использовать алгоритм Балабана. Однако в результате громоздкости и высокой сложности реализации алгоритма, в большинстве практических задач используется алгоритм заметающей прямой Бентли-Оттмана.
Основные понятия
Введем некоторые обозначения. Пусть - множество всех точек пересечения отрезков из множества , а - количество таких пересечений ;
Через обозначим вертикальную полосу, которая ограничена прямыми и , а через — отрезок с вершинами в точках с абсциссами и .
Рассмотрим взаимное расположение вертикальной полосы и отрезка .
| Определение: |
| Будем говорить, что отрезок , с вершинами в точках с абсциссами и :
— охватывает (span) полосу , если ; — внутренний (inner) для полосы , если ; |
| Определение: |
| Два отрезка и называются пересекающимися внутри полосы , если их точка пересечения лежит в пределах этой полосы. Для двух множеств отрезков и определим множество как . |
Обозначения и будут использоваться для описания подмножеств и , состоящих из пересекающихся пар отрезков в пределах полосы .
Далее фигурные скобки используются для определения неупорядоченных множеств, а круглые скобки используются для определения упорядоченных множеств.
и точка пересечения этой прямой с отрезком лежит ниже точки пересечения с .
— любой отрезок из охватывает полосу ;
— нет пересечений отрезков внутри лестницы;
— упорядочена по отношению .
| Определение: |
| Будем называть лестницу полной относительно множества отрезков , если каждый отрезок из либо не охватывает полосу , либо пересекает хотя бы одну из ступенек из множества . |
| Лемма: |
Пусть лестница полна относительно множества отрезков , где состоит из отрезков, пересекающих полосу , тогда , где это число вершин отрезков из , находящихся в пределах полосы . |
| Определение: |
| Если точка отрезка лежит между ступеньками и , тогда число называется местоположением на лестнице и обозначается как |
| Утверждение: |
Имея лестницу и множество отрезков , множество можно найти за время . Однако, если упорядочено отношением , где , тогда можно найти за время . |
Алгоритм
Введем несколько дополнительных функций, чтобы упростить основной алгоритм:
Split
Функция разделяет входное множество отрезков , охватывающих некоторую полосу , на подмножества и так, что лестница полна относительно множества отрезков .
Пусть , где for do if отрезок не пересекает последний отрезок из внутри полосы и при этом охватывает её then добавить в конец else добавить в конец
Эта функция работает за времени.
Search In Strip
Зная мы можем найти и используя следующую рекурсивную функцию:
if then return Найдем
Здесь, это функция объединения множеств и , упорядоченных по отношению . Время выполнения эквивалентно сумме времён каждого её запуска. Очевидно, что время работы -той функции, будет равно , где это соответствующие наборы .
Учитывая лемму, заключаем, что функция работает за .
Предположим, что все отрезки лежат в полосе . Таким образом в самом начале у нас есть пара . Что же дальше происходит: множество распадается в подмножества и , после чего лестница становится полной относительно множества . Необходимо найти пересечения отрезков из и , затем, все пересечения в . Чтобы найти пересечения отрезков в , мы режем полосу и множество по вертикале на полосы , и множества , соответственно, где является медианой вершин отрезков между и . Затем мы рекурсивно вызываем функцию к парам и . Ключевым является тот факт, что согласно лемме , таким образом, число дополнительных отрезков, появляющихся после разрезаний пропорционально числу найденных пересечений.
Ключевые моменты
Давайте разберемся с алгоритмом более подробно:
Не умаляя общности, предположим, что все пересечения и вершины отрезков имеют разные абсциссы (в конечном счете, их можно будет отсортировать введением дополнительных свойств). Будем рассматривать целые координаты на промежутке . Обозначим через слева направо конец отрезка множества , а через отрезок, которому он принадлежит соответственно.
Основная задача нашего алгоритма, это рекурсивная функция . Соединим каждый вызов функции с узлом некоего двоичного дерева (далее рекурсивное дерево). Соответствующим узлом отметим все значения, множества и параметры вызова. Обозначим множество внутренних вершин за .
Отсортируем вершин по координатам и найдем ;
if then отсортируем по отношению ; ; return; Разделим на и так, что лестница будет полной, относительно множества ; Найдем ; ; Разделим отрезки из на пересекающих полосу и полосу ; ; ;
Отсюда и дальше , и означают, соответственно, левого сына, правого сына, и отцовскую вершину узла . Наша задача показать, что все операции с узлом происходят за , для этого возьмем во внимание, что (очевидно, что ).
Функция похожа на функцию . Основная разница заключается в том, что вызывает себя без изменения полосы, когда делит полосу на две части, после чего рекурсивно вызывает себя для них. Другое отличие заключается в том, что множество не упорядочено так же, как . В результате мы не можем напрямую использовать функцию для эффективного деления .
Чтобы решить эту проблему, представим как объединение трех множеств: множества упорядоченного по отношению , неупорядоченного множества , и множества упорядоченного по отношению . Расположим отрезки из , пересекающие границу во множество , отрезки пересекающие во множество , и внутренние отрезки во множество (пример на рисунке справа).
Теперь мы можем вызвать функцию для множества и построить за времени. Но мы натыкаемся на новую проблему: передавая множества , и , необходимо найти соответствующие множества сыновей узла .
Неупорядоченные множества и строятся легко. Множество будет найдено вызовом функции для нахождения в функции . Множество получается из за линейное время вставкой (если левая вершина отрезка) или удалением (если правая вершина отрезка) отрезка . Но как получить из , и без сортировки?
Для листьев мы сделаем проверку вначале, и получим из . Пусть и известны, и все сыновья узла - листья. Для начала запустим функцию и найдем и . Теперь мы должны найти , но мы не знаем и, соответственно, можем найти только . Применим к множеству и получим . Множество получается из вставкой или удалением отрезка . Применим к и найдем . Теперь можем продолжить вычисление и получим слиянием и .
Конечная функция будет выглядеть так:
Отсортируем концов отрезков по абсциссе и найдем , где ; ; ; ;
if then ; return; ; ; Найдем ; ; Разделяем отрезки из внутренние для полосы во множество внутренние для полосы во множество ; if левый конец отрезка then вставить в else удалить из ; Найдем ; for do Найдем используя двоичный поиск; Найдем используя значения, полученные шагом выше; ;
Заметим, что нахождение надо делать аккуратно, так как множества и могут иметь одни и те же отрезки (которые пересекают ). Мы нашли их пересечения с при поиске , и не должны вывести эти пересечения снова.
Время работы
Для начала рассчитаем место, необходимое для выполнения алгоритма. Алгоритм использует рекурсивную функцию . Последовательность вызовов функции может занять память. Эта последовательность может быть представлена как путь корня рекурсивного дерева, до узла. Соответствующий вызов этого узла занимает памяти, каждый его "предок" занимает памяти, а остальные структуры используют . Очевидно, что любой путь от корня рекурсивного дерева до какого-то узла .
В итоге для работы алгоритма требуется памяти.
| Лемма (#2): |
. |
| Доказательство: |
| Утверждение напрямую вытекает из первой леммы и очевидного факта, что для любого множества , количество концов отрезков, лежащих в полосе , меньше чем . |
| Теорема (#1): |
| Доказательство: |
| Утверждение напрямую вытекает из леммы №2 и следующего отношения . |
Обозначим множество всех вершин рекурсивного дерева за .
| Теорема (#2): |
| Доказательство: |
| Для всех узлов, кроме корня имеет место выражение , следовательно . |
Начальная сортировка и инициализация множеств и может быть произведена за времени. Время работы функции является суммой длительностей всех его вызовов. Каждый вызов от внешних узлов добавляет к этой сумме . Для внутренних же узлов, время требуемое для поиска равно , а для остальных . Если мы все это сложим, то придем к выводу, что наш алгоритм работает за . Заметим, что его скорость можно увеличить до , если не будем учитывать время нахождения .
Соответственно в оптимальном алгоритме Балабана находится за .
Примечания
Литература
Т.Вознюк, В.Терещенко — К построению эффективного решения задачи пересечения отрезков
Ф.Препарата, М.Шеймос — Вычислительная геометрия