Регулярная марковская цепь — различия между версиями
Yurik (обсуждение | вклад) |
Yurik (обсуждение | вклад) |
||
| Строка 62: | Строка 62: | ||
Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии <tex>s_i</tex>, и эта вероятность не зависит от начального распределения, а зависит только от матрицы P. | Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии <tex>s_i</tex>, и эта вероятность не зависит от начального распределения, а зависит только от матрицы P. | ||
| − | == | + | == Примеры == |
[[File:Temp.gif|thumb|250px|Пример регулярной цепи]] | [[File:Temp.gif|thumb|250px|Пример регулярной цепи]] | ||
| − | Самый очевидный пример регулярной цепи - | + | Самый очевидный и тривиальный пример регулярной цепи: |
| + | |||
| + | Пусть у нас есть два состояния - "1" и "2". Каждый ход мы кидаем честную монету - если выпал "0", то цепь остается в предыдущем состоянии, если "1" - цепь меняет свое состояние. | ||
| + | |||
| + | Матрица переходов будет выглядеть так: | ||
<tex> | <tex> | ||
| Строка 74: | Строка 78: | ||
Тогда <tex>\forall n \ \ P^n = P = A,\ \alpha = \{ 0.5, 0.5 \}</tex> | Тогда <tex>\forall n \ \ P^n = P = A,\ \alpha = \{ 0.5, 0.5 \}</tex> | ||
| − | То есть через достаточно большое количество ходов наша система будет ''равновероятно'' находится как в состоянии "1", так и в состоянии " | + | То есть через достаточно большое количество ходов наша система будет ''равновероятно'' находится как в состоянии "1", так и в состоянии "2", независимо от начального распределения. |
| + | |||
| + | Более интересный пример - если мы будем управлять переходом состояний с помощью нечестной монеты. | ||
| + | Пусть а - вероятность выпадения "0" на монете. | ||
| + | |||
| + | Матрица переходов будет выглядеть так: | ||
| + | |||
| + | <tex> | ||
| + | P = \begin{bmatrix} | ||
| + | a & 1 - a \\ | ||
| + | 1 - a & a | ||
| + | \end{bmatrix} | ||
| + | </tex> | ||
| + | |||
| + | Тогда при возведении Р в степень n элементы будут стремится к <tex>\frac{1}{2}</tex> с разных сторон. | ||
| + | То есть вектор <tex>\alpha = \{ 0.5, 0.5 \}</tex>, т.е от честности монеты ничего не зависит. | ||
== Литература == | == Литература == | ||
Версия 03:09, 14 января 2012
Содержание
Регулярная цепь Маркова
| Определение: |
| Марковская цепь называется регулярной (нормальной), если в матрице перехода P . |
В регулярной Марковской цепи из любого состояния можно попасть в любое другое за некоторое число ходов.
Лемма
| Лемма: |
Пусть — матрица перехода регулярной цепи, — минимальный элемент этой матрицы. Пусть х — произвольный r-мерный вектор-столбец, имеющий максимальный элемент и минимальный . Пусть и - максимальный и минимальный элементы . Тогда , и |
| Доказательство: |
|
Пусть х' - вектор, полученный из х заменой всех элементов, кроме на . Тогда . Каждый элемент имеет вид , где а - элемент P, который домножается на , причем . Поэтому наше выражение не превосходит . Отсюда и из неравенства получается: . Применяя те же рассуждения для вектора -х, получим: . Складывая эти два неравенства, получаем , ч.т.д. |
Основная теорема регулярных цепей (Эргодическая теорема)
| Теорема: |
Регулярная марковская цепь эргодична. Другими словами: Пусть Р - регулярная переходная матрица. Тогда: |
| Доказательство: |
|
Рассмотрим вектор-столбец , у которого j-й элемент равен 1, а все остальные равны 0. Пусть и - минимальный и максимальный элементы столбца . Так как , то из леммы следует, что и и . Пусть , тогда . Значит сходится к вектору, все элементы которого равны между собой. Пусть - их общее значение. Тогда . Заметим, что - j-тый столбец матрицы . Рассмотрим все для . Тогда сходится к матрице А, у которой по строкам стоит один и тот же вектор . Так как в каждой матрице сумма элементов в строке равна 1, то то же самое справедливо и для предельной матрицы А. Теорема доказана. |
| Определение: |
| Матрица А называется предельной матрицей, вектор - предельным распределением. |
Следствия
| Теорема: |
Пусть - объекты из предыдущей теоремы.
Тогда справедливы факты:
|
| Доказательство: |
|
Пусть - вектор-столбец, состоящий из единиц.
|
Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии , и эта вероятность не зависит от начального распределения, а зависит только от матрицы P.
Примеры
Самый очевидный и тривиальный пример регулярной цепи:
Пусть у нас есть два состояния - "1" и "2". Каждый ход мы кидаем честную монету - если выпал "0", то цепь остается в предыдущем состоянии, если "1" - цепь меняет свое состояние.
Матрица переходов будет выглядеть так:
Тогда То есть через достаточно большое количество ходов наша система будет равновероятно находится как в состоянии "1", так и в состоянии "2", независимо от начального распределения.
Более интересный пример - если мы будем управлять переходом состояний с помощью нечестной монеты. Пусть а - вероятность выпадения "0" на монете.
Матрица переходов будет выглядеть так:
Тогда при возведении Р в степень n элементы будут стремится к с разных сторон. То есть вектор , т.е от честности монеты ничего не зависит.
Литература
Дж. Кемени, Дж. Снелл "Конечные цепи Маркова", стр 93