コンテンツにスキップ

マルコフ連鎖

出典: フリー百科事典『ウィキペディア(Wikipedia)』

マルコフ連鎖マルコフれんさ: Markov chain状態空間高々可算集合マルコフ過程である[1]。すなわち、取りうる状態が離散的かつ未来の状態が過去の状態履歴に影響されない確率過程である。マルコフ鎖マルコフさとも。

概要

[編集]

マルコフ連鎖とは、確率過程の一種であるマルコフ過程のうち、とりうる状態が離散的(有限または可算)なものをいう(⇒ #定義)。すなわち離散状態マルコフ過程を指す。

マルコフ連鎖は、未来の挙動が現在の値だけで決定され、過去の挙動と無関係である(マルコフ性)。各時刻において起こる状態変化(遷移または推移)に関して、マルコフ連鎖は遷移確率が過去の状態によらず、現在の状態のみによる系列である。特に重要な確率過程として、様々な分野に応用される。

マルコフ連鎖の一例に有限状態機械がある。これは、時刻n において状態 y にあるとすると、それが時刻n + 1 において状態x に動く確率は、現在の状態にだけ依存し、時刻n には依存しない。

定義

[編集]

マルコフ連鎖は、一連の確率変数 X1, X2, X3, ... で、現在の状態が決まっていれば、過去および未来の状態は独立であるものである。形式的には、

Xi のとりうる値は、連鎖の状態空間と呼ばれ、可算集合S をなす。マルコフ連鎖は有向グラフで表現され、エッジにはある状態から他の状態へ遷移する確率を表示する。

性質

[編集]

初期状態i から時刻n で状態j に移る確率は、

で定義され、単一段階の遷移は

で定義される。n-段階遷移は、任意の 0<k<n に対して次のチャップマン・コルモゴロフの等式を満たす:

時刻n での状態に関する確率(周辺確率)は次のように書ける:

ここで右上付き添え字 は整数値である。もしマルコフ連鎖が時間に対して定常的ならば、この添え字は"n乗"という意味にとってもよい(下記参照)。

可約性

[編集]

いま状態i にあるとして、未来のある時点で状態j にある確率が 0 でない ならば、状態j は状態ii j)から到達可能 (accessible)といわれる。つまり次のようなn があるということである:

状態i と状態j が互いに到達可能ならば、状態i と状態ji j)は連結(communicate)しているという。状態の集合C のいずれの対も互いに連結しているならば、C連結類(communicating class)という(この連結類は同値類である)。連結類を出る確率が0ならば、連結類は閉じている(closed)という。つまりiC の要素でありj がそうでないならば、ji から到達可能ではない。

状態空間が連結類ならば、マルコフ連鎖は既約(または可約でない:irreducible)という。つまり既約なマルコフ連鎖では、任意の状態から任意の状態へ移ることができる。

周期性

[編集]

状態i への回帰がk の倍数回のみに見られ、しかもk がこの性質を持つ最大の数ならば、「状態i周期k である」という。例えば、i への回帰が偶数回目にのみ起こるならば、i の周期は2である。 形式的には、ある状態の周期は次のように定義される:

(ここで "gcd" は最大公約数のこと) k = 1 ならば、状態は非周期的であるという。連結類の各状態は同じ周期を持たねばならない。

既約なマルコフ連鎖は、状態が非周期的ならば、エルゴード的(ergodic)という。

再帰性

[編集]

状態i から開始するとして、「決してi には戻らない」確率が 0 でないならば、状態i一時的(transient)という。形式的には、確率変数 Ti を次に状態i へ帰る時刻(到達時間):

として、「Ti が有限でない」確率が 0 でないならば、状態i は一時的である:

状態i は、一時的でない(状態iからiに戻る確率 1 で有限な到達時間を持つ)ならば、再帰的(recurrentまたはpersistent)という。

到達時間が有限でも、その平均値が有限であるとは限らない。

定常状態と極限分布

[編集]

時間的に一様なマルコフ連鎖で、過程が時間に依存しない行列 で記述でき、ベクトル π の要素 πj の和が 1 で、次を満たすとする:

この場合には、ベクトル π定常分布という。既約な連鎖は、そのすべての状態が再帰的ならば、またその場合に限り、定常分布を持つ。この場合、π はただ1つで、再帰時間の期待値 Mj との間に次の関係がある:

さらに、連鎖が既約かつ非周期的ならば、任意のij に対して

となる。ここでは初期分布に関して何も仮定していない。つまり連鎖は初期の状態によらず定常分布に収束し,これを連鎖の均衡分布という。

連鎖が既約でないならば、その定常分布はただ1つに定まらない。(閉じた連結類を考えれば、各連結類毎にただ1つの定常分布がある。)しかし、状態 j が非周期的ならば、

であり、他の任意の状態i に対しi を初期状態として、連鎖が状態j に到達する確率をfij とすると、

となる。

分類

[編集]

マルコフ連鎖は更なる制約により以下のように分類される:

有限状態マルコフ連鎖

[編集]

有限状態マルコフ連鎖ゆうげんじょうたいマルコフれんさ: finite-state Markov chainは状態空間が有限集合なマルコフ連鎖である[2]有限マルコフ連鎖ゆうげんマルコフれんさ: finite Markov chainとも。

マルコフ連鎖は状態空間が高々可算集合であり、状態が可算無限個の場合がある。有限状態マルコフ連鎖では状態空間 濃度 が有限、すなわち状態が有限個である[2]。よって時刻 における状態の確率質量は有限次元数ベクトルを用いた確率ベクトル で表現できる。

有限状態マルコフ連鎖はマルコフ性をもち、かつ、遷移時に有限次元数ベクトルである へ移す。よってこの遷移を における確率行列 で表現できる。有限状態マルコフ連鎖の文脈では 遷移行列せんいぎょうれつ遷移確率行列せんいかくりつぎょうれつと呼ぶ[3]

離散時間有限状態マルコフ連鎖は有限状態マルコフ連鎖の一種であり、 で表現できる。

可逆マルコフ連鎖

[編集]

マルコフ連鎖は、次で示されるπ

が存在するならば、可逆(reversible)であるという。可逆マルコフ連鎖では、π は常に定常分布である。

連続時間マルコフ連鎖

[編集]

連続時間マルコフ連鎖れんぞくじかんマルコフれんさ: continuous-time Markov chain; CTMCは状態空間が高々可算集合な連続時間マルコフ過程である。

連続時間に対するマルコフ過程は、微小な時間変化h を用いて次のように定義される:

ただしここでo(h) とは、h が0となる極限でh より速く0に近づく項を表す。またここでh = 1とおけば、普通のマルコフ連鎖と同じ形になる。

この連続時間マルコフ過程から離散的に取り出した系列が、連続時間マルコフ連鎖である。

離散時間マルコフ連鎖

[編集]

離散時間マルコフ連鎖りさんじかんマルコフれんさ: discrete-time Markov chain; DTMCは状態空間が高々可算集合な離散時間マルコフ過程である。

離散時間有限状態マルコフ連鎖

[編集]

離散時間有限状態マルコフ連鎖は時間が離散的で状態空間が有限集合なマルコフ連鎖である。

離散時間有限状態マルコフ連鎖は有限状態マルコフ連鎖であるため、状態を確率ベクトル 、遷移を遷移行列 で表現できる。また離散時間有限状態マルコフ連鎖は離散時間マルコフ連鎖であるため、遷移の連続を積で表現できる。そのため離散時間有限状態マルコフ連鎖は、行列の連鎖乗積を用いて、

で表現できる。

斉時マルコフ連鎖

[編集]

斉時マルコフ連鎖せいじマルコフれんさ: time-homogeneous Markov chainは、すべてのn に対し

であるような過程をいう[4]斉時的マルコフ連鎖時間的に均一なマルコフ連鎖斉次マルコフ連鎖せいじマルコフれんさ: homogeneous Markov chain[5]とも。

斉時性が保証されないマルコフ連鎖は非斉時マルコフ連鎖とも呼ばれる[6]

斉時有限状態マルコフ連鎖

[編集]

斉時有限状態マルコフ連鎖は状態空間が有限集合な斉時マルコフ連鎖である。

斉時有限状態マルコフ連鎖は有限状態であるため遷移行列 で表現でき、かつ、斉時であるため が時間に依らず一定である(添え字 n によらない)。よって -段階遷移確率は行列の冪を用いて と表現できる。

定常分布

[編集]

定常分布π は行ベクトルで、次の式を満たす:

言い換えると、定常分布π は遷移行列の正規化された左側固有ベクトルで、その固有値は 1 である。

もしくはπ を、行列Pに対応する単位単体上の線形(連続)変換での不動点と見ることもできる。単位単体上の任意の連続変換は不動点を持つから、定常分布は必ず存在するが、一般にただ1つであるという保証はない。しかし、マルコフ連鎖が既約かつ非周期的ならば、定常分布πがただ1つ存在する。

さらにPkが、各行が定常分布πであるような行列に収束するならば、

(ここで1はすべての成分が1である列ベクトル)となる(ペロン・フロベニウスの定理)。つまり、時間が経つにつれてマルコフ連鎖は、初期分布に関わりなく、定常分布に収束するということである。

ベルヌーイ系

[編集]

マルコフ連鎖の特別な場合で、遷移確率行列の行がすべて同じであるものを、ベルヌーイ系(Bernoulli scheme)という。これは次の状態が現在の状態からも独立ということである。さらに可能な状態が2つしかないベルヌーイ系が、ベルヌーイ過程ベルヌーイ試行を連続して行うもの)である。

N階マルコフ連鎖と単純マルコフ連鎖

[編集]

次の状態が現在を含めた過去N個の状態履歴に依存して決まる確率過程を、N階マルコフ連鎖(もしくは、N重マルコフ連鎖、N次マルコフ連鎖)という。 これに対して、N=1の通常のマルコフ連鎖は単純マルコフ連鎖と呼ばれることがある。

N階マルコフ連鎖は、形式的には次のような確率過程である。

どんなN階マルコフ連鎖も、N個の状態組を新たな状態空間とすることによって、単純マルコフ連鎖として表現することができる。 このため、単純マルコフ連鎖で成立する性質は、N階マルコフ連鎖でもそのまま成立する。

応用

[編集]

マルコフ系は物理学、とりわけ統計力学にしばしば現れる。ここでは、 力学が時間に対して不変であると想定され、また履歴を考慮する必要がないと想定される場合に、詳細が不明またはモデル化できないために確率過程が用いられる。

マルコフ連鎖はまた待ち行列理論統計学でモデル化に用いられる。

クロード・シャノン情報理論を創始した論文"A mathematical theory of communication"(通信の数学的理論)では、マルコフ連鎖を利用してエントロピーの概念を導入している。さらにこのような方法は、データ圧縮パターン認識に応用されている。

マルコフ連鎖は強化学習でも重要である。

Googleに使われているPageRankもマルコフ連鎖によって定義される。

遷移確率が初め不明でデータからそれを見積らなければならない場合には、隠れマルコフモデルが用いられ、これは音声認識バイオインフォマティクス塩基配列からの遺伝子の探索など)にも広く用いられている。

脚注

[編集]

注釈

[編集]

出典

[編集]
  1. Markov 過程 ... Markov 連鎖はこのうち状態空間が高々可算集合のものである。(永幡 2021, p. 5)
  2. 1 2 取りうる値(状態)を とする。... この確率過程を有限状態マルコフ連鎖モデルという。(秋田 2014, p. 1)
  3. 有限状態マルコフ連鎖 ... 成分とした行列 を確率推移行列という。(秋田 2014, p. 1)
  4. 遷移速度行列 が時間的に不変である「斉時」マルコフ連鎖p.493 より引用。井上, 文彰 (2018). “連続時間マルコフ連鎖における過渡状態確率の数値計算” (PDF). オペレーションズ・リサーチ. 日本オペレーションズ・リサーチ学会 (2018年8月号): 493–500.
  5. 時刻 ... によらず と表されるとき,マルコフ連鎖は斉次 (Homogeneous) であるといわれpp.5-6 より引用。西新, 幹彦 (2011), “3-2 情報源モデル”, 知識の森 (電子情報通信学会)
  6. 非斉時マルコフ連鎖の解析に関してp.11 より引用。来嶋, 秀治 (2022). “動的グラフ上のランダムウォーク”. 応用数理. 32 (1): 5–15.

参考文献

[編集]

関連項目

[編集]

外部リンク

[編集]