← neuroscience-math 索引へ戻る

NSM-014

遷移確率半群と Chapman-Kolmogorov 関係式

マルコフ性から Q 行列への橋 — スライド「マルコフ性 → Q 行列」の中間論理を整理

作成日: 2026-05-25 / §4 補足・半群構造 / Mathematics in Neuroscience プレゼン準備

このノートの目的: ユーザが感じた「マルコフ性から Q 行列の順序の混乱」を直接解消する。 「指数関数」が 2 種類(滞在時間の指数分布 vs 行列指数)あり、それぞれ別の論理連鎖を通る。 本ノートは、スライド「マルコフ性 → Q 行列」の間に挿入すべき半群構造を数学的に整理し、2 系統の論理連鎖を視覚化する。

§1. 核心の宣言: 遷移確率行列 P(t) とは何か

最初に答え

遷移確率を成分とする行列:

$$P_{ij}(t) := P(X(t) = j \mid X(0) = i)$$

これを行列にまとめたもの $P(t) = (P_{ij}(t))_{i,j \in S}$ は次の 3 性質を持つ:

  1. $P(0) = I$ (時刻 0 では必ず元の状態にいる)
  2. $P(t+s) = P(t)\,P(s)$ ($\forall t,s \ge 0$)— Chapman-Kolmogorov 関係式
  3. 各行の成分は非負で、行和が 1 — 確率行列の条件

この性質を 「$\{P(t)\}_{t \ge 0}$ は確率行列の半群をなす」 という。

§2. 各記号の分解 — P(t) の成分を一つずつ読む

$P_{ij}(t)$ が「1 引数」で書ける理由: 時間的斉次性

一般の非斉次な連続時間確率過程では、時刻 $s$ から $s+t$ への遷移確率は $P_{ij}(s, s+t)$ と 2 変数 が必要になる。 CTMC の時間的斉次性(time-homogeneity)は「遷移確率が出発時刻 $s$ に依存しない」という仮定であり、このおかげで $P_{ij}(s, s+t) = P_{ij}(t)$ と 時間差だけ の 1 変数関数になる。

$P(0) = I$ の意味

$P_{ij}(0) = P(X(0) = j \mid X(0) = i) = \delta_{ij}$

時刻 0 では確率 1 で元の状態 $i$ にとどまる($i \ne j$ なら確率 0)。これは単位行列。

$P(t)$ が確率行列であること

これは全確率の法則から直ちに従う。

時間 0 t t+s P(t+s) の (i,j) 成分 中間状態 k P_{ik}(t) P_{kj}(s) P_{ij}(t+s) = Σ_k P_{ik}(t) P_{kj}(s) 状態 i 状態 j
図 1. Chapman-Kolmogorov 関係式の経路分割。時刻 t でいったん中間状態 k を経由し、全 k について和を取る。

§3. Chapman-Kolmogorov が成立する理由

2 つの仮定が鍵を握る

マルコフ性(過去を忘れる):
時刻 $t$ で状態 $k$ を知っていれば、$[0, t]$ の履歴は $[t, t+s]$ の遷移に影響しない。 $$P(X(t+s)=j \mid X(t)=k,\, X(0)=i) = P(X(t+s)=j \mid X(t)=k)$$ これが「経路を $[0,t]$ と $[t,t+s]$ に分割」できる根拠。
時間的斉次性(出発時刻に依存しない):
$$P(X(t+s)=j \mid X(t)=k) = P(X(s)=j \mid X(0)=k) = P_{kj}(s)$$ $[t, t+s]$ の遷移確率が $P(s)$ で書ける根拠。

証明スケッチ

$$P_{ij}(t+s)$$ $$= P(X(t+s)=j \mid X(0)=i)$$ $$= \sum_k P(X(t+s)=j,\, X(t)=k \mid X(0)=i)$$ $$= \sum_k P(X(t)=k \mid X(0)=i)\cdot P(X(t+s)=j \mid X(t)=k,\, X(0)=i)$$ $$\overset{\text{Markov}}{=} \sum_k P_{ik}(t)\cdot P(X(t+s)=j \mid X(t)=k)$$ $$\overset{\text{斉次性}}{=} \sum_k P_{ik}(t)\cdot P_{kj}(s)$$ $$= [P(t)\,P(s)]_{ij}$$

よって行列形式で $P(t+s) = P(t)\,P(s)$。

§4. なぜ「半群」で「群」ではないのか

群の公理$\{P(t)\}_{t \ge 0}$ での成立説明
閉性成立$P(t),P(s)$ は確率行列 → 積も確率行列
結合則成立行列積は常に結合的
単位元成立 ($P(0)=I$)時刻 0 では「何も起きない」= 単位行列
逆元一般に存在しない時間 $t > 0$ を逆行する $P(-t)$ は定義できない
物理的意味: 逆元がないのは時間の不可逆性に対応する。確率的な状態遷移はエントロピーを増大させる方向に流れており、「前の状態に確率 1 で戻る」操作は一般に不可能。例外は可逆なマルコフ連鎖の定常分布周辺のみ(詳細釣り合い条件が成立する場合)。

§5. Q 行列への橋渡し — 微分と標準性

追加の仮定: 標準性(continuity)

$$\lim_{t \to 0+} P(t) = I$$

すなわち $\lim_{t \to 0+} P_{ij}(t) = \delta_{ij}$。直感的には「ごく短時間では状態はほとんど変わらない」。

一様連続半群の微分可能性

有限状態空間 $|S| < \infty$ において、半群 $\{P(t)\}$ が連続(標準性を持つ)ならば、 すべての $t > 0$ で微分可能であり(実は解析的)、次の極限が存在する:

$$Q := P'(0) = \lim_{h \to 0^+} \frac{P(h) - I}{h}$$

この行列 $Q$ を 生成作用素(generator) または Q 行列(intensity matrix) という。

P(t) = exp(Qt)

半群の微分方程式 $P'(t) = QP(t)$(Kolmogorov 前進方程式)を初期条件 $P(0)=I$ のもとで解くと: $$P(t) = e^{Qt} = \sum_{n=0}^{\infty} \frac{(Qt)^n}{n!}$$ 有限状態空間では級数が常に収束し、$P(t)$ は Q 行列から一意に決まる。 詳細は 行列指数関数 $e^{Qt}$ と Q 行列 を参照。

§6. 【最重要】2 つの指数構造の論理連鎖

ユーザが感じた「順序の混乱」は、「指数」が 2 種類あって別の論理連鎖を通っている ことに気づけば完全に解消する。

§6.1 2 種類の「指数」がある

種類(A) 滞在時間の指数分布(B) 行列指数
数式$S_i(t) = e^{-\lambda_i t}$$P(t) = e^{Qt}$
何が指数かスカラー — 状態 $i$ にとどまる確率行列全体 — 全遷移確率をまとめた行列
必要な仮定マルコフ性 + 時間的斉次性 のみマルコフ性 + 時間的斉次性 + 標準性 + 有限状態
経由する道具無記憶性、Cauchy 関数方程式半群、Chapman-Kolmogorov、微分
「指数」の主役状態 $i$ の脱出率 $\lambda_i$ がパラメータQ 行列全体が指数の引数

§6.2 2 系統の論理連鎖図

(A) 滞在時間の指数分布 (B) 遷移確率行列の行列指数 マルコフ性 + 時間的斉次性 無記憶性 P(T>s+t | T>s) = P(T>t) Cauchy 方程式 滞在時間の指数分布 $S_i(t) = e^{-\lambda_i t}$ 仮定 2 つのみで完結 マルコフ性 + 時間的斉次性 半群 P(t+s) = P(t)P(s) (Chapman-Kolmogorov) + 標準性 P(t) 微分可能 Kolmogorov 方程式 P'(t) = QP(t) Q = P'(0) Q 行列が一意に定まる Q = lim(P(h)−I)/h (h→0+) + 有限状態 行列指数 P(t) = e^{Qt} 級数展開 Σ (Qt)^n / n! が収束 接続: λ_i = −q_{ii}
図 2. 2 系統の論理連鎖。(A) はマルコフ性 + 時間的斉次性だけで閉じる。(B) は標準性と有限状態空間が追加で必要。両者は $\lambda_i = -q_{ii}$ で接続される。

§6.3 なぜ順序の混乱が生じたか

元の流れ図:

マルコフ性 + 有限状態空間 + 時間的斉次性 + 標準性(連続性)

P(t) が微分可能

Q = P'(0) が一意に存在

P(t) = exp(Qt)

この流れは (B) 系統のみ を記述している。

混乱の原因: 「マルコフ性 + 時間的斉次性 → 指数が出る」という直感は (A) 系統(滞在時間の指数分布)の話。一方、上記フロー図は (B) 系統(行列指数)の話。Q 行列が先に出て、その後に exp(Qt) が現れるのは B 系統の内部での順序であり、A 系統の話と混同すると「マルコフ性だけで指数が出るはずなのに Q 行列が先?」という違和感が生じる。

§6.4 B 系統の内部での順序が「Q が先、e^{Qt} が後」になる理由

B 系統は半群 → 微分 → Q 抽出 → 行列指数という流れ。Q を「先に定義してから」 $e^{Qt}$ を組み立てるのは、Q が行列指数の 生成元(generator)だからである。 スカラーの場合でいえば $\frac{d}{dt}e^{at} = a\,e^{at}$ において「$a$ を定義してから $e^{at}$ を書く」のと同じ論理順序。

整理:

§7. プレゼン組み込み案

§7.1 現状のスライド構成

markov-property-and-q-matrix.pptx(現状 2 枚)

問題点: スライド 1→2 の論理飛躍が大きい。P(t) の半群構造が説明されないまま Q 行列が現れる。

§7.2 提案: スライド挿入位置

スライド 1 マルコフ性 スライド 1.5(新) P(t) の半群構造 Chapman-Kolmogorov ← ここに挿入 スライド 2 追加仮定 + Q 行列 P(t) = e^{Qt} 任意 2 系統の 整理
図 3. 提案するスライド構成。スライド 1.5 を挿入することで半群構造を明示し、論理飛躍を解消する。

§7.3 新スライド「P(t) の半群構造」1 枚構成案

タイトル: 「遷移確率行列 P(t) と半群構造」

左半分:

右半分 (大きく):

下部キーワード: 「Chapman-Kolmogorov 関係式」「確率行列の半群」「次のスライドで → 標準性を加えると Q 行列が抽出できる」

§7.4 口頭説明スクリプト(30 秒版)

「マルコフ性と時間的斉次性が成り立つと、遷移確率は時間差だけで決まる $P_{ij}(t)$ になります。 それを行列にまとめた $P(t)$ は、半群の性質 $P(t+s) = P(t)P(s)$ を満たします。 これが Chapman-Kolmogorov 関係式で、中間時刻 $t$ でいったん状態 $k$ に立ち寄って $j$ に行く 全パターンを足し合わせるという、確率の経路分解です。 この半群構造から微小時間極限を取ると Q 行列が抽出できる、というのが次のスライドの内容です。」

§7.5 口頭説明スクリプト(1 分版・2 系統の混乱解消も含む)

「マルコフ性と時間的斉次性が成り立つと、遷移確率は時間差だけで決まる $P_{ij}(t)$ になります。 それを行列にまとめた $P(t)$ は、半群の性質 $P(t+s) = P(t)P(s)$ を満たします。 これが Chapman-Kolmogorov 関係式で、中間時刻 $t$ でいったん状態 $k$ に立ち寄って $j$ に行く 全パターンを足し合わせるという、確率の経路分解です。 この半群構造から微小時間極限を取ると Q 行列が抽出できる、というのが次のスライドの内容です。

ここで一つ注意したいのは、「指数関数」が 2 種類出てくることです。 1 つは 1 状態の滞在時間が $e^{-\lambda t}$ になること、 もう 1 つは遷移確率行列全体が $e^{Qt}$ になること。 前者はマルコフ性と時間的斉次性だけで出てきます。 後者にはさらに標準性(連続性)と有限状態空間が必要です。 両者は Q 行列の対角成分 $\lambda_i = -q_{ii}$ で繋がります。 Q 行列を先に出してから $e^{Qt}$ を組み立てるというのは、この「行列指数」側の話の順序です。」

§8. まとめ


作成日: 2026-05-25 / §4 補足 · 半群構造 / Mathematics in Neuroscience プレゼン準備