← neuroscience-math 索引へ戻る
NSM-014
遷移確率半群と Chapman-Kolmogorov 関係式
マルコフ性から Q 行列への橋 — スライド「マルコフ性 → Q 行列」の中間論理を整理
作成日: 2026-05-25 / §4 補足・半群構造 / Mathematics in Neuroscience プレゼン準備
このノートの目的:
ユーザが感じた「マルコフ性から Q 行列の順序の混乱」を直接解消する。
「指数関数」が 2 種類(滞在時間の指数分布 vs 行列指数)あり、それぞれ別の論理連鎖を通る。
本ノートは、スライド「マルコフ性 → Q 行列」の間に挿入すべき半群構造を数学的に整理し、2 系統の論理連鎖を視覚化する。
§1. 核心の宣言: 遷移確率行列 P(t) とは何か
最初に答え
遷移確率を成分とする行列:
$$P_{ij}(t) := P(X(t) = j \mid X(0) = i)$$
これを行列にまとめたもの $P(t) = (P_{ij}(t))_{i,j \in S}$ は次の 3 性質を持つ:
- $P(0) = I$ (時刻 0 では必ず元の状態にいる)
- $P(t+s) = P(t)\,P(s)$ ($\forall t,s \ge 0$)— Chapman-Kolmogorov 関係式
- 各行の成分は非負で、行和が 1 — 確率行列の条件
この性質を 「$\{P(t)\}_{t \ge 0}$ は確率行列の半群をなす」 という。
§2. 各記号の分解 — P(t) の成分を一つずつ読む
$P_{ij}(t)$ が「1 引数」で書ける理由: 時間的斉次性
一般の非斉次な連続時間確率過程では、時刻 $s$ から $s+t$ への遷移確率は
$P_{ij}(s, s+t)$ と 2 変数 が必要になる。
CTMC の時間的斉次性(time-homogeneity)は「遷移確率が出発時刻 $s$ に依存しない」という仮定であり、このおかげで $P_{ij}(s, s+t) = P_{ij}(t)$ と 時間差だけ の 1 変数関数になる。
$P(0) = I$ の意味
$P_{ij}(0) = P(X(0) = j \mid X(0) = i) = \delta_{ij}$
時刻 0 では確率 1 で元の状態 $i$ にとどまる($i \ne j$ なら確率 0)。これは単位行列。
$P(t)$ が確率行列であること
- 成分の非負性: $P_{ij}(t) \ge 0$(確率は負にならない)
- 行和 = 1: $\sum_j P_{ij}(t) = 1$(どこかの状態に必ずいる)
これは全確率の法則から直ちに従う。
図 1. Chapman-Kolmogorov 関係式の経路分割。時刻 t でいったん中間状態 k を経由し、全 k について和を取る。
§3. Chapman-Kolmogorov が成立する理由
2 つの仮定が鍵を握る
マルコフ性(過去を忘れる):
時刻 $t$ で状態 $k$ を知っていれば、$[0, t]$ の履歴は $[t, t+s]$ の遷移に影響しない。
$$P(X(t+s)=j \mid X(t)=k,\, X(0)=i) = P(X(t+s)=j \mid X(t)=k)$$
これが「経路を $[0,t]$ と $[t,t+s]$ に分割」できる根拠。
時間的斉次性(出発時刻に依存しない):
$$P(X(t+s)=j \mid X(t)=k) = P(X(s)=j \mid X(0)=k) = P_{kj}(s)$$
$[t, t+s]$ の遷移確率が $P(s)$ で書ける根拠。
証明スケッチ
$$P_{ij}(t+s)$$
$$= P(X(t+s)=j \mid X(0)=i)$$
$$= \sum_k P(X(t+s)=j,\, X(t)=k \mid X(0)=i)$$
$$= \sum_k P(X(t)=k \mid X(0)=i)\cdot P(X(t+s)=j \mid X(t)=k,\, X(0)=i)$$
$$\overset{\text{Markov}}{=} \sum_k P_{ik}(t)\cdot P(X(t+s)=j \mid X(t)=k)$$
$$\overset{\text{斉次性}}{=} \sum_k P_{ik}(t)\cdot P_{kj}(s)$$
$$= [P(t)\,P(s)]_{ij}$$
よって行列形式で $P(t+s) = P(t)\,P(s)$。
§4. なぜ「半群」で「群」ではないのか
| 群の公理 | $\{P(t)\}_{t \ge 0}$ での成立 | 説明 |
| 閉性 | 成立 | $P(t),P(s)$ は確率行列 → 積も確率行列 |
| 結合則 | 成立 | 行列積は常に結合的 |
| 単位元 | 成立 ($P(0)=I$) | 時刻 0 では「何も起きない」= 単位行列 |
| 逆元 | 一般に存在しない | 時間 $t > 0$ を逆行する $P(-t)$ は定義できない |
物理的意味: 逆元がないのは時間の不可逆性に対応する。確率的な状態遷移はエントロピーを増大させる方向に流れており、「前の状態に確率 1 で戻る」操作は一般に不可能。例外は可逆なマルコフ連鎖の定常分布周辺のみ(詳細釣り合い条件が成立する場合)。
§5. Q 行列への橋渡し — 微分と標準性
追加の仮定: 標準性(continuity)
$$\lim_{t \to 0+} P(t) = I$$
すなわち $\lim_{t \to 0+} P_{ij}(t) = \delta_{ij}$。直感的には「ごく短時間では状態はほとんど変わらない」。
一様連続半群の微分可能性
有限状態空間 $|S| < \infty$ において、半群 $\{P(t)\}$ が連続(標準性を持つ)ならば、
すべての $t > 0$ で微分可能であり(実は解析的)、次の極限が存在する:
$$Q := P'(0) = \lim_{h \to 0^+} \frac{P(h) - I}{h}$$
この行列 $Q$ を 生成作用素(generator) または Q 行列(intensity matrix) という。
P(t) = exp(Qt)
半群の微分方程式 $P'(t) = QP(t)$(Kolmogorov 前進方程式)を初期条件 $P(0)=I$ のもとで解くと:
$$P(t) = e^{Qt} = \sum_{n=0}^{\infty} \frac{(Qt)^n}{n!}$$
有限状態空間では級数が常に収束し、$P(t)$ は Q 行列から一意に決まる。
詳細は
行列指数関数 $e^{Qt}$ と Q 行列 を参照。
§6. 【最重要】2 つの指数構造の論理連鎖
ユーザが感じた「順序の混乱」は、「指数」が 2 種類あって別の論理連鎖を通っている
ことに気づけば完全に解消する。
§6.1 2 種類の「指数」がある
| 種類 | (A) 滞在時間の指数分布 | (B) 行列指数 |
| 数式 | $S_i(t) = e^{-\lambda_i t}$ | $P(t) = e^{Qt}$ |
| 何が指数か | スカラー — 状態 $i$ にとどまる確率 | 行列全体 — 全遷移確率をまとめた行列 |
| 必要な仮定 | マルコフ性 + 時間的斉次性 のみ | マルコフ性 + 時間的斉次性 + 標準性 + 有限状態 |
| 経由する道具 | 無記憶性、Cauchy 関数方程式 | 半群、Chapman-Kolmogorov、微分 |
| 「指数」の主役 | 状態 $i$ の脱出率 $\lambda_i$ がパラメータ | Q 行列全体が指数の引数 |
§6.2 2 系統の論理連鎖図
図 2. 2 系統の論理連鎖。(A) はマルコフ性 + 時間的斉次性だけで閉じる。(B) は標準性と有限状態空間が追加で必要。両者は $\lambda_i = -q_{ii}$ で接続される。
§6.3 なぜ順序の混乱が生じたか
元の流れ図:
マルコフ性 + 有限状態空間 + 時間的斉次性 + 標準性(連続性)
↓
P(t) が微分可能
↓
Q = P'(0) が一意に存在
↓
P(t) = exp(Qt)
この流れは (B) 系統のみ を記述している。
混乱の原因: 「マルコフ性 + 時間的斉次性 → 指数が出る」という直感は (A) 系統(滞在時間の指数分布)の話。一方、上記フロー図は (B) 系統(行列指数)の話。Q 行列が先に出て、その後に exp(Qt) が現れるのは B 系統の内部での順序であり、A 系統の話と混同すると「マルコフ性だけで指数が出るはずなのに Q 行列が先?」という違和感が生じる。
§6.4 B 系統の内部での順序が「Q が先、e^{Qt} が後」になる理由
B 系統は半群 → 微分 → Q 抽出 → 行列指数という流れ。Q を「先に定義してから」
$e^{Qt}$ を組み立てるのは、Q が行列指数の 生成元(generator)だからである。
スカラーの場合でいえば $\frac{d}{dt}e^{at} = a\,e^{at}$ において「$a$ を定義してから $e^{at}$ を書く」のと同じ論理順序。
整理:
- (A) 系統: マルコフ性 + 斉次性 → 無記憶性 → 指数分布 $e^{-\lambda_i t}$(スカラー)
- (B) 系統: マルコフ性 + 斉次性 + 標準性 + 有限状態 → 半群 → Q 行列 → 行列指数 $e^{Qt}$(行列)
- 接続: $\lambda_i = -q_{ii}$(A の指数パラメータ = B の Q 行列対角成分)
- 「Q が先、$e^{Qt}$ が後」は B 系統の内部の話であり、A 系統と独立
§7. プレゼン組み込み案
§7.1 現状のスライド構成
markov-property-and-q-matrix.pptx(現状 2 枚)
- スライド 1: マルコフ性の定義
- スライド 2: 追加仮定(標準性・有限状態等)+ Q 行列の定義
問題点: スライド 1→2 の論理飛躍が大きい。P(t) の半群構造が説明されないまま Q 行列が現れる。
§7.2 提案: スライド挿入位置
図 3. 提案するスライド構成。スライド 1.5 を挿入することで半群構造を明示し、論理飛躍を解消する。
§7.3 新スライド「P(t) の半群構造」1 枚構成案
タイトル: 「遷移確率行列 P(t) と半群構造」
左半分:
- $P_{ij}(t) := P(X(t)=j \mid X(0)=i)$ の定義
- $P(t) = (P_{ij}(t))_{i,j \in S}$ 行列
- $P(0) = I$(時刻 0 = 単位行列)
右半分 (大きく):
- $P(t+s) = P(t)\,P(s)$ を大きく強調
- 成分形: $P_{ij}(t+s) = \sum_k P_{ik}(t)\,P_{kj}(s)$
- 経路分割図 (0 → t → t+s、中間状態 k で合流)
下部キーワード: 「Chapman-Kolmogorov 関係式」「確率行列の半群」「次のスライドで → 標準性を加えると Q 行列が抽出できる」
§7.4 口頭説明スクリプト(30 秒版)
「マルコフ性と時間的斉次性が成り立つと、遷移確率は時間差だけで決まる $P_{ij}(t)$ になります。
それを行列にまとめた $P(t)$ は、半群の性質 $P(t+s) = P(t)P(s)$ を満たします。
これが Chapman-Kolmogorov 関係式で、中間時刻 $t$ でいったん状態 $k$ に立ち寄って $j$ に行く
全パターンを足し合わせるという、確率の経路分解です。
この半群構造から微小時間極限を取ると Q 行列が抽出できる、というのが次のスライドの内容です。」
§7.5 口頭説明スクリプト(1 分版・2 系統の混乱解消も含む)
「マルコフ性と時間的斉次性が成り立つと、遷移確率は時間差だけで決まる $P_{ij}(t)$ になります。
それを行列にまとめた $P(t)$ は、半群の性質 $P(t+s) = P(t)P(s)$ を満たします。
これが Chapman-Kolmogorov 関係式で、中間時刻 $t$ でいったん状態 $k$ に立ち寄って $j$ に行く
全パターンを足し合わせるという、確率の経路分解です。
この半群構造から微小時間極限を取ると Q 行列が抽出できる、というのが次のスライドの内容です。
ここで一つ注意したいのは、「指数関数」が 2 種類出てくることです。
1 つは 1 状態の滞在時間が $e^{-\lambda t}$ になること、
もう 1 つは遷移確率行列全体が $e^{Qt}$ になること。
前者はマルコフ性と時間的斉次性だけで出てきます。
後者にはさらに標準性(連続性)と有限状態空間が必要です。
両者は Q 行列の対角成分 $\lambda_i = -q_{ii}$ で繋がります。
Q 行列を先に出してから $e^{Qt}$ を組み立てるというのは、この「行列指数」側の話の順序です。」
§8. まとめ
- 半群 $P(t+s) = P(t)P(s)$ は CTMC の最も基本的な代数構造であり、マルコフ性と時間的斉次性から導かれる
- Chapman-Kolmogorov は「中間状態を全通り足し合わせる」確率の経路分解を行列積で表現したもの
- これに 標準性(連続性) を加えると $P(t)$ が微分可能になり、Q 行列(生成作用素)が抽出できる
- 有限状態空間 で行列指数 $e^{Qt}$ の級数が収束し、$P(t) = e^{Qt}$ が得られる
- この「行列指数 (B 系統)」と「滞在時間の指数分布 (A 系統)」は 別の論理連鎖 を通るが、$\lambda_i = -q_{ii}$ で接続される
作成日: 2026-05-25 / §4 補足 · 半群構造 / Mathematics in Neuroscience プレゼン準備