指数分布と状態数推定 — §3 の核心

このドキュメントの結論を先に:
  観測される滞在時間分布が「指数 $n$ 本の混合」として書けるとき、
  その $n$ はイオンチャネルの隠れた状態の数を反映している。
  しかも「指数の和 (peakあり)」 vs 「指数の重ね合わせ (peakなし)」で並列か直列かも分かる。

1. 指数分布 — 1状態の滞在時間

1.1 定義

確率密度関数 (probability density function, PDF):

$f(t) = q\, e^{-q t}, \quad t \geq 0$
t f(t) 0 大きい q (早い) 小さい q (遅い) q (大) q (小) 指数分布 f(t) = q·e^(-qt)
図1. 指数分布。$q$ が大きいほど $t=0$ で高くなり急峻に減衰

1.2 重要な性質

性質値・意味
全積分 = 1$\int_0^\infty q e^{-qt}dt = 1$ (確率分布として規格化済み)
平均値$E[T] = 1/q$ (= 平均滞在時間)
最頻値$t=0$ (短い時間ほど起こりやすい)
分散$\text{Var}[T] = 1/q^2$

1.3 神経生理との対応

神経生理学数学
速度定数 $\alpha, \beta$遷移率 $q$
平均 open / closed time$1/q$

例: AChR の開状態の平均滞在時間が 5 ms → $q = 200\,\text{s}^{-1}$、分布は $f(t) = 200 e^{-200 t}$。

シナプス電位の時定数と混同しないこと: シナプス電位の時定数 $\tau_m = C_m/g$ は電圧の時定数。 ここで言う $1/q$ はチャネル状態の滞在時間で別物。

2. 無記憶性 (Memoryless Property)

2.1 主張

チャネルが今までに状態に何秒いたかは、残りの待ち時間に影響しない。

$P(T > s + t \mid T > s) = P(T > t)$

「すでに $s$ 秒待った」という条件のもとでの「あと $t$ 秒以上待つ確率」は、何も条件なしの「$t$ 秒以上待つ確率」と等しい。

t 0 s (待った時間) 既に s 秒待った 残り t 秒以上待つ? どんなに s が大きくても、残り時間の分布は同じ
図2. 無記憶性: 「過去」がいくらあっても「残り」の分布は変わらない

2.2 神経生理的直感

チャネルは「自分が今までどれくらいその状態にいたか」を覚えていない。いつ次の遷移が起きるかは現在の状態だけで決まる。これがまさにマルコフ性

2.3 一意性定理

連続分布で無記憶性を持つのは指数分布だけ。
証明: $f(t) := P(T > t)$ とおくと、無記憶性は $f(s+t) = f(s)f(t)$ という関数方程式に翻訳される。連続性のもとで解くと $f(t) = e^{-\lambda t}$ しか解がない。

3. 多指数構造の正体 — 重ね合わせ vs 和

single channel recording の滞在時間ヒストグラム (open dwell time でも closed dwell time でもよい) が「指数 1本ではフィットできない」とき、その「複数の指数」は2つの違う起源を持ち得る:

パターン A: 重ね合わせ (mixture)パターン B: 和 (Erlang)
構造並列直列
意味同じラベル (例: 閉) の状態が複数並列に存在し、どれを経由したかで時間が変わる同じラベルの状態が直列に連鎖し、すべて順番に通過する
分布指数の重ね合わせErlang / Gamma 分布
単調減少 (peak なし)peak あり (山型)
重要 (誤解しやすい点):
以下の §4 (mixture) と §5 (Erlang) はどちらも「閉滞在時間 (closed dwell time)」のヒストグラムの話。
違いは「閉状態が並列か直列か」だけ。「open と closed の混合」を見ているのではない。
同じ議論は open dwell time にも適用でき、その場合は「開状態の構造」が分かる。

4. パターン A: 指数の重ね合わせ (Mixture) — 並列に閉状態が2つある場合

4.1 例: 並列の2つの閉状態

観測しているもの: 閉滞在時間 (closed dwell time) — 1回 open を離れて次に open に戻るまでの時間。

O C1 (短い) 平均 1ms C2 (長い) 平均 100ms 確率 a 確率 1-a → O に戻る
図3. 並列構造 (mixture)。Open を離れた後、確率 a で C1, 確率 1−a で C2 に分岐

4.2 分布の式

$f(t) = a \cdot q_1 e^{-q_1 t} + (1-a) \cdot q_2 e^{-q_2 t}$

ここで $q_1 = 1/(\text{C1平均})$, $q_2 = 1/(\text{C2平均})$。

4.3 形の特徴

t f(t) C1成分 (急峻) C2成分 (尾が長い) 重ね合わせ f(t) = aq₁e^(-q₁t) + (1-a)q₂e^(-q₂t) 特徴: 単調減少 (peak なし)
図4. 指数の重ね合わせ。2本の指数が足し合わさるが、形は単調減少のまま
semilog プロット: 縦軸を $\log f(t)$ にすると「2本の直線の重なり」になり、傾きから $q_1, q_2$ を読み取れる。Colquhoun-Hawkes 解析の基本テクニック。

5. パターン B: 指数の和 (Erlang/Gamma 分布) — 閉状態が直列に連鎖している場合

5.1 例: 直列の閉状態通過

観測しているもの: §4 と同じく 閉滞在時間 (closed dwell time)
ただし今度は、Open を離れたら C1 → C2 → C3 と3つの閉状態をすべて順番に通過しないと次の Open に戻れない構造。

図の見方の注意:
下の図で両端の O は「閉滞在時間の始点と終点」のマーカーであって、Open 状態の時間は測定対象に含まれていない。
グレーで網掛けした C1 + C2 + C3 の合計時間が、実験で観測される 1 回の「閉滞在時間」。
観測される閉滞在時間 (closed dwell time) O (始点マーカー) C1 C2 C3 O (終点マーカー) q q q q 合計時間 S = X₁ + X₂ + X₃ (Erlang分布)
図5. 直列構造 (sum/Erlang)。閉状態 C1 → C2 → C3 を全部順番に通過する必要があるため、 観測される閉時間は3つの指数の和になる。両端の O は始点・終点を示すだけで測定対象外

5.2 分布の式 — Erlang 分布

$f_S(t) = \dfrac{q^n\, t^{n-1}}{(n-1)!}\, e^{-q t}$

$n$ = 通過する状態の数。$n=1$ なら通常の指数分布、$n=2,3,...$ で形が変わる。

5.3 形の特徴 — peak が出る

t f(t) n=1 (指数) n=2 n=3 (peak あり!) peak Erlang 分布: f(t) = q^n · t^(n-1) / (n-1)! · e^(-qt) 特徴: n≥2 で peak が出現 (山型)
図6. Erlang 分布。$n \geq 2$ で $t=0$ での値がゼロになり、ピークを経て減衰
$t=0$ 付近で $f(0)=0$ になるのは、「短時間で全 $n$ 個の状態をすべて通過するのは確率的に難しい」という直感そのもの。

6. 決定的な違い — peak の有無

重ね合わせ (mixture)和 (Erlang)
観測しているものどちらも同じ — 閉滞在時間 (または開滞在時間) のヒストグラム
構造並列 (同じラベルの状態が複数並ぶ)直列 (同じラベルの状態が鎖状に並ぶ)
$t=0$ での値最大$0$
単調減少peak あり (山型)
数学形$\sum a_i q_i e^{-q_i t}$$\dfrac{q^n t^{n-1}}{(n-1)!} e^{-qt}$
意味隠れ状態が並列に複数ある隠れ状態を直列に通過する
peak の有無が、ヒストグラムだけから状態構造を推測する第1の手がかり

7. 一般のチャネル — 両者が混ざる

実際のチャネル (例: AChR の 5状態モデル C₀-C₁-C₂-C₂*-O) は並列と直列の混合構造を持つ。一般に滞在時間分布は:

$f(t) = \sum_{i} a_i\, |\lambda_i|\, e^{\lambda_i t}$

と書ける。ここで $\lambda_i$ は Q行列のサブブロックの固有値

これが「§4で CTMC・Q行列・exp(Qt) が必要な理由」:
ヒストグラムから固有値を読む = Q のブロック構造を読む = 状態数を読む
次のドキュメント (§4) で Q行列の正体を学ぶ。

7.5. 実データで確認 — 古典的な例 (Colquhoun-Hawkes)

以下は 同じ open / closed が観測されても、内部の状態経路が違うと滞在時間分布の形が変わる ことを示した古典的な図 (Colquhoun & Hawkes の教科書系より)。これまで §4〜§5 で説明してきた現象が、実際の解析でそのまま現れる:

滞在時間分布の比較 (Colquhoun-Hawkes)
図7. 同じ観測ラベルでも、状態経路が違うと滞在時間分布の形が変わる
(a) 確率密度 $f(t)$ vs 時間 — 実線・破線の 2 種類のカーブ
(b)(c) それぞれに対応する内部の状態遷移パターン (3つの状態 1, 2, 3 を行き来する様子)

7.5.1 図の読み方

実線 のカーブ破線 のカーブ
$t=0$ での値最大 (~100 s$^{-1}$)$0$
単調減少 (peak なし)2 ms 付近に peak (山型)
パターン§4 で説明した mixture§5 で説明した Erlang
対応する状態経路並列構造 (隠れ状態が分岐)直列構造 (隠れ状態を順番に通過)

7.5.2 ここがポイント

(a) パネルだけ見せられたら、状態数や経路構造を当てられるか? — それがこの発表のテーマ。

- 実線 (peak なし) を見たら「並列に隠れ状態が複数
- 破線 (peak あり) を見たら「直列に隠れ状態を通過

これがヒストグラムから内部機構を「逆問題的に」当てる第一歩。

7.5.3 線形軸 vs log-log 軸 (補足)

この図は線形軸で描かれている (横軸: 時間 (ms)、縦軸: 確率密度)。これは §4〜§5 で説明した形 (peak なし vs peak あり) に直接対応する。

論文での慣例: 実際の single channel 解析論文では Sigworth-Sine プロット (横軸 $\log t$、縦軸 $\sqrt{f(t) \cdot t}$) が標準的に使われる。 このとき単純指数分布ですらピークを持つ形になるので、解釈には注意が必要 (peakの位置 ≈ 各指数成分の平均寿命 $1/q_i$)。今回の発表では聴衆 (数学者) に分かりやすい線形軸で説明する。

8. まとめ — §3の核心 4ポイント

  1. ✅ 1状態の滞在時間 → 指数分布 $f(t) = q e^{-qt}$ (平均 $1/q$)
  2. ✅ 並列に複数の隠れ状態 → 指数の重ね合わせ (peak なし、単調減少)
  3. ✅ 直列に隠れ状態の連鎖 → 指数の和 = Erlang分布 (peak あり、山型)
  4. ✅ 一般のチャネルでは両方が混ざり、Q行列の固有値が指数部に現れる
プレゼン中に最も強調したいメッセージ:
  「指数の本数 = 隠れた状態の数」
  つまり実験で記録したヒストグラムを指数和でフィットするだけで、観測できない内部状態の数が分かる。

作成日: 2026-05-18 / プロジェクト: Mathematics in Neuroscience プレゼン準備 / §3 数学解説