NSM-004
指数分布と状態数推定 — §3 の核心
関連ドキュメント
このドキュメントの結論を先に:
観測される滞在時間分布が「指数 $n$ 本の混合」 として書けるとき、
その $n$ はイオンチャネルの隠れた状態の数 を反映している。
しかも「畳み込み (peakあり, Erlang/hypoexponential)」 vs 「指数の和 (peakなし, mixture)」で並列か直列か も分かる。
本ノートでの用語規約 (重要):
- 指数の和 (mixture) : $f(t) = a_1 e^{-\lambda_1 t} + a_2 e^{-\lambda_2 t} + \ldots$ — 密度関数の線形結合 (= 「重ね合わせ」と同義)。並列分岐 / 単調減少 / $t=0$ で最大 / 「どの状態に入るかランダム選択」
- 畳み込み (Erlang / hypoexponential) : $f = f_1 * f_2$ — 確率変数の和 $T = T_1 + T_2$ の分布。直列連鎖 / peak あり / $t=0$ でゼロ / 「順番に通過」
i.i.d.(同じレート)の畳み込みが厳密な Erlang 、異レートの畳み込みが hypoexponential (広義の Erlang)。
1. 指数分布 — 1状態の滞在時間
1.1 定義
確率密度関数 (probability density function, PDF):
$f(t) = q\, e^{-q t}, \quad t \geq 0$
$t$: 待ち時間 (秒)
$q$: 遷移率 (rate) — 単位時間あたりに何回イベントが起きるか。単位 $[\text{秒}^{-1}]$
$q$ が大きい = イベントが頻繁 = 早く遷移する
t
f(t)
0
大きい q (早い)
小さい q (遅い)
q (大)
q (小)
指数分布 f(t) = q·e^(-qt)
図1. 指数分布。$q$ が大きいほど $t=0$ で高くなり急峻に減衰
1.2 重要な性質
性質 値・意味
全積分 = 1 $\int_0^\infty q e^{-qt}dt = 1$ (確率分布として規格化済み)
平均値 $E[T] = 1/q$ (= 平均滞在時間)
最頻値 $t=0$ (短い時間ほど起こりやすい)
分散 $\text{Var}[T] = 1/q^2$
1.3 神経生理との対応
神経生理学 数学
速度定数 $\alpha, \beta$ 遷移率 $q$
平均 open / closed time $1/q$
例: AChR の開状態の平均滞在時間が 5 ms → $q = 200\,\text{s}^{-1}$、分布は $f(t) = 200 e^{-200 t}$。
シナプス電位の時定数と混同しないこと : シナプス電位の時定数 $\tau_m = C_m/g$ は電圧の時定数 。 ここで言う $1/q$ はチャネル状態の滞在時間 で別物。
2. 無記憶性 (Memoryless Property)
2.1 主張
チャネルが今までに状態に何秒いたかは、残りの待ち時間に影響しない。
$P(T > s + t \mid T > s) = P(T > t)$
「すでに $s$ 秒待った」という条件のもとでの「あと $t$ 秒以上待つ確率」は、何も条件なしの「$t$ 秒以上待つ確率」と等しい。
t
0
s
(待った時間)
既に s 秒待った
残り t 秒以上待つ?
どんなに s が大きくても、残り時間の分布は同じ
図2. 無記憶性: 「過去」がいくらあっても「残り」の分布は変わらない
2.2 神経生理的直感
チャネルは「自分が今までどれくらいその状態にいたか」を覚えていない。いつ次の遷移が起きるかは現在の状態だけ で決まる。これがまさにマルコフ性 。
2.3 一意性定理
連続分布で無記憶性を持つのは指数分布だけ。
証明: $f(t) := P(T > t)$ とおくと、無記憶性は $f(s+t) = f(s)f(t)$ という関数方程式に翻訳される。連続性のもとで解くと $f(t) = e^{-\lambda t}$ しか解がない。
3. 多指数構造の正体 — 指数の和 (mixture) vs 畳み込み (Erlang/hypoexponential)
single channel recording の滞在時間ヒストグラム (open dwell time でも closed dwell time でもよい) が「指数 1本ではフィットできない」とき、その「複数の指数」は2つの違う起源 を持ち得る:
パターン A: 指数の和 (mixture) パターン B: 畳み込み (Erlang / hypoexponential)
構造 並列 直列
意味 同じラベル (例: 閉) の状態が複数並列に存在し、どれを経由したかで時間が変わる 同じラベルの状態が直列に連鎖し、すべて順番に通過する
確率的操作 確率変数の条件付き分岐 (密度の線形結合) 確率変数の和 (密度の畳み込み積分)
分布 指数の和 (線形結合) $\sum a_j e^{-\lambda_j t}$ Erlang (同レート) / hypoexponential (異レート)
形 単調減少 (peak なし) peak あり (山型)
重要 (誤解しやすい点):
以下の §4 (指数の和 mixture) と §5 (畳み込み Erlang/hypoexp) はどちらも「閉滞在時間 (closed dwell time)」のヒストグラム の話。
違いは「閉状態が並列か直列か」だけ。「open と closed の混合」を見ているのではない。
同じ議論は open dwell time にも適用でき、その場合は「開状態の構造」が分かる。
4. パターン A: 指数の和 (Mixture) — 並列に閉状態が2つある場合
4.1 例: 並列の2つの閉状態
観測しているもの : 閉滞在時間 (closed dwell time) — 1回 open を離れて次に open に戻るまでの時間。
O
C1 (短い)
平均 1ms
C2 (長い)
平均 100ms
確率 a
確率 1-a
→ O に戻る
図3. 並列構造 (mixture)。Open を離れた後、確率 a で C1, 確率 1−a で C2 に分岐
4.2 分布の式
$f(t) = a \cdot q_1 e^{-q_1 t} + (1-a) \cdot q_2 e^{-q_2 t}$
ここで $q_1 = 1/(\text{C1平均})$, $q_2 = 1/(\text{C2平均})$。
4.3 形の特徴
t
f(t)
C1成分 (急峻)
C2成分 (尾が長い)
指数の和 (mixture) f(t) = aq₁e^(-q₁t) + (1-a)q₂e^(-q₂t)
特徴: 単調減少 (peak なし)
図4. 指数の和 (mixture)。2本の指数密度が線形結合で足し合わさり、形は単調減少のまま
semilog プロット : 縦軸を $\log f(t)$ にすると「2本の直線の重なり」になり、傾きから $q_1, q_2$ を読み取れる。Colquhoun-Hawkes 解析の基本テクニック。
5. パターン B: 畳み込み (Erlang / hypoexponential 分布) — 閉状態が直列に連鎖している場合
5.1 例: 直列の閉状態通過
観測しているもの : §4 と同じく 閉滞在時間 (closed dwell time) 。
ただし今度は、Open を離れたら C1 → C2 → C3 と3つの閉状態をすべて順番に通過 しないと次の Open に戻れない構造。
図の見方の注意:
下の図で両端の O は「閉滞在時間の始点と終点」のマーカー であって、Open 状態の時間は測定対象に含まれていない。
グレーで網掛けした C1 + C2 + C3 の合計時間が、実験で観測される 1 回の「閉滞在時間」。
観測される閉滞在時間 (closed dwell time)
O
(始点マーカー)
C1
C2
C3
O
(終点マーカー)
q
q
q
q
合計時間 S = X₁ + X₂ + X₃ (畳み込み → Erlang)
図5. 直列構造 (畳み込み)。閉状態 C1 → C2 → C3 を全部順番に通過する必要があるため、 観測される閉時間は3つの指数 RV の和 (= 密度の畳み込み)。両端の O は始点・終点を示すだけで測定対象外
5.2 分布の式 — Erlang 分布 (等レートの場合) / hypoexponential (異レートの場合)
全状態のレートが等しい ($q_1 = q_2 = \cdots = q_n = q$) 場合 、密度は厳密な Erlang 分布:
$f_S(t) = \dfrac{q^n\, t^{n-1}}{(n-1)!}\, e^{-q t}$
レートが異なる場合 は hypoexponential 分布 (広義の Erlang) になり、$n=2$ の例として $f(t) = \dfrac{q_1 q_2}{q_1 - q_2}(e^{-q_2 t} - e^{-q_1 t})$($q_1 \ne q_2$)。$n$ = 通過する状態の数。$n=1$ なら通常の指数分布、$n=2,3,...$ で形が変わる。
5.3 形の特徴 — peak が出る
t
f(t)
n=1 (指数)
n=2
n=3 (peak あり!)
peak
Erlang 分布: f(t) = q^n · t^(n-1) / (n-1)! · e^(-qt)
特徴: n≥2 で peak が出現 (山型)
図6. Erlang 分布。$n \geq 2$ で $t=0$ での値がゼロになり、ピークを経て減衰
$t=0$ 付近で $f(0)=0$ になるのは、「短時間で全 $n$ 個の状態をすべて通過するのは確率的に難しい」という直感そのもの。
6. 決定的な違い — peak の有無
指数の和 (mixture) 畳み込み (Erlang / hypoexponential)
観測しているもの どちらも同じ — 閉滞在時間 (または開滞在時間) のヒストグラム
構造 並列 (同じラベルの状態が複数並ぶ) 直列 (同じラベルの状態が鎖状に並ぶ)
確率的操作 密度の線形結合 (条件付き分岐) 密度の畳み込み (確率変数の和)
$t=0$ での値 最大 $0$
形 単調減少 peak あり (山型)
数学形 $\sum a_i q_i e^{-q_i t}$ (係数全正) $\dfrac{q^n t^{n-1}}{(n-1)!} e^{-qt}$ (等レート Erlang) / 異レートは hypoexp.
意味 隠れ状態が並列に複数ある 隠れ状態を直列に通過する
peak の有無 が、ヒストグラムだけから状態構造を推測する第1の手がかり 。
7. 一般のチャネル — 両者が混ざる
実際のチャネル (例: AChR の 5状態モデル C₀-C₁-C₂-C₂*-O) は並列と直列の混合構造を持つ。一般に滞在時間分布は:
$f(t) = \sum_{i} a_i\, |\lambda_i|\, e^{\lambda_i t}$
と書ける。ここで $\lambda_i$ は Q行列のサブブロックの固有値 。
これが「§4で CTMC・Q行列・exp(Qt) が必要な理由」:
ヒストグラムから固有値を読む = Q のブロック構造を読む = 状態数を読む 。
次のドキュメント (§4) で Q行列の正体を学ぶ。
7.5. 実データで確認 — 古典的な例 (Colquhoun-Hawkes)
以下は 同じ open / closed が観測されても、内部の状態経路が違うと滞在時間分布の形が変わる ことを示した古典的な図 (Colquhoun & Hawkes の教科書系より)。これまで §4〜§5 で説明してきた現象が、実際の解析でそのまま現れる:
図7. 同じ観測ラベルでも、状態経路が違うと滞在時間分布の形が変わる
(a) 確率密度 $f(t)$ vs 時間 — 実線・破線の 2 種類のカーブ
(b)(c) それぞれに対応する内部の状態遷移パターン (3つの状態 1, 2, 3 を行き来する様子)
7.5.1 図の読み方
実線 のカーブ 破線 のカーブ
$t=0$ での値 $0$ 最大 (~100 s$^{-1}$)
形 2 ms 付近に peak (山型) 単調減少 (peak なし)
パターン §5 で説明した 畳み込み 型 (Erlang / hypoexponential) §4 で説明した 指数の和 (mixture) 型
対応する状態経路 直列構造 (隠れ状態を順番に通過) 並列構造 (隠れ状態が分岐)
7.5.2 ここがポイント
(a) パネルだけ見せられたら、状態数や経路構造を当てられるか? — それがこの発表のテーマ。
- 実線 (peak あり) を見たら「直列に隠れ状態を通過 」
- 破線 (peak なし) を見たら「並列に隠れ状態が複数 」
これがヒストグラムから内部機構を「逆問題的に」当てる第一歩。
7.5.3 線形軸 vs log-log 軸 (補足)
この図は線形軸 で描かれている (横軸: 時間 (ms)、縦軸: 確率密度)。これは §4〜§5 で説明した形 (peak なし vs peak あり) に直接対応する。
論文での慣例 : 実際の single channel 解析論文では Sigworth-Sine プロット (横軸 $\log t$、縦軸 $\sqrt{f(t) \cdot t}$) が標準的に使われる。
このとき単純指数分布ですらピークを持つ形になる ので、解釈には注意が必要 (peakの位置 ≈ 各指数成分の平均寿命 $1/q_i$)。今回の発表では聴衆 (数学者) に分かりやすい線形軸で説明する。
8. まとめ — §3の核心 4ポイント
✅ 1状態の滞在時間 → 指数分布 $f(t) = q e^{-qt}$ (平均 $1/q$)
✅ 並列に複数の隠れ状態 → 指数の和 (mixture, peak なし、単調減少)
✅ 直列に隠れ状態の連鎖 → 畳み込み = Erlang/hypoexponential 分布 (peak あり、山型)
✅ 一般のチャネルでは両方が混ざり、Q行列の固有値 が指数部に現れる
プレゼン中に最も強調したいメッセージ:
「指数の本数 = 隠れた状態の数」 。
つまり実験で記録したヒストグラムを指数和でフィットするだけで、観測できない内部状態の数が分かる。
参考文献
Colquhoun, D. & Hawkes, A. G. (1995). The principles of the stochastic interpretation of ion channel mechanisms. In: Sakmann, B. & Neher, E. (eds.) Single-Channel Recording , 2nd edition, pp. 397–482. Plenum Press, New York. → プロジェクト全体の主要典拠:dwell time 分布の指数和フィットと状態数推定の解釈的根拠
Colquhoun, D. & Hawkes, A. G. (1981). On the stochastic properties of single ion channels. Proceedings of the Royal Society of London B , 211, 205–235. → dwell time 分布の指数成分と状態数の対応関係の基礎的定式化
Colquhoun, D. & Hawkes, A. G. (1982). On the stochastic properties of bursts of single ion channel openings and of clusters of bursts. Philosophical Transactions of the Royal Society of London B , 300, 1–59. → 多成分指数分布による状態数推定:burst/cluster 構造への拡張
Sigworth, F. J. & Sine, S. M. (1987). Data transformations for improved display and fitting of single-channel dwell time histograms. Biophysical Journal , 52, 1047–1054. → dwell time ヒストグラムの sqrt 変換表示法と指数フィットの実用的手法
関連項目
作成日: 2026-05-18 / プロジェクト: Mathematics in Neuroscience プレゼン準備 / §3 数学解説