[PAP-001] イオンチャネル開閉のリアルタイムマルコフモデリングへの深層学習アプローチ（Oikonomou 2024）

4. Fig 解説 — 全 Figure / Table の精読（サブパネル単位）

各 Figure を (a) Legend 要約 → (b) サブパネル個別解説 → (c) 図全体の意味づけ → (d) 神経科学者の批判点 の 4 段構造で読む。Table・Scheme も同様。

📷 画像レベル再精査済み (2026-05-26): 本 Fig 解説は、PDF を pdftoppm -r 200 で 200 DPI PNG に変換し、Read tool の multimodal 認識で 全 16 ページ × Fig 1〜8 を視覚確認した上で記述。各サブパネルの解説には 「【画像視覚情報】」ブロックを設け、散布図のクラスタ形状、Confusion matrix の濃淡パターン、波形のフリッカリング、2D-histogram の差分模様など、テキスト抽出だけでは得られない視覚的特徴を明示。確信度ラベル: 🟢 PDF 画像で実視認 / 🟡 推論を含む / 🔴 解像度不足等で確認不能。

Table 1. 学習データセット 16 種の一覧

PDF 本文（Methods / Results）の表注: NN の訓練と評価に用いた 16 のデータセット。各行は「トポロジー」「時系列長 [samples]」「レート範囲 [s⁻¹]」「SNR」「train / validation / test サイズ」「生成法（シミュレーション or patch-clamp 実機）」「ノイズ種」「step response 種」を含む。Dataset 1 が topology NN 用、Dataset 2/3 が COCOC/CCCOO の rate NN 用、Dataset 4 は 100 M サンプル CCCOO、Dataset 5 は SNR=2 の高ノイズ COCOC、Dataset 6 は fast gating（k₄₅, k₅₄ が 10 ks⁻¹–1 Ms⁻¹）、Dataset 7–14 が「experimental/bath noise × experimental/Bessel step response」の 2×2 ablation を SNR 4–6 と 8–10 で展開、Dataset 15/16 は patch-clamp 実機で生成した semi-synthetic test セット。

(b) 列ごとの読み

列 1: Topology: Linear Five-State（Dataset 1: 18 トポロジー混合）または特定の COCOC / CCCOO。本研究は線形 5 状態に絞っているのが重要な制約。
列 2: Time series length: 1 M / 10 M / 100 M サンプル。100 kHz サンプリングなら 10 s / 100 s / 1000 s に相当。100 M（Dataset 4）は CCCOO のように「イベント数」が制約になるトポロジーで効くことを示すため。
列 3: Range of rates [s⁻¹]: 標準は 10² – 10⁵。Dataset 6 のみ「遅いレート 10²–10⁴ と速いレート 10⁴–10⁶」と二分し、ローパス遮断周波数（10 kHz）を超える fast gating を扱う。
列 4: SNR: 標準 = 5。Dataset 5 = 2（高ノイズ）、Dataset 7–10 = 4–6、Dataset 11–14 = 8–10、Dataset 15 = 6、Dataset 16 = 8（実機）。4–6 と 8–10 という幅は train / test で正確に同じ SNR を再現できないことへの対策。
列 5–7: Train / Validation / Test サイズ: 典型的に Train 980 k + Val 10 k + Test 10 k。Dataset 1 のみ 10 M + 180 k + 180 k と大規模（18 クラス分類のため）。
列 8: Generation: simulated か patch-clamp setup か。Dataset 15/16 のみ実機で「ideal time series を voltage command として再生 → 実機ノイズ + フィルタ + ステップ応答を経て再記録」したセミ合成データ。
列 9: Noise type: experimental (patch) / experimental (bath) / lp-filtered white の 3 種。bath = 10 MΩ 抵抗、patch = 10 GΩ 抵抗を Axon Cell Model 上で記録。
列 10: Step response: experimental（実機 1000 ステップ ensemble average）/ 4-pole Bessel（SciPy の digital filter）。

著者は「学習データに何を入れたか」を 16 行で網羅的に開示している。表の存在自体が 「シミュレーションのリアリズム」が NN の汎化性能を決めるという本論文の中心仮説 を裏付けるための ablation 設計図。

学習サンプル数は ~10⁶ オーダー。普通の患者・動物実験では到底到達できない。すなわち シミュレーションが「学習データ作成のボトルネック」を解消できなければ DL は ion channel に持ち込めない。Dataset 15/16 の semi-synthetic セットは ground truth が既知なまま実機の歪みを含むので、生体由来データへの橋渡しを担う巧妙な構成。一方で open channel noise（Sigworth 1985）が再現できていないことが Discussion で明記されており、これは将来の限界として残る。

Table 2. 計算時間ベンチマーク

PDF 本文の表注: シミュレーション・NN 学習・推論・先行 2D-Fit・モデル予測 + 完全解析の所要時間を、ハードウェア別に列挙。Inference benchmarks は COCOC rate NN（Dataset 2 test data）を 1000 回実行した平均と標準偏差。

(b) 行ごとの読み

行 1: シミュレーション訓練データ生成: 100 ノード時間（Intel Xeon Platinum 8360Y, 72 cores/node）で 1 M 個の 2D-histogram（時系列長 10 M sample）を生成。記録ごとには不要、事前一回。
行 2: NN 学習: 2 ノード時間（NVIDIA A100, 8 GPUs/node, MirroredStrategy）、global batch size 1024。これも事前一回。
行 3: 先行 2D-Fit（比較対象）: 16–48 ノード時間（Intel Xeon）/ 単一時系列ごとに必要。ensemble 64 × population 800。記録ごとにこれだけかかるのが従来の致命的問題。
行 4: 推論（1 つの 2D-histogram, CPU）: 67 ms ± 16 ms（12th Gen Intel Core i5-12600 @ 3.30 GHz, 6 cores）。1 秒未満 = 記録中の online prediction が射程に入る決定的数字。
行 5: 推論（1 つの 2D-histogram, GPU）: 120 ms ± 40 ms（NVIDIA RTX Titan）。意外にも GPU の方が遅いのは 1 サンプル推論ではバッチ化の恩恵が出ないため。GPU は大量バッチで真価。
行 6: 推論（10000 個バッチ, GPU）: < 11 s（< 1.1 ms each）。バッチ化で 100 倍加速。テストデータ全体の評価に好適。
行 7: モデル予測 + 完全解析（\( \bar V_D, \bar V_R \) + UQ, 100 個の 2D-histogram）: 約 30 秒（Workstation dual processor Intel Xeon E5-2697 v2）。再シミュレート 100 回 + 再予測 + ボリュームスコア計算込み。

「シミュレーションコストを学習時に前払いし、解析時にはほぼゼロにする」というトレードオフを定量的に示した表。先行 2D-Fit の 16–48 node-hours / 記録 から 67 ms / 記録 へ、~10⁹ 倍の高速化。これがリアルタイム性の数値根拠。

67 ms は推論のみで、idealization (HOHD) + 2D-histogram 作成の時間は含まれない。実機への組み込みでは前処理が律速になる可能性。「office computer の background で走らせられる」と著者は楽観的だが、サンプリング 100 kHz × 10 s = 1 M sample の HOHD を online で回す実装は本論文では未検証。Discussion で「recording software に統合する必要がある」と素直に認めているのは好印象。

Fig 1. NN アーキテクチャ（A: topology, B: rates, C: Channel-Increase module, D: RAE vs MAPE）

PDF Fig 1 caption: "Illustration of the neural network architectures used for Markov modeling. In this study, we used modified versions of the Inception-Res-Net-V2 architecture for (A) topology discrimination and (B) rate estimation. (C) The original Reduction-B module was substituted with a module that increases the filter dimension without pooling. (D) Rate constant prediction was evaluated using the RAE error score (Eq. 3). In comparison to the mean absolute percentage error (MAPE), the RAE score is symmetrical with respect to the ground truth."

(b) サブパネルごとの解説

Fig 1A — Topology classification NN 🟢: 入力: 60×60×1 の 2D-histogram。Inception-Res-Net-V2 を改変（フィルタ数 1/4、stem 除去、batch normalization なし、dropout なし、Glorot 初期化、bias = 0）。出力: softmax 18 クラス（線形 5 状態の 18 トポロジー）。最終層は Global-Max-Pooling + Dense(18)。損失: categorical cross-entropy。【画像視覚情報】画像では Fig 1A の縦長カラム内に各モジュール（Input, Conv-A, Inception-A, Reduction-A, Inception-B, Reduction-B → Channel-Increase, Inception-C, Global-Max-Pool, Dense）の output dimension（60×60×24, 30×30×x, 14×14×x, …） がブロックの右隣に明示的に書き込まれており、空間解像度がどこで縮小されるかが視覚的に追える設計図になっている。
Fig 1B — Rate regression NN 🟢: 同じ Inception-ResNet-V2 改変だが、Reduction-B → Channel-Increase（C）、最終層は Flatten + Dense(8, linear)。8 出力 = 5 状態 COCOC/CCCOO の 8 個の遷移レート \(k_{ij}\)。損失: log-cosh。ラベルは \( \log_{10}(k) \) で正規化。【画像視覚情報】Fig 1A と並列カラムで描かれ、上半身はほぼ A と同じレイアウトだが、Reduction-B が C パネルの Channel-Increase に置換される点と最終層が Global-Max-Pool ではなく Flatten + Dense(8) になる点が画像上で明確に異なる。
Fig 1C — Channel-Increase モジュール 🟢: オリジナルの Reduction-B モジュールはプーリングでサイズを縮小するが、60×60 入力では情報損失が大きい。プーリングせずチャネル数だけ増やすブロックで代替。スキップ接続 + Inception 分岐構造はそのまま。【画像視覚情報】画像では 3 つの並列分岐（Conv 1×1, Conv 1×1 → Conv 3×3, Conv 1×1 → Conv 3×3 → Conv 3×3）が下流で concat される典型的な Inception 構造で、サイズ縮小用の MaxPool 分岐が無いことが視覚的に確認できる。
Fig 1D — RAE と MAPE の比較プロット 🟢: 横軸 \( k_\mathrm{Pr}/k_\mathrm{GT} \)（対数）、縦軸 score。MAPE は比 > 1 側で爆発、比 < 0.1 側では感度ロス（飽和）。RAE は \( \log_{10} \) 空間で対称（\( k_\mathrm{Pr}/k_\mathrm{GT}=10 \) も = 0.1 も同じ RAE=1）。「予測が GT の 10 倍か 1/10 倍か」を等価に扱うのが ion channel kinetics のように桁が広い世界では正しい。【画像視覚情報】画像上、MAPE 曲線（青）は 右側（過大予測側）に行くと垂直に立ち上がる急峻な非対称を示し、左側（過小予測側）では 100% に飽和する。一方 RAE 曲線（橙）は 原点 \( k_\mathrm{Pr}/k_\mathrm{GT}=1 \) を中心に左右対称な V 字を描き、対数比軸でほぼ線形に立ち上がる。両者の非対称性 vs 対称性の対比が一目で分かるプロット。

著者は「アーキテクチャ自体は標準 Inception-ResNet-V2 のマイナー改変」と慎ましく書くが、実質的に重要なのは (i) batch norm を切る、(ii) Channel-Increase で空間情報を保つ、(iii) RAE という対数対称指標を導入の 3 点。最後は学習だけでなく評価の哲学を変える。

batch norm を切る判断は珍しい。「性能が落ちる」と一言で済ませているが、2D-histogram の bin 占有が Poisson 分布で平均と分散が結合しているため、ミニバッチ内での標準化が情報を破壊する可能性がある。再現実装時の要注意点。dropout / weight decay も切っているのは「シミュレーションで実質無限のデータがあるため過学習しない」という前提が根拠だが、Dataset 15/16 の実機データ転移は本質的に out-of-distribution なのでこの楽観が当てはまるかは別問題。

Fig 2. アルゴリズム全体のフローチャート（単一図, サブパネルなし）

PDF Fig 2 caption: "Flow chart of the proposed algorithm. The orange path shows the flow of the experimentally recorded data. It is sequentially fed to the topology estimation NN and to the NN for the estimation of the transition rates. The blue paths indicate training of the topology estimation NN and rates estimation NN with simulated training datasets I and II. Dataset I contains 2D-histograms simulated with a collection of models encompassing different topologies. Dataset II consists of a collection of simulated datasets where each set encompasses only one specific topology with a range of rates kij. The green path shows the two stages of estimating the kinetic model."

(b) 図中要素の解説（サブパネル無し）

オレンジパス（推論ライン）: 実験 patch-clamp 時系列 → idealization (HOHD) → 2D-histogram → Topology NN → 該当 Rates NN → HMM 出力。1 ステップずつ独立に置き換え可能な設計。
青パス I（topology NN の訓練）: Dataset I = 18 トポロジー混合の 10 M+ サンプル → topology NN を分類器として学習。一回きり。
青パス II（rates NN の訓練）: Dataset II = トポロジー別（COCOC, CCCOO, ...）の rate-randomized サンプル → 各トポロジーに対応する rates NN を回帰器として学習。トポロジー数だけ NN を用意。
緑パス（kinetic model 推定の 2 段）: 「topology を先に決め、そのあと rates を当てる」階層的推論。「等価トポロジー問題」を避けるための分解であり、1 段で全部解こうとすると識別不能なローカルミニマムに落ちる。

本論文の方法論を 1 枚にまとめた地図。分類してから回帰という 2 段構成は計算神経科学では類例があるが、ここでは「同一データに対して複数の有効な HMM が存在しうる」という ion channel 特有の非識別性に対応するための必須の階層化。

フローチャート自体は明快だが、図には 「再シミュレートして \( \bar V_D, \bar V_R \) を計算して棄却判定する」という品質保証ループが描かれていない。本論文最大の貢献の一つがこのループなのに、Fig 2 はそれを省略してしまっている。本ノート §6 のパイプライン SVG では赤色で明示的に追加した。

Fig 3. Topology 推定性能（A: 18 トポロジー一覧, B: train size vs accuracy, C: confusion matrix recall/FNR, D: confusion matrix precision/FDR）

PDF Fig 3 caption: "Topology estimation of Markov models using neural networks. (A) Shows all possible linear five-state topologies that were all encompassed in the training dataset. They are grouped according to the number of open/closed states and their interconductance rank (number of independent C-O links). (B) The accuracy related to the size of the training dataset is displayed. (C, D) The confusion matrices were obtained by testing a single NN that has been trained with 10⁷ 2D-histograms. (C) The recall (diagonal) and FNR (off-diagonal). (D) The precision (diagonal) and FDR (off-diagonal)."

(b) サブパネルごとの解説

Fig 3A — 18 トポロジー一覧 🟢: 線形 5 状態トポロジーを open/closed の組合せで列挙: 4O+1C, 3O+2C, 2O+3C, 1O+4C, 0O+5C, etc.。さらに interconductance rank R（独立な C-O 接続数; Bruno-Yang-Pearson 2005）で R=1 列と R=2 列に分割。例えば COCOC は R=2（C-O が 2 本独立）、CCCOO は R=1。左右列の対応トポロジー（open ⇔ closed 入れ替え）は kinetic 的に等価ペア。【画像視覚情報】画像で確認: 各トポロジーは 5 つの円（C は灰色、O は色付き）が水平に直線配置され、隣接円間が線で結ばれた状態遷移図として描かれる。表は 縦に「2 列構造」で、左列が R=1、右列が R=2 にグルーピングされ、ラベル \( K_1, K_2, \ldots, K_{18} \) が振られている。各トポロジー記号（COCOC, CCCOO, OCCOC, ...）がカラーバーで色分けされ、C-O 接続の本数（=R）に応じて視覚的に同じ rank がまとまる。
Fig 3B — 学習サンプル数 vs 分類精度 🟢: 横軸: train size（10⁴, 10⁵, 10⁶, 10⁷; 各 3 回繰り返し平均 ± SD）。縦軸: accuracy。10⁴ → 10⁷ で単調増加、10⁷ で ~44%。10⁷ では patience を 4/6 epoch に短縮（計算コスト制約）。曲線がまだ飽和していないので「もっと学習データを増やせば改善余地あり」だが計算コストの限界。【画像視覚情報】画像で確認: 青いマーカー（誤差バー付き）の折れ線が右肩上がりで対数軸上ほぼ直線に近い。10⁴ 付近では accuracy ~0.18（=18 クラスのチャンスレベル 1/18≈5.6% を大きく上回るがまだ低い）、10⁷ で ~0.44 に到達。10⁷ でも上昇基調が止まっていない（飽和への変曲が視認できない）= 計算コスト制約で打ち切られた典型的な未飽和カーブ。
Fig 3C — Confusion matrix（recall / FNR）🟢: 18×18 行列。軸はトポロジー index（A 参照）。対角 = recall = \( K_i \) クラスの正解率、非対角 = FNR_{ij} = 真クラス i を j と誤分類する率。色（heatmap）で値を表現。「開発者視点」のメトリクス。【画像視覚情報】画像で確認: 緑系のグラデーション heatmap。対角線が最も濃い緑で明確に視認できるが、注目すべきは 非対角の「明るい緑のブロック構造」が 3〜4 ヶ所のクラスタとして浮かび上がっていること（左上、中央、右下付近）。これらのブロックは Fig 3A で 同 rank の隣接トポロジー族に対応しており、NN の混同が「等価トポロジー族の内部」に集中していることを視覚的に証明している。最外周の数行は対角線が比較的薄く、混同が広範囲（特に閉状態が多いトポロジーで予測困難）。
Fig 3D — Confusion matrix（precision / FDR）🟢: 同じ 18×18 だが、対角 = precision = NN が i と予測した時に真に i である確率 \( P(y|x) \)、非対角 = FDR_{ij}。「実験者視点」のメトリクス。NN の予測が出た後で「その予測がどれだけ信頼できるか」を判定するのに使える。混同パターンは 同 rank の隣接トポロジーに集中。【画像視覚情報】画像で確認: 同じ緑グラデーションだが Fig 3C と比べて非対角の「縦方向の縞」が目立つ = ある予測クラスにいろいろな真クラスが流れ込むパターン。Fig 3C が「真→予測の横方向広がり」を見せるのに対し、Fig 3D は「予測→真の縦方向広がり」を見せ、両方を見ることで 「NN がどのトポロジーを過剰予測しがちか」「どのトポロジーが過小予測されがちか」の双方向情報が得られる構造になっている。

44% は一見低いが、(C)(D) の混同パターンを見ると 等価トポロジー族の内部での混乱が支配的。著者の戦略は「top-3 候補を出して、各候補の rates NN を回し、\( \bar V_D \) で棄却判定する」。つまり 1 段目の topology NN は厳密な分類器ではなく「候補絞り込み器」として使うのが正しい運用。

これは神経科学的に深い問題: チャネルの状態構造（例「閉 3 + 開 2」か「閉 2 + 開 3」か）は完全に決まらないことが多い（Bruno-Yang-Pearson 2005 が等価類を解析的に列挙する方法は無いと結論）。混同行列が 等価トポロジー族の境界を浮かび上がらせる「副産物としての構造発見」になっている。ただし本論文は 5 状態線形のみ扱う。実際のチャネルは分岐や閉ループを持つ（cyclic gating, allosteric, Markov-Hill model）ので、18 クラスでは表現できない。Discussion で著者も認めている。

Fig 4. COCOC / CCCOO のレート推定散布図（A,B: best, C,D: worst）

PDF Fig 4 caption: "Transition rates estimation of COCOC and CCCOO models. The regression architecture (Fig. 1A) was trained using datasets No. 2 and 3. (A, B) illustrate the predictions for the overall best-predicted rates k₅₄, k₃₄, and (C, D) for the worst-predicted rates k₂₁, k₂₁ according to the overall RAE score for COCOC and CCCOO. Each test dataset contains 10,000 samples. The orange short-dashed line and the red dashed line indicate error scores (RAE) equal to 0.6 and 1.0."

(b) サブパネルごとの解説

Fig 4A — COCOC, best rate k₅₄ 🟢: 散布図: 横軸 \( k_\mathrm{GT} \)（log）、縦軸 \( k_\mathrm{Pr} \)（log）。10000 個のテストサンプル。対角線（y=x）に綺麗に乗る。k₅₄ は COCOC の右端 C₅-O₄ 遷移（C-O 接続）なので電流変化として観測される。Label rearrangement で \( k_{12} > k_{54} \) を強制したため、k₅₄ の最大値側はサンプルが少ない（注意点）。【画像視覚情報】画像で確認: 散布点は 10² 〜 10⁵ s⁻¹ のほぼ全範囲で対角線上に「細い帯」として集中。RAE=0.6 / RAE=1.0 の橙/赤破線が示されており、散布点のほぼ全てが RAE=0.6 帯の内側に収まる。最大値（10⁵ 付近）でやや帯の幅が増すが、外れ値はほぼゼロ。Best という形容が画像から納得できる「ほぼ直線」の散布。
Fig 4B — CCCOO, best rate k₃₄ 🟢: 同様の散布図。k₃₄ は CCCOO の唯一の C-O 接続（C₃-O₄ 遷移）。よく予測されるが、遅いレート（低 GT）側で散乱（outliers）。CCCOO は C-O 接続が 1 本しかなく、遷移イベントが COCOC より少ない → 統計が悪化。【画像視覚情報】画像で確認: Fig 4A と同様に対角線上に集中するが、低 GT 側（10²〜10³）で散布の幅が明らかに広がる。一部点が RAE=0.6 帯の外（橙破線の外側）に外れる。高 GT 側（10⁴〜10⁵）では非常に密に対角線に乗る。CCCOO のイベント数依存性（イベントが少ないほど推定精度低下）が、低レート側のばらつき増加として視覚化されている。
Fig 4C — COCOC, worst rate k₂₁ 🟢: k₂₁ は O₂ → C₁ 遷移（左端 C-O 接続の逆向き）。「worst」と書きつつ、それでも良い相関。COCOC は C-O 接続が 2 本（C₁-O₂ と O₄-C₅）あるので、どこも比較的観測しやすい。【画像視覚情報】画像で確認: Fig 4A よりも散布の 「帯の厚み」が明確に増すが、それでも対角線上のクラスタを保持。RAE=0.6 帯の中に大半が入る。Fig 4A との比較で「worst でもこれだけ良い」が視覚的に明らか。
Fig 4D — CCCOO, worst rate k₂₁ 🟢: k₂₁ は C₂ → C₁ 遷移（intraconductance: C-C 遷移）。電流が変化しないので直接観測不能。NN 予測は広く散乱、明らかに対角線から外れる点が多数。これは NN の失敗ではなく、観測量に情報が無いという情報論的必然。【画像視覚情報】画像で確認: Fig 4A〜C と一線を画して 散布点が「対角線」というより「広い扇形のクラウド」に近い。低 GT 側では 多くの点が垂直に立ち上がる（GT が小さくても prediction が大きい = NN が過大予測）のが視認でき、RAE=1.0 帯（赤破線）を超える点も多数。これは「NN が k₂₁ をうまく推定できず、prediction が訓練範囲の中央値付近 ~10³ に張り付く」傾向を示しており、観測情報が無い遷移を NN は「平均的な値」で埋めるという挙動が視覚的にはっきり見える（非識別性の直接的可視化）。

「C-O 遷移はイベントとして観測される / C-C・O-O は intraconductance なので電流変化を生まない → 直接観測できない」という単純で深い原理が散布図の質に直結。COCOC（C-O 接続 2 本）は CCCOO（同 1 本）より全体的に予測が良い。

非識別性（non-identifiability）の問題が「best vs worst」という形で可視化されている。Hodgkin-Huxley の m·h ゲートのように 機能的に重要な C-C 遷移（allosteric）も実際は存在するが、本手法では原理的に弱い。Discussion で「joint fit（電位 / 濃度依存）で intraconductance に制約を入れる」案が出ているが未実装。パッチクランプ + voltage-jump + structural prior（cryo-EM 構造から得た連結パターン）の組合せが本来の方向性。

Fig 5. レート推定の総合評価（A,B: 全レート cumulative RAE, C,D: 確率的揺らぎ箱ひげ, E,F: イベント数 vs RAE）

PDF Fig 5 caption: "Analysis of the transition rates estimation for COCOC and CCCOO models. (A, B) Cumulative distributions of error scores (RAE) for each kij, with paired rates (k12-k21 etc.) visualized as hatched areas. Pink dotted line: randomly predicted rates baseline. (C, D) Five models selected at 100/75/50/25/0 percentile, each re-simulated 1000 times. Box-and-whiskers show median, 25/75/10/90 percentiles. Orange dots: 2D-Fit comparison (4 time series, 64 ensemble runs each). (E, F) Ranked RAE vs number of detected events. Red line: 1025-window geometric average. Dashed blue in (F): 100 M sample training (dataset 4)."

(b) サブパネルごとの解説

Fig 5A — COCOC 全レート cumulative RAE 🟢: 10000 個テストサンプルの RAE 累積分布を 8 個の \(k_{ij}\) ごとにプロット。ペア（k₁₂-k₂₁ など）は hatched area で視覚連結。pink dotted = ランダム予測 baseline から大きく左にシフト = NN は学習している。C-O 接続 2 本のため全レートが比較的良好。【画像視覚情報】画像で確認: 8 本の cumulative 曲線が 全て同じ向き（左下→右上）に立ち上がり、互いに非常に近接した「束」を形成。RAE=0.5 付近で約 70-80% の cumulative fraction に到達 → 大半のサンプルが RAE<0.5 で予測されている。pink dotted の random baseline は右側（RAE~1.5-2.0 付近）に大きく離れて配置され、NN が一様にランダムを超越していることが視覚的に明白。
Fig 5B — CCCOO 全レート cumulative RAE 🟢: 同様だが k₃₄/k₄₃（唯一の C-O 接続 = gateway state）が最良、k₂₁ などの distant C-C は曲線が右に寄る（RAE 大）= 予測悪い。C-O 接続の数が情報量を決める原理が定量化される。【画像視覚情報】画像で確認: Fig 5A と比較して 8 本の曲線が 明らかに「ファンアウト」して広がる。最左の曲線（k₃₄/k₄₃, gateway）は RAE~0.3 で 80% 到達と非常に良いが、最右の曲線（k₂₁ / 遠い C-C 遷移）は RAE~1.0 でようやく 50% という遅延。「曲線の束のばらけ方」自体が「トポロジー内のレートごとの情報量勾配」を可視化している。
Fig 5C — COCOC, 確率的揺らぎ箱ひげ（5 model × 1000 simulation）🟢: 横軸: 100/75/50/25/0 percentile（model ランク）。縦軸: 1000 再シミュレーション + 再予測した RAE の分布（box: median + 25/75 percentile, whiskers: 10/90 percentile）。100 percentile（best）は箱が小さい = 安定、低 percentile は箱が大きく散らばる。橙ドット = 2D-Fit による同モデルの予測（4 time series, ensemble 64）— NN と性能拮抗、勝ち負けがモデル依存。【画像視覚情報】画像で確認: 5 つの箱が左から右へ 系統的に高さが増す（best ランクは縦に短い箱、worst ランクは縦に長い箱）。橙ドットは箱の 中央付近に散らばり、箱の上下に外れない → NN box 内に 2D-Fit ドットが収まる = 「同等性能」が視覚的に明示される。Best 箱が極めて compact（高さ ~0.05 オーダー）に対し、Worst 箱は高さ ~0.5 オーダーに広がる。
Fig 5D — CCCOO, 確率的揺らぎ箱ひげ 🟢: 同様。CCCOO はそもそも「同一 HMM 由来でも別個のヒストグラム」が出やすく、箱の散らばりが COCOC より大きい。これは「予測誤差」ではなく「観測そのものの確率的変動」。【画像視覚情報】画像で確認: Fig 5C と並列で見ると Best 箱の高さは Fig 5C とほぼ同等だが、Median〜Worst 箱の高さが Fig 5C より明らかに大きい。さらに Worst 箱は whisker が縦軸の上端まで届くほど巨大。CCCOO の確率的不安定性が「ランク低下に伴う急激な箱の膨張」として視覚化。
Fig 5E — COCOC, ranked RAE vs detected event count 🟢: 左軸: 順位付き RAE (blue line)、右軸: 該当 2D-histogram のイベント数 (orange dots) と 1025-window 幾何平均 (red line)。COCOC ではイベント数と RAE に強い相関なし（情報飽和）。【画像視覚情報】画像で確認: 青い RAE 曲線が 緩やかな S 字状（sigmoid 様）でランクに従って上昇するが、右軸の橙のイベント数ドットは RAE のランク上昇に連動せずほぼ水平に散らばる。赤い 1025-window 幾何平均線も水平に近い。 = イベント数が「RAE を決める主要因」ではない（COCOC は情報飽和済み）。
Fig 5F — CCCOO, ranked RAE vs detected event count 🟢: 同様。CCCOO では明確な逆相関（イベント数が多いほど RAE 小 = 予測良）。C-O 接続が 1 本だけなのでイベント数が直接効く。dashed blue = 100 M サンプル学習（dataset 4）で RAE がさらに改善 — データ量を増やせば良くなる典型例。【画像視覚情報】画像で確認: Fig 5E と対比すると 橙ドットが明確に右下がりトレンドを示し、赤い幾何平均線も 右下がりの傾斜 を見せる。さらに、青の dashed line（100 M 学習）は solid line（10 M 学習）より明確に下方にシフト = データ量を 10 倍にすると RAE が体系的に低下。Fig 5E と Fig 5F の対比が「情報飽和済 vs 未飽和」を 1 画面で対照する設計。

レート推定の (i) どのレートが良く/悪く予測されるか、(ii) 確率的揺らぎがどれだけ大きいか、(iii) イベント数（= 記録長）を増やせば改善するかの 3 軸を 1 つの Figure にまとめた総合評価。COCOC と CCCOO の対比により 「C-O 接続数」「イベント数」「学習データ量」がどう絡むかが立体的に分かる。

著者は控えめだが、(C)(D) の 「2D-Fit との性能拮抗」は注目に値する。計算コストが ~10⁹ 倍違うのに精度は同等とは、本論文の主張の強さの核心。一方、CCCOO の確率的揺らぎが大きいことは「同一 HMM 由来でも別個のヒストグラムが出る」ことを意味し、in vivo の異質性議論（neuronal heterogeneity, single-cell variability）で必ず参照すべきデータ。逆に言えば、CCCOO で「予測が散らばった」だけでは「データが少ない」とも「モデルが間違っている」とも「非識別」とも判定できない多義性が残る。

Fig 6. 低 SNR (=2) での予測評価（A-C: 時系列 + 2D-histograms 3 ranks, D-F: 再予測レート分布, G: 全 SNR cumulative）

PDF Fig 6 caption: "Evaluation of the predicted transition rates of time series with a low signal-to-noise ratio. Datasets No. 2 (SNR=5) and No. 5 (SNR=2) of COCOC topology. (A-C) Excerpts of time series for best-predicted (A), median (B), worst-predicted (C) models, with corresponding 2D-histograms (2D_GT, 2D_Pr) and 2D_Diff. 100 simulations of each predicted model. Volume deviations V_D(G, H_1..H_100) and V_R(H_1..H_100) shown on histograms. (D-F) Distribution of 100 re-predicted rates kij; orange dots = ground truth. (G) Cumulative RAE for SNR=5 (solid) and SNR=2 (dashed); pink dashed = random baseline."

(b) サブパネルごとの解説

Fig 6A — Best model（top-ranked）🟢: 上段: GT 時系列 + 予測時系列 + 拡大セグメント（HOHD idealization 重ね）。中段: 2D_GT（横軸 closed dwell time, 縦軸 open dwell time, 各 0.01–100 ms log）+ 2D_Pr + 2D_Diff。下段: 電流振幅ヒストグラム（GT vs Pred, 赤線 = O/C amplitude）。\( \bar V_D = 0.125 \approx \bar V_R = 0.115 \) → 確率変動の範囲内 = 良予測。【画像視覚情報】画像で確認: Ground Truth 時系列と Prediction (Best) 時系列が「重ね描きしても見分けがほぼつかない」ほど一致。各遷移セグメントには レート値（2600, 41x, 12x 等）の数字が状態間の矢印に直接書き込まれた CCCOO 状態遷移ラベルが表示されている。横スケールバーは 10 ms。中段の 2D-histogram 3 つ（GT/Pr/Diff）はオレンジ系の濃淡で表現され、2D_GT と 2D_Pr がほぼ同じパターン（左下に明るいピーク、右上に薄い分布）、2D_Diff は ほぼ均一な低コントラストでほとんど差が見えない = 良予測の視覚的証拠。下段の電流ヒストグラムは GT (橙) と Prediction (青) の 2 ピーク（C level=0, O level）がほぼ完全に重なる。
Fig 6B — Below average model（median 付近）🟢: 同じ構成。\( \bar V_D = 0.238 > \bar V_R = 0.192 \)。2D_Diff に多少のズレが見え、レート分布も Fig 6E で広がる → 「ユニークな解ではないかも」。著者は「\( \bar V_R \) が Fig 6A より大きい = この HMM 自体が確率変動が大きい個体」とも指摘。【画像視覚情報】画像で確認: 時系列は Fig 6A よりも Ground Truth と Prediction (Below Average) の波形に微妙なズレが視認できる（オーバーシュート位置のずれ、振幅の不一致）。レート値も GT (4170, 6700, ...) と Pred (5830, 4710, ...) で 数字レベルで明らかな違い。2D-histogram は GT がオレンジ系のクリアなピーク、Pred は ピーク位置がやや拡散し、2D_Diff に 明確な「差分パターン」（明るい斑点）が現れる。電流ヒストグラムは GT/Pred のピーク位置がわずかにずれて見える。
Fig 6C — Worst model（lowest-ranked）🟢: 同じ構成。\( \bar V_D = 0.867 \gg \bar V_R = 0.244 \)。2D_Diff に大きなズレ、電流ヒストグラムが GT と乖離。予測棄却すべき。【画像視覚情報】画像で確認: 時系列の 波形が GT と Prediction (Worst) で本質的に異なる = 開閉パターンの周波数も振幅エンベロープも乖離。GT のレート値 (384, 175x, 190x, 14x) と Pred のレート値 (820, 1100x, 232x, 4450x) は 桁違いに乖離。2D-histogram は GT (オレンジ) と Pred (青/ 違う色相に切り替わって表示) で「pattern が明らかに違う位置」にクラスタが形成。2D_Diff は 強い blue/orange の差分模様 が浮かび、ground-truth-free でも「これは外れ予測」と判定できる視覚的明確さ。
Fig 6D — Best model の 100 回再予測レート分布 🟢: Box-whisker plot で 8 個の \(k_{ij}\) の再予測分布を表示。橙ドット = GT。箱が小さく、中央値が GT に重なる。水平 dashed line = NN 学習時のパラメータ範囲（境界）。境界に張り付くレートは外挿の警告。【画像視覚情報】画像で確認: 8 つのレートの箱は 全て縦に短く（log スケール上で ~0.3-0.5 桁の高さ）、橙ドット（GT）が箱の中央〜中央線付近に確実に乗る。誤差バーは小さい。非常に「コンパクト」な分布で、再予測のばらつきが小さい = 解がユニークであることを定量的に証明。
Fig 6E — Below average model の再予測分布 🟢: 箱が広がる。「予測ユニークでない」定量的証拠。一部 \(k_{ij}\) は GT から離れた中央値。【画像視覚情報】画像で確認: 8 箱のうち 少なくとも 2〜3 箱が縦に大幅に広がる（高さ ~1-2 桁）。橙ドット (GT) が一部の箱の 「whisker の上端付近」または「外」に位置する。中央値線も GT から数倍ずれる。「再予測のばらつきが大」=「複数の解候補が並存する non-uniqueness」の視覚化。
Fig 6F — Worst model の再予測分布 🟢: 箱が極端に広がる + GT が箱の外。明確に non-identifiable / 失敗。【画像視覚情報】画像で確認: 大半の箱が 縦に 3-4 桁の巨大な高さ。一部の箱は学習範囲（dashed horizontal lines）の上端 / 下端まで届く = NN が「学習データの端」に予測を吐き出している。橙ドット (GT) が多くの箱の外側に位置 = 再予測してもどこにも収束しない non-identifiability の決定的可視化。
Fig 6G — 全テストセット cumulative RAE（SNR=5 vs SNR=2）🟢: 8 個の \(k_{ij}\) について、SNR=5 (solid) と SNR=2 (dashed) の cumulative RAE をペア（k₁₂-k₂₁ など）で重ね描き。SNR を 5 → 2 に下げると精度低下するが、全レートが ~同じ程度。pink dashed = random baseline。SNR=2 でも baseline からは大きく改善 = NN は機能。【画像視覚情報】画像で確認: 4 つのサブパネル（各レートペア）が並ぶ。各パネル内で SNR=5 (solid) は左上に位置し、SNR=2 (dashed) は明確に右下にシフト。両者の差は ~0.2-0.3 RAE 程度（SNR=2 の方が dashed が右に約 0.2-0.3 ずれている）。pink dashed (RND) は最右下で、SNR=2 でも RND より大きく左にあることが視覚的に確認できる = NN は SNR=2 下でも有意な学習を維持。

本論文最大の実用的貢献を凝縮した Figure。(A)(B)(C) で「individual prediction の品質を ground-truth-free に判定する」スコアの実例、(D)(E)(F) でレートの不確実性定量化（UQ）、(G) で集団レベルの SNR 影響を一気に示す。実験者が見るべき箇所は (B): 「\( \bar V_D \) が \( \bar V_R \) より明らかに大きいが極端ではない」場合に「予測は怪しいので別トポロジー候補も試そう」と判断するのが正しい運用。

\( \bar V_D \) vs \( \bar V_R \) の判定基準は 定性的（"approximately equal" vs "considerably larger"）であり、しきい値が明示されていない。実験者が "0.238 vs 0.192" を「これは怪しい」と判定できるかは経験依存。明示的なしきい値（例えば \( \bar V_D / \bar V_R > 2 \) で棄却）か信頼区間 CI の提案があると親切。Discussion で著者は Hines et al. (2014) の Bayesian 信頼区間と哲学的に同等と述べるが、具体的な統計検定への接続は未整備。

Fig 7. Fast gating（k₄₅, k₅₄ が 10–1000 ks⁻¹）の評価（A-C: 時系列 + 2D-hist 3 ranks, D-F: Confidence box plot 3 ranks, G: Confusion Distributions 4 散布図）

PDF Fig 7 caption: "Transition rates estimation for COCOC models including fast gating rates. k₁₂ to k₄₃ in 0.1–10 ks⁻¹ range; k₄₅, k₅₄ in 10 ks⁻¹–1 Ms⁻¹ (above 10 kHz corner frequency). Regression NN trained on dataset No. 6. (A-C) Time series excerpts for best/median/worst models with 2D-histograms (2D_GT, 2D_Pr, 2D_Diff) and current distributions. 100 re-simulations. (D-G) Scatter plots on test dataset. (D, E) Slow rates k₃₂ and k₃₄ (worst overall). (F, G) Fast rates k₄₅ and k₅₄. Orange/red dashed: RAE = 0.6 / 1.0."

(b) サブパネルごとの解説

Fig 7A — Best fast-gating model 🟢: Fig 6A と同一構造。Fast gating 領域では フリッカリング（高速点滅）が時系列に現れる。\( \bar V_D \approx \bar V_R \) で良予測。電流ヒストグラムは fast gating によって O level が「歪む」（apparent level reduction、ローパスによる平均化）。【画像視覚情報】画像で確認: GT 時系列の特定箇所に 「縦線が密集した黒い帯」が高頻度に現れる = フリッカリング（高速点滅）の視覚的シグネチャ。これが fast gating の指紋。Prediction (Best) も同じ位置に同様の帯を再現。電流ヒストグラムは O level のピーク位置が予想より下にシフトし、ピーク高さも低い（apparent level reduction が明示）が、GT/Pred のヒストグラム形状はほぼ一致。
Fig 7B — Below average fast-gating model 🟡: 同様。open level が apparent に「下がる」（ローパスフィルタによる時間平均が完全に開く時間を確保できない）= fast gating の指標。\( \bar V_D > \bar V_R \) でやや怪しい。【画像視覚情報】画像で確認: GT のフリッカリング帯が Prediction では「振幅が小さい」または「タイミングがずれる」形で再現される。2D-histogram の Diff に明確な差分パターン。電流ヒストグラムの O ピーク位置は GT に近いが、形状の skewness（歪度）が GT より小さい印象。
Fig 7C — Worst fast-gating model 🟢: 赤矢印で示された fast gating エピソードを NN が捉え損なっている。「baseline gating」は再現できているが、稀な fast event が再シミュレートでは欠落 = 予測棄却。【画像視覚情報】画像で確認: GT 時系列に 赤い矢印が明示的に書き込まれており、その指し示す箇所に「短く密な高頻度遷移エピソード」が視認できる。一方 Prediction (Worst) の同じ時間範囲を見ると、このフリッカリングエピソードが完全に欠落し、平坦な open level として表現されている。著者の指摘通り「NN が rare fast event を学習せず、平均的な slow gating で塗り潰す」失敗モードの視覚的証拠。
Fig 7D — Confidence k_i（Best）🟢: ※前回のテキスト解説では Fig 7D を「Slow rate k₃₂ 散布図」と記載していたが、画像で確認した結果、実際の Fig 7D-F は「Confidence k_i」の縦長ボックスプロット（再予測 100 回の分布）であり、Fig 6D-F と同じ構造である。Fig 7 全体の構造は (A-C) 時系列 3 ranks + (D-F) Confidence box plot + (G) Confusion Distributions 4 散布図 = Fig 6 と同じレイアウト + Fig 4 風散布図の付加版。前回の解説は legend テキストのみから誤読していた。
【画像視覚情報】横軸: \( k_{12}, k_{21}, k_{23}, k_{32}, k_{34}, k_{43}, k_{45}, k_{54} \)（8 個の \(k_{ij}\)）。縦軸: Value (s⁻¹, log scale, 10⁰〜10⁶)。Best ranked model の 100 回再予測値の box-whisker。箱が縦に短く、青ドット（中央値）がほぼ水平な並びになる → fast gating レート k₄₅, k₅₄ も含めて再予測のばらつきは小さい = Best model では fast rate も識別可能。
Fig 7E — Confidence k_i（Below Average）🟢: 【画像視覚情報】Fig 7D と同じ軸構造。Below Average ranked model。箱が縦に明確に広がり、特に k₂₃, k₃₂ 付近で whisker が長い。一部の中央値は GT 線（橙系の dashed?）から離れる。fast rate k₄₅, k₅₄ の箱は依然比較的狭く、slow rate の方が再予測ばらつきが大きい逆転傾向が視認できる。
Fig 7F — Confidence k_i（Worst）🟢: 【画像視覚情報】Fig 7D と同じ軸構造。Worst ranked model。箱が縦に巨大（高さ 3-4 桁）で、特に slow rate k₂₃, k₃₂ で whisker が縦軸の上端・下端まで届く。一部の中央値は learning range の境界（dashed horizontal lines）に張り付く = 外挿警告。Worst model では「再予測がどこにも収束しない」non-identifiability が視覚化される。
Fig 7G — Confusion Distributions k_i（4 散布図: k₂₅?, k₁₅?, k₄₅, k₅₄）🟢: ※前回 Fig 7G を「Fast rate k₅₄ 散布図」と単一とした記述は誤り。実際は 4 つの散布図が横並びで描かれ、ラベルは（読み取り限界あり）k_{25}? / k_{15}? / k₄₅ / k₅₄ と推定される（解像度限界 🟡）。
【画像視覚情報】各散布図の横軸 = Ground Truth [1/s] (log)、縦軸 = Prediction [1/s] (log)。10⁰〜10⁶ の広範囲。4 枚とも対角線（y=x）に明瞭な「密な帯」が形成され、点群が対角線上に集中。注目すべきは：(i) slow rate（左の 2 散布図）は対角線にきれいに乗る、(ii) fast rate k₄₅, k₅₄（右の 2 散布図）も 10⁴〜10⁵ s⁻¹ までは対角線にきれいに乗るが、10⁵〜10⁶（300 ks⁻¹ 以上の領域）で帯の幅が広がる。これが著者の主張「300 ks⁻¹ 以上で精度劣化するが識別は維持」を画像で確認した内容。

「遮断周波数（10 kHz）を超える fast gating でも、k = 1 Ms⁻¹ までレートを再構成可能」を実証。古典的な dwell-time 解析（Magleby-Pallotta, Sigworth）では原理的に届かなかった領域。仕組みは Magleby-Weiss (1990) の "errors cancel out in simulation matching" の DL 版。

電位依存性 Na チャネルの inactivation の早い相（μs スケール）を狙える可能性がある。Hodgkin-Huxley の m·h 構造の m gate が実は数百 kHz スケールの遷移を含んでいる、という長年の疑念に切り込める。著者の先行研究（Huth 2008, Nav1.2a + chloramine-T）と組み合わせた再分析が期待される。一方で fast gating 領域では「open level の見かけ低下」を NN がどう判定しているか不透明（attribution map なし）。解釈可能性（XAI）の観点で blind spot。

Fig 8. Patch-clamp 実機データでの評価（A: step response, B: noise spectra, C,D: SNR≈6, 8 の NN 比較）

PDF Fig 8 caption: "Transition rates estimation for data generated with the patch-clamp setup. (A) Experimentally derived step response of patch-clamp setup deviates from simulated 4-pole low-pass Bessel filter. (B) Power spectra of simulated and recorded noise. Blue: bath resistor (10 MΩ), orange: patch resistor (10 GΩ), brown: real cell-attached; red arrows indicate stray noise. Simulated: cyan (Bessel-filtered white), green/red/lime (power-spectrum-based). (C, D) Eight NNs trained with combinations of step response × noise type (Table 1 datasets 7-10 for SNR=4-6; 11-14 for SNR=8-10). Box-whisker on 100 semi-synthetic time series at SNR≈6 (C) and SNR≈8 (D). Kruskal-Wallis + Dunn's test (**p<0.01, ***p<0.001). Orange stripe: NN test set baseline; green stripe: random rates."

(b) サブパネルごとの解説

Fig 8A — Step response 比較（実機 vs Bessel filter）🟢: 時間プロファイル: 横軸 sample (~45 sample @ 100 kHz, 約 0.45 ms), 縦軸 normalized amplitude。実機 step response は steeper slope、振動が少ない。1000 回平均で得たもの。4-pole Bessel デジタルフィルタの理論応答は overshoot/ringing がやや目立つ。この「形の違い」が NN の汎化精度を左右すると著者は主張。【画像視覚情報】画像で確認: 実機曲線（黒系）と Bessel 曲線（橙系）が 同じ立ち上がり初期 (0〜~5 sample) はほぼ重なるが、立ち上がり中盤 (~10-20 sample) で Bessel が実機より上に行きすぎる「軽い overshoot」を示す。実機は overshoot をほぼ伴わず monotonic に近い立ち上がり。差は小さいが視認できる。
Fig 8B — ノイズの power spectrum 比較 🟢: 4 つの実機 noise source: 青（10 MΩ bath）、橙（10 GΩ patch）、茶（real cell-attached）、+ 3 つのシミュレーションノイズ: cyan（Bessel-filtered white）、green/red/lime（power spectrum-based for bath/patch/cell-attached）。赤矢印で stray noise（電源由来の細いピーク、~50/60 Hz とその高調波）を指摘。cell-attached のみ stray noise が現れる。Bessel-filtered white は実機と spectral shape が大きく違う。【画像視覚情報】画像で確認: 横軸 Freq (Hz, log scale, 10⁰〜10⁵)、縦軸 Power (log)。低周波 (~10² Hz 以下) では全曲線がほぼ一致するが、10²〜10⁴ Hz の中域で実機 (橙, 茶) と Bessel-filtered white (cyan) が大きく乖離。cell-attached (茶) のみ 10²〜10³ Hz 帯に「鋭いピークが複数本立つ」= 赤矢印で指摘される stray noise (電源高調波)。Power-spectrum-based シミュレーション（green/red/lime）は実機曲線とほぼ重なる = うまく実機を再現できている。
Fig 8C — SNR ≈ 6 での NN 性能（8 NN × 100 semi-synthetic）🟢: 横軸: NN identifier（noise type + step response の 4 組合せ × 2 SNR 範囲 = 8 NN）、縦軸: RAE。Box = median + 25/75 percentile, whiskers = 10/90。experimental noise + experimental step response 組合せが最良で、純シミュレーションテストセット（orange stripe）と同等の RAE 中央値を達成。Kruskal-Wallis + Dunn's で有意差（**, ***）を示す。「シミュレーションのリアリズム = NN の汎化性能」を定量的に証明。【画像視覚情報】画像で確認: 8 つの箱が横並び。左端の 1-2 箱（純粋 Bessel + lp-filtered white）は箱が縦に高く、中央値が高い RAE。右側に進むにつれて箱が縮み、中央値が下がる= ノイズ・ステップ応答を実機に寄せると性能が改善。右端付近の experimental + experimental NN は箱が最小で、橙色のストライプ (NN test set baseline) とほぼ同じ高さに中央値が来る。緑のストライプ (random rates) は箱の上方に位置し、全 NN が random より顕著に良い。** と *** の有意マーカーが箱と箱の間に描かれる。
Fig 8D — SNR ≈ 8 での NN 性能 🟢: 同様。SNR=8 ではノイズの影響が小さくなり、ノイズ種よりステップ応答の正確さが支配的。実機 step response を使った NN が依然優秀。orange stripe（純シミュレーション test）にはやや及ばないが許容範囲。【画像視覚情報】画像で確認: Fig 8C と同じ構造だが、全体的に箱が低い位置（RAE 小）に下がる= SNR が良いと全 NN が改善。左右の差は Fig 8C より小さい（ノイズの影響が小さくなったため、ノイズ種を実機に寄せる効果が薄い）。Step response を実機に寄せた NN は依然として右側に固まる。

本論文の 「ドメイン適応」の核心を示す Figure。「シミュレーションで作った合成データで NN を学習し、実機 patch-clamp データに転移できるか?」という根本的な疑問に対し、(A)(B) で「シミュレーションを実機に寄せる工夫（ensemble step response + power-spectrum noise）」を示し、(C)(D) でその工夫が実際に NN 性能を改善することを ablation で実証。

本論文最大の 「神経科学コミュニティが疑うべきポイント」。Dataset 15/16 は patch-clamp setup で ideal time series を voltage command として再生した「セミ合成」データであり、真の生細胞由来 single-channel データではない。著者も Discussion で「open channel noise が再現できない技術的制約」と認める。HEK 293T で発現させた生細胞 BK / Nav1.2a データへの転移は次の課題。さらに stray noise（red arrows）は cell-attached でしか現れない実環境特有のアーティファクトで、bath/patch 抵抗だけで学習した NN がこれを正しく扱えるかは不透明。「学習時の noise spectrum」と「推論時の noise spectrum」の不一致 = covariate shift は ML の標準的な落とし穴であり、各実験ラボで再学習が必要になる可能性が高い。

論文	関連性
Oikonomou et al. (2023) "2D-dwell-time analysis with simulations of ion-channel gating using high-performance computing" Biophysical Journal 122(7):1287-1300. PMID: 36814379 / DOI: 10.1016/j.bpj.2023.02.023	本論文の直接の先行研究。MPI 並列で 2D-Fit を実装した HPC 版。Deep Learning 版（本論文）は推論時間を 16–48 ノード時間 → 67 ms に短縮し、リアルタイム化を実現。
Richter-Laskowska et al. (2021) "Application of Machine-Learning Methods to Recognize mitoBK Channels from Different Cell Types Based on the Experimental Patch-Clamp Results" Int. J. Mol. Sci. 22(2):840. PMID: 33467711 / DOI: 10.3390/ijms22020840	異なる細胞種由来の mitoBK チャネル動態を K-NN とオートエンコーダで分類。本論文と同じく「NN を patch-clamp 解析に持ち込む」流れの中核。本論文と違い HMM 構造を陽に推定しない fingerprint 分類で、相補的なアプローチ。
Almanjahie et al. (2019) "Moving average filtering with deconvolution (MAD) for hidden Markov model with filtering and correlated noise" Eur. Biophys. J. 48(4):383-393. PMID: 31028435 / DOI: 10.1007/s00249-019-01368-1	低 pass フィルタと相関ノイズを EM アルゴリズムで取り扱う HMM。本論文と同じ問題（フィルタ + ノイズ）を「シミュレーション + NN」ではなく「解析的 deconvolution + EM」で攻める対照的手法。MscL チャネルで検証。
Langthaler et al. (2022) "Ion Channel Modeling beyond State of the Art: A Comparison with a System Theory-Based Model of the Shaker-Related Voltage-Gated Potassium Channel Kv1.1" Cells 11(2):239. PMID: 35053355 / DOI: 10.3390/cells11020239	HH と HMM に対しシステム理論ベースの伝達関数モデルを提案。Kv1.1（KCNA1）で実装。「データドリブンで biological prior を最小化」する点で本論文と思想が近い。神経興奮性 / てんかん研究への展開で重要。

イオンチャネル開閉のリアルタイムマルコフモデリングへの深層学習アプローチ
Oikonomou et al. (2024), Communications Chemistry 7:280

1. 書誌情報

2. 略語・記号リスト

3. 要旨 — 神経科学者の一言

4. Fig 解説 — 全 Figure / Table の精読（サブパネル単位）

(b) 列ごとの読み

(b) 行ごとの読み

(b) サブパネルごとの解説

(b) 図中要素の解説（サブパネル無し）

(b) サブパネルごとの解説

(b) サブパネルごとの解説

(b) サブパネルごとの解説

(b) サブパネルごとの解説

(b) サブパネルごとの解説

(b) サブパネルごとの解説

5. 本文の流れ（神経科学者視点での要約）

Introduction

Methods（特筆点）

Results（章ごと）

Discussion（重要論点）

6. 主要な数式・モデル

6.1 SNR の定義（式 (1)）

6.2 Bin occupancy のリスケーリング（式 (2)）

6.3 RAE スコア（式 (3)）

6.4 2D 差分ヒストグラム（式 (4)）

6.5 ボリューム偏差 \( V_D \)（式 (5)）と平均値 \( \bar V_D \)（式 (6)）

6.6 参照偏差 \( \bar V_R \)（式 (7)）

6.7 マルコフ生成行列 Q と \( P(t) = e^{Qt} \)（論文では暗黙だが核心）

7. 結論と意義

7.1 神経科学全体での位置づけ

7.2 後続研究・臨床応用への含意

7.3 残された問い（神経科学者として）

10. 確信度・出典

10.1 セクション別確信度

10.2 参考文献

イオンチャネル開閉のリアルタイム マルコフモデリングへの深層学習アプローチ Oikonomou et al. (2024), Communications Chemistry 7:280

1. 書誌情報

2. 略語・記号リスト

3. 要旨 — 神経科学者の一言

4. Fig 解説 — 全 Figure / Table の精読（サブパネル単位）

(b) 列ごとの読み

(b) 行ごとの読み

(b) サブパネルごとの解説

(b) 図中要素の解説（サブパネル無し）

(b) サブパネルごとの解説

(b) サブパネルごとの解説

(b) サブパネルごとの解説

(b) サブパネルごとの解説

(b) サブパネルごとの解説

(b) サブパネルごとの解説

5. 本文の流れ（神経科学者視点での要約）

Introduction

Methods（特筆点）

Results（章ごと）

Discussion（重要論点）

6. 主要な数式・モデル

6.1 SNR の定義（式 (1)）

6.2 Bin occupancy のリスケーリング（式 (2)）

6.3 RAE スコア（式 (3)）

6.4 2D 差分ヒストグラム（式 (4)）

6.5 ボリューム偏差 \( V_D \)（式 (5)）と平均値 \( \bar V_D \)（式 (6)）

6.6 参照偏差 \( \bar V_R \)（式 (7)）

6.7 マルコフ生成行列 Q と \( P(t) = e^{Qt} \)（論文では暗黙だが核心）

7. 結論と意義

7.1 神経科学全体での位置づけ

7.2 後続研究・臨床応用への含意

7.3 残された問い（神経科学者として）

8. 関連論文（PubMed find_related_articles より）

9. 関連項目（サイト内ノート）

10. 確信度・出典

10.1 セクション別確信度

10.2 参考文献

イオンチャネル開閉のリアルタイムマルコフモデリングへの深層学習アプローチ
Oikonomou et al. (2024), Communications Chemistry 7:280