評価結果

このページは、戦略ごとの検証結果を「同一条件で比較できる形」で整理したものです。
主目的は、10ETH固定保有 に対する超過収益（Alpha）の評価です。

1. 共通評価条件

ベンチマーク: benchmark_hold_eth = 10.0
公平比較時の初期条件: initial_position_eth = 10.0
執行モデル: limit-only
約定遅延: order_latency_sec = 0.3
発注間隔制御: min_order_interval_sec = 300
主指標:
- alpha_total_pnl_jpy
- alpha_sharpe
- alpha_max_dd
- orders / fills / turnover

2. Hold10 Softmax 系（本番想定区間）

対象期間: 2025-10-01〜2026-02-11

Strategy / Model	Alpha Total (JPY)	Alpha Sharpe	Alpha MaxDD	Turnover	Fills
`ml_hold10_softmax_overlay_aggressive (h60)`	+6,447,520	1.4869	-2,966,820	20	1
`ml_hold10_softmax_overlay_aggressive (h300, class-balanced)`	+4,052,820	1.2119	-2,842,080	240	12
`ml_hold10_softmax_overlay_derisk_only_aggressive (h300)`	+2,026,410	1.2119	-1,421,040	120	12

解釈:

利益最大化は h60 aggressive が優位。
ドローダウン抑制は h300 derisk_only_aggressive が優位。
目的（利益優先か安定優先か）で採用候補が分かれる。

3. Image / Transformer 系（OOS Shadow）

対象期間: 2025-10-01〜2026-02-11

Model	Target Corr	MAE (JPY)	RMSE (JPY)	Sign Acc
`image_alpha_linear`	0.00497	17,797.43	27,569.24	0.49398
`image_alpha_transformer`	0.00855	17,748.51	27,525.77	0.50096

解釈:

Transformer は線形より改善したが、単独採用にはまだ弱い。
現状は補助シグナル候補として扱うのが妥当。

4. 公平条件バックテスト（短区間の実運用比較）

対象期間: 2026-01-01〜2026-01-07
条件: initial_position_eth=10, benchmark_hold_eth=10

Strategy	Alpha Total (JPY)	Alpha Sharpe	Turnover
`ml_hold10_softmax_overlay_aggressive (h300)`	-49,736.68	-1.3825	30
`ml_hold10_softmax_overlay_cost_guard (h300)`	-67,406.68	-1.8707	30
`ml_hold10_softmax_overlay_aggressive (h60)`	-294,941.99	-7.0589	30
`ml_hold10_softmax_overlay_regime_blend (h60/h300)`	-557,827.13	-9.9928	2270
`baseline_technical_hold_overlay_adaptive`	-481,648.95	-27.7086	3438

解釈:

学習指標の改善と実運用Alphaは一致しない。
取引密度が高い戦略はコスト影響で悪化しやすい。

5. Stateful ラベル戦略（採用候補）

対象戦略: ml_hold10_softmax_overlay_derisk_only_aggressive
モデル設定: label_mode=stateful, switch_cost_bps=4, short_switch_extra_bps=8, switch_hysteresis_bps=1

5.1 月次評価

Period	Alpha Total (JPY)	Alpha Sharpe	Alpha MaxDD	Orders	Turnover
`2026-01-01〜2026-01-31`	+447,560	2.7803	-	19	190
`2026-01-01〜2026-02-11`	+1,142,330	3.7668	-660,230	19	190

比較対象（同条件）:

greedy_h300_q3: 取引0件、alpha_total_pnl_jpy = 0

5.2 Walk-forward（2026-01-01〜2026-02-11）

Window	Stateful Alpha Total (JPY)	Stateful Win Rate	Greedy Alpha Total (JPY)
7日	+732,210	50.0%	+213,660
14日	+1,142,330	66.7%	0
21日	+1,142,330	50.0%	0

解釈:

窓幅を変えても stateful が一貫して優位。
greedy は無取引化しやすく、機会損失が大きい。

6. Stateful の2年安定性評価

対象期間: 2024-02-12〜2026-02-11
窓設定: window_days=21, step_days=21

評価結果（最新）:

windows: 35
alpha_total_pnl_jpy: -754,150
alpha_win_rate（全窓）: 8.57%
active_windows（注文あり）: 7
active_alpha_win_rate: 42.86%
active_alpha_total_pnl_jpy: -754,150

解釈:

全窓勝率が低く見える主因は「非稼働窓」の多さ。
稼働窓ベースでも現状はマイナス優位で、長期安定性は未達。

7. 低勝率区間フォーカス分析

最悪窓: 2025-09-22〜2025-10-12

alpha_total_pnl_jpy: -37,500
days: 21
orders_total: 1
fills_total: 1
active_days: 1

分析所見:

問題は「過剰売買」ではなく「非稼働（機会未取得）」。
実質1トレードで成績が決まっており、タイミング誤差に脆弱。

8. 現時点の判断

短中期では stateful derisk_only_aggressive が有望。
ただし2年安定性は未達のため、次段階は次を優先:
1. 稼働率向上（無取引窓の削減）
2. 低勝率窓の再発防止（状態遷移条件の再設計）
3. long horizonでの再検証

9. 参照データ

data/derived/reports/experiment_summary_2026-02-14_hold10.csv
data/derived/reports/eval_hold10_stateful_walkforward_overall_2026-01-01_2026-02-11_w7.csv
data/derived/reports/eval_hold10_stateful_walkforward_overall_2026-01-01_2026-02-11_w14.csv
data/derived/reports/eval_hold10_stateful_walkforward_overall_2026-01-01_2026-02-11_w21.csv
data/derived/reports/stateful_stability_windows_2024-02-12_2026-02-11.csv
data/derived/reports/stateful_stability_overall_2024-02-12_2026-02-11.json
data/derived/reports/stateful_low_win_analysis/ETH_JPY_2025-09-22_2025-10-12/summary.json

1. 共通評価条件​

2. Hold10 Softmax 系（本番想定区間）​

3. Image / Transformer 系（OOS Shadow）​

4. 公平条件バックテスト（短区間の実運用比較）​

5. Stateful ラベル戦略（採用候補）​

5.1 月次評価​

5.2 Walk-forward（2026-01-01〜2026-02-11）​

6. Stateful の2年安定性評価​

7. 低勝率区間フォーカス分析​

8. 現時点の判断​

9. 参照データ​