評価結果
このページは、戦略ごとの検証結果を「同一条件で比較できる形」で整理したものです。
主目的は、10ETH固定保有 に対する超過収益(Alpha)の評価です。
1. 共通評価条件
- ベンチマーク:
benchmark_hold_eth = 10.0 - 公平比較時の初期条件:
initial_position_eth = 10.0 - 執行モデル: limit-only
- 約定遅延:
order_latency_sec = 0.3 - 発注間隔制御:
min_order_interval_sec = 300 - 主指標:
alpha_total_pnl_jpyalpha_sharpealpha_max_ddorders / fills / turnover
2. Hold10 Softmax 系(本番想定区間)
対象期間: 2025-10-01〜2026-02-11
| Strategy / Model | Alpha Total (JPY) | Alpha Sharpe | Alpha MaxDD | Turnover | Fills |
|---|---|---|---|---|---|
ml_hold10_softmax_overlay_aggressive (h60) | +6,447,520 | 1.4869 | -2,966,820 | 20 | 1 |
ml_hold10_softmax_overlay_aggressive (h300, class-balanced) | +4,052,820 | 1.2119 | -2,842,080 | 240 | 12 |
ml_hold10_softmax_overlay_derisk_only_aggressive (h300) | +2,026,410 | 1.2119 | -1,421,040 | 120 | 12 |
解釈:
- 利益最大化は
h60 aggressiveが優位。 - ドローダウン抑制は
h300 derisk_only_aggressiveが優位。 - 目的(利益優先か安定優先か)で採用候補が分かれる。
3. Image / Transformer 系(OOS Shadow)
対象期間: 2025-10-01〜2026-02-11
| Model | Target Corr | MAE (JPY) | RMSE (JPY) | Sign Acc |
|---|---|---|---|---|
image_alpha_linear | 0.00497 | 17,797.43 | 27,569.24 | 0.49398 |
image_alpha_transformer | 0.00855 | 17,748.51 | 27,525.77 | 0.50096 |
解釈:
- Transformer は線形より改善したが、単独採用にはまだ弱い。
- 現状は補助シグナル候補として扱うのが妥当。
4. 公平条件バックテスト(短区間の実運用比較)
対象期間: 2026-01-01〜2026-01-07
条件: initial_position_eth=10, benchmark_hold_eth=10
| Strategy | Alpha Total (JPY) | Alpha Sharpe | Turnover |
|---|---|---|---|
ml_hold10_softmax_overlay_aggressive (h300) | -49,736.68 | -1.3825 | 30 |
ml_hold10_softmax_overlay_cost_guard (h300) | -67,406.68 | -1.8707 | 30 |
ml_hold10_softmax_overlay_aggressive (h60) | -294,941.99 | -7.0589 | 30 |
ml_hold10_softmax_overlay_regime_blend (h60/h300) | -557,827.13 | -9.9928 | 2270 |
baseline_technical_hold_overlay_adaptive | -481,648.95 | -27.7086 | 3438 |
解釈:
- 学習指標の改善と実運用Alphaは一致しない。
- 取引密度が高い戦略はコスト影響で悪化しやすい。
5. Stateful ラベル戦略(採用候補)
対象戦略: ml_hold10_softmax_overlay_derisk_only_aggressive
モデル設定: label_mode=stateful, switch_cost_bps=4, short_switch_extra_bps=8, switch_hysteresis_bps=1
5.1 月次評価
| Period | Alpha Total (JPY) | Alpha Sharpe | Alpha MaxDD | Orders | Turnover |
|---|---|---|---|---|---|
2026-01-01〜2026-01-31 | +447,560 | 2.7803 | - | 19 | 190 |
2026-01-01〜2026-02-11 | +1,142,330 | 3.7668 | -660,230 | 19 | 190 |
比較対象(同条件):
greedy_h300_q3: 取引0件、alpha_total_pnl_jpy = 0
5.2 Walk-forward(2026-01-01〜2026-02-11)
| Window | Stateful Alpha Total (JPY) | Stateful Win Rate | Greedy Alpha Total (JPY) |
|---|---|---|---|
| 7日 | +732,210 | 50.0% | +213,660 |
| 14日 | +1,142,330 | 66.7% | 0 |
| 21日 | +1,142,330 | 50.0% | 0 |
解釈:
- 窓幅を変えても
statefulが一貫して優位。 greedyは無取引化しやすく、機会損失が大きい。
6. Stateful の2年安定性評価
対象期間: 2024-02-12〜2026-02-11
窓設定: window_days=21, step_days=21
評価結果(最新):
windows: 35alpha_total_pnl_jpy:-754,150alpha_win_rate(全窓):8.57%active_windows(注文あり): 7active_alpha_win_rate:42.86%active_alpha_total_pnl_jpy:-754,150
解釈:
- 全窓勝率が低く見える主因は「非稼働窓」の多さ。
- 稼働窓ベースでも現状はマイナス優位で、長期安定性は未達。
7. 低勝率区間フォーカス分析
最悪窓: 2025-09-22〜2025-10-12
alpha_total_pnl_jpy:-37,500days: 21orders_total: 1fills_total: 1active_days: 1
分析所見:
- 問題は「過剰売買」ではなく「非稼働(機会未取得)」。
- 実質1トレードで成績が決まっており、タイミング誤差に脆弱。
8. 現時点の判断
- 短中期では
stateful derisk_only_aggressiveが有望。 - ただし2年安定性は未達のため、次段階は次を優先:
- 稼働率向上(無取引窓の削減)
- 低勝率窓の再発防止(状態遷移条件の再設計)
- long horizonでの再検証
9. 参照データ
data/derived/reports/experiment_summary_2026-02-14_hold10.csvdata/derived/reports/eval_hold10_stateful_walkforward_overall_2026-01-01_2026-02-11_w7.csvdata/derived/reports/eval_hold10_stateful_walkforward_overall_2026-01-01_2026-02-11_w14.csvdata/derived/reports/eval_hold10_stateful_walkforward_overall_2026-01-01_2026-02-11_w21.csvdata/derived/reports/stateful_stability_windows_2024-02-12_2026-02-11.csvdata/derived/reports/stateful_stability_overall_2024-02-12_2026-02-11.jsondata/derived/reports/stateful_low_win_analysis/ETH_JPY_2025-09-22_2025-10-12/summary.json