メインコンテンツまでスキップ

評価結果

このページは、戦略ごとの検証結果を「同一条件で比較できる形」で整理したものです。
主目的は、10ETH固定保有 に対する超過収益(Alpha)の評価です。

1. 共通評価条件

  • ベンチマーク: benchmark_hold_eth = 10.0
  • 公平比較時の初期条件: initial_position_eth = 10.0
  • 執行モデル: limit-only
  • 約定遅延: order_latency_sec = 0.3
  • 発注間隔制御: min_order_interval_sec = 300
  • 主指標:
    • alpha_total_pnl_jpy
    • alpha_sharpe
    • alpha_max_dd
    • orders / fills / turnover

2. Hold10 Softmax 系(本番想定区間)

対象期間: 2025-10-01〜2026-02-11

Strategy / ModelAlpha Total (JPY)Alpha SharpeAlpha MaxDDTurnoverFills
ml_hold10_softmax_overlay_aggressive (h60)+6,447,5201.4869-2,966,820201
ml_hold10_softmax_overlay_aggressive (h300, class-balanced)+4,052,8201.2119-2,842,08024012
ml_hold10_softmax_overlay_derisk_only_aggressive (h300)+2,026,4101.2119-1,421,04012012

解釈:

  • 利益最大化は h60 aggressive が優位。
  • ドローダウン抑制は h300 derisk_only_aggressive が優位。
  • 目的(利益優先か安定優先か)で採用候補が分かれる。

3. Image / Transformer 系(OOS Shadow)

対象期間: 2025-10-01〜2026-02-11

ModelTarget CorrMAE (JPY)RMSE (JPY)Sign Acc
image_alpha_linear0.0049717,797.4327,569.240.49398
image_alpha_transformer0.0085517,748.5127,525.770.50096

解釈:

  • Transformer は線形より改善したが、単独採用にはまだ弱い。
  • 現状は補助シグナル候補として扱うのが妥当。

4. 公平条件バックテスト(短区間の実運用比較)

対象期間: 2026-01-01〜2026-01-07
条件: initial_position_eth=10, benchmark_hold_eth=10

StrategyAlpha Total (JPY)Alpha SharpeTurnover
ml_hold10_softmax_overlay_aggressive (h300)-49,736.68-1.382530
ml_hold10_softmax_overlay_cost_guard (h300)-67,406.68-1.870730
ml_hold10_softmax_overlay_aggressive (h60)-294,941.99-7.058930
ml_hold10_softmax_overlay_regime_blend (h60/h300)-557,827.13-9.99282270
baseline_technical_hold_overlay_adaptive-481,648.95-27.70863438

解釈:

  • 学習指標の改善と実運用Alphaは一致しない。
  • 取引密度が高い戦略はコスト影響で悪化しやすい。

5. Stateful ラベル戦略(採用候補)

対象戦略: ml_hold10_softmax_overlay_derisk_only_aggressive
モデル設定: label_mode=stateful, switch_cost_bps=4, short_switch_extra_bps=8, switch_hysteresis_bps=1

5.1 月次評価

PeriodAlpha Total (JPY)Alpha SharpeAlpha MaxDDOrdersTurnover
2026-01-01〜2026-01-31+447,5602.7803-19190
2026-01-01〜2026-02-11+1,142,3303.7668-660,23019190

比較対象(同条件):

  • greedy_h300_q3: 取引0件、alpha_total_pnl_jpy = 0

5.2 Walk-forward(2026-01-01〜2026-02-11)

WindowStateful Alpha Total (JPY)Stateful Win RateGreedy Alpha Total (JPY)
7日+732,21050.0%+213,660
14日+1,142,33066.7%0
21日+1,142,33050.0%0

解釈:

  • 窓幅を変えても stateful が一貫して優位。
  • greedy は無取引化しやすく、機会損失が大きい。

6. Stateful の2年安定性評価

対象期間: 2024-02-12〜2026-02-11
窓設定: window_days=21, step_days=21

評価結果(最新):

  • windows: 35
  • alpha_total_pnl_jpy: -754,150
  • alpha_win_rate(全窓): 8.57%
  • active_windows(注文あり): 7
  • active_alpha_win_rate: 42.86%
  • active_alpha_total_pnl_jpy: -754,150

解釈:

  • 全窓勝率が低く見える主因は「非稼働窓」の多さ。
  • 稼働窓ベースでも現状はマイナス優位で、長期安定性は未達。

7. 低勝率区間フォーカス分析

最悪窓: 2025-09-22〜2025-10-12

  • alpha_total_pnl_jpy: -37,500
  • days: 21
  • orders_total: 1
  • fills_total: 1
  • active_days: 1

分析所見:

  • 問題は「過剰売買」ではなく「非稼働(機会未取得)」。
  • 実質1トレードで成績が決まっており、タイミング誤差に脆弱。

8. 現時点の判断

  • 短中期では stateful derisk_only_aggressive が有望。
  • ただし2年安定性は未達のため、次段階は次を優先:
    1. 稼働率向上(無取引窓の削減)
    2. 低勝率窓の再発防止(状態遷移条件の再設計)
    3. long horizonでの再検証

9. 参照データ

  • data/derived/reports/experiment_summary_2026-02-14_hold10.csv
  • data/derived/reports/eval_hold10_stateful_walkforward_overall_2026-01-01_2026-02-11_w7.csv
  • data/derived/reports/eval_hold10_stateful_walkforward_overall_2026-01-01_2026-02-11_w14.csv
  • data/derived/reports/eval_hold10_stateful_walkforward_overall_2026-01-01_2026-02-11_w21.csv
  • data/derived/reports/stateful_stability_windows_2024-02-12_2026-02-11.csv
  • data/derived/reports/stateful_stability_overall_2024-02-12_2026-02-11.json
  • data/derived/reports/stateful_low_win_analysis/ETH_JPY_2025-09-22_2025-10-12/summary.json