14連敗の記録 — 棄却された仮説たちと、それでも残った1本
1. スコアボード
2026-06-10時点で、このプロジェクトは EXP-0001 から EXP-0016 までの16本の実験を実行済みです。結果を先に言います。
- 測定:EXP-0001(GMOの実効スプレッド中央値 5.6bps を実測。全実験のコストモデルの土台)
- 生き残り:EXP-0009 のただ1本
- それ以外:すべて棄却
「棄却(reject)」とは、「この仮説が正しいとは言えない」と判定することです。1本の実験が複数の仮説を束ねている場合もあるため(EXP-0005 は6仮説、EXP-0002/0003 は18戦略を一括検定)、葬られた仮説の総数は16をはるかに超えます。なお EXP-0017/0018 は事前登録済みでまだ実行前です。
この一覧は失敗の墓場ではありません。「ETH_JPY に、この方法ではコストを上回るエッジは存在しない」という確定した知識の蓄積であり、本サイトの本体です。
2. 評決一覧(翻訳つき表)
表で使う用語を先に定義します。IS/OOS = in-sample(戦略探索に使ったデータ内の成績)/ out-of-sample(まだ見ていないデータでの成績)。AUC = 分類予測の良さの指標(0.5=当てずっぽう、1.0=完璧)。相関係数 = −1〜+1で関係の強さを表す数(0=無関係)。HAC-t と DSR は記事3で定義した「偶然らしさ」の補正指標です(HAC-t≥3 または DSR≥0.95 が合格ライン)。
| ID | 試した仮説(平易文) | 結果 | 一言解説 |
|---|---|---|---|
| 0002/0003 | 登録済みの戦略群はコスト込みで勝てるか | 棄却 | 取引した全18戦略がコスト後マイナス。「取引しない20戦略が同率首位」に見えたのは、ベンチマークが−175万円暴落した期間の人工物 |
| 0004 | 高度なML(GBDT)は単純な線形モデルに勝つか | 棄却 | 同じ13特徴量で GBDT の OOS AUC 0.493 < 線形 0.516。複雑にしたら悪化した |
| 0005 | 06:00 JST の日付境界に値動きの癖があるか | 棄却(6仮説全滅) | ドリフトはコスト後ほぼ0(HAC t≈0.3)。最有力の「09:00モメンタム」も +5.3bps で t=1.33 止まり——惜敗は合格ではない |
| 0006 | 過去成績の良い戦略は未見データでも勝つか | 全棄却 | スイング系は IS 0.96% → OOS −0.22%。典型的なリーク(見かけ倒し) |
| 0007 | ウォークフォワード(時間を進めながら再学習→検証を繰り返す方式)なら勝てるか | 棄却 | ISで好調、OOSで崩壊(DSR 0.23)。分布の変化に再学習が追いつかない |
| 0008 | Binance が GMO に約1秒先行する(リード・ラグ=先行遅行関係)——それで稼げるか | 棄却 | 先行は実在(相関 +0.239 @+1秒)。だがテイカー往復コスト 5.6bps がすべて食い尽くし、実行可能な利益はゼロ |
| 0010 | 特徴量を13個→39個に増やせば精度が上がるか | 棄却 | OOS AUC 0.5194 で13個より統計的に有意に悪化。過学習の実例 |
| 0011 | アルトコインならメイカーで稼げるか | 棄却 | メイカーの下限を満たす銘柄なし。スプレッドが広い=流動性がないだけだった |
| 0012 | 東京オープン(09:00)のモメンタム | 棄却 | 約定がまばら(30秒あたり中央値2〜6本)で短期戦略が成立せず。全フォールドでコスト後マイナス |
| 0013 | BTC/ETH/XRP のペア取引(統計的裁定) | 棄却 | 主要銘柄間に持続的な関係なし(DSR≈0.49)。しかも2本足のテイカー往復で約8.5bpsのコスト |
| 0014 | チャートを画像化すればMLは賢くなるか | 棄却 | 画像系の予測力は表形式データ以下。元の情報が同じ(約定データのみ)なら形式を変えても増えない |
| 0015 | 数日単位のトレンドフォロー | 棄却 | OOSで +12.9bps/日が出たが HAC-t=1.68、DSR=0.892 でゲート不通過。キャリー+スプレッドの18bpsも重い |
| 0016 | Binance の板・デリバティブ情報の先行性(段階制) | 棄却(Stage 0/1とも) | 一次指標は有意に見えた(p=0.0005)が、シャッフル統制と2秒遅延統制で消滅。有料データの購入を回避——統制がお金を守った実例 |
3. 連敗から学べる3つのパターン
(a)シグナルは実在しても、コストが食う。 EXP-0008 の約1秒先行は本物でした。それでも往復5.6bpsの前では利益ゼロ。記事2の算数が、実験でそのまま再現された形です。
(b)複雑化は劣化する。 GBDTは線形に負け(0004)、特徴量39個は13個に負け(0010)、画像化は表形式に負けた(0014)。データ量に対してモデルを複雑にするほど、過学習で未見データの成績は落ちます。
(c)有意に見えても、統制をかけると消える。 EXP-0016 の p=0.0005 は一見強力ですが、シャッフルした偽データや遅延統制で再検定すると効果が消えました。統制がなければ、有料データを買い込んで同じ幻を追いかけていたはずです。
4. 生き残った1本
唯一棄却されなかったのが EXP-0009——「Binance の値動きを合図に、GMO で指値を置いて待つメイカー側の実現利益」です。1約定あたり [−1.53, +2.53] bps という区間で実在が確認され(HAC-t 最大9.6、プラセボ通過)、ただし符号(プラスかマイナスか)はまだ確定していません。
この区間に白黒をつける計画と、「答えが出る前に決めてある終わらせ方」は記事6で扱います。
再現性情報(脚注): 評決はすべて 2026-06-10 時点の docs/STATUS.md および各実験記録 docs/research/experiments/EXP-0001〜0016 に基づく。コスト前提(実効スプレッド5.6bps、p50=5.58 / p90=9.45)は EXP-0001(サンプル72.27万件、2026-02-17以降のブック期データ)による実測。EXP-0012 は 2019-02〜2024-11 の再構成データを、EXP-0015 は再構成時間足データを使用。EXP-0017/0018 の事前登録は docs/research/experiments/prereg/ に凍結済み(2026-06-10)。