14連敗の記録 — 棄却された仮説たちと、それでも残った1本

1. スコアボード

2026-06-10時点で、このプロジェクトは EXP-0001 から EXP-0016 までの16本の実験を実行済みです。結果を先に言います。

測定:EXP-0001(GMOの実効スプレッド中央値 5.6bps を実測。全実験のコストモデルの土台)
生き残り:EXP-0009 のただ1本
それ以外:すべて棄却

「棄却(reject)」とは、「この仮説が正しいとは言えない」と判定することです。1本の実験が複数の仮説を束ねている場合もあるため(EXP-0005 は6仮説、EXP-0002/0003 は18戦略を一括検定)、葬られた仮説の総数は16をはるかに超えます。なお EXP-0017/0018 は事前登録済みでまだ実行前です。

この一覧は失敗の墓場ではありません。「ETH_JPY に、この方法ではコストを上回るエッジは存在しない」という確定した知識の蓄積であり、本サイトの本体です。

2. 評決一覧(翻訳つき表)

表で使う用語を先に定義します。IS/OOS = in-sample(戦略探索に使ったデータ内の成績)/ out-of-sample(まだ見ていないデータでの成績)。AUC = 分類予測の良さの指標(0.5=当てずっぽう、1.0=完璧)。相関係数 = −1〜+1で関係の強さを表す数(0=無関係)。HAC-t と DSR は記事3で定義した「偶然らしさ」の補正指標です(HAC-t≥3 または DSR≥0.95 が合格ライン)。

ID	試した仮説(平易文)	結果	一言解説
0002/0003	登録済みの戦略群はコスト込みで勝てるか	棄却	取引した全18戦略がコスト後マイナス。「取引しない20戦略が同率首位」に見えたのは、ベンチマークが−175万円暴落した期間の人工物
0004	高度なML(GBDT)は単純な線形モデルに勝つか	棄却	同じ13特徴量で GBDT の OOS AUC 0.493 < 線形 0.516。複雑にしたら悪化した
0005	06:00 JST の日付境界に値動きの癖があるか	棄却(6仮説全滅)	ドリフトはコスト後ほぼ0(HAC t≈0.3)。最有力の「09:00モメンタム」も +5.3bps で t=1.33 止まり——惜敗は合格ではない
0006	過去成績の良い戦略は未見データでも勝つか	全棄却	スイング系は IS 0.96% → OOS −0.22%。典型的なリーク(見かけ倒し)
0007	ウォークフォワード(時間を進めながら再学習→検証を繰り返す方式)なら勝てるか	棄却	ISで好調、OOSで崩壊(DSR 0.23)。分布の変化に再学習が追いつかない
0008	Binance が GMO に約1秒先行する(リード・ラグ=先行遅行関係)——それで稼げるか	棄却	先行は実在(相関 +0.239 @+1秒)。だがテイカー往復コスト 5.6bps がすべて食い尽くし、実行可能な利益はゼロ
0010	特徴量を13個→39個に増やせば精度が上がるか	棄却	OOS AUC 0.5194 で13個より統計的に有意に悪化。過学習の実例
0011	アルトコインならメイカーで稼げるか	棄却	メイカーの下限を満たす銘柄なし。スプレッドが広い=流動性がないだけだった
0012	東京オープン(09:00)のモメンタム	棄却	約定がまばら(30秒あたり中央値2〜6本)で短期戦略が成立せず。全フォールドでコスト後マイナス
0013	BTC/ETH/XRP のペア取引(統計的裁定)	棄却	主要銘柄間に持続的な関係なし(DSR≈0.49)。しかも2本足のテイカー往復で約8.5bpsのコスト
0014	チャートを画像化すればMLは賢くなるか	棄却	画像系の予測力は表形式データ以下。元の情報が同じ(約定データのみ)なら形式を変えても増えない
0015	数日単位のトレンドフォロー	棄却	OOSで +12.9bps/日が出たが HAC-t=1.68、DSR=0.892 でゲート不通過。キャリー+スプレッドの18bpsも重い
0016	Binance の板・デリバティブ情報の先行性(段階制)	棄却(Stage 0/1とも)	一次指標は有意に見えた(p=0.0005)が、シャッフル統制と2秒遅延統制で消滅。有料データの購入を回避——統制がお金を守った実例

3. 連敗から学べる3つのパターン

(a)シグナルは実在しても、コストが食う。 EXP-0008 の約1秒先行は本物でした。それでも往復5.6bpsの前では利益ゼロ。記事2の算数が、実験でそのまま再現された形です。

(b)複雑化は劣化する。 GBDTは線形に負け(0004)、特徴量39個は13個に負け(0010)、画像化は表形式に負けた(0014)。データ量に対してモデルを複雑にするほど、過学習で未見データの成績は落ちます。

(c)有意に見えても、統制をかけると消える。 EXP-0016 の p=0.0005 は一見強力ですが、シャッフルした偽データや遅延統制で再検定すると効果が消えました。統制がなければ、有料データを買い込んで同じ幻を追いかけていたはずです。

4. 生き残った1本

唯一棄却されなかったのが EXP-0009——「Binance の値動きを合図に、GMO で指値を置いて待つメイカー側の実現利益」です。1約定あたり [−1.53, +2.53] bps という区間で実在が確認され(HAC-t 最大9.6、プラセボ通過)、ただし符号(プラスかマイナスか)はまだ確定していません。

この区間に白黒をつける計画と、「答えが出る前に決めてある終わらせ方」は記事6で扱います。

再現性情報(脚注): 評決はすべて 2026-06-10 時点の docs/STATUS.md および各実験記録 docs/research/experiments/EXP-0001〜0016 に基づく。コスト前提(実効スプレッド5.6bps、p50=5.58 / p90=9.45)は EXP-0001(サンプル72.27万件、2026-02-17以降のブック期データ)による実測。EXP-0012 は 2019-02〜2024-11 の再構成データを、EXP-0015 は再構成時間足データを使用。EXP-0017/0018 の事前登録は docs/research/experiments/prereg/ に凍結済み(2026-06-10)。

1. スコアボード​

2. 評決一覧(翻訳つき表)​

3. 連敗から学べる3つのパターン​

4. 生き残った1本​

1. スコアボード

2. 評決一覧(翻訳つき表)

3. 連敗から学べる3つのパターン

4. 生き残った1本