[X投稿版] https://twitter.com/money_boat_
いわゆるAIである機械学習(LightGBM)で6艇の相対的な強さを予測したものです
問題文としてレース前情報である勝率や展示データ項目、その答えとして1着=100点 2着=65点 3着=30点 4着以下=0点を用意してAIに学習させました
AIは問題文と答えのパターンを学び
「1号艇の勝率の項目は他艇より高いな、一方モータ2連対率は低いな・・・このパターンの時の答えは70点だろう」
と問題文中の全項目(※1)を加味した答えをレース10分前に予測します
人間に勝る点:
- 1日の全レース(※2)を判断できる
- 数万レースすべてのパターンを覚えれる
- 選手やモータ成績、展示タイムなど約40もの項目を全て考慮して総合的に点数を判断できる
人間に劣る点:
- スリット写真やノビなど数値がない情報は学べず熟練者には敵わない
- 展開予想はできない
- 選手個人の思惑や選手間の関係性は考慮できない
当たるのかどうか:
- 予測したレースすべて買うと平均して的中率は9~11% 期待値は85~90です(AIはあくまで意思決定の補助、決断するのは人間)
- ただし各艇の力が開いているとどちらも上昇します
- AIの特徴として、3着4着の差が大きかったり、Powerのばらつき具合(標準偏差)が大きいレースに絞ると期待値は110を超えてきます
予測根拠は:
- 競艇公式で公開されている番組表や選手、結果データ1年分
- https://www.boatrace.jp/owpc/pc/extra/data/download.html
- 過去データから算出した自作の新概念データ
(※1)登録番号/当地勝率/当地2率/枠別複勝率/モーター勝率/モーター2率/今節平均順位/平均ST/平均ST順位/1ヶ月平均ST/3ヶ月枠別平均ST/波高/展示タイム/一周タイム/周足タイム/直線タイム/選手調子スコア(過去10レースで枠番から順位をいくつ上げたか)/モーター調子スコア(過去30, 90レースそれぞれ枠番から順位をいくつ上げたか)/レース場/レース回/1逃げ勝率/1差し負率/1捲り負率/1捲り差し負率/2逃げ負率/差し勝率(2~6枠)/捲り勝率(2~6枠)/捲り差し勝率(2~6枠)/逃し2着率(2〜6枠)
(※2)荒れるレースを問題文に入れると、AIは過学習して逆に普通のレースを外します
ですので展示進入が枠なり&波高3cm以下&風速3m以下の穏やかなレースのみ学習させ、その条件のレースのみ予測させています(選手欠場のあるレースも除いています)
はてなブログの24時間の投稿上限が100のため、100以下に絞る意味もあります...
また、早朝の番組表に基づいてAIを動かす時刻表を組んでいるため、当日の出走時間がスケジュールより約10分以上遅れると予測できません
一周タイムの展示がない津、荒れる場である江戸川・戸田・平和島・鳴門・多摩川・桐生の合計7場は除いています
[参考]
予測方法や可視化のアイデアはこちらを参考にさせていただきました
https://dx-navigation.com/boatrace/
- プロフィール
- id:wazamashin41
- ウェブサイト
- https://twitter.com/money_boat_
- ブログ投稿数
- 15532 記事
- ブログ投稿日数
- 277 日
- 読者