どうも、「電ファミ」では競馬担当になりつつある、長谷川リョーです。
前回は北海道まで出張取材をした「リアルダビスタ」の記事をお届けしました。「将来の夢は馬主になることだ」と競馬への愛についても触れさせていただきましたが、馬券の方も嗜みます。週末は重賞を中心に、平場のレースまで手広く買うことが多いです。
1度だけ万万万馬券を当てたことがあり、生涯収支は間違いなくプラスなのですが、あの大当たりがなければ間違いなく回収率は100%を下回っていたことと思います。(僕だけではなく、おそらく多くの人が同じ現状だと思います……)
普段はAI(人工知能)、IoT、VRのようなテクノロジー周りの取材記事を書くことも多く、「ディープラーニングのような技術を元に、競馬予想をするプログラムを作ることができるのでは?」と夢想したことも一度や二度ではありません。IT企業に勤めていた前職では、本気でデータサイエンティストを探したりもしました……。
実際、近年の人工知能技術の発展は目覚しいものがあります。広く知られるところでは、チェス王者を倒した「ディープ・ブルー」、囲碁では「AlphaGo(アルファ碁)」、そして将棋では「Ponanza(ポナンザ)」と人間の知力を凌駕したコンピュータ・ソフトが続々と登場しています。こうした技術を競馬予想にも生かせないものだろうか? その問いに真正面から挑んでくれるのが、ドワンゴが主催する競馬予想プログラミング競技会「電脳賞」です。
はじめに、「電脳賞」の対戦方式の基本的なルールを確認しておきましょう。
「電脳賞」の基本ルール
・独自のロジックを用いて競馬の予想を支援するソフトを開発し、該当レースにおける指定条件(競技部門)の達成に挑戦するプログラム競技会です。
・当大会のソフトとはブラウザ上で動作するシミュレーターやアプリケーションなど形式は問わず、予想ロジックに基づき結果を出力できるものを指します。
・作成したソフトのみを使用し、対象レースの結果を予想してください。
・競馬専門紙や日刊紙、他メディア等の他者の予想や指数に乗ること、利用することは禁止します。
・中央競馬のすべてのレースを予想できるようにしてください。
・大会の様子は、一部ニコニコ生放送にて生放送されます。
(その他、詳しいルールについては公式サイトを御覧ください)
この大会、合計8チームが参加したのですが、2日目に早くも決定的となる大的中がありました。3月5日の中山7R「4歳以上500万以下[指定]」で、「ニコちゃんAI競馬」が配当1162.2倍の三連複を500pt分的中させ、2日目の回収率はなんと1217.6%に。結果的に最終日まで「ニコちゃんAI競馬」が首位の座を譲らず、他チームに圧倒的な差をつけて優勝しました。
上記の図をご覧ください。まず目につくのは、「ニコちゃんAI競馬」の181.9%という驚異的な通算回収率。そして、「CHANCE」の結果にも目をみはります。通算回収率こそ60.5%と目立ったものではありませんが、大会初日から最終日まで一度も外すことなく、パーフェクト的中を実現しています。
今回はこの「ニコちゃんAI競馬」「CHANCE」の2チームを座談会に招き、人工知能とデータ分析を交えて作成したそれぞれの競馬ソフトについて、苦労した点、今後の展望について語っていただきました。
優勝のポイントは「1番人気が1位になりにくいレース」!?
――まずは「ニコちゃんAI競馬」【※】チームのお二人、優勝おめでとうございます。いきなりですが、勝因はどういう部分にあったとお考えですか?
「ニコちゃんAI競馬」チーム・テリー氏(以下、テリー氏):
一言でいうと、「1番人気が1位になりにくいレースを探す」という発想をしたんです。
すると、それ自体は偶然に近かったのですが、2日目に結果が出たんです。その時点で回収率が100%を越えたため、残りのレースも自信を持って同じロジックで進めることができました。
――ん、ん? どういうことでしょうか。「1位の的中を狙う」のならわかりやすいと思うのですが、「1番人気が1位になりにくいレースを探す」とは……。
テリー氏:
これは、回収率を高める買い方なんです。
つまり、今回のレースで評価されるのは、1位を的中させた回数ではなくて、「最終的に儲けた額」ですよね。であれば、「的中率」は犠牲にしてでも、高い倍率になるレースをチョイスしていく前提でロジックを組んだ方がいいという判断をしたんです。
――おお、つまり「1位を的中させる」よりも「当たったときにドカッとポイントを稼げるレースが何か」を考えて選んだ、ということですか。
テリー氏:
そうですね。具体的には、3歳馬のデータを中心に選んでいます。
競走馬は普通2歳でデビューするので、3歳というのは戦績が浅く、せいぜい3〜4レースしか走っていません。5歳馬のように10〜20レース走っていれば、平均速度のようなデータもきれいに出すことができるんですが、3〜4回しか走っていないと、天気や周りの馬との関係性により不正確なデータになります。つまり、5歳馬に比べるとデータの正確性がかなり低い。そうなると当てづらいんですね。
でも、「当てづらい」ということは、つまり「オッズ(払い戻し率)と人気という情報が信用ならない」ということでもあります。
――なるほど。だから当然、「当てたときの儲けは大きくなるであろう」と。とはいえ、テリーさんにとっても不正確な情報で判断することになりますよね。
テリー氏:
そこで私は、確率論で一番当たりやすい組み合わせの6頭BOX【※】買いをやっていきました。
特定のレースを当てるのは難しいですけど、1番人気の馬が3着以内にくるレースであれば、もう少し簡単ですから。
――でも、買い目は「的中率」が高いものをしっかり決める必要はありますよね?
テリー氏:
私のロジックではオッズや人気は考慮せず、あくまでも「速度」のようなデータから算出する期待値に基づいて買い目を決めます。
――つまり、人間の判断を絡めない「客観的なモデル」を作ったと。逆にここで「的中率」が1位だった「CHANCE」【※】チームにも話を伺ってみたいですね。そもそも「電脳賞」にはどういった経緯で参加されたんですか?
「CHANCE」チーム・C氏(以下、C氏):
もともとAI系の勉強会を色々やっていたのですが、そのうちに、競馬は結果もすぐに出ますし統計的な効果も見えやすいということで、「分析の対象として優れているのではないか」と思ったんです。それで試しにやってみたらすごくハマってしまって(笑)。そこに「電脳賞」というイベントがタイミングよくあったので、参加してみたという経緯になります。
私たちの場合は、はじめはオッズ、馬体重、タイムなどあらゆるパラメーターを入れていたんですが、そこから競馬を徐々に理解していくにつれて不必要なものを引いていったんですね。その結果、的中率が上がっていきました。こうした調整は合計で30回ほど行いましたね。
――まさに「的中率」を徹底的に上げる方向で勝負に挑まれた……と。今回の電脳賞は、そんな正攻法に対して、「的中率」なんて大して上がらないことを「見切って」挑んだ「ニコちゃんAI競馬」チームが優勝してしまった、と総括できそうですね。
テリー氏:
そもそも人工知能が発展していくことで、1番人気の馬が来る確率を割り出す精度は今後も上がっていくと思いますが、回収率という観点でみると、「オッズが1.0倍に近づいていく」ということにすぎません。すると、オッズの逆数の分だけ的中率が必要ですから、かなり高い的中率を維持しなくてはいけないことになってしまいます【※】。
でも、私の「回収率の高いレースをチョイスする」というやり方であれば、そういう未来の競馬においてもある程度高い倍率が維持できるとは思います。
【※】
以下の個人ブログで、現在日本で採用されている「パリミュチュエル方式」に則ったときに、「予想者の全員が、各馬に関する十分な情報を持っており、馬の着順の確率を正確に判断できる(#)」という状況で、的中率がオッズの逆数になることが解説されている。(#)の状況は、競馬の着順の確率を十分に精度高く予想できるAIが普及した状況である、と考えられる。
・競馬のオッズ、確率と期待値について(プロローグ):お手持ちの勝馬投票券は確定までお捨てにならないようお願い致します