AIが競馬予想で回収率180%突破の快挙! 『電脳賞』優勝のITエンジニアが語る戦略が鮮やかすぎて目からウロコ

1

2

3

「競馬知識ゼロ」からソフトを完成させるまで

――ちなみに、お二人は競馬の経験はあるのですか?

C氏:
 最初にメンバー3人でやっていたときは、みんな完全に競馬の初心者でした。

テリー氏:
 僕も「電脳賞」に取り組む前まではやったことがありませんでした。

 本来、自分の性格的には「超人気馬を100円買う」といった石橋を叩くようなタイプなんです。ただ、コンテストの場合は現金を損するわけではないので、勝利至上主義になります(笑)。

――AI開発では、将棋ソフトや医療系のAIベンチャーなんかでもそうですが、専門分野の知識よりも情報科学への理解度が効いてくるんでしょうかね。

C氏:
 私たちの場合は、あとから競馬歴15年のメンバーが加わり、馬券の買い方から教えてもらったんです。アナログで競馬を予想してきた人が重視する予想のポイントを聞きながら、それをパラメーターに組み込んでいきました。

 進め方としては、モデルをいくつか作って、データの結果を見ながら試していく感じです。私自身が会社ではエンジニアとして、クッキー情報をみながらユーザー行動を分析したり、ビッグデータから不動産の価格を推定したりしているのですが、その経験が生きたかもしれません。

影響を与えあった2チームの“戦略

――「ニコちゃんAI競馬」チーム側からは、「CHANCE」チームのロジックはどう見えていましたか?

テリー氏:
 僕のロジック通りに買おうと思うと、最低2000円(20通り×100円)がかかってしまうんです。すると、いくら「10回に1回万馬券が来るから」と人工知能に言われても、仮に3回連続で外れるともう信用ならなくなるんですね。そこは人間の心理として、やっぱりちょっと怖いんですよ(笑)。

 それに比べて、「CHANCE」さんのロジックのように「1回目は500円が300円になった、でも2回目は300円が800円になった」みたいな推移をうろちょろしていると、良いところで抜けてプラスになるといった期待もしやすいのではないかと思いました。

C氏:
 実は、うちの「SIVA(シヴァ)」【※】はもともと人気の高い馬を中心に固めの予想をするという特徴があったんです。

※SIVA(シヴァ)……「CHANCE」チームのソフト名。使用言語はPython, JAVA, node.js(Typescript)。機械学習、重回帰分析をメインとしたロジックを使用する。(by 長谷川)

 ただ、大会の開始早々から「ニコちゃんAI競馬」チームが10万馬券を当てたことで、回収率100%前後を争う戦いではなくなった。それを受けて、私たちも「穴場をいかに探すか」という方向にシフトしていったんです。

テリー氏:
 そういう意味では、僕らも「CHANCE」さんの影響を受けているんですよ。というのも、実は彼女とはハッカソン【※】友達で付き合いが長く、一緒にアメリカのシリコンバレーに行ったこともある仲なんです。

※ハッカソン……hack(ハック)+marathon(マラソン)から成る造語。ソフトウエア開発者たちが集い、協議・協力しながら集中的にコーディングを行うセッションのこと。
(Photo by Getty Images)

 今回の「電脳賞」にあたっても、去年末に「CHANCE」さんが開催した勉強会に参加させてもらいました。そこで彼女たちのロジックを見させてもらい、自分は違う方向でロジックを作ることにしたんです。

――ちなみに、参加していた他のチームのソフトで面白かったものはありますか?

テリー氏:
 僕は「蛸坊主」【※1】さんと「ワセダパラドックス」【※2】さんに注目していましたね。「蛸坊主」さんは単勝の買い目によって選出レースを絞るロジックで、回収率向上を視野に入れられていたので、これで回収率100%越えができるのかが気になっていました。今回の結果としては、100%を越えることはありませんでしたが。

 ちなみに、業界では単勝の控除率は低いという通説になっていますが、それを踏まえると的中率と回収率でバランスは取れないのではないかというのが僕の見立てです。ただそれを良い意味で裏切ってほしいと思って注目していました。

 「ワセダパラドックス」さんの方は、単純に競馬に詳しい人が人工知能の競馬ソフトを作っている、ということで注目していましたね。今日出場されていた方も、親の代から競馬をやっているとのことで、かなり詳しかったです。僕も早稲田出身なものですから、いつか仲間に入れてもらいたいですね(笑)。

※ 蛸坊主(たこぼうず)
リーダーは30年にわたる競馬歴とパソコンによるデータ分析や予想プログラムを作成してきたITエンジニア。 1990年~1998年にかけて競馬予想ソフトの審査やラジオ番組とのメディアミックスなど多方面で競馬界に関わってきた実績を持つ。また、サラブレ誌へ寄稿もするなど競馬ライターとしても活躍している。長年の経験から得た様々な知見やアルゴリズムで電脳賞へ挑む!(by 長谷川)

※2 ワセダパラドックス
早稲田大学に通うゼミの先輩後輩コンビ。第1回電脳賞(春)にはメンバーが揃わず、参加が叶わなかったが、プログラミングに長けたゼミの先輩を引連れ、今回満を持して第2回電脳賞に参戦!チーム名は年を経る毎に強くなるタイムパラドックス産駒のように、多くの結果を積み重ねることによってより精度の高いアルゴリズムになるよう願いを込めて名付けたとの事。第2回電脳賞での目標はパーフェクト予想!(by 長谷川)

――「ニコちゃんAI競馬」チームは最初に万馬券を当てましたが、それを受けてプログラムの変化などはしましたか?

テリー氏:
 実は一回だけロジックを変えているんです。3月4日の生放送時にミスパンテール【※1】という馬がいたのですが、データが1回分しかなかったために買うのを見送りました。つまり、人力で削ったんです。

 すると、2着に来てしまい、そこで嫁ブロック【※2】を受けてしまったんです(笑)。それからはコンピュータの予想通りに馬券を買いましたが、結果として52レース中3レースで万馬券が当たっていますので、嫁の判断は正しかったのかなと……。

※1 ミスパンテール父・ダイワメジャー、母・エールドクラージュ。デビュー2戦目となるチューリップ賞で2着となり、桜花賞では4番人気に支持されたものの、16着と惨敗した。(by 長谷川)

※2 嫁ブロック
もともとは既婚男性が妻に転職や独立を反対、阻止(ブロック)されることを指す。転じて、妻が夫の行動を制限することにも広げて使われることがある。(by 長谷川)

――それは素晴らしい方向性の「嫁ブロック」でしたね!

プロの予想家をも上回る「回収率100%超」のロジックの正体

――では、そろそろテリーさんが組んだプログラムの正体について、お聞きしたいです。

テリー氏:
 実を言うと、そもそもは娘の発言がきっかけなんです。

 ニコが、あるとき「馬群の一番後ろにいた馬が急に追いかけてきて、大逆転して勝つシーンが競馬らしい」と口にしたんです。そこで、それを計算式で表すにはどうしたらいいかと考えて、1番遅い馬を測定する計算を入れました。つまり、前半1番遅い馬と後半速度のバランスを計算に組み込んだんです。これは前半と後半の1:2に倍率を掛けるだけなのですが、この指数を計算した上で、並べ替えていきました。

――いわゆる「上がり」【※】ですよね。

※ 上がり
競走(レース)および調教用のコースを利用した調教における終盤の走破タイムのことをいう。競馬において最も重要なところとされる。競馬のレースにおいてはゴールまで3ハロンないし4ハロンの地点からペースアップすることが多いため、終盤3ハロンの走破タイムを上がり3ハロン、終盤4ハロンの走破タイムを上がり4ハロンと呼ぶ。(by 長谷川)

テリー氏:
 当然、芝とダートをどう分けるかとか、他のランダム要素もあるんですけどね。

(Photo by Getty Images)

 1度や2度しか走っていないので、前提として必ずしもデータとして信用ならないということは織り込んだ上で、ランダムで10回やったなかで1回当たればプラスの回収率になるという発想でやっていました。

――「追い込み」の脚質【※1】に注目して、「馬」自体の客観的なモデルを作ったんですね。ただ、そういうモデリングの手法を改めて考えると、競馬予想のために用意されているデータって、かなり間接的なデータです。Alpha碁や電王戦は、盤面に解析に必要十分な情報が全て含まれてますからね。だから、本当は馬の脈拍などの生体情報なんかまで提供してもらえるといいのかもしれない(笑)。例えば、パドックの馬の動きを画像処理技術で取って、筋肉の隆起の仕方や歩様【※2】の様子で順位を予想できれば、もっと予想が正確になる気もするんです。

※1 脚質(きゃくしつ)
レースにおいて馬が得意にしている走り方のこと。馬群の前から順に「逃げ」、「先行」、「差し」、「追い込み」と分類される。(by 長谷川)

※2 歩様(ほよう)
馬の歩き方のこと。後肢の踏み込みの強さや前肢の出方のスムーズさなどの、全体的な感じをいう。(by 長谷川)

C氏:
 パドックで線よりもはみ出るくらい元気に歩いていると、その日は調子が良いのか悪いのかといったことですよね。

(Photo by Getty Images)

――はい。競馬の解説の人ってそんなにロジカルなことは言っていない気がするんです(笑)。たとえば「暴れまわっている馬」一つ取っても、「気合が乗っている」というポジティブな見方と同時に「気性が荒い」というネガティブな見方もできる。本当はここを定量化していくことで、根拠を持った予想ができる気がするんですよ。

テリー氏:
 今回、たまたま自分のロジックの回収率が100%を越えたということで、プロの予想家さんたちの回収率も調べてみたんです。すると、しょっちゅうTVに出ている方やネットで記事を書いている方でも、回収率60〜70%ほどであることも多いように思いました。

 つまり、全レースを的中させるということは本当に難しいんですね。特に予想家や記者は自分でレースを選ぶというよりは、決まったレースの予想を求められますから、そうすると高回収率を維持するのはかなり難しいですよね。

――ちなみに、読者の方に向けて一般的な競馬の予想のやり方を説明すると、出走馬のラインナップからレース内容を予想していくんですね。
 例えば、逃げ馬が多いとペースが速くなるので、後ろに待機する差し・追い込みの馬が有利になるし、逆に逃げ馬が一頭であればマイペースに逃げられるので、その逃げ馬が単純に有利になる。当然、馬場のコンディションや騎手の作戦によって予想通りにならないこともありますが、基本的な予想のセオリーはこんな感じです。ただ、これもまだまだ人間による曖昧なやり方でしかなく……。

C氏:
 今おっしゃっていただいたようなセオリーをロジックに組み込んで調整することはできそうですよね。それこそ、雨の日の傾向や関連性をパラメーターに組み入れることでロジックの精度が上がるかどうかも、検証してみる価値がありそうです。

 この辺りのセオリーについては、やはり競馬に詳しい方にアドバイスを仰ぐのがいいのかもしれません。

1

2

3

  • このエントリーをはてなブックマークに追加

この記事に関するタグ

関連記事

SNSで話題の記事

新着記事

新着記事

連載・特集一覧

カテゴリ

ゲームマガジン

関連サイト

その他

若ゲのいたり

カテゴリーピックアップ