将棋

ベイズ統計モデリングを使って藤井聡太と全盛期の羽生善治を比べてみた①

将棋界では藤井聡太棋士のフィーバーが起こっています。若干18歳になりたての藤井棋士のタイトル戦が大きな話題になっています。歴史的には、羽生善治、谷川浩司、加藤一二三といった当時の神童達もかつては世間を騒がせたはずです。

世代の異なる強者同士が、ピーク時の実力で戦うと、誰が強いのか?これは将棋界だけでなく、勝負の各世界で話題に上がることです。ここでは、プロ棋士の過去の膨大な対局データと統計モデルによって、各棋士の実力を数値化し、誰が最強なのかを相対的に示してみようと思います。

対象は将棋棋士成績DB[1]に掲載がある棋士番号のあるプロ棋士に限定します。初期の方の棋士(9名)は対戦データがないため除き、2019年10月以降にプロとなった棋士(5名)もデータ不足のため除きます。これで合計309名になり、この棋士同士の対局データのみを集めます。(309名のリスト)データは全て将棋棋士成績DB[1]から得ました。

不戦勝や勝敗が不明な対局を除くと、2020年7月14日までの対局数は117,098局になり、以下ではこの勝敗データを使います。

始めに、年齢による勝率の変化を見てみましょう。

なんと、勝率は年を取ると単調に減少しています。実力のある棋士だけが高齢になっても生き残れることを考えると、高齢での実力の低下は更に大きいものでしょう。この図からは、10代で実力のピークを迎えていそうですが、必ずしもそうとは限りません。若手とベテランでは対戦相手のレベルも異なりますし、10代でプロ棋士になれるのは一部の実力者だけです。実際、プロ棋士の実力のピーク年齢は20代半ばと言われていることが多そうです。[2][3][4]

藤井は18歳、羽生は50歳です。いずれにせよ、32歳差は致命的であり、2人の対局結果から、どちらが歴史的な最強棋士として相応しいか判断するのはフェアでないことは明らかです。

棋士の実力の数値化としては、レート[5]や、タイトル履歴を用いる方法等[2]があるようですが、これらからでは各年代の棋士のピーク実力を相対的に比較することは出来ません。各棋士の実力を数値化し、年齢による実力の変化を見るにはベイズ統計モデリングが最も適しています。

それでは、順を追って歴史的な棋士の実力を比べてみましょう。

                                

1つ目のモデルは、棋士はプロになってから引退まで実力が一定であると仮定したモデルです。この仮定は明らかに誤りですが、統計モデリングのコツはシンプルなモデルから試みることです。

このモデルではシンプルに次の2つの仮定をします。

(仮定1)棋士の実力は極値統計のガンベル分布に従う  
(仮定2)勝敗確率は各棋士の実力の関数で表せる  

プロ棋士は多くの候補生の中を勝ち抜いた強者のみで構成されます。これは正に極値統計[6]の出番です。具体的な実力が数値化できなくても、適当な規格化を行うことで、棋士の実力cの分布は標準ガンベル分布に従うことが期待できます(仮定1)。これを数式でc_n \sim {\rm Gummbel}(0,1)と表します。c_nは棋士nの実力を表します。

(仮定2)は、棋士1と棋士2の対局において、棋士1が勝つ確率がp_1=0.5+f(c_1,c_2)と表せることを意味します。c_1,c_2はそれぞれの棋士の実力です。この仮定は、対戦相手との相性は無視されていますが、相対的な順位付けには仕方ないです。関数fには明らかな制約があり、f(c_1,c_1)=0c_1>c_2f(c_1,c_2)>0f(c_1,c_2)=-f(c_2,c_1)が満たされます。実際の実装では、これらの制約を満たすように、fはパラメータを用いて近似します。ここでは単純にfは実力差c_1-c_2に比例するとします。

以上のモデルは、統計モデリングの表現法で、

となります。n,n'は各棋士を表し、n(g,0),n(g,1)は対局gの負け棋士と勝ち棋士を表します。対局データから調節されるパラメータはc_n,Aです。これらのパラメータはベイズ統計モデリングのソフトウェアであるStan[7]を用いて行います。次の図に実力cの結果を示します。

実力は右肩上がりになっています。先輩棋士ほど高齢で後輩棋士と対局するため、実力が年齢によらないモデルではこの様になってしまいます。それでも、大山、中原、谷川、羽生といった歴史的棋士の実力の高さは明らかです。藤井聡太の実力は現役棋士中では既にダントツであることが分かります。残念ながら羽生棋士は既に何人かの若手棋士に実力で劣ります。右肩上がりの傾きを考慮して、年齢によらない比較をすることはできますが、引退のタイミングも重要な要因であるためフェアな方法にはなりません。

次回は、年齢効果を取り入れて、ピーク時の強さの比較を行ってみます。

                                                                    

引用先

[1]http://kenyu1234.php.xdomain.jp/index.php  
[2]https://shogibu.com/fujiisota/peaknenrei.html  
[3]https://shogi100.com/2018/03/21/1-46/ 
[4]https://mainichi.jp/articles/20200117/k00/00m/040/134000c
[5]https://shogidata.info/list/rateranking.html 
[6]https://ja.wikipedia.org/wiki/%E6%A5%B5%E5%80%A4%E5%88%86%E5%B8%83
[7]https://mc-stan.org/

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です