ぶたろうノート

棋力向上のための覚書

山本一成氏が語る「電王戦で見えたponanzaの課題」

昨日も取り上げましたニコニコ動画での第3回将棋ウォーズ名人戦 最終日 生中継での電王戦の話についてです。「ponanzaの圧勝を予想していたが、思ったような展開ではなかった。その原因は序盤にあり、序盤を定跡通り指せば、さらにコンピュータは強くなる」と考える大平五段に対して、山本一成さんが自身の考えを述べているところです。

---------

山本「(コンピュータは)横歩系統が弱いんじゃないか、とか…横歩取りとか角換わりが、コンピュータと戦うとき良いんじゃないか、っていう人が多いんじゃないですかね、今だと」

山口「では、またそれを山本さんとしては、研究したりするんですか」

山本「でも、どうしたらよいか…そう聞いてもどうやって対応すれば良いか難しいですね。つまり、横歩取りで、例えば△6二玉って指すのが悪手だとしても、評価関数のどこをどういじったら△6二玉って指さないようになるのか、というのはプログラマーの理解を超えているので...。あと、定跡をやれば良いっていうのもまさにその通りなんですけど、例えば、青野流ってかなり最新定跡なんですか」

f:id:emptywords:20140424002235j:plain

横歩取り△3三角に対して、▲3六飛と引かずに戦うのが青野流

大平「いや、そんなでもないですけど。ただ、解明されてない部分が多いっていう」

山本「そうですよね、プログラマーは、その定跡を追っているわけではないので、そのアップデートについていけてないんですよね、プロ棋界の定跡の。というのがあるので、そういう方向性には進めないですし…。また、あれですよね、定跡の理解が…結局なぞっているだけなんで。本質を理解していないので、人間と違って。逆に危ないかな、という印象を持ってるんです、変に定跡の理解を追ってしまうのは。

例えば、定跡で角換わり同型ってあるじゃないですか。角換わり腰掛け銀で、富岡流という、凄い有名な先手の必勝手順があるんですけど、コンピュータはふらふらっと富岡流で負けてしまうんですよね*1。そういうところもあるので、定跡を追ってしまうのは危険なところがあるとわたしは思っているんですけど」

大平「なるほど」

山本「追えてないので、アップデートを」

大平「機械は素人なんでわかんないんですけど…将棋界には、『高速道路』と言われてる、これがわかってれば、奨励会三段かプロくらいまではいける、っていわれている、定跡とか、なんて言うんですかね、今まで出尽くした結果とか変化みたいなのがあるんですけど、それを覚えてて、あんだけ終盤強ければ負けようがないんじゃないかと僕は思っちゃうんですけどね。あとは、最新の変化していくものをどんどんアップデートしていけば…終盤なかなかノーミスだとキツいんじゃないかなと思いますけど。まぁ、でもそこを追うまでが大変ですからね」

山本「追っていって、追い続けられないですし。でも、それってちょっと違うかなと思ってるんですよね。それってコンピュータそのものが強くなったわけじゃないじゃないですか。まさになぞっているだけだから。コンピュータそのものは強くなってないなという印象があるので。それはちょっと良くないかなと、わたし個人は思ってるんですよね」

大平「なるほど」

山本「強くなり方も、ちょっと選んでるところがあるんですよね。こう強くなってほしいというのがあって。直近1回だけ勝つんだったら、その方法が正しいのかもしれないですけど、長く勝つんだったら、そういう方法で良いのかっていうのはちょっと疑問かな、と思ってるんですよ」

大平「なるほど」

山口「面白いですね、ずっと聞いていたいですけど…どこを強くしたいっていうのは企業秘密ですか」

山本「どこを強くですかね…今回、屋敷先生と指してもらって、屋敷先生の方が駒損してるけれども、全部の駒が活躍してて、持ち駒の飛車2枚のポテンシャルが凄く高いっていう局面があって。Ponanza側が駒得を重視してしまって、良いと思っちゃってるんですね。ただ進んでみると、ほぼ互角、実際はわからないですけど、棋士の方は、屋敷先生の方がよかったという発言も多いから、ひょっとすると先手の方が良かったかもしれないですけど。ただ、事実としてPonanzaは自分側を良すぎると評価していたので、そうった部分…評価関数ですかね、局面の正しい認識の改善を進めなきゃ、と思いましたね」

山口「形勢判断ですか」

山本「そうですね」

山口「なるほど。どういう変化を遂げるか楽しみですね」

大平「終盤はこれ以上強くならないでしょうから、序盤中盤くらいしかないですよね。改善ポイント」

---------

この山本さんの「定跡を覚えさせるっていう方法は、追いかけるばかりで、ソフトそのものが強くなっている、とは言えないのではないか」という反論に感心しました。山本さんの反論を聞き、大平五段の主張が素朴すぎると感じてしまったほどです。

ここでははっきりとは述べられていませんが、「コンピュータ・ソフトはプロの定跡を追いかけるフォロワーではないんだ!」と言いたいように感じられました。大平五段の主張は、言ってみれば「序盤はプロに追いついていない」というものですが、山本さんは、その点について認めながらも、だからといって、定跡を単純に覚えさせるのではなくて、評価関数 (形勢判断や大局観と言われる部分) などを修正・改良することが今後の課題だと主張しています。

話は逸れますが、Floodgate blogという興味深いサイトがあります。これはFloodgateという、コンピュータ・ソフト同士の対局場で指された「新手らしきもの」を機械的に抽出しているサイトです。もしかしたら、人間がまだ気づいていない、または気付きにくかったような手筋、新手などが発見されたりすることもあるんじゃないかと勝手に期待しています。

「新手一生」を実践しているのは、プロ棋士だけではなく(もちろんアマチュアの方にもいらっしゃると思いますが)、山本さんを含めたコンピュータ・ソフト開発者も、そういった志を持ち、また実践しているのだと感じました。

 

※ 大平五段の発言について「素朴すぎる」と感じましたが、これは、大平五段の発言に価値がないということは意味しません。むしろ、山本さんの考え方を引き出してくれた、意味のある発言だったと思います。大平五段は、以前のブログなどでも議論を喚起するような発言がたびたびあり、現在の将棋界で貴重な存在のひとりだと感じています。

*1:参考: ボンクラーズ VS 定跡 (角換わり腰掛け銀先後同型 富岡流)http://blog.livedoor.jp/i2chmeijin/archives/822117.html