2015年11月21~23日に開催される第3回将棋電王トーナメントに出場する予定のソフトの中で、あるソフトが「強すぎる」という話が持ち上がっています。
そのソフトとは「技巧」。
開発者は出村洋介さん。詳しい経歴はわからないのですが、以前は東京大学大学院法学政治学研究科に在籍されていた(後述)ようです。
PR文書は以下。
コンピュータ将棋ソフト「技巧」(ニコニコ動画) ※PDFです
あまり聞き馴染みのないソフトですが、コンピュータ将棋関係者に衝撃を与えているようです。
強すぎやろ
今回の電王トーナメントの優勝最有力候補と見られているPonanzaの開発者、山本一成さんは以下のようにツイート。
今年も最後の最後に恐ろしいほど強いプログラムが来ましたね。
「技巧」さんです。このプログラム絶対に電王トーナメントで恐ろしい強さを発揮するはずです。現在Floodgateの2週間レートトップです。 pic.twitter.com/XfBqDhBcF4
— 山本 一成@Ponanza (@issei_y) 2015, 11月 17
floodgateはインターネット上のコンピュータ将棋対局場。電王トーナメントとは対局条件(持ち時間や使用するマシンスペック)が違うので、floodgateの強さがそのまま電王トーナメントでの強さになるわけではありませんが、十分参考にはなります。
前回5位で、昨年の第24回世界コンピュータ将棋選手権を制したApery(今回は「大樹の枝」として参戦)の平岡拓也さんも「強すぎやろ」ツイート。
技巧強すぎやろ。。。22回選手権の時も短い期間でしっかり作り上げてはったもんなー。すごい。
— 平岡 拓也@Ponanza倒したい (@HiraokaTakuya) 2015, 11月 17
上記のように、2012年の第22回世界コンピュータ将棋選手権への出場実績があるようです。
この選手権で技巧は1次予選から参加。26ソフト中3位で2次予選に進出。
強豪ソフトも加わった2次予選では、3勝1分5敗で24ソフト中18位となり決勝へは進めませんでしたが、当時ともに初参加だったAperyと引き分け、AWAKEには勝利しています(両ソフトとも2次予選敗退)。
やねうら王開発者のやねうらおさんもツイートしています。
floodgateの技巧、さすがに強いな…。Ponanzaを超えてる可能性も。PR文書だけ読んでこの強さを予言した私はやはり天才かも知れん。え?「クジラちゃんがAperyの最新版と同じぐらい強いは間違ってたじゃないかって?」 あー、聞こえない、聞こえない。(指で耳をふさぎながら)
— やねうら王 (@yaneuraou) 2015, 11月 17
やねうらおさんはブログでも「強すぎワロタ」として、技術的な観点から記事を書かれています。
コンピュータ将棋に詳しい千田翔太五段も「強い」と発言。
技巧強いな。細かくて巧みだし、gps相手に有利の評価を示す段階も早いし。
ponanzaも現れていてとても有難い。
— Shota Chida (@mizumon_) 2015, 11月 17
技巧の強さを受けてPonanzaもfloodgateに参戦しましたが、直接対決は実現しませんでした。
floodgate、技巧とponanzaの対局が実現しないのも、それもまた一興すな。本番にプレミアム感でますな。
— 平岡 拓也@Ponanza倒したい (@HiraokaTakuya) 2015, 11月 17
あー、一晩おいたけど技巧さんいないくなったし、対戦もきまらなかった・・・
まあ電王トーナメントでやればいいか。 pic.twitter.com/UIStXJbEBb
— 山本 一成@Ponanza (@issei_y) 2015, 11月 17
2015/11/19追記:
この後初対決が実現し、後手の技巧がPonanzaを破っています。こちらの記事を参照。
技巧の強さとは
調べてみると、技巧は上記の世界コンピュータ将棋選手権の他、同年開催された5五将棋の大会で「技巧ミニ」としてCOM部門2位となり、独創賞という賞を受賞しています。5五将棋は5×5の盤で行う将棋類です。
上記リンク先から当時の「技巧ミニ」のPR文書も閲覧でき、そこには以下のようなことが書かれています。
新開発の「Bishop Learning」により、評価関数を学習!
– 将棋の棋譜を用いず、
– 自己対戦も行わないで、
– 大規模な評価関数(パラメータ約200万)の学習に成功しました!
– 学習時間は家庭用PCで数時間程度です
Bishop Learningは「半教師付き学習」であり、大量の棋譜が必要な「教師あり学習」(Bonanza Method)、対戦されることが必要な「教師なし学習」に比べて、棋譜不要、対戦不要、という特徴があるようです。
また、他の手法と違い「読みや必至の概念」を「直接的に理解」するとしています。
さらに、今後の発展の可能性として以下のようにも書かれています。
教師値は神様の評価関数の近似になっていればどんなものでもよいので、詰みや必至に限らず、様々なデータを与えることで、さらに性能を向上できる可能性があります
このPR文書によると、2012年当時、開発者の出村洋介さんの肩書は「東京大学大学院法学政治学研究科」となっています。
人間に近いソフト?
そして今回の電王トーナメントのPR文書を見てみると。
人間的な4つの評価項目(駒の損得、駒の効率、玉の堅さ、手番)を考慮して、形勢判断を行います。
「多クラスロジスティック回帰」という手法により指し手の確率を学習し、読みを強化しています。
評価項目については、Bonanza型の評価関数で考慮されていない「玉の堅さ」と「手番」を考慮した、読みについては激指の手法を発展・拡張した、とのこと。さらに
人間が使っている「手筋」の概念を、コンピュータに理解させることが目標です。
とも書かれています。5五将棋の時には「詰みや必至」だったのが、今回は「手筋」にまで至った、ということでしょうか。だとするとこれまでより人間に近いコンピュータ将棋ソフトである可能性があります。
参考文献に棋書
その証拠になるのかわかりませんが、PR文書の参考文献には以下の様な、人間が読む「棋書」も羅列されています。
開発にあたっては、多くの棋書も参考にしております。大変興味深いアイデアが満載で、いつも楽しく読ませていただいております。
* 基本的な考え方について
木村一基『初級者でもわかる受けの基本』、武市三郎『将棋の力をつける本』、藤井猛『攻めの基本戦略』。
* 形勢判断について
先崎学『先ちゃんの将棋ABC』、羽生善治『上達するヒント』、谷川浩司『将棋に勝つ考え方』。
* 手筋について
青野照市『手筋事典』、桐谷広人『歩の玉手箱』、佐藤康光『実践で使える囲いの急所』、高橋道雄『手筋の教科書』、森雞二『羽生の実践手筋』。
* 定跡について
上野裕和『将棋・序盤完全ガイド 振り飛車編』『同・相居飛車編』。
今回出場する30のソフトの中で、PR文書で棋書を参考文献としてあげているのは他にない(私の見落としがなければ)はず。
今回の電王トーナメントでは、優勝候補Ponanzaが独走する可能性もありましたが、ここにきて違うタイプの強いソフトが出てきて俄然楽しみになってきましたね。
注目の第3回将棋電王トーナメントは、11月21(予選リーグ)、22(決勝T初日)、23日(決勝最終日)に行われます。
コメント
とりあえず。ソフト対人間という現電王戦の局面では。ソフト。人間に似て無くても、強ければなんでも良いです。私は、頭が単純なもので。「技巧」のようなソフトは。現在、一部で「ソフト指し」と揶揄されるケースも残る、「ソフトを使ったプロ棋士の将棋」の時代に。今後大いに活躍が期待できそうですね。
コメントありがとうございます。
そうですね、人間ではできないような手を指すというソフトもありだと思いますし。私はなんとなく、強さばかりじゃなくて個性があったり、人間の棋力向上に役立つとよいなと思っていましたので、技巧に注目してみました。
28角のような手を回避できるのかに興味があります。
そうですね。電王トーナメントのニコニコ生放送にコメントを打って聞いてみるとか、ですかね。やってみたことあるかもわかりませんが。