「AI(人工知能)が将棋でプロに勝った!」
AI(人工知能)という言葉を頻繁に見かけるようになり、盤上で戦うゲームで人間に勝ったという話もよく見かけるようになりましたよね。
とりわけ話題をさらったのは株式会社ドワンゴが主催、開催していた将棋電王戦。この電王戦にはボンクラーズややねうら王といった様々なAI(人工知能)将棋チームが出場しています。
2013年に行われた第二回電王戦では山本一成氏が開発したソフトウェアPonanzaが佐藤慎一四段に勝利。コンピュータが公の場でプロ棋士を破ったのはこれが初めてのこと。しかし20年ほど前にはチェスで人間のトップレベルと十分戦える段階にはなっていました。
そこで今回は「AIの将棋ソフトがプロ棋士に勝利!その決め手はコレだ!」と題しAI(人工知能)が将棋で勝つために乗り越えなくてはいけなかった壁とは何か、そして勝つきっかけとなった技術はどのようなものであったかに迫っていきます。
それではまず、チェスが将棋を大きくリードしていた理由からお伝えします。
チェスのAI(人工知能)は将棋を大きくリードしていた!その理由に迫る!
初めに言及した通りAI(人工知能)が将棋でプロ棋士に勝つ前の20年ほど前にチェスで既に人間のトップレベルと勝負できるような段階になってはいました。AI(人工知能)の開発過程で将棋にこれほどタイムラグができていた要因として最初に「扱いにくさ」があります。
単純計算を例に考えてみましょう。計算するだけであれば人間はどうやってもコンピュータに勝つことはできません。しかしAI(人工知能)に将棋をさせるとなると話は別。計算以前に何をどのようにするのかわからないのです。
チェスと将棋のゲーム性の違いについて触れていきます。
コンピュータの場合残っている駒の数を計算させるのはとても簡単だったのでゲームについて論理的に説明しやすかったのです。これがコンピュータが将棋とチェスを区別する大きな要素の一つでタイムラグに繋がっていました。
勝利の決め手は大量の経験値!人間がAI(人工知能)に将棋を教わる時代!?
将棋がチェスよりも論理的でないのであればそれをどうやってプログラムにしていったか。Ponanzaの開発者である山本一成氏曰く将棋のプログラムは1万行くらいで規模としては中小程度とのこと。そしてそのプログラムに将棋の全てが書いてあるわけではないようです。プログラム以外にAI(人工知能)自身が学習した部分があります。それは約2億もの情報量からできていると語っています。
そこで記述する勉強法では「強化学習」が挙げられます。これは価値を最大化させるような方法を試行錯誤しながら学ぶというものです。
そして山本氏はPonanzaが強くなるに留まらず新しい戦法が湯水のように出てきており、プロ棋士らがコンピュータから勉強する時代になっているとも語っています。
AI(人工知能)が将棋の大局観を身につける!?Ponanzaに影響を与えたBonanzaのアルゴリズムから秘密に迫る!
将棋そのものへさらにフォーカスをあてていきましょう。ここではPonanzaに影響を与えた将棋ソフトBonanzaの仕組みに触れていきます。
平均80パターンといっても大半は攻撃にも防御にもならないものであり、お互い王将を前後左右に動かしているだけで140手過ぎてしまう場合も十分に考えられます。もちろん無限ループになるのであらゆる状況で勝てるような手を指すことはできません。
棋士の大局観に負けないようにするために評価関数という数値を活用しています。
強い駒を取れば相手を陣形を弱らせつつ自分のそれを強化させ有利に運ぶことができます。そのため全ての駒に点数を与え駒を得ることで勝てるようにするアルゴリズムが作られました。
そこで問題になったのは序盤では駒の交換があまり起こらないということです。そのため棋士の対局の序盤を学習させることで駒がぶつかるまでサポートするという仕組みを作っています。
しかしそれだけだと初めの段階で学習してない手を打たれるとどうにもならなくなってしまいます。例えばネットや本にあるマイナーな戦法を真似してしまえば初心者でも赤子の手を握るように勝ててしまうのです。
一連の手法はボナンザメソッドと呼ばれており、Ponanza含む今日の将棋ソフトに多大な影響を与えていると言っても過言ではありません。
今回は「AIの将棋ソフトがプロ棋士に勝利!その決め手はコレだ!」と題しAI(人工知能)が将棋で勝つために乗り越えなくてはいけなかった壁とは何か、そして勝つきっかけとなった技術はどのようなものであったかに迫っていきました。
今後も将棋ソフトの改良しどこまで人間を凌駕していくか注目していけるといいですよね。
コメントをどうぞ