相互RSS募集!詳細はこちら

オタコムはアニメ・ゲームなどサブカルチャー系情報の総合ブログどんなネタでも扱います!

2017年12月07日 11:00 コメントを見る

『AlphaGo』から進化を果たし、ついに最強のチェス・将棋AIが爆誕!わずか24時間の自己学習で最強AIを越える

コンピュータの進化は凄すぎる

20171207065615

世界最強の囲米Alphabet傘下のDeepMindは12月5日(現地時間)、同社の囲碁AI「AlphaGo Zero」のアルゴリズムを、囲碁以外にも適用できるようにした盤上ゲームAI「AlphaZero」を発表した。数時間学習させることで、世界トップレベルのチェスAI「Stockfish」、将棋AI「Elmo」、囲碁AI「AlphaGo Zero」「初代AlphaGo」の全ての性能を上回ったとしている。

ts2056_dm01

囲碁AIであるAlphaGo Zeroは、囲碁のルール以外は与えられない環境下で自身のプログラムどうしで対戦し、最善手を学習していくプログラム。AlphaZeroは、これをさらに一般化し、チェスや将棋のルールのみを与えた状態で学習を重ねた。

同社の論文によれば、AlphaZeroに対し70万ステップ学習させ、ステップを経るごとに強さの指標であるレーティングを測った。学習には自身どうしの対戦に5000個の第1世代TPUを、ニューラルネットワークの訓練に64個の第2世代TPUを使用した。

学習の結果、チェスのStockfishには4時間(30万ステップ)で、将棋のElmoには2時間(11万ステップ)の学習でそれらのレーティングを上回り、8時間(16万5000ステップ)の学習で韓国のプロ棋士・李世ドルさんを破った初代AlphaGoを上回った。3日間学習させたAlphaGo Zeroに対しても、24時間以内(約38万ステップ)に性能で上回った。

学習を完了したAlphaZeroとStockfish、Elmo、AlphaGo Zero(3日間学習)を、それぞれ先攻後攻を切り替えて50回対戦させたところ、どのケースでもAlphaZeroが他のAIに勝ち越した。AlphaZeroとAlphaGo Zeroは4TPUを使用、StockfishとElmoは1GBのハッシュサイズと64スレッドを用いた最大レベルで戦わせた。

ki1609376_alphazero02

1秒当たりに読む手を比較すると、Stockfishは7000万手、Elmoは3500万手と膨大な量を読んでいたのに対し、AlphaZeroがチェスで8万手、将棋で4万手と従来のAIに比べて明らかに少ない手数しか読んでいなかった。「AlphaZeroはディープニューラルネットワークにより最善手に当たりをつけ、より『人間らしい』アプローチで探索している」と、論文では指摘している。

ki1609376_alphazero03

http://www.itmedia.co.jp/news/articles/1712/06/news138.html

この記事への反応

何このドラゴンボール並みのインフレ
もしかしてAIに「戦闘力5か、ゴミだな」とか言われるようになるのか

たった24時間で理解出来るゲームだったのか(笑)

将棋なんか日本人しかやってないし外国人が参入したら日本人ボコボコにされるんやろな

人間が神の一手とか言ってるのが
恥ずかしくなる。

elmoも化け物相手に10回に1回は勝つくらいの意地は見せたな

ポナンザ  桃白白
やねうら  チャパ王
elmo    べジータ
AlphaZero フリーザ

将棋には向いていないとか誰か言っていたよなぁw

割と興味深いのは
「チェスは一定以上の強者が試合すると8割位引き分けになる」って事だな


将棋世界 2018年1月号
将棋世界 2018年1月号
posted with amazlet at 17.12.06
マイナビ出版 (2017-12-01)

コメント

1.とある名無しのオタコム2017年12月7日 14:47
▽このコメントに返信

もう 人間対機械の戦いとか つまらない
なぜって 機械が勝つのが当たり前になってしまったから。

コメントを投稿する

コメントを残す

※コメントの番号の前に「※」をつけると、
そのコメントに返信できます(例:※1)

おすすめサイト最新記事一覧

リツイート数ランキング

Amazonランキング

記事ランキング本日週間