Mais conteúdo relacionado Semelhante a 将棋ニューラルネットとこれからのゲームAI (20) 将棋ニューラルネットとこれからのゲームAI2. About myself
大渡 勝己 (Katsuki Ohto)
東京大学大学院 修士2年
- ゲームAI 研究
これまで 12種類のゲームAI 大会(国内・海外)に参加
- 大富豪、カーリング、囲碁、将棋、ぷよぷよ
人狼、Trax、5五将棋、サイコロ将棋、
ターン制戦略ゲーム、Block Go 、Dots & Boxes
3. About myself
大渡 勝己 (Katsuki Ohto)
大富豪AIで人間(NEWS手越さん)
と対戦
← 大富豪AIについて話しました
http://nge.jp/2017/04/16/post-139377
7. これまでの将棋プログラム
- コンピュータはノートパソコンでも秒間 300 万局面 程度を探索
- 人間は当然そんなには読めないので、
コンピュータは力任せの方法と揶揄されてきた
- しかし、人間の脳の並列計算回路の方が
演算回数はずっと多いのでは??
- 「賢くない」が「力任せ」の演算こそニューラルネットの得意分野
「読みのゲーム」将棋においてもニューラルネットが使えるのか?
9. 参考 囲碁のニューラルネット
AlphaGo論文:全13層の Convolutional Neural Network
(狭い範囲のパターンマッチの積み重ね)
その後、
- Residual Network にして深くしたり
- Spatial Batch Normalization を使う
などの性能向上が多方から報告されている
(最新のAlphaGoの policy net は 40層という噂)
Silver et al. (2016)
Mastering the game of Go with Deep
Neural Networks and Tree Search
15. 将棋ニューラルネットの学習
Ponanza Chainer では1手1秒自己対戦棋譜 5億局面から教師あり学習
を行ったらしい
大渡個人で製作した結果、1700万局面で 51.8 % の一致
その後、レベルは低いが5億以上の中終盤局面を学習データに追加し
たところ、
棋譜との一致率は落ちたが強さは大分向上
将棋は初期局面が1つなので、序盤の学習は簡単。
強さの向上には、序盤で一致率を稼ぐより中終盤の汎化の方が重要http://ppp-
lab.sakura.ne.jp/ProgrammingPlacePlus/algorithm/data_str
uct/007.html
Notas do Editor 中国で10種目出ている人がいた 去年のML15では大富豪の話しました どれくらいの人がしているか? 藤井四段の登場で少しプロの最高レートが上がったかも 自分もNN作ってみた ただし将棋の方が一様なパターンマッチでは不足かも? ところで、人間と同じ方法に近くなる これまでは時間をかけてチューニングできる人、高速化できる人が重要だったが、これからはそれだけではだめ