O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.
人工知能の技術を用いれば誰でも人工知能の技術を用いれば誰でも人工知能の技術を用いれば誰でも人工知能の技術を用いれば誰でも
名人に勝つ将棋名人に勝つ将棋名人に勝つ将棋名人に勝つ将棋/囲碁のプログラム囲碁のプログラム囲碁のプログラム囲碁のプログラム...
∗ 思考ゲームは人工知能の良い例題
∗ ルールが明確
∗ 勝敗によって評価が容易
∗ さまざまなむずかしさのゲームが存在する
∗ 強い人間が存在する
∗ それ自体が面白い
人工知能と思考ゲーム
∗ 欧米では人工知能の基本的な例題となった(チューリン
グ、シャノンなどが「お墨付き」を与えた)
∗ 日本では長い間思考ゲームを例題とすることが認めら
れなかった(白い目で見られた)
∗ 「ゲームの研究はなぜ日本では疎外されてきたか」
(ゲーム...
∗ チェッカー 10の30乗 1994年
∗ オセロ 10の60乗 1997年
∗ チェス 10の120乗 1997年
∗ 将棋 10の220乗(80の115乗) 2015年
∗ 囲碁 10の360乗 2016年
∗ 数学的に解けた(必勝法がわ...
∗ 1950年ごろ チューリング、シャノンが開始
∗ (1950年代にサイモンはあと10年で世界チャンピオンに勝てると宣
言して後で「ほらふき」と言われる)
∗ (哲学者のドレイファスがコンピュータは永遠に世界チャンピオンに
勝てないと出張する...
∗ 1975年頃研究がスタート(チェスに比べてかなり遅い)
∗ どうしようもなく弱い時代が続く
∗ 1984年前後 森田将棋発売
∗ 1990年代 アマチュア有段レベル
∗ 2000年代 アマチュア高段レベル
∗ 2006年 ボナンザメソッド(...
将棋の思考アルゴリズム (保木さん)
6 5 4 3 2 1
14
4 先手番局面
後手番局面
最善応手系列
静的評価関数
静的評価関数の効果的な設計法は?
将棋は分岐数が多い。
十分深く探索できるのか?
15 末端評価値
b 子局面a
プロ棋士の選択
c
下方修正上方修正
ルート局面
コンピュータの選択
7
7
性質の良い目的関数を設計して
ミニマックス探索ごと自動調整
評価関数の自動学習法(保木さん)
Player 勝率勝率勝率勝率 (%)
多数決合議 73
Gekisashi 50
GPS Shogi 36
Bonanza 62
YSS 37
• 分散並列探索法+合議法
4異種プログラム (Gekisashi, GPS Shogi, Bon...
∗ 2015年10月11日 情報処理学会将棋プロジェクト終了
宣言。トッププロ棋士に勝つコンピュータ将棋を開発す
るというプロジェクトの目的を事実上クリアできたので終
了する。マスコミでかなり取り上げられる。
∗ 羽生さんといい勝負をするのは今...
コンピュータも創造性を持てる?
∗ 創造性は人間だけのものでコンピュータには持てないという
主張がある
∗ 人間のデータから機械学習すると人間を越えられないという
主張がある
∗ しかしコンピュータ将棋が新手を創造している
∗ GPS新手(第2...
3七銀
5五銀左
(ちょっと自分たちの研究の宣伝)
∗ コンピュータは創造性を持たせるための研究の一環と
して小説を書かせよう
∗ 「きまぐれ人工知能 作家ですのよ」 プロジェクトを201
2年から実施している
∗ コンピュータに星新一のようなショートショートを...
∗ 小説創作は「ストーリーを考える」、「考えたストーリーを
文章にする」の2つから成る
∗ 2つをコンピュータにやらせることを並列に研究している
が、今回は後者の「考えたストーリーを文章にする」こと
を実現した
∗ 現状ではストーリーは(ほぼ)...
∗ 現在の機械学習のほとんどは人間の(ビッグ)データか
ら学習をしている
∗ コンピュータ将棋はもう人間より強くなったので、人間の
データは参考にならない?
∗ コンピュータ将棋同士でたくさん将棋を指してその棋譜
データを貯めて、そのデータから...
∗ 竜王戦(10月15日開始)の挑戦者である三浦弘行9段が直前の10
月12日になって対局停止
∗ 挑戦者決定戦で負けた棋士が代わりに挑戦
∗ 三浦9段に対局中にスマホでカンニングをした疑い
∗ 本人は否認
∗ 昨年一杯対局禁止の措置
∗ 今後...
∗ 藤井聡太
∗ 中学生で将棋のプロ棋士(4段) 4人目
∗ デビューから公式戦13連勝(新記録)
∗ 小さい頃からコンピュータの対戦に親しんでいる
∗ コンピュータの気持ちがわかる?
∗ 「AIネイティブ」世代
明るい兆し
そもそも。。。
∗ プロ棋士が負けるのはいわば「歴史的な必然」
∗ 人間のプライドをかけて戦うべきものではない
∗ 負けたり引き分けたりして泣くべきものではない
∗ 人間対コンピュータの対決ではなく人間同士の異種格
闘技にすぎない
∗ 人工知能...
コンピュータに負けた将棋は?
∗ 世の中で一番将棋が強い存在は人間ではなくコン
ピュータになる
∗ 15年以上前に負けたチェスが参考になりそう
∗ チェスは依然として盛ん 寂れていない
∗ 将棋もそうなってほしいが心配がある。。。
∗ チェスは...
100メートル競走と将棋
∗ 人間のチャンピオンよりも機械(車)の方が100メートル
競走は早い
∗ でもそれは悔しくない
∗ ではなぜ将棋だと悔しいのか?
∗ 人間は体力で負けることは経験がある(動物にも機械
にも負けている)が、知性で負けた...
∗ 1960年代に研究が始まる
∗ 長い長いとても弱い時代が続く
∗ 2000年代半ば モンテカルロ法の応用手法開発
∗ 2010年代 アマ高段者レベル
∗ 2016年 Google のAlphaGo プロ棋士に勝つ
∗ 深層学習+モンテカルロ...
∗ メインは D.Silver とAja Huang の二人
∗ 2016年10月弱いプロ(2段)に5戦5勝 非公式戦を入れ
ると8勝2敗
∗ 深層学習でプロ棋士の棋譜(3000万局面)を再現する
予測器の作成 予測率 57%
∗ 予測器を初期...
∗ 機械学習に50個のGPU 一か月
∗ 対戦は1202個のCPUと176個のGPU
∗ やはりGoogle の資金力はすごい
∗ Nature の論文の著者が20人!!
∗ 「論文のレベルでは絶対イ・セドルに勝てない(すべて
のプロ棋士が断言...
∗ 2016年3月 AlphaGoがイ・セドルに4勝1敗
∗ コンピュータ側の完勝(イ・セドルに大きなミスはない)
∗ 世界中の囲碁のプロ棋士、囲碁ファン、人工知能関係
者がショックを受けている
∗ AlphaGoは人間より優れた大局観を持って...
∗ 日本のDeepZenGoが趙治勲に1勝2敗(2016年)
∗ 刑天(中国)がカ・ケツといい勝負(2016年)
∗ Masterが世界中のトッププロ棋士に60連勝負けなし
(2016-2017年)
∗ Master はAlphaGoの改良版
...
∗ 中国のテンセント(世界最大のゲーム会社)が作ったコ
ンピュータ囲碁のプログラム
∗ 深層学習(ディープラーニング)+モンテカルロ木探索
+強化学習 AlphaGoの仕組みと基本的に一緒
∗ 昨年AlPhaGoが発表されてから開発を開始
∗ ...
∗ 技巧、ボナンザ、Apery、やねうら王、うさぴょんなど公
開されている強い将棋ソフトを拾ってくる(中にはプロに
勝てるソフトもある)
∗ 機械学習は既存のものを応用する
∗ 探索はストックフィッシュ(チェスの公開ソフト)を応用す
る
∗ F...
∗ Natureの論文などでAlphaGoの手法を勉強する
∗ モンテカルロ木探索を勉強する(「コンピュータ囲碁-
モンテカルロ法の理論と実践―」,美添・山下著 など)
∗ 強化学習を勉強する(「強化学習」サットン他 など)
∗ 「彩」(山下宏...
∗ ルールが明確で棋譜がたくさんあるので機械学習で強
くすることができた
∗ 人間の棋譜から学んだが、人間を超えることができた
(創造性も発揮できるようになった)
∗ 人間には理解しがたい手を指す/打つようになった
∗ ルールが不明確な対象では...
[AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる?
[AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる?
[AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる?
Próximos SlideShares
Carregando em…5
×

de

[AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 1 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 2 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 3 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 4 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 5 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 6 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 7 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 8 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 9 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 10 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 11 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 12 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 13 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 14 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 15 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 16 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 17 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 18 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 19 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 20 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 21 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 22 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 23 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 24 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 25 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 26 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 27 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 28 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 29 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 30 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 31 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 32 [AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる? Slide 33
Próximos SlideShares
What to Upload to SlideShare
Avançar
Transfira para ler offline e ver em ecrã inteiro.

0 gostaram

Compartilhar

Baixar para ler offline

[AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる?

Baixar para ler offline

最近の人工知能の進歩を示す例として、将棋と囲碁というゲームでコンピューターがトップレベルのプロ棋士に勝ったということがあります。技術的なブレークスルーは機械学習によるもので、将棋は Bonanza、囲碁は AlphaGo という 1 つのプログラムが最初に成功を収めました。その後多くのプログラムが同じレベルに達しています。ゲームのルールを知らない段階から開発を始めて 1 年足らずでトップレベルのプロ棋士に勝つまでになっています。これは人工知能の技術による方法論が確立したということを意味します。ここではゲームを例として、機械学習によって高性能のプログラムがどのように作られているかを解説します。

松原 仁
公立はこだて未来大学
教授

  • Seja a primeira pessoa a gostar disto

[AI11] 人工知能の技術を用いれば誰でも名人に勝つ将棋/囲碁のプログラムを作ることができる?

  1. 1. 人工知能の技術を用いれば誰でも人工知能の技術を用いれば誰でも人工知能の技術を用いれば誰でも人工知能の技術を用いれば誰でも 名人に勝つ将棋名人に勝つ将棋名人に勝つ将棋名人に勝つ将棋/囲碁のプログラム囲碁のプログラム囲碁のプログラム囲碁のプログラム を作ることができるを作ることができるを作ることができるを作ることができる? 松原 仁 公立はこだて未来大学 2017年5月23日
  2. 2. ∗ 思考ゲームは人工知能の良い例題 ∗ ルールが明確 ∗ 勝敗によって評価が容易 ∗ さまざまなむずかしさのゲームが存在する ∗ 強い人間が存在する ∗ それ自体が面白い 人工知能と思考ゲーム
  3. 3. ∗ 欧米では人工知能の基本的な例題となった(チューリン グ、シャノンなどが「お墨付き」を与えた) ∗ 日本では長い間思考ゲームを例題とすることが認めら れなかった(白い目で見られた) ∗ 「ゲームの研究はなぜ日本では疎外されてきたか」 (ゲームプログラミング、共立出版、1998) ∗ 結果的に日本は出遅れた 思考ゲームの研究
  4. 4. ∗ チェッカー 10の30乗 1994年 ∗ オセロ 10の60乗 1997年 ∗ チェス 10の120乗 1997年 ∗ 将棋 10の220乗(80の115乗) 2015年 ∗ 囲碁 10の360乗 2016年 ∗ 数学的に解けた(必勝法がわかった)のはチェッカーま で ゲームの場合の数
  5. 5. ∗ 1950年ごろ チューリング、シャノンが開始 ∗ (1950年代にサイモンはあと10年で世界チャンピオンに勝てると宣 言して後で「ほらふき」と言われる) ∗ (哲学者のドレイファスがコンピュータは永遠に世界チャンピオンに 勝てないと出張する) ∗ 1967年 マックハック アマ初級者 ∗ 1970年代 Chess X.Y. アマ上級者 ∗ 1985年 Deep Thought プロ並み ∗ 1996年 Deep Blue Kasparovに1勝 ∗ 1997年 Deep Blue Kasparovに勝ち越し ∗ 機械学習は(ほとんど)使っていない コンピュータチェス (人工知能の「蠅」 by McCarthy)
  6. 6. ∗ 1975年頃研究がスタート(チェスに比べてかなり遅い) ∗ どうしようもなく弱い時代が続く ∗ 1984年前後 森田将棋発売 ∗ 1990年代 アマチュア有段レベル ∗ 2000年代 アマチュア高段レベル ∗ 2006年 ボナンザメソッド(機械学習で評価関数を作る) ∗ 2010年 女流プロに勝つ(あから2010 情報処理学会) ∗ 2013年 プロ棋士に勝ち越す ∗ 2015年 実力的にはトッププロ棋士を超える ∗ 2017年 Ponanzaが佐藤天彦名人に圧勝 コンピュータ将棋
  7. 7. 将棋の思考アルゴリズム (保木さん) 6 5 4 3 2 1 14 4 先手番局面 後手番局面 最善応手系列 静的評価関数 静的評価関数の効果的な設計法は? 将棋は分岐数が多い。 十分深く探索できるのか?
  8. 8. 15 末端評価値 b 子局面a プロ棋士の選択 c 下方修正上方修正 ルート局面 コンピュータの選択 7 7 性質の良い目的関数を設計して ミニマックス探索ごと自動調整 評価関数の自動学習法(保木さん)
  9. 9. Player 勝率勝率勝率勝率 (%) 多数決合議 73 Gekisashi 50 GPS Shogi 36 Bonanza 62 YSS 37 • 分散並列探索法+合議法 4異種プログラム (Gekisashi, GPS Shogi, Bonanza, YSS) で多数決 表: 多数決による性能の向上。勝率は一手3秒 1,000局より計算 あから2010の開発(保木さん) • 約200台の計算機を使用 人間が分散並列環境と対峙 T. Obata, T. Sugiyama, K. Hoki, T. Ito, CG2010 IPSJ Official Character
  10. 10. ∗ 2015年10月11日 情報処理学会将棋プロジェクト終了 宣言。トッププロ棋士に勝つコンピュータ将棋を開発す るというプロジェクトの目的を事実上クリアできたので終 了する。マスコミでかなり取り上げられる。 ∗ 羽生さんといい勝負をするのは今しかない!!数年後 にしても意味がない。 ∗ コンピュータ将棋の研究は人間より強くするという目的 ではないものに移る(たとえば「接待将棋」) 終了宣言
  11. 11. コンピュータも創造性を持てる? ∗ 創造性は人間だけのものでコンピュータには持てないという 主張がある ∗ 人間のデータから機械学習すると人間を越えられないという 主張がある ∗ しかしコンピュータ将棋が新手を創造している ∗ GPS新手(第2回電王戦第5局) この新手でコンピュータが 勝った ∗ Ponanza新手(2013年名人戦第5局)コンピュータの手を名人 が真似をした ∗ コンピュータは人間のデータから人間は思いつかなかった創 造性を持つことができた
  12. 12. 3七銀
  13. 13. 5五銀左
  14. 14. (ちょっと自分たちの研究の宣伝) ∗ コンピュータは創造性を持たせるための研究の一環と して小説を書かせよう ∗ 「きまぐれ人工知能 作家ですのよ」 プロジェクトを201 2年から実施している ∗ コンピュータに星新一のようなショートショートを創作させ ることを目指す ∗ 昨年の星新一賞(第3回)に人間とコンピュータ共同で 創作した作品を応募した(順当に落選したが、一次審 査に通った)
  15. 15. ∗ 小説創作は「ストーリーを考える」、「考えたストーリーを 文章にする」の2つから成る ∗ 2つをコンピュータにやらせることを並列に研究している が、今回は後者の「考えたストーリーを文章にする」こと を実現した ∗ 現状ではストーリーは(ほぼ)人間が与え、それに基づ いてコンピュータが文章化している ∗ 人間8割でコンピュータ2割 ∗ これから頑張らないと。。。。 コンピュータによる小説創作
  16. 16. ∗ 現在の機械学習のほとんどは人間の(ビッグ)データか ら学習をしている ∗ コンピュータ将棋はもう人間より強くなったので、人間の データは参考にならない? ∗ コンピュータ将棋同士でたくさん将棋を指してその棋譜 データを貯めて、そのデータから学習する(強化学習) ∗ 人間とは関係なく、コンピュータだけで(人間には理解 でない)将棋を指すことになるかもしれない 以前は人間から学んでいたが、 人間を超えたときは。。。
  17. 17. ∗ 竜王戦(10月15日開始)の挑戦者である三浦弘行9段が直前の10 月12日になって対局停止 ∗ 挑戦者決定戦で負けた棋士が代わりに挑戦 ∗ 三浦9段に対局中にスマホでカンニングをした疑い ∗ 本人は否認 ∗ 昨年一杯対局禁止の措置 ∗ 今後対局中はスマホ利用禁止 ∗ 第三者委員会の判断は三浦9段はシロだが対局禁止の判断もや むを得ない ∗ 会長辞任 スマホカンニング疑惑事件
  18. 18. ∗ 藤井聡太 ∗ 中学生で将棋のプロ棋士(4段) 4人目 ∗ デビューから公式戦13連勝(新記録) ∗ 小さい頃からコンピュータの対戦に親しんでいる ∗ コンピュータの気持ちがわかる? ∗ 「AIネイティブ」世代 明るい兆し
  19. 19. そもそも。。。 ∗ プロ棋士が負けるのはいわば「歴史的な必然」 ∗ 人間のプライドをかけて戦うべきものではない ∗ 負けたり引き分けたりして泣くべきものではない ∗ 人間対コンピュータの対決ではなく人間同士の異種格 闘技にすぎない ∗ 人工知能は道具なので、対等の立場で戦うというもの ではない
  20. 20. コンピュータに負けた将棋は? ∗ 世の中で一番将棋が強い存在は人間ではなくコン ピュータになる ∗ 15年以上前に負けたチェスが参考になりそう ∗ チェスは依然として盛ん 寂れていない ∗ 将棋もそうなってほしいが心配がある。。。 ∗ チェスは(頭脳)スポーツだが、将棋はスポーツでなく人 間の道の一つ
  21. 21. 100メートル競走と将棋 ∗ 人間のチャンピオンよりも機械(車)の方が100メートル 競走は早い ∗ でもそれは悔しくない ∗ ではなぜ将棋だと悔しいのか? ∗ 人間は体力で負けることは経験がある(動物にも機械 にも負けている)が、知性で負けた経験がなかった
  22. 22. ∗ 1960年代に研究が始まる ∗ 長い長いとても弱い時代が続く ∗ 2000年代半ば モンテカルロ法の応用手法開発 ∗ 2010年代 アマ高段者レベル ∗ 2016年 Google のAlphaGo プロ棋士に勝つ ∗ 深層学習+モンテカルロ法+強化学習 ∗ 2016年3月 韓国のイ・セドルと対戦 コンピュータ囲碁
  23. 23. ∗ メインは D.Silver とAja Huang の二人 ∗ 2016年10月弱いプロ(2段)に5戦5勝 非公式戦を入れ ると8勝2敗 ∗ 深層学習でプロ棋士の棋譜(3000万局面)を再現する 予測器の作成 予測率 57% ∗ 予測器を初期値としてコンピュータ同士で強化学習さ せ、元のに80%勝つシステムを作成 ∗ そのシステムを使って3000万局面をデータにしてvalue networkを作成(これが囲碁の評価関数に相当) ∗ それにモンテカルロ木探索を使ってプレイする AlphaGo 1
  24. 24. ∗ 機械学習に50個のGPU 一か月 ∗ 対戦は1202個のCPUと176個のGPU ∗ やはりGoogle の資金力はすごい ∗ Nature の論文の著者が20人!! ∗ 「論文のレベルでは絶対イ・セドルに勝てない(すべて のプロ棋士が断言)が、機械学習がその後もすごくうまく いっていれば、もしかするともしかするかもしれない」と 当初は思っていた。。。。 AlphaGo 2
  25. 25. ∗ 2016年3月 AlphaGoがイ・セドルに4勝1敗 ∗ コンピュータ側の完勝(イ・セドルに大きなミスはない) ∗ 世界中の囲碁のプロ棋士、囲碁ファン、人工知能関係 者がショックを受けている ∗ AlphaGoは人間より優れた大局観を持っている(コン ピュータには人間に見えない未来が見えていた) ∗ すでに実力として人間よりもAlphaGoの方が上と思わざ るを得ない ∗ 囲碁も将棋と同じ道を辿ったことになる AlphaGo 3
  26. 26. ∗ 日本のDeepZenGoが趙治勲に1勝2敗(2016年) ∗ 刑天(中国)がカ・ケツといい勝負(2016年) ∗ Masterが世界中のトッププロ棋士に60連勝負けなし (2016-2017年) ∗ Master はAlphaGoの改良版 ∗ DeepZenGoも井山に勝利 ∗ 2017年5月にカ・ケツとAlphaGoが対戦する(3回戦) その後のコンピュータ囲碁
  27. 27. ∗ 中国のテンセント(世界最大のゲーム会社)が作ったコ ンピュータ囲碁のプログラム ∗ 深層学習(ディープラーニング)+モンテカルロ木探索 +強化学習 AlphaGoの仕組みと基本的に一緒 ∗ 昨年AlPhaGoが発表されてから開発を開始 ∗ 開発メンバーは誰も囲碁のルールを知らず ∗ 1年でトッププロ棋士に勝つレベルに達する ∗ 人工知能の開発方法論が確立されたということ 絶芸
  28. 28. ∗ 技巧、ボナンザ、Apery、やねうら王、うさぴょんなど公 開されている強い将棋ソフトを拾ってくる(中にはプロに 勝てるソフトもある) ∗ 機械学習は既存のものを応用する ∗ 探索はストックフィッシュ(チェスの公開ソフト)を応用す る ∗ Floodgateというコンピュータ将棋のサイトで対戦するこ とで強化する(棋譜データを入手する) 名人に勝つ将棋ソフトの作り方
  29. 29. ∗ Natureの論文などでAlphaGoの手法を勉強する ∗ モンテカルロ木探索を勉強する(「コンピュータ囲碁- モンテカルロ法の理論と実践―」,美添・山下著 など) ∗ 強化学習を勉強する(「強化学習」サットン他 など) ∗ 「彩」(山下宏さん)などの情報で囲碁のソフトの作り方 を学ぶ ∗ 速いGPUを用意する!! 名人に勝つ囲碁ソフトの作り方
  30. 30. ∗ ルールが明確で棋譜がたくさんあるので機械学習で強 くすることができた ∗ 人間の棋譜から学んだが、人間を超えることができた (創造性も発揮できるようになった) ∗ 人間には理解しがたい手を指す/打つようになった ∗ ルールが不明確な対象ではまだコンピュータの能力は 低い ∗ データを集めるのがむずかしい対象では機械学習を使 えない 将棋と囲碁からの教訓

最近の人工知能の進歩を示す例として、将棋と囲碁というゲームでコンピューターがトップレベルのプロ棋士に勝ったということがあります。技術的なブレークスルーは機械学習によるもので、将棋は Bonanza、囲碁は AlphaGo という 1 つのプログラムが最初に成功を収めました。その後多くのプログラムが同じレベルに達しています。ゲームのルールを知らない段階から開発を始めて 1 年足らずでトップレベルのプロ棋士に勝つまでになっています。これは人工知能の技術による方法論が確立したということを意味します。ここではゲームを例として、機械学習によって高性能のプログラムがどのように作られているかを解説します。 松原 仁 公立はこだて未来大学 教授

Vistos

Vistos totais

679

No Slideshare

0

De incorporações

0

Número de incorporações

0

Ações

Baixados

31

Compartilhados

0

Comentários

0

Curtir

0

×