Anúncio

人間対Pc2

Ken Ogura
6 de Jun de 2013
Anúncio

人間対Pc2

  1. 人間対PC 佐竹俊哉 13年6月3日月曜日
  2. 人間対PC • 第二回将棋電王戦 • PC側の3勝1敗1分 け • トップのA級棋士に も勝った 13年6月3日月曜日
  3. 人間対PC チェス...1988年にグランドマスター(チ ェス選手の最高位のタイトル)に初勝利 囲碁...まだプロには勝てない 13年6月3日月曜日
  4. Topic • 将棋&囲碁 13年6月3日月曜日
  5. 将棋 13年6月3日月曜日
  6. ゲーム木 • ゲームの可能な 手順を表現 今 二手後 一手後 13年6月3日月曜日
  7. ゲーム木(例) 13年6月3日月曜日
  8. 完全なゲーム木 • 指せる全ての手を終局まで表現したゲ ーム木 • 3目並べとかならできる(26830通り) • 将棋は駒と盤面多すぎて局面多すぎ • 詰将棋 13年6月3日月曜日
  9. • 全部の局面が作 れたら・・ 勝 負 勝 負 勝 勝 勝 勝負 勝 13年6月3日月曜日
  10. (・ω・) • 将棋は局面多すぎ・・・ 13年6月3日月曜日
  11. じゃあどうするか 13年6月3日月曜日
  12. とりあえず • ある深さまで手を読む • そこでの局面を評価して完全なゲーム 木と似たようなことをする 13年6月3日月曜日
  13. ミニマックス法 • ある局面の優劣を「評価関数」で評価 • 数値の大きさに応じて、+なら先手, −な ら後手が優勢とする 13年6月3日月曜日
  14. ミニマックス法 • MaxをどうMinにするかを調べる • (ネガマックス法という派生も) 13年6月3日月曜日
  15. 9 13 13 6 7 8 7-5 7 -5 : Maxを調べる : Minを調べる 13年6月3日月曜日
  16. ミニマックス法 • これで1~3手ぐらいなら読めるけど... • まだ弱すぎ 13年6月3日月曜日
  17. どうやって無駄を減らす? 13年6月3日月曜日
  18. αβ探索 • それぞれの頂点で最大や最小のみを選 択することに注目 13年6月3日月曜日
  19. 7 4 7 × 57 7 -3 5 ×515 × [-∞, 7] [7, ∞] 探索順序 13年6月3日月曜日
  20. αβ探索 • 要は調べる必要の無い所を無視 • 得られる結果はミニマックス法と同じ • うまく使えば、同じ時間でミニマック ス法の2倍先まで読める 13年6月3日月曜日
  21. 将棋 • αβ探索したり、序盤は棋譜のデータか ら学習して定石を使ったり • より高速化する方法が研究されている 13年6月3日月曜日
  22. 囲碁 13年6月3日月曜日
  23. 囲碁 • αβ探索は別に将棋に限らず有効な手段 だった • 囲碁にも使えるのでは??? 13年6月3日月曜日
  24. 囲碁 • 結論から言うと無理 • ▂▅▇█▓▒░(’ω’)░▒▓█▇▅▂うわああ あああああ 13年6月3日月曜日
  25. 囲碁 • 19路盤囲碁 • 9路盤囲碁も.. • なぜだろう 将棋 9路盤囲碁 19路盤囲碁 10 10 10 71 38 171 13年6月3日月曜日
  26. (再掲) 7 4 7 × 57 7 -3 5 ×515 × [-∞, 7] [7, ∞] 探索順序 13年6月3日月曜日
  27. (再掲) 7 4 7 × 57 7 -3 5 ×515 × [-∞, 7] [7, ∞] 探索順序 これ!! 13年6月3日月曜日
  28. 囲碁 • それぞれの局面での評価値を利用して いる • つまり、評価関数が作れないと無理 13年6月3日月曜日
  29. 評価の難しさ • 石たちの価値が同じ • 領域が決まるのは最後 • オセロとかのように角を取るべきとか がない • 捨石とか 13年6月3日月曜日
  30. 囲碁 • 評価関数を使わずに探索できないか? • 対局が終わった最後の状態なら勝ち負 けがわかる 13年6月3日月曜日
  31. (原始)モンテカルロ法 • 局面を評価する代わりに適当に打って みる 13年6月3日月曜日
  32. プレイアウト • 乱数を用いて、最後までプレイするこ とをプレイアウトと呼ぶ こんな感じにしてしまう 13年6月3日月曜日
  33. (原始)モンテカルロ法 • プレイアウトをたくさんして勝てそう な手を選ぶ 13年6月3日月曜日
  34. • このままだと運任せすぎて全然勝てな い • もうちょっとしっかりとした手を (原始)モンテカルロ法 13年6月3日月曜日
  35. モンテカルロ木探索 • 有利な手には多くの プレイアウトを • プレイアウト回数が 増えすぎたら段が増 える 13年6月3日月曜日
  36. モンテカルロ木探索 • 将棋の時と違って、勝ちか負けかだけ を見る • スコア差ではなく勝率重視 13年6月3日月曜日
  37. 囲碁 • これでそれなりの性能 • UCTという戦略も 13年6月3日月曜日
  38. 将棋&囲碁 • 同じようなゲームとは言っても状況が 全然違った • まだまだこれからの進化が期待 13年6月3日月曜日
  39. PCの強み • 圧倒的な計算速度 • ムーアの法則(「半導体の集積密度は18 ∼24ヶ月で倍増する」という法則)に表 れるように、進化している • 人間の設計したアルゴリズム通りに動 く 13年6月3日月曜日
  40. PCの弱み • いくら計算が速いといっても限度有り (考えうる状態が多すぎると計算しきれ ない) • こうした方針を取れば良いという良い 戦略が無いとうまく動かない 13年6月3日月曜日
  41. まとめ • 全てアルゴリズムにかかっている • 自分で考えるのも楽しい 13年6月3日月曜日
  42. !結局人間対人間! 13年6月3日月曜日
  43. ご清聴ありがとうございました 13年6月3日月曜日
Anúncio