戦技研　ぷよぷよAI　学生講義

Puyo Puyo Strategy & Technology
Development Institute of Waseda
ぷよぷよＡＩは人類を超えるか？
ぷよぷよ戦術技術開発研究所

Place © 2004 Kenji SuzukiDate of Presentation
目次
 ぷよぷよのルール
 ぷよぷよの戦術
 ゲームＡＩ
 ぷよぷよＡＩの実演
 ぷよぷよＡＩの思考
 ぷよぷよＡＩの課題

ぷよぷよのルール
 ４個以上、左右上下にくっつけると消える
 ３列目の１２段目が埋まると負け
 連鎖をすると大量のお邪魔ぷよを送るこ
とができる

ぷよぷよのルール
 ４個以上、左右上下にくっつけると消える
 ３列目の１２段目が埋まると負け
 連鎖をすると大量のお邪魔ぷよを送るこ
とができる
５連鎖

ぷよぷよ対戦動画
 （動画１、大連鎖の打ち合い）

ぷよぷよの戦術：後打ち
 大連鎖が消える時間は長い
 相手の大連鎖中に、自分はさらに連鎖を伸ばすことができる
 先に打たせて、後から伸ばして打った方が強い：後打ち

ぷよぷよの戦術：後打ち
 （動画２、純粋な後打ち）

ぷよぷよの戦術：催促（成功例）
 相手に大連鎖を打たせるために、小連鎖を打って相手にプ
レッシャーをかける
 この小連鎖を「催促」という
（相手に大連鎖の使用を催促することから）
 相手が大連鎖を打つか、つぶされてしまえば成功

ぷよぷよの戦術：催促（成功例）
 （動画３、催促の成功例）

ぷよぷよの戦術：催促（失敗例）
 【ケース１】
相手に打たせようとするあまり、自分の大連鎖が崩れてしまうと、
相手の大連鎖に押し負けてしまう
 【ケース２】
催促として使った連鎖が大きすぎると、後打ちの大連鎖作成が間
に合わなくなる
 【ケース３】
相手により大きい威力の催促を同時に使用された場合、結果的に
自分が催促を受けた形になってしまう

ぷよぷよの戦術：催促（失敗例）
 （動画４、催促の失敗例）

ぷよぷよの戦術：ぷよぷよの中盤戦
 相手に先に大連鎖を打たせたい→小連鎖で催促する
 自分は先に大連鎖打ちたくない→相手の催促に小連鎖で「対応」する
 これら小連鎖のぶつかり合いが「中盤戦」
 自分の大連鎖を維持したまま、相手に大連鎖を先打ちさせれば
中盤戦に勝利したことになる

ゲームＡＩ：様々なゲームＡＩの現在
ゲームの種類探索空間強さ
チェッカー 10の30乗世界最強
オセロ 10の60乗世界最強
全宇宙の原子数 10の78乗 ―
チェス 10の120乗世界最強
将棋 10の220乗アマチュアトップレベル
囲碁 10の360乗アマチュア高段者
探索空間＝ゲームに現れるパターン数

ゲームＡＩ：様々なゲームＡＩの現在
ゲームの種類探索空間強さ
チェッカー 10の30乗世界最強
オセロ 10の60乗世界最強
全宇宙の原子数 10の78乗 ―
チェス 10の120乗世界最強
ぷよぷよ 10の170乗上級者レベル
将棋 10の220乗アマチュアトップレベル
囲碁 10の360乗アマチュア高段者
ぷよぷよの探索空間 ≒ 170 （およそチェスと将棋の間）

ゲームＡＩ：ゲーム木と評価関数
盤面をノード（頂点）
手をエッジ（枝）で表したもの
ゲーム木
状況の優劣を判断する関数
自分が有利なほど高い値,不利なほど低い値
評価関数
評価関数ゲーム木ゲームＡＩ＝ +
評価関数＝ +0.8 ⇒ 先手有利
評価関数＝－0.5 ⇒ 後手有利
ex
ex

ゲームＡＩ：ターン性ゲームのアルゴリズム例
MAX MIN
先手後手
ＶＳ
プレイヤーMAXは評価関数が最大になるように
プレイヤーＭＩＮは評価関数が最少になるように手を決定
このルールで先読みをして盤面を評価
MiniMax法

ゲームＡＩ：ゲーム木三目並べの例
MAX(×)
…
× ×
×
× ×
MIN(○)
…× ○ × ○
○
×
×
… …
終端
＋１０－１
MAX(×)
評価関数
…
× ○ ○
×
× ○ ×
×× ○
○ ○ ×
× ○ ×
○
○ ×
× ○ ×

ゲームＡＩ：評価関数― チェスの例
チェスの例
駒の価値
駒の配置
1 3 3 5 9
ポーンストラクチャ
0.5
キングの安全性
0.5
先手：正後手：負
これらの総和を計算

ゲームＡＩ：評価関数― 将棋の例
飛車１５竜王１７
角行１３龍馬１５
金将９
銀将８成銀９
桂馬６成桂１０
香車５成香１０
歩兵１と金１２
駒の価値

ゲームＡＩ：ぷよぷよＡＩの難しさ
問題点ぷよぷよで対応するもの対応するゲーム
1. 敵がジャマをするおじゃまぷよ将棋,チェス等
2. 探索空間が巨大で
最後まで先読みできない
最善手, 受けの広い積み将棋,チェス等
3. 偶然の要素を含むことがあるツモ, おじゃまぷよの降り方バックギャモン
(すごろく)
4. 駒の強さがなく評価が難しいぷよはどの色も同じ強さ囲碁
5. 瞬時判断 NextNext,相手のフィールド判断
(数フレームでの素早い判断)
ぷよ特有

縦に６×２通り
横に５×２通り
ぷよぷよＡＩの思考：基本
 ぷよぷよの１手の置き方は２２通りあ
る
 基本的に、223
（≒10000）通りの置き
方がある
 どの置き方が最も良いかを調べる

ぷよぷよＡＩの思考：連鎖の評価
 いろいろな置き方を試して、その中で連
鎖数が大きいものを高評価にする
１２３

 途中で消してしまうような手は、低評価
にする
１２３

１２３
 連鎖の「始点」を人間は認識できる
 ＡＩにも見えている手以外に、工夫を加
えたい
例）各列に１個ずつ４色のぷよを加えて
連鎖させてみる（２４通り）
連鎖の始点（発火点）

ぷよぷよＡＩの思考：大連鎖
 （動画５、AI大連鎖）

ぷよぷよＡＩの思考：大連鎖
 ＡＩの大連鎖データ（比較：ＤＳ強化黄色いサタンデータ）
※ＡＩ平均連鎖：10.76 ＤＳ平均連鎖：6.41
0
50
100
150
200
250
300
350
5 6 7 8 9 10 11 12 13 14 15 16 × N
DS
AI
（自滅）
（ノーカウント）

ぷよぷよＡＩの思考：相手のフィールド把握
 自分のフィールドを把握するのと同様に、
相手のフィールドも把握できる
 相手に大連鎖がある場合
→相手の連鎖を上回るような大連鎖を
打てるようにする
１２３

ぷよぷよＡＩの思考：相手のフィールド把握
 相手から見える限りで大連鎖がない場
合
→２、３連鎖程度で相手をつぶしてしまう
 人間よりフィールドを把握する能力が優
れている
１２３

ぷよぷよＡＩの思考：つぶし
 （動画６、AI潰し）

ぷよぷよＡＩの課題：①大連鎖の上限
 極限まで大きな連鎖を打つために
・無駄なぷよがない・４個消しで連鎖する
→人間にはできるが、ＡＩには完全にできていない
人
間
が
組
む
連
鎖
Ａ
Ｉ
が
組
む
連
鎖

ぷよぷよＡＩの課題：②中盤戦
 状況に応じた最善手は、人間でもわ
からない部分が多い
 中盤戦の要素として、「催促・つぶし
を打った後の形」というのがある
→ＡＩに「良い形」「悪い形」の判断が
できるようにならないといけない
 自分の最善手は相手の「形」による
２連鎖？２連鎖ダブル？４連鎖？
それとも何もしない？大連鎖？

参考
 GeNEsWoRK（ぷよぷよＡＩとサーバー上で対戦できます）
http://www.geocities.co.jp/lockitjapan/atgc/
 ゲームプレイング
http://lis2.huie.hokudai.ac.jp/~kurihara/
classes/AI/game.ppt

ＥＮＤ

参考資料

ゲームＡＩ：オセロ
 日本人のチャンピオンに勝ち世界最強
 オセロはまだ完全には計算されていないゲーム
 8×8 の場合は局面が膨大な数になるため、
現時点では双方最善手順は発見されていない
強さ：世界最強

ゲームＡＩ：バックギャモン (双六のようなゲーム)
 サイコロを振るため偶然性がある
 ニューラルネットの学習機能により評価関数を学習した
TD-Gammonというプログラムが有名
強さ：世界トップレベル

ゲームＡＩ：チェス
 1997年にIBMが開発したチェス専用のスーパーコンピュータ
Deep Blue が名人Kasparovに勝利
1秒間に2億手の先読み
 現在ではソフトの進化により
市販ハードでもDeepBlue並の強さ
強さ：世界最強

ゲームＡＩ：将棋
 2005年：非常に強い将棋AI Bonanza が登場
Bonanza methodと呼ばれるアルゴリズムが有名
 チェスよりも遥かに探索空間が広いため、
まだプロには負けるが、アマのトップレベルの強さ
強さ：アマトップレベル

ゲームＡＩ：囲碁
強さ：アマ高段者レベル
 探索空間がチェスよりも将棋よりもはるかに多い。
 実力はアマ高段者の域に近づいてきている
 最近の囲碁プログラムの考え方は、モンテカルロ碁が有名

ゲームＡＩ：ミニマックス法(minimax procedure)
MAX
MIN
3 12 8 2 4 6 14 5 2
3
3 2 2
終
端
MIN MIN MIN
MAX

ゲームＡＩ：アルファベータ法
MAX
MIN
3 12 8 6
3
α＝３
β＝２
MAXの
これまでのベスト
MINの
これまでのベスト
≦６
≧3
ミニマックス法の効率を上げる
2
β＝６
≦２
α≧βで
枝刈り

最強ぷよぷよAI
フリー対戦
スペース
ぷよぷよの腕に自信のある方どうぞ．

戦技研　ぷよぷよAI　学生講義

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)