ゲームAIから見るAIの歴史

中学生・高校生のための
人工知能の教養講座第二回
「ゲームAIから見るAIの歴史」
三宅陽一郎三宅陽一郎@miyayou
2020.4.28
https://www.facebook.com/youichiro.miyake
http://www.slideshare.net/youichiromiyake
y.m.4160@gmail.com

人工知能の歴史
１９５６年１９８６年２０1６年
人工知能
発祥
日本人工知能学会
発足
現在

人工知能の歴史を紐解く名著

経歴
京都大学（数学）大阪大学（原子核実験物理）東京大学
（エネルギー工学/人工知能）
高エネルギー加速器研究所（半年ぐらい。修士論文）
http://www.facebook.com/youichiro.miyake

経歴
京都大学（数学）大阪大学（原子核実験物理）東京大学
（エネルギー工学/人工知能）
高エネルギー加速器研究所（半年ぐらい。修士論文）
http://www.facebook.com/youichiro.miyake
連続群論で卒業論文
（紙と鉛筆、ときどきコーディン
グ）
ひたすらビックデータ解析
（コーディング）
数学＋人工知能のシミュレーショ
（数学とコーディング）

2004 2011
東京大学
フロム・ソフトウェア
スクウェア・エニックス
人工知能（キャラクターAI）の基礎研究
ゲームAI全般の基礎理論の確立
ゲームAI理論の汎用化・学習・進化の導入
主にFPSタイトルを中心にゲームAIが進化大型・小型タイトル全般にゲームAI技術が浸透
モバイルゲームにおける人工知能（サーバー側）
2013
開発における人工知能
2016

My Works (2004-2017)
AI for Game Titles
Books

自然知能と人工知能
人間
＝自然知能
機械
＝人工知能

機械（マシン）
ソフトウェア
知能
身体
機能
知能
http://www.1999.co.jp/blog/1210192
http://ja.wallpapersma.com/wallpaper/_-
%E3%83%AA%E3%82%B9%E3%80%81%E5%A3%81%E7%B4%99%E3%80%81%E3%83%AF%E3%82%A4%E3%83%89%E3%82%B9%E3%82%AF%E3%83%AA%E3%83%BC%E3%83%B3%E3%81%AE%E3%80%81%E3%
83%9E%E3%83%83%E3%82%AF%E3%80%81%E3%83%9A%E3%83%83.html

身体性とインテリジェンス
Gray’s anatomy
脳の中心の部位は身体とつながっている。
生理機能を司っている。
それを囲うように、辺縁体、大脳がある。
http://square.umin.ac.jp/neuroinf/brain/005.html
http://www.amazon.co.jp/Grays-Anatomy-Anatomical-Clinical-Practice/dp/0443066841

人間の精神
意識
前意識
無意識
知能
言語による
精神の構造化
外部からの
情報
言語化のプロセス
シニフィアン
/シニフィエ
言語回路
（＝解釈）
意識の形成
世界を分節化している

人間の精神、機械の精神
意識
前意識
識
外部からの
情報
意識
前意識
無意識
外部からの
情報
言語・非言語境界面
知覚の境界面
人工知能は、人間の知能を機械に移したもの。

第二章人工知能の歴史

この３００年の技術の動向
時間
規模
産業革命
情報革命
ネット革命
知能革命
機械化・自動化（オートメーション化）
電子情報化
オンライン化
知能化
第二次産業革命
電動化
1750 1860 1960 1990 Now…
現代は「知能化」の時代に
入りつつある。
第一次AIブーム第二次AIブーム第三次AIブーム

二つの人工知能
IF (s_collison==true)
register_all(s_star);
assign_edge();
assign_vertex();
mix_all();
シンボルによる人工知能
（シンボリズム）
ニューラルネットによる人工知能
（コネクショニズム）
IBM ワトソン
Google検索
など
AlphaGo
など
http://www.nature.com/nature/journal/v518/n7540/full/nature14236.html

神経素子（ニューロン）とは？
入力
入力
入力
出力
入力
この中にはイオン（電解,Na+,K+）
溶液が入っていて、入力によって電圧が
高まると出力する仕組みになっています。
100mVぐらい
ニューラルネットワーク内シグナル伝達スピード 100(m/sec) … 案外遅い
http://www.brain.riken.go.jp/jp/aware/neurons.html

ニューラルネットを理解しよう② 数学的原理
http://www.pri.kyoto-u.ac.jp/brain/brain/11/index-11.html
医学的知識
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/sozai/ai.html
モデル化
数学的モデル
ニューロン
人工ニューロン
入出力関係のグラフ入出力関係の関数（シグモイド関数）
ニューラルネットワーク
（ニューロンをつなげたもの）
道具はこれで全て。これで何ができるだろう？

人工知能がブームになるとき
時間
規模
情報革命
ネット革命
知能革命
電子情報化
オンライン化
知能化
1960 1990 2000
1970 1980 2010

2 第一次ＡＩブーム（1960年代）
• コンピューターは大型のものしかない。
• 人工知能という分野自体が誕生したばかり。
• ニューラルネットという新しい分野のブーム。
１９世紀後半
人間の脳は
ニューロンという
もので出来てい
るらしい
２０世紀前半
ニューロンの
電気的性質が
解明される
（ホジキン博士、
ハクスレー博士）
1950年代に
ニューラルネット
発明
1963年に
ホジキン＝ハク
スレー方程式が
ノーベル賞

身長体重年齢
健康要運動注意
学習データから
ここの重みを
変化させます
健康
要運動
注意
新しいデータ
ニューラルネット＝データを分類する人工知能

もし A ならば B
もし B ならば C
よって、
もし A ならば C
（記号主義）
推論ベースニューラルネット
誕生

3 第二次ＡＩブーム（1980年代）
• パソコンが普及して行く。
• ルールを集めて知能を作ろう。
• 逆伝播法によるニューラルネットのブーム。
パソコンが
世の中で
普及して行く
知識主義
＝
たくさんの知識
を人工知能に
与えて推論
すれば知能が
できる
インターネット
もなく、知識
が足りない。
推論も専門的
な機能のみ。

IF （A） then B
IF （C） then D
IF （E） then F
IF （G） then H
IF （ I ） then J
（記号主義）
ルールベース
新しい学習法＝
逆伝搬法

1 0 0
このように学習させたい

0 1 0

0 0 1

0 0 0
【逆伝播法】
ここが１になるように、
結合の強さを、
さかのぼって変えて行く。

4 第三次ＡＩブーム（2010年代）
• インターネットが普及して行く。
• インターネットで蓄積されたデータを学習させて
知能を作ろう。
• 改善されたニューラルネットのブーム。
インターネット
が世の中で
普及して行く
データ
学習主義
＝
たくさんのデー
タを人工知能
に学習させる
現在、進行中

（記号主義）
データベース
新しい学習法＝
ディープラーニング
データベース
検索エンジン
キーワード検索結果
検索
人
次の章で
説明
します

インターネットによる
膨大なデータ
時間
規模
1960 1990 2000
1970 1980 2010
ルールベース
逆伝播法
データベース
ディープ
ラーニング
推論ベース
ニューラル
ネット誕生
小型・中型
コンピュータの普及
大型コンピュータ
専門家のみのブーム

時間
知能の規模
1960 1990 2000
1970 1980 2010
ルールベース
逆伝播法
データベース
ディープ
ラーニング
推論ベース
ニューラル
ネット誕生
コネクショニズム
記号主義
デジタルゲームAI
人工知能の歴史

リアルタイムノンリアルタイム
身体を持つ
身体を持たない
身体を持ち
リアルタイムに
空間を運動する
身体を持たず
空間を運動しない
ゲーム・ロボット
ビックデータ解析

ゲームＡＩの特徴
リアルタイム
インタラクティブ
身体を持つ
ゲーム
VR/AR ロボット・
自動運転
デジタルサイネージ
ドローン
エージェント・サービス

人工知能全域
機械学習
ディープ
ラーニング
統計
学習
コネクショニズム
記号主義
デジタルゲームAI
人工知能全域とデジタルゲームAI

ゲームの中、ゲームの外
ゲームの外のAI
（外＝開発、現実）
ゲームの中のAI
（中＝コンテンツ）
メタAI
キャラクター
AI
ナビゲーション
AI
開発支援
AI
QA-AI
自動バランス
AI
インターフェース
上のAI
データ
マイニング
シミュレー
ション技術ゲーム
可視化
ユーザーの
生体信号
プロシー
ジャルAI

レベル
ナビゲーション
AI
メタAI
キャラクター
AI
ゲームの流れを作る
エージェントを動的に配置
レベル状況を監視
エージェントに指示
自律的な判断
仲間同士の協調
パス検索 / 位置解析
メタAI, キャラクターAIの為に
レベルの認識のためのデータを準備
オブジェクト表現を管理
ナビゲーション・データの管理
Support
敵キャラクタ－
プレイヤー
頭脳として機能
情報獲得
コントロール

参考URL:人工知能学会「私のブックマーク」
https://www.ai-gakkai.or.jp/resource/my-bookmark/

参考URL:人工知能学会「私のブックマーク」

FC SFC SS, PS PS2,GC,Xbox Xbox360, PS3, Wii
DC （次世代）Hardware 時間軸20051999
ゲームの進化と人工知能
複雑な世界の
複雑なＡＩ
ゲームも世界も、ＡＩの身体と内面もますます複雑になる。
単純な世界の
シンプルなＡＩ
（スペースインベーダー、タイトー、1978年）（アサシンクリード、ゲームロフト、2007年）

(例) スペースインベーダー(1978)
プレイヤーの動きに関係なく、決められた動きをする
（スペースインベーダー、タイトー、1978年）

（例）プリンス・オブ・ペルシャ
「プリンス・オブ・ペルシャ」など、
スプライトアニメーションを用意する必要がある場合、
必然的にこういった制御となる。
（プリンスオブペルシャ、1989年）

このＡＩはどう作るか？
プレイ
ヤー
キャラクター
岩地面
池
例として、次のようなキャラクターのＡＩをどう作るか考えてみよう。
http://dear-croa.d.dooo.jp/download/illust.html
http://piposozai.blog76.fc2.com/

このＡＩはどう組むか？
こういったＡＩをゲーム産
業では「Scripted AI」と言
います。こういったＡＩは
ゲームデザイナーがス
クリプト言語で書く場合
多いため。
プレイ
ヤー
キャラクター
岩地面
池
Ａ B
、
（例）
プレイヤーがＡにいれば
Ｂをうろうろする。
プレイヤーがＢにいれば
近づいて攻撃する。
http://septieme-ciel.air-
nifty.com/nikubanare/2007/08/post_3c38.htmlhttp://dear-croa.d.dooo.jp/download/illust.html

スクリプト
Scripted AI から自律型ＡＩへの変化
ゲームデザイナーの頭の中
Scripted AI
操り人形（Scripted AI）から、キャラクターが自分で考えて行動する自律型ＡＩ
（Autonomous AI）になるためには、
ゲームデザイナーが頭の中で持っている知識と思考をＡＩに埋め込む必要がある。

プレイ
ヤー
キャラクター
岩地面
池
地形データ
（Way Points）
、
ステップ１：
ＡＩにゲームステージの
地形を認識させたい
＝地形のデータを与え
る。
ＡＩは地形データによって、自分とプレイヤーの位置関係を知
ることができる。

地形データ
（Way Points）
ＡＩは地形データによって、自分とプレイヤーの位置関係を知
ることができる。（ネットワークグラフの問題に帰着）
http://dear-croa.d.dooo.jp/download/illust.htmlhttp://dear-croa.d.dooo.jp/download/illust.html

知能
思考知識
ＡＩを作る
人間
地形デー
タ
（Way
Points）
地形デー
タを用い
た思考
オブジェク
トデータ
意思決定
の思考
自分の
身体デー
タ
身体運動
の
ロジック
人工知能＝知識 × 思考

人工知能
＝知識ｘ思考

スクリプト
Scripted AI から自律型ＡＩへの変化
ゲームデザイナーの頭の中ゲームデザイナーの頭の中
知識思考
Scripted AI 自律型 AI (Autonomous AI)
操り人形（Scripted AI）から、キャラクターが自分で考えて行動する
自律型ＡＩ（Autonomous AI）になるためには、
ゲームデザイナーが頭の中で持っている知識と思考をＡＩに埋め込
む必要がある。

Intelligence
World
センサー
Information Flow
エフェクター
Agent Architecture

知能の世界
環境世界
認識の
形成
記憶
センサー・
身体
記憶体
情報処理過程
情報
統合

知能の世界
環境世界
認識の
形成
記憶
意思の
決定
センサー・
身体
意思決定
モジュール
意思決定
モジュール
意思決定
モジュール
記憶体
情報処理過程
情報
統合

知能の世界
環境世界
認識の
形成
記憶
意思の
決定
身体
制御
エフェクター・
身体
運動の
構成
センサー・
身体
意思決定
モジュール
意思決定
モジュール
意思決定
モジュール
記憶体
情報処理過程運動創出過程
身体部分
情報
統合
運動
統合

知能の世界
環境世界
認識の
形成
記憶
意思の
決定
身体
制御
エフェクター・
身体
運動の
構成
センサー・
身体
意思決定
モジュール
意思決定
モジュール
意思決定
モジュール
対象・
現象
情報の流れ（インフォメーション・フロー）
影響を与える影響を受ける

３Ｄゲームの中のＡＩ
Halo
（ＨＡＬＯ、バンジー、2001年）デバッグ画面
The Illusion of Intelligence - Bungie.net Downloads
http://downloads.bungie.net/presentations/gdc02_jaime_griesemer.ppt

知能
環境の情報身体の制御
知的機能を持つ車
意思決定
環境

遅延反応系
INPUT OUTPUT
時間
情報抽象度
反射的に行動
少し場合ごとに対応
抽象的に思考
理論的に考える
反応を遅延させるところに、知性の生じるチャンスがある。

サブサンプション・アーキテクチャ（ロドニー・ブルックス）
INPUT OUTPUT
時間
情報抽象度
反射的に行動
少し場合ごとに対応
抽象的に思考
理論的に考える
= 自意識の構築化
Subsumpution Architecture
運動の実現のプロセス
= 身体運動の生成

ルンバ（iRobot社）
http://chihoko777.exblog.jp/12567471/

パス検索とは
現在の地点から指定したポイントへの経路を、
リアルタイムで計算して導く技術。
RTS - Pathfinding A*
https://www.youtube.com/watch?v=95aHGzzNCY8

Counter Strike (2000) : Nav Mesh
The Official Counter-Strike Bot
http://aigamedev.com/insider/presentation/official-counter-strike-bot/
Dragon Age : Way Point
Dragon Age pathfinding program put to the test
https://www.youtube.com/watch?v=l7YQ5_Nbifo

Counter Strike: Path Following (デモ)
The Official Counter-Strike Bot
http://aigamedev.com/insider/presentation/official-counter-strike-bot/

強化学習（例）
強化学習
（例）格闘ゲーム
キック
パン
チ
波動
R_0 : 報酬＝ダメージ

強化学習
（例）格闘ゲームTaoFeng におけるキャラクター学習
Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge
"Forza, Halo, Xbox Live The Magic of Research in Microsoft Products"
http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx
Microsoft Research Playing Machines: Machine Learning Applications in Computer Games
http://research.microsoft.com/en-us/projects/mlgames2008/
Video Games and Artificial Intelligence
http://research.microsoft.com/en-us/projects/ijcaiigames/

F.E.A.R.のプランニング
シンボルによる連鎖プランニング
ターゲットＡが
死んでいる
ターゲットＡが
死んでいる
攻撃
武器が装填
されている
武器が装填
されている
装填する
武器を
持っている
武器を
持っている
武器を拾う
条件なし
プラナー
プランニング
Jeff Orkins, Three States and a Plan: The AI of FEAR
http://alumni.media.mit.edu/~jorkin/gdc2006_orkin_jeff_fear.pdf

計画を立てるＡＩ/計画を変更するＡＩ
Jeff Orkins, Three States and a Plan: The AI of FEAR
http://alumni.media.mit.edu/~jorkin/gdc2006_orkin_jeff_fear.pdf

メタＡＩの歴史
1980 1990
メタＡＩというのは、ゲームそのものに埋め込まれたＡＩ。
1980 1990 2000
古典的メタAI
現代のメタＡＩ
キャラクターＡＩ技術の発展

メタＡＩの歴史
1980 1990 2000
古典的メタAI
現代のメタＡＩ
キャラクターＡＩ技術の発展
その歴史は古く、1980年代にまでさかのぼる。
その時代と現代のメタＡＩは、異なる点も多いので、
古典的メタＡＩ、現代のメタＡＩと名づけて区別することにしよう。

（例）「ゼビウス」（ナムコ、1983）
敵出現テーブル巻き戻し
敵0
敵１
敵2
敵3
敵4
敵5
『あと面白い機能なんですけれど、ゼビウスには非常に簡単なAIが組み込まれています。
「プレイヤーがどれくらいの腕か」というのを判断して、出てくる敵が強くなるんです。
強いと思った相手には強い敵が出てきて、弱いと思った相手には弱い敵が出てきます。そういっ
たプログラムが組み込まれています。ゲームの難易度というのは「初心者には難しくて、上級者
には簡単だ」ということが、ひとつの難易度で(調整を)やっていくと起きてしまうので、その辺を何
とか改善したいな、ということでそういったことを始めてみたのですけれど、お陰で割合にあまり上
手くない人でも比較的長くプレイできる、うまい人でも最後のほうに行くまで結構ドラマチックに楽
しめる、そういった感じになっています。』
－遠藤雅伸（出演）、1987、「糸井重里の電視遊戯大展覧会」『遠藤雅伸ゼビウスセミナー』フジテレビ－
ゼビウス

現代のメタAI
より積極的にゲームに干渉する。
メタAI
敵配位敵スパウニングストーリー
レベル
動的生成
ユーザー

メタＡＩ Left 4 Dead の事例
Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and
Interactive Digital Entertainment Conference at Stanford.
http://www.valvesoftware.com/publications.html
今回は Left 4 Dead の事例を見てみる。

適応型動的ペーシング
[基本的発想]
(1) ユーザーがリラックスしている時に、ユーザーの
緊張度が一定の敷居を超えるまで敵をぶつけ
続ける。
(2) ユーザーの緊張度が一定の緊張度を超えると
敵を引き上げる。
(3) リラックスすると敵を出現し始める（(１)へ）。
Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and
Interactive Digital Entertainment Conference at Stanford.

メタAI(=AI Director)によるユーザーのリラックス度に応じた敵出現度
ユーザーの緊張度
実際の敵出現数
計算によって
求められた
理想的な敵出現数
Build Up …プレイヤーの緊張度が目標値を超えるまで
敵を出現させ続ける。
Sustain Peak … 緊張度のピークを3-5秒維持するために、
敵の数を維持する。
Peak Fade … 敵の数を最小限へ減少していく。
Relax … プレイヤーたちが安全な領域へ行くまで、30-45秒間、
敵の出現を最小限に維持する。
Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and Interactive Digital Entertainment Conference at Stanford.
より具体的なアルゴリズム

メタＡＩがゲームを認識する方法
キャラクター用に作成された
ナビゲーションメッシュを
メタＡＩがゲームの
状況を認識するために使用する。

メタAIが作用を行う領域
メタＡＩが作用（敵の生成・
消滅）を行う領域を、
AAS（= Active Area Set）と
言う。

メタAIが作用を行う領域
(AAS=Active Area Set)

安全な領域までの道のり(Flow Distance)
メタＡＩはプレイヤー群の経路を
トレースし予測する。
- どこへ来るか
- どこが背面になるか
- どこに向かうか

プレイヤーからの可視領域
可視領域（プレイヤーから見えている
部屋）では、敵のスパウニング（発生）
はできない。

敵出現領域
背後前方
前方と背後のプレイヤー群から見えてない部屋に、
モンスターを発生させる。

まとめ
メタＡＩは、ゲームの流れを動的に作るＡＩで、キャラクターＡＩ、イベントなどに
は命令だけを出す。これは明確に、メタＡＩと他のモジュールが独立した関
係にあるから可能なこと。

人がコンテンツにより添う（これまで）
コンテンツ
（教育）
人
（知能）
適応する

コンテンツが人により添う（これから）
コンテンツ
（教育）
人
（知能）
適応する

同じコンテンツをたくさんの人に与える
（これまで）
それぞれの人にコンテンツを合わせる
（人工知能）

AlphaGO
膨大な棋譜のデータ
（人間では多過ぎて
読めない）
この棋譜を
そっくり打てる
ように学習する
自己対戦して
棋譜を貯める
この棋譜を
そっくり打てる
ように学習する
AlphaGO

Deep Q-Learning
Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves,
Ioannis Antonoglou, Daan Wierstra, Martin Riedmiller (DeepMind Technologies)
Playing Atari with Deep Reinforcement Learning
http://www.cs.toronto.edu/~vmnih/docs/dqn.pdf
画面を入力
操作はあらかじめ教える
スコアによる強化学習

二つの人工知能
IF (s_collison==true)
register_all(s_star);
assign_edge();
assign_vertex();
mix_all();
（記号主義）
IBM ワトソン
など
AlphaGo
など

学習過程解析
Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves,
Ioannis Antonoglou, Daan Wierstra, Martin Riedmiller (DeepMind Technologies)
Playing Atari with Deep Reinforcement Learning
http://www.cs.toronto.edu/~vmnih/docs/dqn.pdf

• Pπ ロールアウトポリシー（ロールアウトで討つ手を決める。
Pπ（a|s） sという状態でaを討つ確率）
• Pσ Supervised Learning Network プロの討つ手からその
手を討つ確率を決める。Pσ（a|s）sという状態でaを討つ確
率。
• Pρ 強化学習ネットワーク。Pρ（学習済み）に初期化。
• Vθ(s’) 局面の状態 S’ を見たときに、勝敗の確率を予測
する関数。つまり、勝つか、負けるかを返します。
Mastering the game of Go with deep neural networks and tree search
https://deepmind.com/research/alphago/

Mastering the game of Go with deep neural networks and tree search
https://deepmind.com/research/alphago/

あから２０１０
激指 YSS
合議
Bonanza
GPS
将棋
あから2010合議サーバログを可視化してみた（A Successful Failure）
http://blog.livedoor.jp/lunarmodule7/archives/1121781.html

第四章
生成系ニューラルネットワーク

神経素子（ニューロン）とは？
入力
入力
入力
出力
入力
この中にはイオン（電解,Na+,K+）
溶液が入っていて、入力によって電圧が
高まると出力する仕組みになっています。
100mVぐらい
ニューラルネットワーク内シグナル伝達スピード 100(m/sec) … 案外遅
い
http://www.brain.riken.go.jp/jp/aware/neurons.html

ニューラルネットを理解しよう② 基本原理
http://www.pri.kyoto-u.ac.jp/brain/brain/11/index-11.html
医学的知識
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/sozai/ai.html
モデル化
数学的モデル
ニューロン人工ニューロン
入出力関係のグラフ入出力関係の関数（シグモイド関数）

ニューラルネットを理解しよう③ 数学的原理
数学的モデル
入力信号
＝繋がっている
ニューロンから
やって来ます
ウエイト（重み）
＝各ニューロン間の結合の強さ
「入力信号ｘ重み」＋「バイアス」（初期電位、適当な小さな値）
出力信号
(0~1の間)
バイアスをうまく調整して、
このセンシティブな領域に入力が集中するように
調整しよう！（ニューラルネットの技術的なコツ）

ニューラルネットを理解しよう③ 数学的原理
数学的モデル階層型ニューラルネットワーク
… 一方向にニューロンをつなげたもの
入力層隠れ層出力層
重み重み
最初に定義するもの＝ウエイト（重み）、バイアス
とりあえず全ての結合を定義しておく（ニューロン間の重みを０にすれば切れる）
数値の組み
が入ります
数値の組み
が出ます
これは３層の例だけど、
何層つなげてもよい
一旦定義してから変えることができないもの…全体の構造
変えることができるもの…ウエイト（重み）

生成系ニューラルネットワーク技術
GAN （一般敵対的ネット）
（ディープラーニング）
ニューロエヴォリューション
（進化的ニューラルネット）
逆伝播法

⑤ニューラルネットワークの構造が進化させる
「NEAT」の技術
Mat Buckland, Chapter 11, AI techniques for game programming, Premier Press, 2002
(実行ファイルとソースコードがCD-ROMにあります)
これまでニューラルネットは、最初に構造を定義した後は変化しなかった。
動的にニューラルネットの構造を変化させる技術
Neuron Evoluation of Augmenting Topologies (NEAT)

Neuro Evolution
を詳しく解説

NEAT
回路の構成を遺伝子コードで表現する。
Weight: 1.2
From: 1
To: 3
Enabled: Y
Recurrent: N
Innovation: 1
Weight: -3
From: 1
To: 4
Enabled: Y
Recurrent: N
Innovation: 6
Weight: 0.7
From: 2
To: 4
Enabled: Y
Recurrent: N
Innovation: 2
Weight: -2.1
From: 3
To: 4
Enabled: Y
Recurrent: N
Innovation: 6
Weight: 1.1
From: 3
To: 5
Enabled: N
Recurrent: N
Innovation: 3
Weight: 0.8
From: 4
To: 5
Enabled: Y
Recurrent: N
Innovation: 4
Weight: -1
From: 5
To: 3
Enabled: Y
Recurrent: Y
Innovation: 7
ID: 1
Type: Input
ID: 2
Type: Input
ID: 3
Type: hidden
ID: 4
Type: hidden
ID: 5
Type: Output
2
1
4
3
5
つなぎ方を定義する遺伝子
ニューロンを定義する遺伝子
入力出力

NEAT
回路の構成を遺伝子コードで表現する。
Weight: 1.2
From: 1
To: 3
Enabled: Y
Recurrent: N
Innovation: 1
Weight: -3
From: 1
To: 4
Enabled: Y
Recurrent: N
Innovation: 6
Weight: 0.7
From: 2
To: 4
Enabled: Y
Recurrent: N
Innovation: 2
Weight: -2.1
From: 3
To: 4
Enabled: Y
Recurrent: N
Innovation: 6
Weight: 1.1
From: 3
To: 5
Enabled: N
Recurrent: N
Innovation: 3
Weight: 0.8
From: 4
To: 5
Enabled: Y
Recurrent: N
Innovation: 4
Weight: -1
From: 5
To: 3
Enabled: Y
Recurrent: Y
Innovation: 7
ID: 1
Type: Input
ID: 2
Type: Input
ID: 3
Type: hidden
ID: 4
Type: hidden
ID: 5
Type: Output
2
1
4
3
5
リンク（つなぎ方）を定義する遺伝子
ニューロンを定義する遺伝子
Innovation ID によってリンク、
ニューロンを全遺伝子共通の管理す
る。
無効
入力出力

NEATにおける交叉
親１
2
1
7
3
4
1
1->4
2
2->4
3
3->4
6
3->7
7
7->4
12
1->7
1
1->4
2
2->4
3
3->4
4
2->5
5
5->4
8
5->9
9
9->4
15
3->9
親２
2
1
3
95 4
Innovation ID
ID順に並べます。
1
1->4
2
2->4
3
3->4
1
1->4
2
2->4
3
3->4
4
2->5
5
5->4
6
3->7
7
7->4
8
5->9
9
9->4
12
1->7
15
3->9
交
叉
4
2->5
5
5->4
8
5->9
9
9->4
15
3->9
1
1->4
2
2->4
3
3->4

NEATにおける交叉
親１
2
1
7
3
4
1
1->4
2
2->4
3
3->4
6
3->7
7
7->4
12
1->7
1
1->4
2
2->4
3
3->4
4
2->5
5
5->4
8
5->9
9
9->4
15
3->9
親２
2
1
3
95 4
Innovation ID
交
叉
2
1
3
95 4
4
2->5
5
5->4
8
5->9
9
9->4
15
3->9
1
1->4
2
2->4
3
3->4
子供＝新しいニューラルネットワーク

エージェント・アーキテクチャー
身体
センサーエフェクター
ＮＰＣの知能部分
ゲーム世界
相互作用
時間
時間
知覚する行動する
機体
制御
交配の中で発展して行く

第３世代
第９２９世代
第１３６８世
代
左は俯瞰図（赤は衝突してしまってい
る）
右は適応度ベスト４のニューラルネット

https://arxiv.org/pdf/1410.7326.pdf

弾幕自動生成
• Applying Evolutionary Algorithms to the Galactic Arms Race
• http://aigamedev.com/open/interviews/galactic-arms-race/
https://www.youtube.com/watch?v=N8q2uOwWcFc

第五章
強化学習と

テスターをAIに置き換える
AI
https://www.irasutoya.com

EA SEED - Deep Learning
IMITATION LEARNING WITH CONCURRENT ACTIONS IN 3D GAMES
https://www.ea.com/seed/news/seed-imitation-learning-concurrent-actions

• https://www.ea.com/seed/news/self-learning-agents-play-
bf1
https://www.ea.com/seed/news/self-learning-agents-play-bf1
EA SEED - Deep Learning
IMITATION LEARNING WITH CONCURRENT ACTIONS IN 3D GAMES

The Alchemy and Science of Machine Learning for Games (GDC 2019)
https://www.gdcvault.com/play/1025653/The-Alchemy-and-Science-of

Deep Mind
• https://deepmind.com/blog
/capture-the-flag/
• Multi agnet learning
Deep Mind: Capture the Flag: the emergence of complex cooperative agents
https://deepmind.com/blog/article/capture-the-flag-science

Two Agent Cooperation by DeepMind
Deep Mind: Capture the Flag: the emergence of complex cooperative agents
https://deepmind.com/blog/article/capture-the-flag-science

Phase-Functioned Neural Networks for Character Control
DANIEL HOLDEN, University of Edinburgh
TAKU KOMURA, University of Edinburgh
JUN SAITO, Method Studios
http://theorangeduck.com/media/uploads/other_stuff/phasefunction.pdf

https://www.youtube.com/watch?v=Ul0Gilv5wvY

Tom Mathews Making "Big Data" Work for 'Halo': A Case Study
http://ai-wiki/wiki/images/d/d8/AI_Seminar_177th.pdf

Gameplay Data Analysis: Asking the Right Questions
Ian Thomas (Epic Games) http://www.gdcvault.com/play/1015482/Gameplay-Data-Analysis-Asking-the

第六章人工知能と創造性

プロシージャル技術
ゲームAI技術
AI技術
プロシージャル
技術
コンテンツ自動生成技術
（PCG, Procedural Contents Generation ）

（例）① GA Racer遺伝的アルゴリズムによって、遠くまで到達できるレーサーを作成する。
最初はここまでしか
たどり着けないけど…
だんだんと遠くまで、
たどりつけるようにする。
Mat Buckland, "Building Better Genetic Algorithm", 11.4., AI Game Programming Wisdom 2
（CD-ROMにソースコードと実行ファイルがあります）
最初の世代新世代（１００～世代後）

（例）③ムーンランディング
（月着陸）
３世代２０世代３５世代
落下法則（物理法則）のもとで降下ポイントから台座に垂直に着陸する操作を見出す
最初は全く見当違い。だんだんと近付いて来る。
Mat Buckland, Andre Lamothe, “Moon Landings Made Easy ”, chapter.6.,
AI techniques for game programming, Premier Press (2002)
（CD-ROMにソースコードと実行ファイルがあります）
着陸地点
降下開始ポイント降下開始ポイント降下開始ポイント

Neural Networks in Supreme Commander 2 (GDC 2012)
Michael Robbins (Gas Powered Games)
http://www.gdcvault.com/play/1015406/Off-the-Beaten-Path-Non
http://www.gdcvault.com/play/1015667/Off-the-Beaten-Path-Non
ニューラルネットワークの応用

Black & White （Lionhead,2000）
クリーチャーを育てていくゲーム。
クリーチャーは自律的に行動するが、
訓練によって学習させることができる。
http://www.youtube.com/watch?v=2t9ULyYGN-s
http://www.lionhead.com/games/black-white/

Belief – Desire – Intention モデル
Desire
(Perceptrons)
Opinions
(Decision Trees)
Beliefs
(Attribute List)
Intention
Overall Plan
(Goal, Main Object)
Attack enemy town
Specific Plan
(Goal, Object List)
Throw stone at house
Primitive Action
List
Walk towards stone,
Pick it up,
Walk towards house,
Aim at house,
Throw stone at house
Richard Evans, “Varieties of Learning”, 11.2, AI Programming Wisdom

Belief – Desire – Intention モデル
Desire
(Perceptrons)
Opinions
(Decision Trees)
Beliefs
(Attribute List)
Richard Evans, “Varieties of Learning”, 11.2, AI Programming Wisdom
Low Energy
Source =0.2
Weight =0.8
Value =
Source*Weight =
0.16
Tasty Food
Source =0.4
Weight =0.2
Value =
Source*Weight =
0.08
Unhappines
s
Source =0.7
Weight =0.2
Value =
Source*Weight =
0.14
∑
0.16+0.08+0.14
Threshold
（0～1の値に
変換）
hunger
Desire（お腹すいた度）欲求を決定する
対象を決定する
それぞれの対象の
固有の情報
他にも
いろいろな
欲求を計算
Hunger
Compassion
Attack（戦いたい）
Help
Black & White （Lionhead,2000）
14:00-

Rogue (1980)のレベル生成法
Rect[0] Rect[0] Rect[1]
Rect[0]
Rect[1]
Rect[2] Rect[3]
http://racanhack.sourceforge.jp/rhdoc/intromaze.html

Rogue (1980)のダンジョン生成法
Rect[0] Rect[0] Rect[1]
Rect[0]
Rect[1]
Rect[2] Rect[3]
このようにアセット（ゲームのデータ）をツールなどを通して製作するのではなく、
プログラムで作ることを「プロシージャル・コンテンツ・ジェネレーション」（PCG）と言う。
http://racanhack.sourceforge.jp/rhdoc/intromaze.html

迷路の自動的な作り方
• 穴掘り法
• 棒倒し法
• 壁伸ばし法

WarFrame における自動生成マップの
自動解析による自動骨格抽出
• 自動生成するだけでなく、自動生成したダンジョンを、自動
解析します。ここでは、トポロジー（形状）検出を行います。

アーロンのアルゴリズム
• 知識ベースの人工知能
＝対象に対する知識をインプットして描かせる

＝閉曲線で描くことを学ぶ。
1981

(左) 学んだ知識から描く
（右）架空のものを学んだものから描く
19851983

前後関係を取れるようにする。
1986

ブラウン運動
ロバート・ブラウン博士によって、１８２７年に発見された現象。
微粒が媒質（液体）の中で行う不規則な運動。
アインシュタイン博士によって、熱運動する媒質の不規則な
衝突によって引き起こされると説明された。
http://ja.wikipedia.org/wiki/%E3%83%96%E3%83%A9%E3%82%A6%E3%83%B3%E9%81%8B%E5%8B%95

ブラウン運動から地形生成
ロバート・ブラウン博士によって、１８２７年に発見された現象。
微粒が媒質（液体）の中で行う不規則な運動。
アインシュタイン博士によって、熱運動する媒質の不規則な
衝突によって引き起こされると説明された。
宮田一乗「プロシージャル技術の動向」（CEDEC 2008）

https://www.youtube.com/watch?v=m4JDNzwFZFI

http://www.kenmusgrave.com

NO MAN’S SKY (Hello Games, 2016)
http://www.no-mans-sky.com/
宇宙、星系、太陽系、惑星を自動生成する。

FarCry2 におけるプロシージャル技術
50km四方のマップを作る
オブジェクト（草木）＆アニメーションデータを自動生成

FarCry2 (Dunia Engine ) デモ
草原自動生成時間システム
樹木自動生成動的天候システム
動的天候システム
http://www.farcry2-hq.com/downloads,18,dunia-engine-nr1.htm

http://www.desura.com/engines/dunia
FarCry3 におけるプロシージャル技術

ゲームAIから見るAIの歴史

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a ゲームAIから見るAIの歴史

Semelhante a ゲームAIから見るAIの歴史 (20)

Mais de Youichiro Miyake

Mais de Youichiro Miyake (20)

Último

Último (8)

ゲームAIから見るAIの歴史