4. ビックレーオークションのモデル
売り手の余剰(落札額)
= 2000
売
特徴(3,1,2)
買2
2000 1 f 3000 2 f
買1 買3
1000 3 f
2番目に高い入札額 最も高額の入札者
買い手の余剰(評価値-落札額)
= 3000-2000 = 1000
特徴(3,1,2) 特徴(3,1,2) 特徴(3,1,2)
売り手が財の特徴ベクトルを
各買い手に提示
各買い手の評価関数に
基づく財の評価値
(=入札額)
最も高額の入札者が
2番目に高い入札額で落札
( , ,..., ) l l1 l2 lN feature 財 l の特徴ベクトル V v v v
財を feature
N 個(3個)の特徴量で表現
(1~3の整数値で与える:数値が大ほど良い財)
N feature
k
lk
j
l k
j f a v
1
買い手j の財l の評価関数 (V )
買い手によって重視する特徴量が異なることを
想定し,各買い手の をさまざまに与える j
k a
買い手が評価値を偽らず入札するとき
社会的余剰(売り手と買い手の余剰和)が最大となる
⇒評価値をそのまま入札するのが最適戦略 [Vickrey,W(1961)]
5. 本研究のモデル
売
特徴(3,1,2)
買1 買2 買3
特徴(3,*,2) 特徴(3,*,2) 特徴(3,*,2)
特徴(3,*,2)
(1,1,1)
特徴ベクトル
l V
売り手 i の意思決定テーブル
i
i
' V
開示する特徴
ベクトル
(*,1,*)
(1,1,2) (1,*,2)
…
…
(3,1,1) (3,*,*)
…
…
意思決定テーブルに基づき
買い手に特徴ベクトルを提示
特徴(3,1,2)
2000 1 f 3000 2 f 1000 3 f 各買い手で推定された
特徴量に基づき入札
特徴(3,2,1) 特徴(3,3,2)
各買い手の特徴量推定テーブルに基づき
財の特徴量を推定
(2,1,3)
推定特徴ベ
クトル i
l
'' V
買い手 i の特徴量推定テーブル
開示された特
徴ベクトル
(1,1,2)
…
(3,2,1)
…
i
i
' V
(*,1,*)
(1,*,2)
…
(3,*,*)
…
• 売り手は財の情報の開示
非開示のみを選択
• 売り手は財を偽って
開示することはない
売り手・買い手ともに合理的なエージェントを想定し
両者とも自分に有利な売買ができるように各テーブルを学習
6. 売り手の意思決定テーブルと学習方法
i
2 T
・・・ i
Ns _ table
T
売
特徴(3,1,2)
特徴(3,*,2)
買
特徴(3,*,*)
?
?
学習
どの特徴量がどの値のときに非開示にすると
売り手の余剰を最大化できるか?
(1,1,1)
特徴ベクトル
l V
:売り手 i の意思決定テーブル
i
i
' V
開示する特徴
ベクトル
(*,1,*)
(1,1,2) (1,*,2)
…
…
(3,1,1) (3,*,*)
…
…
…
i T i T のもと一定回数財を売買したときの余剰の総和 i の適応度 : T
i
1 T
学習世代tにおけるテーブル集合
テーブル 適応度
15000
30000
4000
・・・
学習世代t+1におけるテーブル集合
最も適応度の高いテーブル
の近傍解を複数生成
・・・
テーブル
i
2 T
i
Ns _ table
T
i
1 T
Hill Climbingに基づく意思決定テーブルの学習
7. 買い手の特徴量推定テーブルと学習方法
・・・ i
Ns _ table
U
買 特徴(3,1,2)
特徴(3,2,2)
?
?
学習
財の評価を誤らないために,隠された
特徴量の値をなるべく正確に推定したい
:買い手 i の推定テーブル
…
i U i U のもと一定回数財を売買したとき i の適応度 : U
i
1 U
学習世代tにおけるテーブル集合
テーブル 適応度
20
45
30
・・・
学習世代t+1におけるテーブル集合
最も適応度の高いテーブル
の近傍解を複数生成
テーブル
Hill Climbingによる特徴量推定決定テーブルの学習
特徴(3,*,2)
(2,1,3)
推定特徴ベ
クトル
i
l
'' V
開示された特
徴ベクトル
(1,1,2)
…
(3,2,1)
…
i
i
' V
(*,1,*)
(1,*,2)
…
(3,*,*)
…
推定した特徴量と落札した財の特徴量が一致した回数
i
2 U
・・・ i
Ns _ table
U
i
1 U
i
2 U
8. 実験
設定1:買い手が売り手を区別できない場合
買い手が各売り手に対して
同一の特徴値推定テーブルを持つ
設定2:買い手が売り手を区別できる場合
買い手が各売り手に対して
個別の特徴値推定テーブルを持つ
売り手
買い手
売り手
買い手
財の特徴量 : 3次元,3段階
売り手数 : 5人
売り手が売る財 : 2700個
買い手数 : 10人
買い手の財評価関数 : 平均1.0,分散0.2の標準正規乱数でランダムに設定
( , , ) 1 2 3
l l l l
k V v v v {1,2,3} l
k v
• 売り手の情報開示戦略の学習によって,売り手の余剰がどのように変化するか
• 売り手の余剰を大にする情報開示戦略がどのような戦略であるかを分析
実験設定