SlideShare uma empresa Scribd logo
1 de 15
Transfer learning在广告
点击率预估的应用
黄晶
微博:黄晶PKU
2015.6
个人简介:jhuangpku.github.io
library(wordcloud)
wordcloud(blog$word, blog$freq, random.order=F, color=pal)
主要内容
 业务问题
 解决方案
学术界方案
Data-level transfer
Parameter-level transfer
应用效果&Future Work
 广告时间----WE ARE HIRING
什么是在线广告
广告A
出价5元
 规则
广告主对关键词出价bid
点击一次收费bid(实际
GSP)
 目标:收益最大化
有限位置怎么选择广告?
Bid*广告点击率降序排列
核心问题:点击率怎么估计
点击率:0
平均收益:0元
广告B
出价2元
广告C
出价1元
点击率:0.1
平均收益:0.2元
点击率:0.1
平均收益:0.1元
怎么预估点击率
 数据/样本
一个广告的一次展现
 特征
ID类特征
泛化特征
统计特征
….
 模型
LR->GBDT->DNN
怎么预估点击率-LR
数据集
1 0 0 …
1 0 0 …
0 1 0 …
0 0 0 …
0 0 0 …
0 1 0 …
0 0 1 …
1
0
1
0
0
0
0
Target y
X1
X2
X3
X4
X5
X6
X7
0 0 0 …
1 0 0 …
1 0 0 …
0 1 0 …
0 0 0 …
0 1 0 …
0 0 1 …
。。
query 广告ID
Y=1
Y=0
||||),,(min
1
wCywXl
m
i
iii 
距离分界面越远,loss越小
))),(1log()1(),(log(),,( wXhywXhyywXl iiiiiii 
)exp(1
1
),(
i
ti
Xw
wXh


)exp(1
1
)|1(P
i
ti
Xw
Xy

点击率学习目标:给定样本,y=1的概率
0 0 1 … ?Xn 0 0 1 …
我们的问题-商业知心
广告
成
特点:同一套广告描述 VS 多种展现形式(不断有新展现形式)
学术界方法
Instance-base
Feature-base Parameter-base
借数据
借数据 借参数
Data-Level
Source Target
Data-level
基本假设:S上的data经过合理
的变化,可以变成T上的data
核心&问题:data相似度的衡量
Ps(x,y) ->Pt(x,y)
代表方法:
 Instance base
 Feature base
x1
三维示例
x1
x2
问题:X2!=0的由于数据少,未观测到
x1
x2
真实T分布
x1
x2
相似变换
x2
w降低
W增加
观测S分布
观测T分布
调整后S分布
Data-Level
Source Target
Data-level
基本假设:S上的data经过合理
的变化,可以变成T上的data
核心&问题:data相似度的衡量
Ps(x,y) ->Pt(x,y)
代表方法:
 Instance base
 Feature base
现实是
噪音!
噪音!!
噪音!!!
Parameter-Level
Parameter-level
基本假设:S上的权重和T上的权
值有”相似性”
核心&问题:权值相似度的衡量
该度量方法表现为一个约束
代表方法:
 parameter base
W1
W2
W3 W3’
W4 W4’
W5 W5’
Common
source target
||||)()(
2
1
)()( '''
wwCwwLwwLwwwLwf SSTSS
T
SS 
target上的拟合 正则
新权值在Source的数据上的loss近似模拟
另一种观点:bayes LR
提供的是先验
:source上的权重
:target上的权重
Sw
wwS  Sw
Parameter revisited
Parameter-level
W1
W2
W3 W3’
W4 W4’
W5 W5’
Common
source target
近似实现common-part和individual-part的方法:
Step1:在source上的训练只训练“可迁移”的特征—common-part
Step2:在target上把所有特征带进去训练
效果:common-part变动较少,individual-part变动较多
Common-part的业务含义,不同query在不同卡片的weight近似一致
||||)()(
2
1
)()( '''
wwCwwLwwLwwwLwf SSTSS
T
SS 
应用效果&Future Work
 应用效果
 Future Work
数据:Source,target的选择
特征:可迁移特征的选择(单slot在S上训练T上校验)
模型:multi-task / GBDT增量
项目 线下auc 线上ctr
医疗知心中间页找医院TL模型 +0.8% 2.08%
教育知心无线找课程TL模型 +5%+ 7.52%
bdl_job@baidu.com

Mais conteúdo relacionado

Semelhante a Transfer learning@r语言大会2.0 发布版

數據化營銷的必備觀念 第二節
數據化營銷的必備觀念 第二節數據化營銷的必備觀念 第二節
數據化營銷的必備觀念 第二節煜庭 邱
 
商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.com商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.comsuilingbo
 
商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.com商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.comsuilingbo
 
数据监测体系 章明
数据监测体系 章明数据监测体系 章明
数据监测体系 章明yixieshi
 
Google Engage夥伴計劃-廣告帳戶專題分享與建立mcc我的客戶中心
Google Engage夥伴計劃-廣告帳戶專題分享與建立mcc我的客戶中心Google Engage夥伴計劃-廣告帳戶專題分享與建立mcc我的客戶中心
Google Engage夥伴計劃-廣告帳戶專題分享與建立mcc我的客戶中心Souyi Yang
 
【Google × ur ad】解密數據,決定優化策略
【Google × ur ad】解密數據,決定優化策略【Google × ur ad】解密數據,決定優化策略
【Google × ur ad】解密數據,決定優化策略AdWordsGreaterChina
 
香港六合彩
香港六合彩香港六合彩
香港六合彩shujia
 
Yahoo! 奇摩關鍵字廣告聯播網
Yahoo! 奇摩關鍵字廣告聯播網Yahoo! 奇摩關鍵字廣告聯播網
Yahoo! 奇摩關鍵字廣告聯播網Joseph Chiang
 
Google關鍵字致勝行銷
Google關鍵字致勝行銷Google關鍵字致勝行銷
Google關鍵字致勝行銷Google Account
 
2012 proposal for CNA 中央社 (CN)
2012 proposal for CNA 中央社 (CN)2012 proposal for CNA 中央社 (CN)
2012 proposal for CNA 中央社 (CN)Sun.Lee
 
杨炯纬 如何提升市场的投资回报率
杨炯纬   如何提升市场的投资回报率杨炯纬   如何提升市场的投资回报率
杨炯纬 如何提升市场的投资回报率chaojiwangpu
 
江苏钱旺网络科技有限公司 -餐饮企业消费返现解决方案
江苏钱旺网络科技有限公司 -餐饮企业消费返现解决方案江苏钱旺网络科技有限公司 -餐饮企业消费返现解决方案
江苏钱旺网络科技有限公司 -餐饮企业消费返现解决方案zzgloves
 
如何從搏來客行銷(Inbound marketing) 進化到成長駭客行銷(growth hacker marketing)?
如何從搏來客行銷(Inbound marketing) 進化到成長駭客行銷(growth hacker marketing)?如何從搏來客行銷(Inbound marketing) 進化到成長駭客行銷(growth hacker marketing)?
如何從搏來客行銷(Inbound marketing) 進化到成長駭客行銷(growth hacker marketing)?Taiwan Inbound Marketing Envangelist
 
20161208 sem關鍵字廣告專案的執行
20161208 sem關鍵字廣告專案的執行20161208 sem關鍵字廣告專案的執行
20161208 sem關鍵字廣告專案的執行煜庭 邱
 
行動廣告與大數據資料分析策略與執行
行動廣告與大數據資料分析策略與執行行動廣告與大數據資料分析策略與執行
行動廣告與大數據資料分析策略與執行Craig Chao
 
Use Google adwords to help you
Use Google adwords to help youUse Google adwords to help you
Use Google adwords to help youMichael Li
 
網路廣告操作基礎 - 架構設計與優化邏輯
網路廣告操作基礎 - 架構設計與優化邏輯網路廣告操作基礎 - 架構設計與優化邏輯
網路廣告操作基礎 - 架構設計與優化邏輯Norika
 
宫鑫:服装B2 c行业广告投放分享
宫鑫:服装B2 c行业广告投放分享宫鑫:服装B2 c行业广告投放分享
宫鑫:服装B2 c行业广告投放分享Gong Xin
 

Semelhante a Transfer learning@r语言大会2.0 发布版 (20)

數據化營銷的必備觀念 第二節
數據化營銷的必備觀念 第二節數據化營銷的必備觀念 第二節
數據化營銷的必備觀念 第二節
 
商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.com商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.com
 
商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.com商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.com
 
数据监测体系 章明
数据监测体系 章明数据监测体系 章明
数据监测体系 章明
 
Google Engage夥伴計劃-廣告帳戶專題分享與建立mcc我的客戶中心
Google Engage夥伴計劃-廣告帳戶專題分享與建立mcc我的客戶中心Google Engage夥伴計劃-廣告帳戶專題分享與建立mcc我的客戶中心
Google Engage夥伴計劃-廣告帳戶專題分享與建立mcc我的客戶中心
 
product ads简介
product ads简介product ads简介
product ads简介
 
【Google × ur ad】解密數據,決定優化策略
【Google × ur ad】解密數據,決定優化策略【Google × ur ad】解密數據,決定優化策略
【Google × ur ad】解密數據,決定優化策略
 
香港六合彩
香港六合彩香港六合彩
香港六合彩
 
Yahoo! 奇摩關鍵字廣告聯播網
Yahoo! 奇摩關鍵字廣告聯播網Yahoo! 奇摩關鍵字廣告聯播網
Yahoo! 奇摩關鍵字廣告聯播網
 
Google關鍵字致勝行銷
Google關鍵字致勝行銷Google關鍵字致勝行銷
Google關鍵字致勝行銷
 
2012 proposal for CNA 中央社 (CN)
2012 proposal for CNA 中央社 (CN)2012 proposal for CNA 中央社 (CN)
2012 proposal for CNA 中央社 (CN)
 
杨炯纬 如何提升市场的投资回报率
杨炯纬   如何提升市场的投资回报率杨炯纬   如何提升市场的投资回报率
杨炯纬 如何提升市场的投资回报率
 
江苏钱旺网络科技有限公司 -餐饮企业消费返现解决方案
江苏钱旺网络科技有限公司 -餐饮企业消费返现解决方案江苏钱旺网络科技有限公司 -餐饮企业消费返现解决方案
江苏钱旺网络科技有限公司 -餐饮企业消费返现解决方案
 
如何從搏來客行銷(Inbound marketing) 進化到成長駭客行銷(growth hacker marketing)?
如何從搏來客行銷(Inbound marketing) 進化到成長駭客行銷(growth hacker marketing)?如何從搏來客行銷(Inbound marketing) 進化到成長駭客行銷(growth hacker marketing)?
如何從搏來客行銷(Inbound marketing) 進化到成長駭客行銷(growth hacker marketing)?
 
20161208 sem關鍵字廣告專案的執行
20161208 sem關鍵字廣告專案的執行20161208 sem關鍵字廣告專案的執行
20161208 sem關鍵字廣告專案的執行
 
行動廣告與大數據資料分析策略與執行
行動廣告與大數據資料分析策略與執行行動廣告與大數據資料分析策略與執行
行動廣告與大數據資料分析策略與執行
 
w5-Digital Marketing
w5-Digital Marketingw5-Digital Marketing
w5-Digital Marketing
 
Use Google adwords to help you
Use Google adwords to help youUse Google adwords to help you
Use Google adwords to help you
 
網路廣告操作基礎 - 架構設計與優化邏輯
網路廣告操作基礎 - 架構設計與優化邏輯網路廣告操作基礎 - 架構設計與優化邏輯
網路廣告操作基礎 - 架構設計與優化邏輯
 
宫鑫:服装B2 c行业广告投放分享
宫鑫:服装B2 c行业广告投放分享宫鑫:服装B2 c行业广告投放分享
宫鑫:服装B2 c行业广告投放分享
 

Transfer learning@r语言大会2.0 发布版