SlideShare uma empresa Scribd logo
1 de 23
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 1
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
【.LOG(ドットログ)】第2回アドテクノロジーを支える技術 #ドットログ
「SpiderAFにおける機械学習を使った不正検知」
2019/02/21@ログリー株式会社
赤石 暁(株式会社Phybbit)
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 2
赤石 暁 (あかいし あきら)
株式会社Phybbit Developer
略歴
2010年 3月 首都大学東京 博士過程修了
2012年11月 電気通信大学 特任助教
2018年 3月 株式会社Phybbit 入社
やってること
SpiderAFの開発
不正トラフィックの研究・解析
P E N D I N G P A T E N T
C O N F I D E N T I A L Copyright © 2018, Phybbit Ltd. All rights reserved.
目次
1. アドフラウド(広告不正)って何?
2. ログデータから何がわかる?
3. 不正パターンの可視化
4. まとめ
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 44
Phybbit (SpiderAF)
広告ログデータを集計
可視化・スコアリング
データから
アドフラウドを
見つけ出す!
SpiderAF ダッシュボード
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 55
アドフラウド(広告詐欺)って何?
広告をクリック
ウェブサイト運営者
スクリプト・ボットによる
不正クリック
アドフラウドのひと
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 66
ログデータから不正を見つける
クリック時間、IP、OS/端末情報
不正サイトを見つける
ルールベース
機械学習
- 教師あり(XGBoost , CNN, NLP, etc.)
- 教師なし(k-means clustering, t-SNE)
P E N D I N G P A T E N T
C O N F I D E N T I A L Copyright © 2018, Phybbit Ltd. All rights reserved.
目次
2. ログデータから何がわかる?
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 88
ログデータから得られる情報
時間
IP:国、県、ISP
デバイス情報、OS環境、ブラウザ
クリック=HTTP request UserAgent/SDK
サイトA
サイトB
サイトC
サイトD
サイトE
サイトF
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 99
クリック時間の集計
サイトごとに集計
サイトBサイトA
サイトB
サイトB
サイトA
一定期間(e.g.一ヶ月)の
データを集計
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 1010
時間分布の不正パターン
サイトA
昼休み
サイトB
一日中クリックしっぱなし?!
寝てる😴
仕事終わり😆
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 1111
分の分布の不正パターン
サイトA サイトB
何分にクリックするかはバラバラ
→平均するとほぼ一定
15分おきにクリック?!
ボット/スクリプトによるクリック?!
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 1212
IPの分析
国の分布 県の分布 ISPの分布
正常サイトでは日本の人口分布に近くなる
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 1313
IPの分析
国の分布 県の分布 ISPの分布
正常サイトでは日本の人口分布に近くなる不正サイトでは、不自然な分布になる
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 1414
端末情報
正常サイト 不正サイト
デバイス、ブラウザでも同様の傾向がある
iOS 6.0は2012年リリース
不正サイトでは
古いOSが使われがち
(scriptのUAを更新してない?!
安い端末で大量クリック?!)
P E N D I N G P A T E N T
C O N F I D E N T I A L Copyright © 2018, Phybbit Ltd. All rights reserved.
目次
3. 不正パターンの可視化
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 1616
不正パターンを見つけたい
クリックの時間
24次元データ 低次元データ
サイトA
サイトB
サイトC
サイトA
サイトB
サイトC
Dimensionality reduction
PCA
NMF
t-SNE
サイトごとに合計で割る
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 1717
t-SNE
t-distributed stochastic neighbor embedding
サイトA
サイトB
サイトC
サイトA
サイトB
サイトC
https://scikit-learn.org/
元データ構造を2次元にmapping
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 1818
t-SNEでの可視化
不正サイトを一括で見つけられる!
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 1919
OS version
• androidだけ
• iOSだけ
• 両方
サイトA
サイトB
サイトC
57次元
サイトA
サイトB
サイトC
サイトごとに合計で割る
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 2020
OS t-SNE
iOSだけ
androidだけ
両方
サイトC
サイトB
サイトA
サイトD
サイトE
サイトF
サイト
G
サイトH
サイトI
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 2121
OS t-SNE
古いiOSだけ
小さい“島”は
異常なパターンになっている
→ぜんぶ不正サイト
android 5.0 ?!
iOS 10.3 ?!
サイトC
サイトB
サイトA
サイトD
サイトE
サイトF
サイト
G
サイトH
サイトI
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 2222
t-SNEによる不正検出
どんなデータでも使える
ラベルなしで使える(教師なし)
t-SNEの利点
不正サイトを一括で見つけられる
サイトの類似性がわかる
• 不正スコアの精度向上
• 新しい不正パターンの発見
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved.
CONFIDENTIAL
PATENT PENDING
Copyright © 2018, Phybbit Ltd. All rights reserved. 2323
まとめ
ログデータから不正を見つける
サイトごとに集計し、不正パターンを見つける
t-SNEで可視化
https://spideraf.com

Mais conteúdo relacionado

Semelhante a SpiderAFにおける機械学習を使った不正検知

ROSでロボット開発中
ROSでロボット開発中ROSでロボット開発中
ROSでロボット開発中ssuser2144b2
 
Pycon reject banditアルゴリズムを用いた自動abテスト
Pycon reject banditアルゴリズムを用いた自動abテストPycon reject banditアルゴリズムを用いた自動abテスト
Pycon reject banditアルゴリズムを用いた自動abテストShoichi Taguchi
 
誰でもできるGoogleアシスタント開発
誰でもできるGoogleアシスタント開発誰でもできるGoogleアシスタント開発
誰でもできるGoogleアシスタント開発Namito Satoyama
 
AlibabaCloud使ってみた ~震える手でお小遣いからDATAVを買う編~
AlibabaCloud使ってみた ~震える手でお小遣いからDATAVを買う編~AlibabaCloud使ってみた ~震える手でお小遣いからDATAVを買う編~
AlibabaCloud使ってみた ~震える手でお小遣いからDATAVを買う編~Hironari Ono
 
Smart Phone Reward & Social Game
Smart Phone Reward & Social GameSmart Phone Reward & Social Game
Smart Phone Reward & Social GameNobuyoshi Noda
 
モバイル・IoT・VR、今後のデバイスに向けた開発手法について ~スマホの次を見据えて~
モバイル・IoT・VR、今後のデバイスに向けた開発手法について ~スマホの次を見据えて~モバイル・IoT・VR、今後のデバイスに向けた開発手法について ~スマホの次を見据えて~
モバイル・IoT・VR、今後のデバイスに向けた開発手法について ~スマホの次を見据えて~Koichi Sasaki
 
ハイブリットソーシャルゲームの現場
ハイブリットソーシャルゲームの現場ハイブリットソーシャルゲームの現場
ハイブリットソーシャルゲームの現場Shota Suzuki
 
非エンジニアよ エクセル辞めてBigQueryを使いなさい
非エンジニアよ エクセル辞めてBigQueryを使いなさい非エンジニアよ エクセル辞めてBigQueryを使いなさい
非エンジニアよ エクセル辞めてBigQueryを使いなさいHironari Ono
 
「未知の脅威」を検出するために -Securitydays2015 imatrixセミナー@KITTE-
「未知の脅威」を検出するために -Securitydays2015 imatrixセミナー@KITTE-「未知の脅威」を検出するために -Securitydays2015 imatrixセミナー@KITTE-
「未知の脅威」を検出するために -Securitydays2015 imatrixセミナー@KITTE-imatrix_share
 
セキュリティエバンジェリストやってますが、実はネツエンなんです
セキュリティエバンジェリストやってますが、実はネツエンなんですセキュリティエバンジェリストやってますが、実はネツエンなんです
セキュリティエバンジェリストやってますが、実はネツエンなんですTaku Harako
 
電子出版と電子書籍の今とこれから
電子出版と電子書籍の今とこれから電子出版と電子書籍の今とこれから
電子出版と電子書籍の今とこれから馮 富久
 
Ionicを使ってスマホアプリを作ってみた
Ionicを使ってスマホアプリを作ってみたIonicを使ってスマホアプリを作ってみた
Ionicを使ってスマホアプリを作ってみた虎の穴 開発室
 
【DMP x LPO ABテスト】パブリックdmpを用いたデータドリブンペルソナ構築
【DMP x LPO ABテスト】パブリックdmpを用いたデータドリブンペルソナ構築【DMP x LPO ABテスト】パブリックdmpを用いたデータドリブンペルソナ構築
【DMP x LPO ABテスト】パブリックdmpを用いたデータドリブンペルソナ構築Satoru Yamamoto
 
自前でcloud foundryを構築してgooのビッグサービスをカットオーバーした話
自前でcloud foundryを構築してgooのビッグサービスをカットオーバーした話自前でcloud foundryを構築してgooのビッグサービスをカットオーバーした話
自前でcloud foundryを構築してgooのビッグサービスをカットオーバーした話和也 大木
 

Semelhante a SpiderAFにおける機械学習を使った不正検知 (20)

ROSでロボット開発中
ROSでロボット開発中ROSでロボット開発中
ROSでロボット開発中
 
Yahoo! JAPANの不正投稿対策 #yjmu
Yahoo! JAPANの不正投稿対策 #yjmu Yahoo! JAPANの不正投稿対策 #yjmu
Yahoo! JAPANの不正投稿対策 #yjmu
 
Pycon reject banditアルゴリズムを用いた自動abテスト
Pycon reject banditアルゴリズムを用いた自動abテストPycon reject banditアルゴリズムを用いた自動abテスト
Pycon reject banditアルゴリズムを用いた自動abテスト
 
誰でもできるGoogleアシスタント開発
誰でもできるGoogleアシスタント開発誰でもできるGoogleアシスタント開発
誰でもできるGoogleアシスタント開発
 
AlibabaCloud使ってみた ~震える手でお小遣いからDATAVを買う編~
AlibabaCloud使ってみた ~震える手でお小遣いからDATAVを買う編~AlibabaCloud使ってみた ~震える手でお小遣いからDATAVを買う編~
AlibabaCloud使ってみた ~震える手でお小遣いからDATAVを買う編~
 
Smart Phone Reward & Social Game
Smart Phone Reward & Social GameSmart Phone Reward & Social Game
Smart Phone Reward & Social Game
 
モバイル・IoT・VR、今後のデバイスに向けた開発手法について ~スマホの次を見据えて~
モバイル・IoT・VR、今後のデバイスに向けた開発手法について ~スマホの次を見据えて~モバイル・IoT・VR、今後のデバイスに向けた開発手法について ~スマホの次を見据えて~
モバイル・IoT・VR、今後のデバイスに向けた開発手法について ~スマホの次を見据えて~
 
ハイブリットソーシャルゲームの現場
ハイブリットソーシャルゲームの現場ハイブリットソーシャルゲームの現場
ハイブリットソーシャルゲームの現場
 
Tapnow資料
Tapnow資料Tapnow資料
Tapnow資料
 
リースまるみえくん
リースまるみえくんリースまるみえくん
リースまるみえくん
 
非エンジニアよ エクセル辞めてBigQueryを使いなさい
非エンジニアよ エクセル辞めてBigQueryを使いなさい非エンジニアよ エクセル辞めてBigQueryを使いなさい
非エンジニアよ エクセル辞めてBigQueryを使いなさい
 
「未知の脅威」を検出するために -Securitydays2015 imatrixセミナー@KITTE-
「未知の脅威」を検出するために -Securitydays2015 imatrixセミナー@KITTE-「未知の脅威」を検出するために -Securitydays2015 imatrixセミナー@KITTE-
「未知の脅威」を検出するために -Securitydays2015 imatrixセミナー@KITTE-
 
YJTC18 Keynote Shape the Future - through the Power of Technology
YJTC18 Keynote Shape the Future - through the Power of TechnologyYJTC18 Keynote Shape the Future - through the Power of Technology
YJTC18 Keynote Shape the Future - through the Power of Technology
 
セキュリティエバンジェリストやってますが、実はネツエンなんです
セキュリティエバンジェリストやってますが、実はネツエンなんですセキュリティエバンジェリストやってますが、実はネツエンなんです
セキュリティエバンジェリストやってますが、実はネツエンなんです
 
画像認識技術のローカルサービスへの適用 #ヤフー名古屋
画像認識技術のローカルサービスへの適用 #ヤフー名古屋画像認識技術のローカルサービスへの適用 #ヤフー名古屋
画像認識技術のローカルサービスへの適用 #ヤフー名古屋
 
Wab090225a
Wab090225aWab090225a
Wab090225a
 
電子出版と電子書籍の今とこれから
電子出版と電子書籍の今とこれから電子出版と電子書籍の今とこれから
電子出版と電子書籍の今とこれから
 
Ionicを使ってスマホアプリを作ってみた
Ionicを使ってスマホアプリを作ってみたIonicを使ってスマホアプリを作ってみた
Ionicを使ってスマホアプリを作ってみた
 
【DMP x LPO ABテスト】パブリックdmpを用いたデータドリブンペルソナ構築
【DMP x LPO ABテスト】パブリックdmpを用いたデータドリブンペルソナ構築【DMP x LPO ABテスト】パブリックdmpを用いたデータドリブンペルソナ構築
【DMP x LPO ABテスト】パブリックdmpを用いたデータドリブンペルソナ構築
 
自前でcloud foundryを構築してgooのビッグサービスをカットオーバーした話
自前でcloud foundryを構築してgooのビッグサービスをカットオーバーした話自前でcloud foundryを構築してgooのビッグサービスをカットオーバーした話
自前でcloud foundryを構築してgooのビッグサービスをカットオーバーした話
 

Mais de Spider Labs, Ltd.

Spider AF-アプリ広告主向け資料
Spider AF-アプリ広告主向け資料Spider AF-アプリ広告主向け資料
Spider AF-アプリ広告主向け資料Spider Labs, Ltd.
 
SpiderAF-ウェブ広告主向け資料
SpiderAF-ウェブ広告主向け資料SpiderAF-ウェブ広告主向け資料
SpiderAF-ウェブ広告主向け資料Spider Labs, Ltd.
 
アドフラウド対策ツール「SpiderAF」
アドフラウド対策ツール「SpiderAF」アドフラウド対策ツール「SpiderAF」
アドフラウド対策ツール「SpiderAF」Spider Labs, Ltd.
 
3月アドフラウド勉強会_「Industry pulse」からみる2019年アドベリフィケーション
3月アドフラウド勉強会_「Industry pulse」からみる2019年アドベリフィケーション3月アドフラウド勉強会_「Industry pulse」からみる2019年アドベリフィケーション
3月アドフラウド勉強会_「Industry pulse」からみる2019年アドベリフィケーションSpider Labs, Ltd.
 
3月アドフラウド勉強会_パネルディスカッション2
3月アドフラウド勉強会_パネルディスカッション23月アドフラウド勉強会_パネルディスカッション2
3月アドフラウド勉強会_パネルディスカッション2Spider Labs, Ltd.
 
3月アドフラウド勉強会_パネルディスカッション1
3月アドフラウド勉強会_パネルディスカッション13月アドフラウド勉強会_パネルディスカッション1
3月アドフラウド勉強会_パネルディスカッション1Spider Labs, Ltd.
 
第二回アドフラウド勉強会パネルディスカッション2
第二回アドフラウド勉強会パネルディスカッション2第二回アドフラウド勉強会パネルディスカッション2
第二回アドフラウド勉強会パネルディスカッション2Spider Labs, Ltd.
 
第二回アドフラウド勉強会パネルディスカッション1
第二回アドフラウド勉強会パネルディスカッション1第二回アドフラウド勉強会パネルディスカッション1
第二回アドフラウド勉強会パネルディスカッション1Spider Labs, Ltd.
 
BOTだけではない!新型アドフラウドによる新たな問題点
BOTだけではない!新型アドフラウドによる新たな問題点BOTだけではない!新型アドフラウドによる新たな問題点
BOTだけではない!新型アドフラウドによる新たな問題点Spider Labs, Ltd.
 

Mais de Spider Labs, Ltd. (9)

Spider AF-アプリ広告主向け資料
Spider AF-アプリ広告主向け資料Spider AF-アプリ広告主向け資料
Spider AF-アプリ広告主向け資料
 
SpiderAF-ウェブ広告主向け資料
SpiderAF-ウェブ広告主向け資料SpiderAF-ウェブ広告主向け資料
SpiderAF-ウェブ広告主向け資料
 
アドフラウド対策ツール「SpiderAF」
アドフラウド対策ツール「SpiderAF」アドフラウド対策ツール「SpiderAF」
アドフラウド対策ツール「SpiderAF」
 
3月アドフラウド勉強会_「Industry pulse」からみる2019年アドベリフィケーション
3月アドフラウド勉強会_「Industry pulse」からみる2019年アドベリフィケーション3月アドフラウド勉強会_「Industry pulse」からみる2019年アドベリフィケーション
3月アドフラウド勉強会_「Industry pulse」からみる2019年アドベリフィケーション
 
3月アドフラウド勉強会_パネルディスカッション2
3月アドフラウド勉強会_パネルディスカッション23月アドフラウド勉強会_パネルディスカッション2
3月アドフラウド勉強会_パネルディスカッション2
 
3月アドフラウド勉強会_パネルディスカッション1
3月アドフラウド勉強会_パネルディスカッション13月アドフラウド勉強会_パネルディスカッション1
3月アドフラウド勉強会_パネルディスカッション1
 
第二回アドフラウド勉強会パネルディスカッション2
第二回アドフラウド勉強会パネルディスカッション2第二回アドフラウド勉強会パネルディスカッション2
第二回アドフラウド勉強会パネルディスカッション2
 
第二回アドフラウド勉強会パネルディスカッション1
第二回アドフラウド勉強会パネルディスカッション1第二回アドフラウド勉強会パネルディスカッション1
第二回アドフラウド勉強会パネルディスカッション1
 
BOTだけではない!新型アドフラウドによる新たな問題点
BOTだけではない!新型アドフラウドによる新たな問題点BOTだけではない!新型アドフラウドによる新たな問題点
BOTだけではない!新型アドフラウドによる新たな問題点
 

Último

論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 

Último (9)

論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 

SpiderAFにおける機械学習を使った不正検知

  • 1. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 1 CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 【.LOG(ドットログ)】第2回アドテクノロジーを支える技術 #ドットログ 「SpiderAFにおける機械学習を使った不正検知」 2019/02/21@ログリー株式会社 赤石 暁(株式会社Phybbit)
  • 2. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 2 赤石 暁 (あかいし あきら) 株式会社Phybbit Developer 略歴 2010年 3月 首都大学東京 博士過程修了 2012年11月 電気通信大学 特任助教 2018年 3月 株式会社Phybbit 入社 やってること SpiderAFの開発 不正トラフィックの研究・解析
  • 3. P E N D I N G P A T E N T C O N F I D E N T I A L Copyright © 2018, Phybbit Ltd. All rights reserved. 目次 1. アドフラウド(広告不正)って何? 2. ログデータから何がわかる? 3. 不正パターンの可視化 4. まとめ
  • 4. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 44 Phybbit (SpiderAF) 広告ログデータを集計 可視化・スコアリング データから アドフラウドを 見つけ出す! SpiderAF ダッシュボード
  • 5. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 55 アドフラウド(広告詐欺)って何? 広告をクリック ウェブサイト運営者 スクリプト・ボットによる 不正クリック アドフラウドのひと
  • 6. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 66 ログデータから不正を見つける クリック時間、IP、OS/端末情報 不正サイトを見つける ルールベース 機械学習 - 教師あり(XGBoost , CNN, NLP, etc.) - 教師なし(k-means clustering, t-SNE)
  • 7. P E N D I N G P A T E N T C O N F I D E N T I A L Copyright © 2018, Phybbit Ltd. All rights reserved. 目次 2. ログデータから何がわかる?
  • 8. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 88 ログデータから得られる情報 時間 IP:国、県、ISP デバイス情報、OS環境、ブラウザ クリック=HTTP request UserAgent/SDK サイトA サイトB サイトC サイトD サイトE サイトF
  • 9. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 99 クリック時間の集計 サイトごとに集計 サイトBサイトA サイトB サイトB サイトA 一定期間(e.g.一ヶ月)の データを集計
  • 10. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 1010 時間分布の不正パターン サイトA 昼休み サイトB 一日中クリックしっぱなし?! 寝てる😴 仕事終わり😆
  • 11. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 1111 分の分布の不正パターン サイトA サイトB 何分にクリックするかはバラバラ →平均するとほぼ一定 15分おきにクリック?! ボット/スクリプトによるクリック?!
  • 12. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 1212 IPの分析 国の分布 県の分布 ISPの分布 正常サイトでは日本の人口分布に近くなる
  • 13. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 1313 IPの分析 国の分布 県の分布 ISPの分布 正常サイトでは日本の人口分布に近くなる不正サイトでは、不自然な分布になる
  • 14. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 1414 端末情報 正常サイト 不正サイト デバイス、ブラウザでも同様の傾向がある iOS 6.0は2012年リリース 不正サイトでは 古いOSが使われがち (scriptのUAを更新してない?! 安い端末で大量クリック?!)
  • 15. P E N D I N G P A T E N T C O N F I D E N T I A L Copyright © 2018, Phybbit Ltd. All rights reserved. 目次 3. 不正パターンの可視化
  • 16. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 1616 不正パターンを見つけたい クリックの時間 24次元データ 低次元データ サイトA サイトB サイトC サイトA サイトB サイトC Dimensionality reduction PCA NMF t-SNE サイトごとに合計で割る
  • 17. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 1717 t-SNE t-distributed stochastic neighbor embedding サイトA サイトB サイトC サイトA サイトB サイトC https://scikit-learn.org/ 元データ構造を2次元にmapping
  • 18. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 1818 t-SNEでの可視化 不正サイトを一括で見つけられる!
  • 19. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 1919 OS version • androidだけ • iOSだけ • 両方 サイトA サイトB サイトC 57次元 サイトA サイトB サイトC サイトごとに合計で割る
  • 20. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 2020 OS t-SNE iOSだけ androidだけ 両方 サイトC サイトB サイトA サイトD サイトE サイトF サイト G サイトH サイトI
  • 21. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 2121 OS t-SNE 古いiOSだけ 小さい“島”は 異常なパターンになっている →ぜんぶ不正サイト android 5.0 ?! iOS 10.3 ?! サイトC サイトB サイトA サイトD サイトE サイトF サイト G サイトH サイトI
  • 22. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 2222 t-SNEによる不正検出 どんなデータでも使える ラベルなしで使える(教師なし) t-SNEの利点 不正サイトを一括で見つけられる サイトの類似性がわかる • 不正スコアの精度向上 • 新しい不正パターンの発見
  • 23. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. CONFIDENTIAL PATENT PENDING Copyright © 2018, Phybbit Ltd. All rights reserved. 2323 まとめ ログデータから不正を見つける サイトごとに集計し、不正パターンを見つける t-SNEで可視化 https://spideraf.com

Notas do Editor

  1. SELECT site_id, HOUR(time) AS hour, COUNT(1) FROM log_data_table GROUP BY site_id, hour