SlideShare uma empresa Scribd logo
1 de 29
Digdagを用いた
大規模広告配信ログデータの
加工と運用
株式会社マイクロアド
前西 鷹
Developers Boost 2020
#devboost
自己紹介
● 前西 鷹 (Taka Maenishi)
株式会社マイクロアド
システム開発本部 アプリケーションエンジニア
○ 27歳、新卒3年目
○ 大規模なデータのバッチ処理開発を主に担当
○ 副: エンジニア広報
● 使用言語
○ ほとんどPython
● 関西出身
● Twitter
○ @taka_na_u
● 会社のTwitter: @microad_dev もよろしくお願いします。
2
もくじ
● 広告配信システムのログの概要
● ログの加工処理
● ワークフローエンジンDigdagの利用
● 保守・運用
● 課題
3
4
広告配信システムのログ
広告配信システムのログ
● 広告配信システムはRTB(入札)・インプレッション・
クリックなどのイベントに合わせてログを出力する。
○ ログの内容はそのイベントに関わるあらゆる情報
■ タイムスタンプ、SSP名(ID)、デバイス情報、ユーザ情報、入札額…
○ そのログ件数は合計すると毎日数百億件にも
5
SSP
(Supply-Side
Platform)
WEBページ
広告枠
入札
(RTB/Real-Time
Bidding)
要求広告をリクエスト
応札
広告が表示される:インプレッション
広告がクリックされる:クリック
DSP
(Demand-side
Platform)広告をレスポンス
ログの利用用途
マイクロアドでは、広告配信システムから出力される大量のログを
保持し、様々な用途に利用している。
例えば…
● 配信実績集計
● 監視
● 可視化
● 分析
● 機械学習
→ 生ログを加工し、それぞれの用途に合う使いやすい形にしたい。
6
7
ログの加工処理
ログ基盤
● ログ基盤にはHadoopを利用。
● JSON形式の生ログをKafkaに蓄積し、FlumeでHadoopまで転送。
● 詳細: MicroAdのデータ基盤 - MicroAd Developers Blog
8
ログの圧縮処理
● Hadoopに送られた生ログに対して、長期保存のため、加工する前に
まずは圧縮処理をかけて容量を削減。
● 圧縮形式には、以下の理由からParquet形式を採用。
○ 列指向フォーマットで、大規模データの処理に適している。
○ カラム追加などのスキーマ変更が容易である。
○ データ分析に用いられるImpala等でサポートされている形式である。
● 圧縮処理は1時間ごとに行われ、タイムスタンプの情報をもとに
1時間ごとにパーティショニングして保持。
9
ログの加工処理
用途に合わせた加工や集計を行う。
例えば…
● 1時間毎の配信実績を集計したい。
○ RTB, インプレッション, クリックのそれぞれのログの紐付けを行い、
1つのテーブルに集約する。
● 分析や機械学習に利用するための前処理を行いたい。
○ レコード数の削減
○ カラム数の削減
○ 変換
10
データの転送処理
● 加工したデータを、用途に合わせて別のクラスタやデータストアに
転送したい場合も多々あり。
● 詳細: MicroAdのログ蓄積の流れ - MicroAd Developers Blog
11
定期実行したい
● 絶え間なく生成され続けるログに対して、これらの一連の処理を
止めることなく実行し続けなければならない。
12
13
ワークフローエンジンDigdagの利用
Digdagとは
● Treasure Data社が開発するOSSのワークフローエンジン。
● 特徴
○ ワークフローをYAMLで定義できる。
○ タスクをDockerコンテナ上で実行できる。
○ タスクをShell, Python, Rubyで記述可能。
○ session_timeという、バッチの処理対象時間を担保する概念がある。
■ システム時間によって処理対象が変わるなどといったことが無い。
■ リトライの時に特に便利。
○ retryやkillなどの処理がWeb UIからクリック一つで簡単に実行できる。
○ 自動リトライやアラートなどの機能も備わっている。
○ オペレータを自前で実装して追加できる。
14
Digdagの利用
● Hadoopに転送されたデータに対して行う定期実行のバッチ処理を
Digdagで記述。
15
ワークフローの記述
ワークフローファイルはYAMLに似たフォーマットで、
宣言的に記述できる。
16
taskA
↓
taskB & taskC (並列で実行される)
↓
taskD
という順番で実行される。
左図の例だと…
Digdagバッチ CI/CDの構成
GitHub Enterprise上のバッチ管理リポジトリの変化に応じて、
Jenkinsがビルド・テスト・コードチェック・デプロイを
自動で行う仕組みを構築。
17
Digdagバッチの実行環境
Digdag + Docker + Pythonで実行環境を構築。
● 詳細:
Digdagバッチの基本設計とビルドの実例紹介 - MicroAd Developers Blog
18
19
保守・運用
バッチは失敗する
● バッチは様々な要因で失敗する。
○ データの不整合、ネットワークエラー、高負荷…
● 少しインターバルを置いた自動リトライを設定。
● しかし、手作業が避けられない場面がどうしても発生する。
20
Web UIからワンクリックで
リトライが可能
RETRY FAILED:
ワークフローの途中で失敗していた
場合、失敗したところから再開。
RETRY ALL:
最初から全て再実行。
処理失敗時のアラート
● バッチが失敗した場合、速やかにそれを検知できることが望ましい。
● アラートをSlackに即時通知する仕組みを導入。
● メンション付きでSlackに通知される
○ 担当チームへメンション
○ 対応の緊急度や注意点なども同時に通知
● 詳細: アラートメールのslack通知の話 - MicroAd Developers Blog
21
バッチの冪等性が重要
● バッチが再実行された場合にもデータの整合性を保つ必要がある。
○ データが重複して生成されたりしてはならない。
● 冪等性を確保することを強く意識。
○ 冪等性: 同じ操作を何度繰り返しても同じ結果が得られる性質のこと。
● 具体的には
○ INSERTであればINSERT OVERWRITE(上書き)にする。
○ 1レコードずつ挿入したい場合など、上書きでは実現できない場合は
DELETEしてからINSERTするようにする。
○ cpなどのコピーも必ず上書きするオプションをつける。
22
Digdagを導入してみて
● Digdagを導入して約2年ほど運用を続けている。
○ 従来のJenkinsやcrontab等のスケジュール実行方法に比べて、
メンテナンス性が向上し、大規模データに対する処理フローも安定稼働。
○ 障害発生時の即時通知のおかげで、可用性の高いシステムに。
○ 導入前と比較して、手動による運用コストが大幅削減。
● 現在マイクロアドでは、200以上ものDigdagバッチが稼働。
23
24
課題
課題
● 同時実行できるタスクの数に上限がある。
○ 設定値で増やすことはできるが、負荷とのトレードオフ。
○ 依存関係のあるバッチが止まってしまうと、後続処理が進まなくなる
ため、上限数にぶつかってしまう。
25
26
まとめ
まとめ
● 広告配信ログを圧縮した後、様々な加工を施して保持している。
○ ログ基盤にはHadoopを採用。
○ 必要に応じて他のデータストアにも適宜転送。
● 圧縮や加工などのバッチ処理はDigdagを用いたワークフローで管理。
○ ワークフローをソースコードで管理できる。
○ メンテナンスが非常にしやすい。
○ JenkinsによるCI/CDによる開発フローを整備。
○ バッチ実行環境にはDocker + Pythonを採用。
● 運用における工夫
○ バッチが失敗したことを素早く検知できる仕組みを導入。
○ 再実行された場合にもデータに不整合が生じないように、冪等性を担保。
○ 手動による運用コストを最小限にするため試行錯誤している。
● 課題
○ 同時実行できるタスクの数に上限がある。
27
We Are Hiring!!
28
マイクロアドでは、広告配信システムを一緒に作りたい人を
募集しています!
https://recruit.microad.co.jp/
公式Twitterアカウント @microad_dev もよろしくお願いします。
29
ご清聴ありがとうございました!

Mais conteúdo relacionado

Mais procurados

エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善BrainPad Inc.
 
H08_固定電話の常識を変える!Teams 電話でますます快適なハイブリッドワークを実現するには [Microsoft Japan Digital Days]
H08_固定電話の常識を変える!Teams 電話でますます快適なハイブリッドワークを実現するには [Microsoft Japan Digital Days]H08_固定電話の常識を変える!Teams 電話でますます快適なハイブリッドワークを実現するには [Microsoft Japan Digital Days]
H08_固定電話の常識を変える!Teams 電話でますます快適なハイブリッドワークを実現するには [Microsoft Japan Digital Days]日本マイクロソフト株式会社
 
H11_ハイブリッドワーク時代に加速する、現場を含めたホンモノ DX - Microsoft 365 Frontline Worker ソリューション [...
H11_ハイブリッドワーク時代に加速する、現場を含めたホンモノ DX - Microsoft 365 Frontline Worker ソリューション [...H11_ハイブリッドワーク時代に加速する、現場を含めたホンモノ DX - Microsoft 365 Frontline Worker ソリューション [...
H11_ハイブリッドワーク時代に加速する、現場を含めたホンモノ DX - Microsoft 365 Frontline Worker ソリューション [...日本マイクロソフト株式会社
 
A12_リーンスタートアップアジャイルへの挑戦 ~ 東京証券取引所の ETF プラットフォーム “CONNEQTOR” で実現した DX ~ [Micr...
A12_リーンスタートアップアジャイルへの挑戦  ~ 東京証券取引所の ETF プラットフォーム “CONNEQTOR” で実現した DX ~ [Micr...A12_リーンスタートアップアジャイルへの挑戦  ~ 東京証券取引所の ETF プラットフォーム “CONNEQTOR” で実現した DX ~ [Micr...
A12_リーンスタートアップアジャイルへの挑戦 ~ 東京証券取引所の ETF プラットフォーム “CONNEQTOR” で実現した DX ~ [Micr...日本マイクロソフト株式会社
 
G01_ハイブリッドワークの価値と日本マイクロソフトの実践 [Microsoft Japan Digital Days]
G01_ハイブリッドワークの価値と日本マイクロソフトの実践 [Microsoft Japan Digital Days]G01_ハイブリッドワークの価値と日本マイクロソフトの実践 [Microsoft Japan Digital Days]
G01_ハイブリッドワークの価値と日本マイクロソフトの実践 [Microsoft Japan Digital Days]日本マイクロソフト株式会社
 
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?BrainPad Inc.
 
[自己PR]12/23 エンジニア"1on1"面談会
[自己PR]12/23 エンジニア"1on1"面談会[自己PR]12/23 エンジニア"1on1"面談会
[自己PR]12/23 エンジニア"1on1"面談会Toshi Matsumoto
 
全社のデータ活用を一段階上げる取り組み
全社のデータ活用を一段階上げる取り組み全社のデータ活用を一段階上げる取り組み
全社のデータ活用を一段階上げる取り組み株式会社MonotaRO Tech Team
 
H06_これからの日本の働き方が『ハイブリッドワーク』で変わる ~ 従業員を支え、寄り添い、よりよい働き方へ ~ [Microsoft Japan Di...
H06_これからの日本の働き方が『ハイブリッドワーク』で変わる  ~ 従業員を支え、寄り添い、よりよい働き方へ ~ [Microsoft Japan Di...H06_これからの日本の働き方が『ハイブリッドワーク』で変わる  ~ 従業員を支え、寄り添い、よりよい働き方へ ~ [Microsoft Japan Di...
H06_これからの日本の働き方が『ハイブリッドワーク』で変わる ~ 従業員を支え、寄り添い、よりよい働き方へ ~ [Microsoft Japan Di...日本マイクロソフト株式会社
 
B18_Dynamics 365 Commerce と Dynamics 365 SCM の高速 MRP で実現する一気通貫小売りの世界 [Microso...
B18_Dynamics 365 Commerce と Dynamics 365 SCM の高速 MRP で実現する一気通貫小売りの世界 [Microso...B18_Dynamics 365 Commerce と Dynamics 365 SCM の高速 MRP で実現する一気通貫小売りの世界 [Microso...
B18_Dynamics 365 Commerce と Dynamics 365 SCM の高速 MRP で実現する一気通貫小売りの世界 [Microso...日本マイクロソフト株式会社
 
JPC2018[F1]航空宇宙技術の発展と Microsoft HoloLens を活用した次世代可視化への挑戦
JPC2018[F1]航空宇宙技術の発展と Microsoft HoloLens を活用した次世代可視化への挑戦JPC2018[F1]航空宇宙技術の発展と Microsoft HoloLens を活用した次世代可視化への挑戦
JPC2018[F1]航空宇宙技術の発展と Microsoft HoloLens を活用した次世代可視化への挑戦MPN Japan
 
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発BrainPad Inc.
 
メルペイの与信モデリングにおける特徴量の品質向上の施策
メルペイの与信モデリングにおける特徴量の品質向上の施策メルペイの与信モデリングにおける特徴量の品質向上の施策
メルペイの与信モデリングにおける特徴量の品質向上の施策Mai Nakagawa
 
【kintone hive 上海】天津ネットワーク様講演資料_160918
【kintone hive 上海】天津ネットワーク様講演資料_160918【kintone hive 上海】天津ネットワーク様講演資料_160918
【kintone hive 上海】天津ネットワーク様講演資料_160918Cybozucommunity
 
【de:code 2020】 最前線の現場を支援する Dynamics 365 Mixed Reality アプリケーション最新活用情報
【de:code 2020】 最前線の現場を支援する Dynamics 365 Mixed Reality アプリケーション最新活用情報【de:code 2020】 最前線の現場を支援する Dynamics 365 Mixed Reality アプリケーション最新活用情報
【de:code 2020】 最前線の現場を支援する Dynamics 365 Mixed Reality アプリケーション最新活用情報日本マイクロソフト株式会社
 
N08_次世代通信キャリアの "Resilience" を支援する Microsoft Cloud [Microsoft Japan Digital Days]
N08_次世代通信キャリアの "Resilience" を支援する Microsoft Cloud [Microsoft Japan Digital Days]N08_次世代通信キャリアの "Resilience" を支援する Microsoft Cloud [Microsoft Japan Digital Days]
N08_次世代通信キャリアの "Resilience" を支援する Microsoft Cloud [Microsoft Japan Digital Days]日本マイクロソフト株式会社
 
S07_経営層 / IT 部門が意識すべきコンプライアンス対応 - Microsoft 365 E5 Compliance で実現するリスク対策 - [...
S07_経営層 / IT 部門が意識すべきコンプライアンス対応  - Microsoft 365 E5 Compliance で実現するリスク対策 - [...S07_経営層 / IT 部門が意識すべきコンプライアンス対応  - Microsoft 365 E5 Compliance で実現するリスク対策 - [...
S07_経営層 / IT 部門が意識すべきコンプライアンス対応 - Microsoft 365 E5 Compliance で実現するリスク対策 - [...日本マイクロソフト株式会社
 
B13_株式会社資生堂 プロフェッショナル事業の日本とタイの基幹系業務を「 Microsoft Dynamics 365 」で統合管理 [Microsof...
B13_株式会社資生堂 プロフェッショナル事業の日本とタイの基幹系業務を「 Microsoft Dynamics 365 」で統合管理 [Microsof...B13_株式会社資生堂 プロフェッショナル事業の日本とタイの基幹系業務を「 Microsoft Dynamics 365 」で統合管理 [Microsof...
B13_株式会社資生堂 プロフェッショナル事業の日本とタイの基幹系業務を「 Microsoft Dynamics 365 」で統合管理 [Microsof...日本マイクロソフト株式会社
 

Mais procurados (20)

エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
 
H08_固定電話の常識を変える!Teams 電話でますます快適なハイブリッドワークを実現するには [Microsoft Japan Digital Days]
H08_固定電話の常識を変える!Teams 電話でますます快適なハイブリッドワークを実現するには [Microsoft Japan Digital Days]H08_固定電話の常識を変える!Teams 電話でますます快適なハイブリッドワークを実現するには [Microsoft Japan Digital Days]
H08_固定電話の常識を変える!Teams 電話でますます快適なハイブリッドワークを実現するには [Microsoft Japan Digital Days]
 
H11_ハイブリッドワーク時代に加速する、現場を含めたホンモノ DX - Microsoft 365 Frontline Worker ソリューション [...
H11_ハイブリッドワーク時代に加速する、現場を含めたホンモノ DX - Microsoft 365 Frontline Worker ソリューション [...H11_ハイブリッドワーク時代に加速する、現場を含めたホンモノ DX - Microsoft 365 Frontline Worker ソリューション [...
H11_ハイブリッドワーク時代に加速する、現場を含めたホンモノ DX - Microsoft 365 Frontline Worker ソリューション [...
 
A12_リーンスタートアップアジャイルへの挑戦 ~ 東京証券取引所の ETF プラットフォーム “CONNEQTOR” で実現した DX ~ [Micr...
A12_リーンスタートアップアジャイルへの挑戦  ~ 東京証券取引所の ETF プラットフォーム “CONNEQTOR” で実現した DX ~ [Micr...A12_リーンスタートアップアジャイルへの挑戦  ~ 東京証券取引所の ETF プラットフォーム “CONNEQTOR” で実現した DX ~ [Micr...
A12_リーンスタートアップアジャイルへの挑戦 ~ 東京証券取引所の ETF プラットフォーム “CONNEQTOR” で実現した DX ~ [Micr...
 
G01_ハイブリッドワークの価値と日本マイクロソフトの実践 [Microsoft Japan Digital Days]
G01_ハイブリッドワークの価値と日本マイクロソフトの実践 [Microsoft Japan Digital Days]G01_ハイブリッドワークの価値と日本マイクロソフトの実践 [Microsoft Japan Digital Days]
G01_ハイブリッドワークの価値と日本マイクロソフトの実践 [Microsoft Japan Digital Days]
 
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
 
[自己PR]12/23 エンジニア"1on1"面談会
[自己PR]12/23 エンジニア"1on1"面談会[自己PR]12/23 エンジニア"1on1"面談会
[自己PR]12/23 エンジニア"1on1"面談会
 
全社のデータ活用を一段階上げる取り組み
全社のデータ活用を一段階上げる取り組み全社のデータ活用を一段階上げる取り組み
全社のデータ活用を一段階上げる取り組み
 
H06_これからの日本の働き方が『ハイブリッドワーク』で変わる ~ 従業員を支え、寄り添い、よりよい働き方へ ~ [Microsoft Japan Di...
H06_これからの日本の働き方が『ハイブリッドワーク』で変わる  ~ 従業員を支え、寄り添い、よりよい働き方へ ~ [Microsoft Japan Di...H06_これからの日本の働き方が『ハイブリッドワーク』で変わる  ~ 従業員を支え、寄り添い、よりよい働き方へ ~ [Microsoft Japan Di...
H06_これからの日本の働き方が『ハイブリッドワーク』で変わる ~ 従業員を支え、寄り添い、よりよい働き方へ ~ [Microsoft Japan Di...
 
B18_Dynamics 365 Commerce と Dynamics 365 SCM の高速 MRP で実現する一気通貫小売りの世界 [Microso...
B18_Dynamics 365 Commerce と Dynamics 365 SCM の高速 MRP で実現する一気通貫小売りの世界 [Microso...B18_Dynamics 365 Commerce と Dynamics 365 SCM の高速 MRP で実現する一気通貫小売りの世界 [Microso...
B18_Dynamics 365 Commerce と Dynamics 365 SCM の高速 MRP で実現する一気通貫小売りの世界 [Microso...
 
JPC2018[F1]航空宇宙技術の発展と Microsoft HoloLens を活用した次世代可視化への挑戦
JPC2018[F1]航空宇宙技術の発展と Microsoft HoloLens を活用した次世代可視化への挑戦JPC2018[F1]航空宇宙技術の発展と Microsoft HoloLens を活用した次世代可視化への挑戦
JPC2018[F1]航空宇宙技術の発展と Microsoft HoloLens を活用した次世代可視化への挑戦
 
レガシーコードに向き合ってみた話
レガシーコードに向き合ってみた話レガシーコードに向き合ってみた話
レガシーコードに向き合ってみた話
 
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
 
メルペイの与信モデリングにおける特徴量の品質向上の施策
メルペイの与信モデリングにおける特徴量の品質向上の施策メルペイの与信モデリングにおける特徴量の品質向上の施策
メルペイの与信モデリングにおける特徴量の品質向上の施策
 
【kintone hive 上海】天津ネットワーク様講演資料_160918
【kintone hive 上海】天津ネットワーク様講演資料_160918【kintone hive 上海】天津ネットワーク様講演資料_160918
【kintone hive 上海】天津ネットワーク様講演資料_160918
 
【de:code 2020】 最前線の現場を支援する Dynamics 365 Mixed Reality アプリケーション最新活用情報
【de:code 2020】 最前線の現場を支援する Dynamics 365 Mixed Reality アプリケーション最新活用情報【de:code 2020】 最前線の現場を支援する Dynamics 365 Mixed Reality アプリケーション最新活用情報
【de:code 2020】 最前線の現場を支援する Dynamics 365 Mixed Reality アプリケーション最新活用情報
 
N08_次世代通信キャリアの "Resilience" を支援する Microsoft Cloud [Microsoft Japan Digital Days]
N08_次世代通信キャリアの "Resilience" を支援する Microsoft Cloud [Microsoft Japan Digital Days]N08_次世代通信キャリアの "Resilience" を支援する Microsoft Cloud [Microsoft Japan Digital Days]
N08_次世代通信キャリアの "Resilience" を支援する Microsoft Cloud [Microsoft Japan Digital Days]
 
S07_経営層 / IT 部門が意識すべきコンプライアンス対応 - Microsoft 365 E5 Compliance で実現するリスク対策 - [...
S07_経営層 / IT 部門が意識すべきコンプライアンス対応  - Microsoft 365 E5 Compliance で実現するリスク対策 - [...S07_経営層 / IT 部門が意識すべきコンプライアンス対応  - Microsoft 365 E5 Compliance で実現するリスク対策 - [...
S07_経営層 / IT 部門が意識すべきコンプライアンス対応 - Microsoft 365 E5 Compliance で実現するリスク対策 - [...
 
B13_株式会社資生堂 プロフェッショナル事業の日本とタイの基幹系業務を「 Microsoft Dynamics 365 」で統合管理 [Microsof...
B13_株式会社資生堂 プロフェッショナル事業の日本とタイの基幹系業務を「 Microsoft Dynamics 365 」で統合管理 [Microsof...B13_株式会社資生堂 プロフェッショナル事業の日本とタイの基幹系業務を「 Microsoft Dynamics 365 」で統合管理 [Microsof...
B13_株式会社資生堂 プロフェッショナル事業の日本とタイの基幹系業務を「 Microsoft Dynamics 365 」で統合管理 [Microsof...
 
Minitabへようこそ 製造向け
Minitabへようこそ 製造向けMinitabへようこそ 製造向け
Minitabへようこそ 製造向け
 

Semelhante a Digdagを用いた大規模広告配信ログデータの加工と運用

ベアメタルで実現するSpark&Trino on K8sなデータ基盤
ベアメタルで実現するSpark&Trino on K8sなデータ基盤ベアメタルで実現するSpark&Trino on K8sなデータ基盤
ベアメタルで実現するSpark&Trino on K8sなデータ基盤MicroAd, Inc.(Engineer)
 
Inspire2017 Osaka [PS OSK] Microsoft as a Transformation Platform
Inspire2017 Osaka [PS OSK]  Microsoft as a Transformation PlatformInspire2017 Osaka [PS OSK]  Microsoft as a Transformation Platform
Inspire2017 Osaka [PS OSK] Microsoft as a Transformation PlatformMPN Japan
 
Inspire2017 Fukuoka [PS FUK] Microsoft as a Transformation Platform
Inspire2017 Fukuoka [PS FUK]  Microsoft as a Transformation PlatformInspire2017 Fukuoka [PS FUK]  Microsoft as a Transformation Platform
Inspire2017 Fukuoka [PS FUK] Microsoft as a Transformation PlatformMPN Japan
 
Inspire2017 Sapporo [PS SAP] Microsoft as a Transformation Platform
Inspire2017 Sapporo [PS SAP] Microsoft as a Transformation PlatformInspire2017 Sapporo [PS SAP] Microsoft as a Transformation Platform
Inspire2017 Sapporo [PS SAP] Microsoft as a Transformation PlatformMPN Japan
 
Visual Studio App CenterでAndroid開発にCI/CDを導入しよう
Visual Studio App CenterでAndroid開発にCI/CDを導入しようVisual Studio App CenterでAndroid開発にCI/CDを導入しよう
Visual Studio App CenterでAndroid開発にCI/CDを導入しようShinya Nakajima
 
アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜
アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜
アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜MicroAd, Inc.(Engineer)
 
ManuTech_for_Manufacturer_v1.1
ManuTech_for_Manufacturer_v1.1ManuTech_for_Manufacturer_v1.1
ManuTech_for_Manufacturer_v1.1gCompass Inc
 
OSC Hiroshima 2013
OSC Hiroshima 2013OSC Hiroshima 2013
OSC Hiroshima 2013Yuya Adachi
 
Retty recommendation project
Retty recommendation projectRetty recommendation project
Retty recommendation projectJiro Iwanaga
 
A04_これがデジタル変革だ!3 か月で B2C の WEB ポータルをスクラッチした Microsoft クラウドネイティブ の開発事例 [Micros...
A04_これがデジタル変革だ!3 か月で B2C の WEB ポータルをスクラッチした Microsoft クラウドネイティブ の開発事例 [Micros...A04_これがデジタル変革だ!3 か月で B2C の WEB ポータルをスクラッチした Microsoft クラウドネイティブ の開発事例 [Micros...
A04_これがデジタル変革だ!3 か月で B2C の WEB ポータルをスクラッチした Microsoft クラウドネイティブ の開発事例 [Micros...日本マイクロソフト株式会社
 
100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情Rakuten Group, Inc.
 
SDGC2018報告「ネットビジネスとサービスデザイン」
SDGC2018報告「ネットビジネスとサービスデザイン」SDGC2018報告「ネットビジネスとサービスデザイン」
SDGC2018報告「ネットビジネスとサービスデザイン」Nozomu Tannaka
 
Implementation Approach of Artifical Intelligence
Implementation Approach of Artifical IntelligenceImplementation Approach of Artifical Intelligence
Implementation Approach of Artifical IntelligenceTakao Tetsuro
 
ウォーターフォール開発で生 産性を測る指標
ウォーターフォール開発で生 産性を測る指標ウォーターフォール開発で生 産性を測る指標
ウォーターフォール開発で生 産性を測る指標Kouhei Aoyagi
 
JPC2018[D1]「信頼できるCloud」のために ― マイクロソフト法務部門からお伝えしたいこと
JPC2018[D1]「信頼できるCloud」のために ― マイクロソフト法務部門からお伝えしたいことJPC2018[D1]「信頼できるCloud」のために ― マイクロソフト法務部門からお伝えしたいこと
JPC2018[D1]「信頼できるCloud」のために ― マイクロソフト法務部門からお伝えしたいことMPN Japan
 
リクルート式ビッグデータ活用術
リクルート式ビッグデータ活用術リクルート式ビッグデータ活用術
リクルート式ビッグデータ活用術Recruit Technologies
 
Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力NTT DATA OSS Professional Services
 

Semelhante a Digdagを用いた大規模広告配信ログデータの加工と運用 (20)

ベアメタルで実現するSpark&Trino on K8sなデータ基盤
ベアメタルで実現するSpark&Trino on K8sなデータ基盤ベアメタルで実現するSpark&Trino on K8sなデータ基盤
ベアメタルで実現するSpark&Trino on K8sなデータ基盤
 
Inspire2017 Osaka [PS OSK] Microsoft as a Transformation Platform
Inspire2017 Osaka [PS OSK]  Microsoft as a Transformation PlatformInspire2017 Osaka [PS OSK]  Microsoft as a Transformation Platform
Inspire2017 Osaka [PS OSK] Microsoft as a Transformation Platform
 
Inspire2017 Fukuoka [PS FUK] Microsoft as a Transformation Platform
Inspire2017 Fukuoka [PS FUK]  Microsoft as a Transformation PlatformInspire2017 Fukuoka [PS FUK]  Microsoft as a Transformation Platform
Inspire2017 Fukuoka [PS FUK] Microsoft as a Transformation Platform
 
Inspire2017 Sapporo [PS SAP] Microsoft as a Transformation Platform
Inspire2017 Sapporo [PS SAP] Microsoft as a Transformation PlatformInspire2017 Sapporo [PS SAP] Microsoft as a Transformation Platform
Inspire2017 Sapporo [PS SAP] Microsoft as a Transformation Platform
 
Visual Studio App CenterでAndroid開発にCI/CDを導入しよう
Visual Studio App CenterでAndroid開発にCI/CDを導入しようVisual Studio App CenterでAndroid開発にCI/CDを導入しよう
Visual Studio App CenterでAndroid開発にCI/CDを導入しよう
 
アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜
アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜
アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜
 
ManuTech_for_Manufacturer_v1.1
ManuTech_for_Manufacturer_v1.1ManuTech_for_Manufacturer_v1.1
ManuTech_for_Manufacturer_v1.1
 
OSC Hiroshima 2013
OSC Hiroshima 2013OSC Hiroshima 2013
OSC Hiroshima 2013
 
Retty recommendation project
Retty recommendation projectRetty recommendation project
Retty recommendation project
 
A04_これがデジタル変革だ!3 か月で B2C の WEB ポータルをスクラッチした Microsoft クラウドネイティブ の開発事例 [Micros...
A04_これがデジタル変革だ!3 か月で B2C の WEB ポータルをスクラッチした Microsoft クラウドネイティブ の開発事例 [Micros...A04_これがデジタル変革だ!3 か月で B2C の WEB ポータルをスクラッチした Microsoft クラウドネイティブ の開発事例 [Micros...
A04_これがデジタル変革だ!3 か月で B2C の WEB ポータルをスクラッチした Microsoft クラウドネイティブ の開発事例 [Micros...
 
100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情
 
SDGC2018報告「ネットビジネスとサービスデザイン」
SDGC2018報告「ネットビジネスとサービスデザイン」SDGC2018報告「ネットビジネスとサービスデザイン」
SDGC2018報告「ネットビジネスとサービスデザイン」
 
SDGC2018 redux Tannaka
SDGC2018 redux TannakaSDGC2018 redux Tannaka
SDGC2018 redux Tannaka
 
Implementation Approach of Artifical Intelligence
Implementation Approach of Artifical IntelligenceImplementation Approach of Artifical Intelligence
Implementation Approach of Artifical Intelligence
 
ウォーターフォール開発で生 産性を測る指標
ウォーターフォール開発で生 産性を測る指標ウォーターフォール開発で生 産性を測る指標
ウォーターフォール開発で生 産性を測る指標
 
JPC2018[D1]「信頼できるCloud」のために ― マイクロソフト法務部門からお伝えしたいこと
JPC2018[D1]「信頼できるCloud」のために ― マイクロソフト法務部門からお伝えしたいことJPC2018[D1]「信頼できるCloud」のために ― マイクロソフト法務部門からお伝えしたいこと
JPC2018[D1]「信頼できるCloud」のために ― マイクロソフト法務部門からお伝えしたいこと
 
リクルート式ビッグデータ活用術
リクルート式ビッグデータ活用術リクルート式ビッグデータ活用術
リクルート式ビッグデータ活用術
 
エンタープライズにおける開発ツールの導入と活用推進
エンタープライズにおける開発ツールの導入と活用推進エンタープライズにおける開発ツールの導入と活用推進
エンタープライズにおける開発ツールの導入と活用推進
 
エンタープライズにおける開発ツールの導入と活用推進
エンタープライズにおける開発ツールの導入と活用推進エンタープライズにおける開発ツールの導入と活用推進
エンタープライズにおける開発ツールの導入と活用推進
 
Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力
 

Mais de MicroAd, Inc.(Engineer)

20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用
20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用
20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用MicroAd, Inc.(Engineer)
 
Kafka Connect:Iceberg Sink Connectorを使ってみる
Kafka Connect:Iceberg Sink Connectorを使ってみるKafka Connect:Iceberg Sink Connectorを使ってみる
Kafka Connect:Iceberg Sink Connectorを使ってみるMicroAd, Inc.(Engineer)
 
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話MicroAd, Inc.(Engineer)
 
Chromeの3rd Party Cookie廃止とインターネット広告への影響
Chromeの3rd Party Cookie廃止とインターネット広告への影響Chromeの3rd Party Cookie廃止とインターネット広告への影響
Chromeの3rd Party Cookie廃止とインターネット広告への影響MicroAd, Inc.(Engineer)
 
DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)
DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)
DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)MicroAd, Inc.(Engineer)
 
InternetWeek2022 - インターネット広告の羅針盤
InternetWeek2022 - インターネット広告の羅針盤InternetWeek2022 - インターネット広告の羅針盤
InternetWeek2022 - インターネット広告の羅針盤MicroAd, Inc.(Engineer)
 
マイクロアドにおけるデータストアの使い分け
マイクロアドにおけるデータストアの使い分けマイクロアドにおけるデータストアの使い分け
マイクロアドにおけるデータストアの使い分けMicroAd, Inc.(Engineer)
 
データセンターネットワークの構成について
データセンターネットワークの構成についてデータセンターネットワークの構成について
データセンターネットワークの構成についてMicroAd, Inc.(Engineer)
 
インフラ領域の技術スタックや業務内容について紹介
インフラ領域の技術スタックや業務内容について紹介インフラ領域の技術スタックや業務内容について紹介
インフラ領域の技術スタックや業務内容について紹介MicroAd, Inc.(Engineer)
 
RTBにおける機械学習の活用事例
RTBにおける機械学習の活用事例RTBにおける機械学習の活用事例
RTBにおける機械学習の活用事例MicroAd, Inc.(Engineer)
 
アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜MicroAd, Inc.(Engineer)
 
アドテクに機械学習を組み込むための推論の高速化
アドテクに機械学習を組み込むための推論の高速化アドテクに機械学習を組み込むための推論の高速化
アドテクに機械学習を組み込むための推論の高速化MicroAd, Inc.(Engineer)
 
アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜MicroAd, Inc.(Engineer)
 
RTBにおける機械学習の活用事例
RTBにおける機械学習の活用事例RTBにおける機械学習の活用事例
RTBにおける機械学習の活用事例MicroAd, Inc.(Engineer)
 
インターネット広告の概要とシステム設計
インターネット広告の概要とシステム設計インターネット広告の概要とシステム設計
インターネット広告の概要とシステム設計MicroAd, Inc.(Engineer)
 
アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング
アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング
アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング MicroAd, Inc.(Engineer)
 
マイクロアドのアドテクを支える技術
マイクロアドのアドテクを支える技術マイクロアドのアドテクを支える技術
マイクロアドのアドテクを支える技術MicroAd, Inc.(Engineer)
 
Scala、DDD、Akkaで立ち向かう 〜広告配信システムに課せられた100msの制約〜
Scala、DDD、Akkaで立ち向かう 〜広告配信システムに課せられた100msの制約〜Scala、DDD、Akkaで立ち向かう 〜広告配信システムに課せられた100msの制約〜
Scala、DDD、Akkaで立ち向かう 〜広告配信システムに課せられた100msの制約〜MicroAd, Inc.(Engineer)
 
Hadoopデータ基盤とMulti-CloudなML基盤への取り組みの紹介
Hadoopデータ基盤とMulti-CloudなML基盤への取り組みの紹介Hadoopデータ基盤とMulti-CloudなML基盤への取り組みの紹介
Hadoopデータ基盤とMulti-CloudなML基盤への取り組みの紹介MicroAd, Inc.(Engineer)
 

Mais de MicroAd, Inc.(Engineer) (20)

20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用
20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用
20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用
 
Kafka Connect:Iceberg Sink Connectorを使ってみる
Kafka Connect:Iceberg Sink Connectorを使ってみるKafka Connect:Iceberg Sink Connectorを使ってみる
Kafka Connect:Iceberg Sink Connectorを使ってみる
 
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
 
Chromeの3rd Party Cookie廃止とインターネット広告への影響
Chromeの3rd Party Cookie廃止とインターネット広告への影響Chromeの3rd Party Cookie廃止とインターネット広告への影響
Chromeの3rd Party Cookie廃止とインターネット広告への影響
 
DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)
DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)
DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)
 
InternetWeek2022 - インターネット広告の羅針盤
InternetWeek2022 - インターネット広告の羅針盤InternetWeek2022 - インターネット広告の羅針盤
InternetWeek2022 - インターネット広告の羅針盤
 
マイクロアドにおけるデータストアの使い分け
マイクロアドにおけるデータストアの使い分けマイクロアドにおけるデータストアの使い分け
マイクロアドにおけるデータストアの使い分け
 
データセンターネットワークの構成について
データセンターネットワークの構成についてデータセンターネットワークの構成について
データセンターネットワークの構成について
 
インフラ領域の技術スタックや業務内容について紹介
インフラ領域の技術スタックや業務内容について紹介インフラ領域の技術スタックや業務内容について紹介
インフラ領域の技術スタックや業務内容について紹介
 
RTBにおける機械学習の活用事例
RTBにおける機械学習の活用事例RTBにおける機械学習の活用事例
RTBにおける機械学習の活用事例
 
アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜
 
アドテクに機械学習を組み込むための推論の高速化
アドテクに機械学習を組み込むための推論の高速化アドテクに機械学習を組み込むための推論の高速化
アドテクに機械学習を組み込むための推論の高速化
 
アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜
 
RTBにおける機械学習の活用事例
RTBにおける機械学習の活用事例RTBにおける機械学習の活用事例
RTBにおける機械学習の活用事例
 
インターネット広告の概要とシステム設計
インターネット広告の概要とシステム設計インターネット広告の概要とシステム設計
インターネット広告の概要とシステム設計
 
アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング
アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング
アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング
 
Cumulus Linuxを導入したワケ
Cumulus Linuxを導入したワケCumulus Linuxを導入したワケ
Cumulus Linuxを導入したワケ
 
マイクロアドのアドテクを支える技術
マイクロアドのアドテクを支える技術マイクロアドのアドテクを支える技術
マイクロアドのアドテクを支える技術
 
Scala、DDD、Akkaで立ち向かう 〜広告配信システムに課せられた100msの制約〜
Scala、DDD、Akkaで立ち向かう 〜広告配信システムに課せられた100msの制約〜Scala、DDD、Akkaで立ち向かう 〜広告配信システムに課せられた100msの制約〜
Scala、DDD、Akkaで立ち向かう 〜広告配信システムに課せられた100msの制約〜
 
Hadoopデータ基盤とMulti-CloudなML基盤への取り組みの紹介
Hadoopデータ基盤とMulti-CloudなML基盤への取り組みの紹介Hadoopデータ基盤とMulti-CloudなML基盤への取り組みの紹介
Hadoopデータ基盤とMulti-CloudなML基盤への取り組みの紹介
 

Digdagを用いた大規模広告配信ログデータの加工と運用