O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.
機械学習⼯学研究会 現場を交えた勉強会 #1
データサイエンティストとエンジニア
両者が幸せになれる機械学習基盤を求めて
⽥村 真⼀
㈱リクルートライフスタイル
データエンジニアリング2G
2018 年 8 ⽉ 21 ⽇ (⽕)
私たちについて
リクルートのビジネスモデル
https://recruit-holdings.co.jp/who/downloads/
リクルートライフスタイル
⽥村 真⼀
‣
‣
‣
‣
データプロダクトを
扱うということ
データプロダクトのライフサイクル
予約⼊⼒での
離脱率下げたい
過去ログ使って
LightGBM で分類
モデルを…
GAE で Flask と
Datastore 使って…
新規ユーザに絞れば
CVR が有意に改善! ⽇次バッチがコケたから
...
必要な3つの観点
‣
‣
‣
CET 黎明期
CET 発展期 ― 役割の変化
https://recruit-lifestyle.connpass.com/event/74957/
これまでの実践例
汎⽤ API
データ基盤実践例: 汎⽤ API
API
GKE
Dequeue
Read ReadWritePut Access
Enqueue
Worker
GCE
Storage
S3
Msg. queue
SNS + SQS
Database
Bigt...
達成したこと
汎⽤ API の反省
この API ⼿直しして、もう 1 回
AB テストリベンジしたいんですけど!
退職した 〇〇さんが作った、
誰も詳細が分からないやつだ……
次のチャレンジ
統合機械学習基盤
できるようにしたいこと
‣
‣
‣
‣
アーキテクチャ(案)
Fetch
Fetch
Access Access
Storage
GCS
DWH
BigQuery
Batch
GKE
Notebook
GKE
API
GKE
Put
Deploy
Fetch
Cont.Deploy
...
透明性と安全性の両⽴
‣
‣
トレードオフをどう実現するか
‣
‣
‣
‣
https://github.com/cloudpipe/cloudpickle
‣
まとめ
今⽇のまとめ
‣
‣
‣
Weʼre hiring!
https://www.wantedly.com/projects/185933
https://www.wantedly.com/projects/212977
https://engineer.recruit-l...
Próximos SlideShares
Carregando em…5
×

データサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めて

2.627 visualizações

Publicada em

2018年8月21日開催『機械学習工学研究会 現場を交えた勉強会 #1』での発表資料。
機械学習をサービスの現場で実践していく中で、どのような視点で開発・運用を行うべきかを考えます。
https://mlxse.connpass.com/event/97131/

Publicada em: Engenharia
  • Seja o primeiro a comentar

データサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めて

  1. 1. 機械学習⼯学研究会 現場を交えた勉強会 #1 データサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めて ⽥村 真⼀ ㈱リクルートライフスタイル データエンジニアリング2G 2018 年 8 ⽉ 21 ⽇ (⽕)
  2. 2. 私たちについて
  3. 3. リクルートのビジネスモデル https://recruit-holdings.co.jp/who/downloads/
  4. 4. リクルートライフスタイル
  5. 5. ⽥村 真⼀ ‣ ‣ ‣ ‣
  6. 6. データプロダクトを 扱うということ
  7. 7. データプロダクトのライフサイクル 予約⼊⼒での 離脱率下げたい 過去ログ使って LightGBM で分類 モデルを… GAE で Flask と Datastore 使って… 新規ユーザに絞れば CVR が有意に改善! ⽇次バッチがコケたから メモリ増やして再実⾏
  8. 8. 必要な3つの観点 ‣ ‣ ‣
  9. 9. CET 黎明期
  10. 10. CET 発展期 ― 役割の変化 https://recruit-lifestyle.connpass.com/event/74957/
  11. 11. これまでの実践例 汎⽤ API
  12. 12. データ基盤実践例: 汎⽤ API API GKE Dequeue Read ReadWritePut Access Enqueue Worker GCE Storage S3 Msg. queue SNS + SQS Database Bigtable
  13. 13. 達成したこと
  14. 14. 汎⽤ API の反省 この API ⼿直しして、もう 1 回 AB テストリベンジしたいんですけど! 退職した 〇〇さんが作った、 誰も詳細が分からないやつだ……
  15. 15. 次のチャレンジ 統合機械学習基盤
  16. 16. できるようにしたいこと ‣ ‣ ‣ ‣
  17. 17. アーキテクチャ(案) Fetch Fetch Access Access Storage GCS DWH BigQuery Batch GKE Notebook GKE API GKE Put Deploy Fetch Cont.Deploy Cloud Function
  18. 18. 透明性と安全性の両⽴ ‣ ‣
  19. 19. トレードオフをどう実現するか ‣ ‣ ‣ ‣ https://github.com/cloudpipe/cloudpickle ‣
  20. 20. まとめ
  21. 21. 今⽇のまとめ ‣ ‣ ‣
  22. 22. Weʼre hiring! https://www.wantedly.com/projects/185933 https://www.wantedly.com/projects/212977 https://engineer.recruit-lifestyle.co.jp/recruiting/

×