SlideShare uma empresa Scribd logo
1 de 38
Baixar para ler offline
Leverages Co., Ltd Data Strategy Office

データドリブン施策による

サービス品質向上の取り組み

丸の内アナリティクスバンビーノ#23

2021/07/28

レバレジーズ株式会社

データ戦略室 室長 阪上晃幸

Leverages Co., Ltd Data Strategy Office

自己紹介

名前:阪上晃幸(さかうえ てるゆき)



出身:兵庫県宝塚市



バックグラウンド:経済学(計量経済学、マクロ経済学)




趣味:読書、ブログ作成、トランペット、料理




大学院修了後、2012年にレバレジーズに入社し、


SEM(検索エンジンマーケティング)を中心にマーケティング業務を行い、
2017年より社内の便利屋になり、2019年より


データ戦略室の発足と同時に室長に。



丸の内アナリティクスバンビーノは2016年6月にLT以降、


5年ぶり2度目の発表。

2

レバレジーズ株式会社 Leverages co.,Ltd. 

〒150-6190 東京都渋谷区渋谷 2-24-12  

渋谷スクランブルスクエア 24・25階 

2005年 4月 6日 

27拠点(海外拠点を含む、2021年5月時点) 

正規:1183名 非正規:675名(2021年5月時点) 

5,000万円

自社メディア事業・人材関連事業・システムエンジニアリング事業 

M&Aコンサルティング事業・ ASP/ SaaS/クラウド関連事業 

有料職業紹介事業  13-ユ-302698 

労働派遣事業 派 13-302333 



社会の課題を解決し、関係者全員の幸福を追求し続けることをミッションに、メディア・人材・システムエンジニアリング・M&Aの領域で
国や業界をまたいだ問題解決を行っています。各分野のスペシャリストが集うオールインハウスの組織構成と、業界を絞らないポート
フォリオ経営で、時代を代表するグローバル企業を目指します。 

経営判断を早め、実現性を上げるため、分社・子会社化を行っています。 



Leverages Groupについて

会社名

所在地



設立

拠点数

従業員数

資本金

事業内容



認定

・レバテック株式会社 

・レバレジーズキャリア株式会社 

・レバレジーズメディカルケア株式会社 

・レバレジーズオフィスサポート株式会社 

・レバレジーズM&Aアドバイザリー株式会社 



会社概要

レバレジーズグループ会社一覧

Leverages Co., Ltd Data Strategy Office

ブログを始めました!
 4

https://analytics.leverages.jp/

Leverages Co., Ltd Data Strategy Office

ブログを始めました!
 5

Leverages Co., Ltd Data Strategy Office

今回お話しする内容

● 0章:レバレジーズの課題/分析環境など

● 1章:LTV計算と広告投資

● 2章:職務経歴書の解析

● 3章:機械学習の解釈可能性を用いた入力補助(PoC)

6

Leverages Co., Ltd Data Strategy Office

話すこと・話さないこと

● 対象リスナー

○ データを蓄積して何かできないかを知りたいマーケターやエンジニア



● 話すこと

○ 課題とデータを用いた施策の事例紹介



● 話さないこと

○ 手法の詳細(データやアルゴリズム)

○ 具体的にどのサービスで使っているか

資料は公開します
ので、メモは不要
7

Leverages Co., Ltd Data Strategy Office



● 0章:レバレジーズの課題/分析環境など

● 1章:LTV計算と広告投資

● 2章:職務経歴書の解析

● 3章:機械学習の解釈可能性を用いた入力補助(PoC)

8

Leverages Co., Ltd Data Strategy Office

0章:レバレジーズの課題/分析環境など

● 課題

○ 顧客体験を改善すること

■ やりたい仕事ができる/キャリアアップができる

■ プロジェクトが成功する

■ スキルアップできる



○ 社員の生産性向上

■ 情報検索にかける時間の短縮など



○ マーケティング

■ ROIの向上

9

Leverages Co., Ltd Data Strategy Office

0章:レバレジーズの課題/分析環境など

生成
データ
生成
データ
収集
データレイク データウェア
ハウス
レコメンドシス
テム
データ可視化
アドホック
分析
収集 蓄積 活用
利益向
上
意思決
定
構造化
データ
構造化
データ
非構造化
データ
赤線のデータ基盤を起点にデータ分析業務を行なっている

10

データ基盤

Leverages Co., Ltd Data Strategy Office

0章:レバレジーズの課題/分析環境など

● よく分析に用いる言語/ツールなど

○ Python

○ R

○ Stan

○ SQL(BigQuery)

○ MeCab

11

Leverages Co., Ltd Data Strategy Office



● 0章:レバレジーズの課題/分析環境など

● 1章:LTV計算と広告投資

● 2章:職務経歴書の解析

● 3章:機械学習の解釈可能性を用いた入力補助(PoC)

12

Leverages Co., Ltd Data Strategy Office

1章:LTV計算と広告投資

● 問題設定

○ マーケティングにおける広告予算を決めるには

顧客生涯価値(CLTV)を求める必要がある。

ビジネスモデルによっては解約率次第でCLTVは大きく変わる。



● データ

○ 数年分の顧客との取引レコード(月単位)

○ それに紐づく情報

13

Leverages Co., Ltd Data Strategy Office

1章:LTV計算と広告投資

● 手法

○ 生存時間分析

■ ベイズ統計学でのWeibull分布を用いた

比例ハザードモデル

○ RやStanを使用

14

Leverages Co., Ltd Data Strategy Office

1章:LTV計算と広告投資

● 評価指標

○ 1年間、2年間の顧客売上金額の

RMSE(二乗平均平方根誤差)

■ 🤔。○(1~2年て生涯ではないのでは?)



● 進め方

○ データの整形

○ 離脱の定義の設定(N期経つと離脱とみなす)

○ モデルの当てはめ(様々なカテゴリデータで回帰)

○ 検証用データでの精度の比較

○ 従来手法(ルールオブサム)との比較

15

Leverages Co., Ltd Data Strategy Office

1章:LTV計算と広告投資
 16

LTVの計算方法と生存曲線

月毎の継続確率の推定 

割引現在価値に関しては事業部ご
とに自由に設定。
Leverages Co., Ltd Data Strategy Office

1章:LTV計算と広告投資

● 結果

○ 検証用データにおいてルールオブサムよりもよくなったので、意思決定に利用している。

17

ルールオブサム
では3年目を高く
見積もりすぎてい
る。
Leverages Co., Ltd Data Strategy Office

今回お話しする内容

● 0章:レバレジーズの課題/分析環境など

● 1章:LTV計算と広告投資

● 2章:職務経歴書の解析

● 3章:機械学習の解釈可能性を用いた入力補助(PoC)

18

Leverages Co., Ltd Data Strategy Office

2章:職務経歴書の解析

● 問題設定

○ 顧客の職務経歴情報はWord・PDF・Excelなどで

蓄積しているが、データ化して活用することが十分に

できていなかった。

■ 用途として求人とのマッチングや検索があげられる。



● データ

○ 顧客の職務経歴情報はWord・PDF・Excelなど

○ 顧客関連の別レコード情報

19

Leverages Co., Ltd Data Strategy Office

2章:職務経歴書の解析
 20

典型的な職務経歴書
 期間
 社名
 職務内容

Leverages Co., Ltd Data Strategy Office

2章:職務経歴書の解析

● 手法

○ daXtra(ダクストラ)というレジュメ解析に特化した

SaaSのAPIを活用(有償)

■ 職務経歴書をアップロードするとJSON形式のデータが返される。(API
のサーバにデータは残らないようになっている)

● そのJSONにはスキル名やその年数、

最後に用いた年や、どの企業に何年在籍したのかが入っている。

○ ETLなど諸々、Pythonを使用

21

Leverages Co., Ltd Data Strategy Office

2章:職務経歴書の解析

● 評価指標

○ なし

■ 一応、サンプリングしたデータでの

職務経歴書と抽出結果との適合率は見ている。



● 進め方

○ 職務経歴書をPythonで読み込み、WebAPIを用いて解析

○ JSONを解析し、テーブルを生成

○ 解析した結果と職務経歴書を比較して、

正しい値が入っているかチェック。(初回のみ)

○ DWHに日次でアップロードするワークフローを構築(初回以降)

22

Leverages Co., Ltd Data Strategy Office

2章:職務経歴書の解析

● 結果

○ フォーマットとして苦手なものも一部あるが、だいたいの職務
経歴書において構造化データとして抽出することができた。

23

Leverages Co., Ltd Data Strategy Office

2章:職務経歴書の解析
 24

例:スキル情報を取得(DWHに蓄積されている)

スキルの経験月数

最後にそのスキルを使った年 

Leverages Co., Ltd Data Strategy Office

2章:職務経歴書の解析
 25

例:職務経歴情報を時系列で取得(DWHに蓄積されている)

会社名
 業務内容
 期間

Leverages Co., Ltd Data Strategy Office

2章:職務経歴書の解析
 26

活用例1:ニッチなスキルの検索



希少性の高いスキルが必要な求人が
ある場合に、それを有する方を検索す
ることが容易に。

活用例2:年収の推定(機械学習)



スキルの情報を使って年収をある程度
の精度で予測することが可能に。

Leverages Co., Ltd Data Strategy Office



● 0章:レバレジーズの課題/分析環境など

● 1章:LTV計算と広告投資

● 2章:職務経歴書の解析

● 3章:機械学習の解釈可能性を用いた入力補助(PoC)

27

Leverages Co., Ltd Data Strategy Office

3章:機械学習の解釈可能性を用いた入力補助

● 問題設定

○ 人の職種に関するデータをこれまで人間が判断して

入力していたが、半自動化できればデータ入力が捗るのではないか。

■ ただし、半自動化するにも機械的に判断した際の根拠が欲しい。



● データ

○ 職種が付与されたユーザーデータ(職種は70種類以上)

○ 職務経歴データ

28

Leverages Co., Ltd Data Strategy Office

3章:機械学習の解釈可能性を用いた入力補助
 29

● 手法

○ LIME

■ Local Interpretable Model-agnostic Explanationsの頭文字をとったもので、機械学習に
よって構築したモデルに関して、その予測結果を人間が

解釈しやすくする技術です。

● ゲーム理論の知見を応用したSHAPなどもある。

○ 多クラス分類のためにscikit-learnのLabelEncoderを利用

○ 今回扱うアルゴリズムはRandom Forest(RF)

■ このRFのモデルにLIMEを適用する。

○ Pythonを使用

Leverages Co., Ltd Data Strategy Office

3章:機械学習の解釈可能性を用いた入力補助
 30

参照元:https://github.com/marcotcr/lime 

猫を猫だと推論した根拠は黄緑の領域、
犬を犬だと推論した根拠は赤の領域
Leverages Co., Ltd Data Strategy Office

3章:機械学習の解釈可能性を用いた入力補助

● 評価指標

○ Precision(適合率)

■ 予測した職種が当たっているかどうかを評価



● 進め方

○ 前処理

○ 複数のクラスを分類するための特徴量を作成

○ 一定の精度に至るまで交差検証を続ける

○ 一定の精度に至ればLIMEを適用してみる

31

Leverages Co., Ltd Data Strategy Office

3章:機械学習の解釈可能性を用いた入力補助

● 結果

○ テスト用データでの精度が77%となった。

■ 人間が100%に近いと思うとまだ低い水準。

32

Leverages Co., Ltd Data Strategy Office

3章:機械学習の解釈可能性を用いた入力補助
 33

【LIMEの結果】

職務経歴書から抽出したスキル情報を特徴量に学習したモデルから、

その予測の根拠としている特徴量を可視化している。

YamahaやCisco
のネットワーク系
の機器の経験か
ら、
ネットワークという
職種を予測
納得感はありそう。
Leverages Co., Ltd Data Strategy Office

3章:機械学習の解釈可能性を用いた入力補助
 34

Leverages Co., Ltd Data Strategy Office

3章:機械学習の解釈可能性を用いた入力補助
 35

ユーザー情報
の入力
機械学習での予測
+
LIMEでの可視化
解釈可能性の情報
を見ながら、
職種のデータ
を入力する
ユーザー情報
の入力
ユーザーの過去に
取り組んだ
仕事内容を熟読
人手で、複数ある分
類表を見ながら職種
を決め入力する
これまで

これから

今後の方向性

Leverages Co., Ltd Data Strategy Office

まとめ/今後の展望

● レバレジーズではマーケティング活動、

営業活動の効率化、データ蓄積支援など幅広く

データサイエンスを適用している。今回はその一部を紹介した。



● 今後は、データ基盤をより発展させ、データドリブン施策を低コストで実行す
ること、

より増加していく機械学習プロダクトを管理していく体制を構築していく。

36

Leverages Co., Ltd Data Strategy Office

Appendix:発表していないが取り組んでいること

● 求人レコメンドシステム開発

● マーケティング施策の効果検証のための統計モデリング

● 機械学習を用いた、Google広告のためのオフラインコンバージョン値の予測

● オウンドメディアの評価向上のための自然言語処理技術の適用

37

Leverages Co., Ltd Data Strategy Office

Q&A用

● 0章:レバレジーズの課題/分析環境など

○ データ基盤、OSSでの分析



● 1章:LTV計算と広告投資

○ 生存時間分析、CLTV



● 2章:職務経歴書の解析

○ 職務経歴書、解析、ETL、スキル検索、年収予測



● 3章:機械学習の解釈可能性を用いた入力補助(PoC)

○ 機械学習の解釈可能性、マルチクラス分類

38


Mais conteúdo relacionado

Mais procurados

セグメント?クラスタリング? ユーザーを分類し、サービスの改善に活かすポイント
セグメント?クラスタリング? ユーザーを分類し、サービスの改善に活かすポイントセグメント?クラスタリング? ユーザーを分類し、サービスの改善に活かすポイント
セグメント?クラスタリング? ユーザーを分類し、サービスの改善に活かすポイント
Naoto Tamiya
 

Mais procurados (20)

子供の言語獲得と機械の言語獲得
子供の言語獲得と機械の言語獲得子供の言語獲得と機械の言語獲得
子供の言語獲得と機械の言語獲得
 
MLOpsの概要と初学者が気をつけたほうが良いこと
MLOpsの概要と初学者が気をつけたほうが良いことMLOpsの概要と初学者が気をつけたほうが良いこと
MLOpsの概要と初学者が気をつけたほうが良いこと
 
Amazon AthenaでSageMakerを使った推論
Amazon AthenaでSageMakerを使った推論Amazon AthenaでSageMakerを使った推論
Amazon AthenaでSageMakerを使った推論
 
先駆者に学ぶ MLOpsの実際
先駆者に学ぶ MLOpsの実際先駆者に学ぶ MLOpsの実際
先駆者に学ぶ MLOpsの実際
 
ChatGPTの仕組みの解説と実務でのLLMの適用の紹介_latest.pdf
ChatGPTの仕組みの解説と実務でのLLMの適用の紹介_latest.pdfChatGPTの仕組みの解説と実務でのLLMの適用の紹介_latest.pdf
ChatGPTの仕組みの解説と実務でのLLMの適用の紹介_latest.pdf
 
Prophet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツールProphet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツール
 
データサイエンティスト養成読本の解説+書き忘れたこと
データサイエンティスト養成読本の解説+書き忘れたことデータサイエンティスト養成読本の解説+書き忘れたこと
データサイエンティスト養成読本の解説+書き忘れたこと
 
Data-Centric AIの紹介
Data-Centric AIの紹介Data-Centric AIの紹介
Data-Centric AIの紹介
 
2019年度チュートリアルBPE
2019年度チュートリアルBPE2019年度チュートリアルBPE
2019年度チュートリアルBPE
 
ビジネスパーソンのためのDX入門講座エッセンス版
ビジネスパーソンのためのDX入門講座エッセンス版ビジネスパーソンのためのDX入門講座エッセンス版
ビジネスパーソンのためのDX入門講座エッセンス版
 
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
 
DSIRNLP#1 ランキング学習ことはじめ
DSIRNLP#1 ランキング学習ことはじめDSIRNLP#1 ランキング学習ことはじめ
DSIRNLP#1 ランキング学習ことはじめ
 
探索と活用の戦略 ベイズ最適化と多腕バンディット
探索と活用の戦略 ベイズ最適化と多腕バンディット探索と活用の戦略 ベイズ最適化と多腕バンディット
探索と活用の戦略 ベイズ最適化と多腕バンディット
 
レコメンドアルゴリズムの基本と周辺知識と実装方法
レコメンドアルゴリズムの基本と周辺知識と実装方法レコメンドアルゴリズムの基本と周辺知識と実装方法
レコメンドアルゴリズムの基本と周辺知識と実装方法
 
機械学習と主成分分析
機械学習と主成分分析機械学習と主成分分析
機械学習と主成分分析
 
深層学習を用いた服飾画像の印象推定に関する研究
深層学習を用いた服飾画像の印象推定に関する研究深層学習を用いた服飾画像の印象推定に関する研究
深層学習を用いた服飾画像の印象推定に関する研究
 
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話
 
セグメント?クラスタリング? ユーザーを分類し、サービスの改善に活かすポイント
セグメント?クラスタリング? ユーザーを分類し、サービスの改善に活かすポイントセグメント?クラスタリング? ユーザーを分類し、サービスの改善に活かすポイント
セグメント?クラスタリング? ユーザーを分類し、サービスの改善に活かすポイント
 
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models
 

Semelhante a [丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み

Gerald Pryor Bi Portfolio
Gerald Pryor Bi PortfolioGerald Pryor Bi Portfolio
Gerald Pryor Bi Portfolio
gppryor1
 
Vedicsoft Presentation 2009
Vedicsoft Presentation 2009Vedicsoft Presentation 2009
Vedicsoft Presentation 2009
LincolnNeely
 

Semelhante a [丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み (20)

ca mayu.pptx
ca mayu.pptxca mayu.pptx
ca mayu.pptx
 
Report PPT
Report PPTReport PPT
Report PPT
 
Power bi implementation for finance services firms
Power bi implementation for finance services firmsPower bi implementation for finance services firms
Power bi implementation for finance services firms
 
LDM Webinar: Data Modeling & Business Intelligence
LDM Webinar: Data Modeling & Business IntelligenceLDM Webinar: Data Modeling & Business Intelligence
LDM Webinar: Data Modeling & Business Intelligence
 
Portfolio
PortfolioPortfolio
Portfolio
 
Portfolio
PortfolioPortfolio
Portfolio
 
Gerald Pryor Bi Portfolio
Gerald Pryor Bi PortfolioGerald Pryor Bi Portfolio
Gerald Pryor Bi Portfolio
 
Business analytics tool power bi
Business analytics tool power biBusiness analytics tool power bi
Business analytics tool power bi
 
Resume_ASA
Resume_ASAResume_ASA
Resume_ASA
 
Integration services at yash increase the value of sap investments with share...
Integration services at yash increase the value of sap investments with share...Integration services at yash increase the value of sap investments with share...
Integration services at yash increase the value of sap investments with share...
 
AyushRanjan_Resume
AyushRanjan_ResumeAyushRanjan_Resume
AyushRanjan_Resume
 
AyushRanjan_Resume
AyushRanjan_ResumeAyushRanjan_Resume
AyushRanjan_Resume
 
Vedicsoft Presentation 2009
Vedicsoft Presentation 2009Vedicsoft Presentation 2009
Vedicsoft Presentation 2009
 
Karl Umaguing: Resume
Karl Umaguing: ResumeKarl Umaguing: Resume
Karl Umaguing: Resume
 
Big data vs business intelligence.pptx
Big data vs business intelligence.pptxBig data vs business intelligence.pptx
Big data vs business intelligence.pptx
 
Business Intelligence Trends With System Upgrade & SaaS Deployment
Business Intelligence Trends With System Upgrade & SaaS DeploymentBusiness Intelligence Trends With System Upgrade & SaaS Deployment
Business Intelligence Trends With System Upgrade & SaaS Deployment
 
Bibo sap
Bibo sapBibo sap
Bibo sap
 
Business Intelligence Presentation M Oyach
Business Intelligence Presentation M OyachBusiness Intelligence Presentation M Oyach
Business Intelligence Presentation M Oyach
 
The future growth of a career as a business analyst its role and responsibili...
The future growth of a career as a business analyst its role and responsibili...The future growth of a career as a business analyst its role and responsibili...
The future growth of a career as a business analyst its role and responsibili...
 
Big data careers
Big data careersBig data careers
Big data careers
 

Mais de Teruyuki Sakaue

Mais de Teruyuki Sakaue (14)

警察庁オープンデータで交通事故の世界にDeepDive!
警察庁オープンデータで交通事故の世界にDeepDive!警察庁オープンデータで交通事故の世界にDeepDive!
警察庁オープンデータで交通事故の世界にDeepDive!
 
[Music×Analytics]プロの音に近づくための研究と練習
[Music×Analytics]プロの音に近づくための研究と練習[Music×Analytics]プロの音に近づくための研究と練習
[Music×Analytics]プロの音に近づくための研究と練習
 
[DSO] Machine Learning Seminar Vol.8 Chapter 9
[DSO] Machine Learning Seminar Vol.8 Chapter 9[DSO] Machine Learning Seminar Vol.8 Chapter 9
[DSO] Machine Learning Seminar Vol.8 Chapter 9
 
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
データ分析ランチセッション#24 OSSのAutoML~TPOTについてデータ分析ランチセッション#24 OSSのAutoML~TPOTについて
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
 
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
 
[DSO] Machine Learning Seminar Vol.2 Chapter 3
[DSO] Machine Learning Seminar Vol.2 Chapter 3[DSO] Machine Learning Seminar Vol.2 Chapter 3
[DSO] Machine Learning Seminar Vol.2 Chapter 3
 
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
 
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
 
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
 
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
 
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
流行りの分散表現を用いた文書分類について Netadashi Meetup 7流行りの分散表現を用いた文書分類について Netadashi Meetup 7
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
 
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
 
Marketing×Python/Rで頑張れる事例16本ノック
Marketing×Python/Rで頑張れる事例16本ノックMarketing×Python/Rで頑張れる事例16本ノック
Marketing×Python/Rで頑張れる事例16本ノック
 
機械学習による積極的失業〜オウンドメディアの訪問予測
機械学習による積極的失業〜オウンドメディアの訪問予測機械学習による積極的失業〜オウンドメディアの訪問予測
機械学習による積極的失業〜オウンドメディアの訪問予測
 

Último

CALL ON ➥8923113531 🔝Call Girls Hazratganj Lucknow best sexual service Online
CALL ON ➥8923113531 🔝Call Girls Hazratganj Lucknow best sexual service OnlineCALL ON ➥8923113531 🔝Call Girls Hazratganj Lucknow best sexual service Online
CALL ON ➥8923113531 🔝Call Girls Hazratganj Lucknow best sexual service Online
anilsa9823
 

Último (20)

Moving beyond multi-touch attribution - DigiMarCon CanWest 2024
Moving beyond multi-touch attribution - DigiMarCon CanWest 2024Moving beyond multi-touch attribution - DigiMarCon CanWest 2024
Moving beyond multi-touch attribution - DigiMarCon CanWest 2024
 
BDSM⚡Call Girls in Sector 128 Noida Escorts >༒8448380779 Escort Service
BDSM⚡Call Girls in Sector 128 Noida Escorts >༒8448380779 Escort ServiceBDSM⚡Call Girls in Sector 128 Noida Escorts >༒8448380779 Escort Service
BDSM⚡Call Girls in Sector 128 Noida Escorts >༒8448380779 Escort Service
 
The Future of Brands on LinkedIn - Alison Kaltman
The Future of Brands on LinkedIn - Alison KaltmanThe Future of Brands on LinkedIn - Alison Kaltman
The Future of Brands on LinkedIn - Alison Kaltman
 
Major SEO Trends in 2024 - Banyanbrain Digital
Major SEO Trends in 2024 - Banyanbrain DigitalMajor SEO Trends in 2024 - Banyanbrain Digital
Major SEO Trends in 2024 - Banyanbrain Digital
 
Turn Digital Reputation Threats into Offense Tactics - Daniel Lemin
Turn Digital Reputation Threats into Offense Tactics - Daniel LeminTurn Digital Reputation Threats into Offense Tactics - Daniel Lemin
Turn Digital Reputation Threats into Offense Tactics - Daniel Lemin
 
Enjoy Night⚡Call Girls Dlf City Phase 4 Gurgaon >༒8448380779 Escort Service
Enjoy Night⚡Call Girls Dlf City Phase 4 Gurgaon >༒8448380779 Escort ServiceEnjoy Night⚡Call Girls Dlf City Phase 4 Gurgaon >༒8448380779 Escort Service
Enjoy Night⚡Call Girls Dlf City Phase 4 Gurgaon >༒8448380779 Escort Service
 
Brand Strategy Master Class - Juntae DeLane
Brand Strategy Master Class - Juntae DeLaneBrand Strategy Master Class - Juntae DeLane
Brand Strategy Master Class - Juntae DeLane
 
BDSM⚡Call Girls in Sector 150 Noida Escorts >༒8448380779 Escort Service
BDSM⚡Call Girls in Sector 150 Noida Escorts >༒8448380779 Escort ServiceBDSM⚡Call Girls in Sector 150 Noida Escorts >༒8448380779 Escort Service
BDSM⚡Call Girls in Sector 150 Noida Escorts >༒8448380779 Escort Service
 
Defining Marketing for the 21st Century,kotler
Defining Marketing for the 21st Century,kotlerDefining Marketing for the 21st Century,kotler
Defining Marketing for the 21st Century,kotler
 
CALL ON ➥8923113531 🔝Call Girls Hazratganj Lucknow best sexual service Online
CALL ON ➥8923113531 🔝Call Girls Hazratganj Lucknow best sexual service OnlineCALL ON ➥8923113531 🔝Call Girls Hazratganj Lucknow best sexual service Online
CALL ON ➥8923113531 🔝Call Girls Hazratganj Lucknow best sexual service Online
 
No Cookies No Problem - Steve Krull, Be Found Online
No Cookies No Problem - Steve Krull, Be Found OnlineNo Cookies No Problem - Steve Krull, Be Found Online
No Cookies No Problem - Steve Krull, Be Found Online
 
The+State+of+Careers+In+Retention+Marketing-2.pdf
The+State+of+Careers+In+Retention+Marketing-2.pdfThe+State+of+Careers+In+Retention+Marketing-2.pdf
The+State+of+Careers+In+Retention+Marketing-2.pdf
 
personal branding kit for music business
personal branding kit for music businesspersonal branding kit for music business
personal branding kit for music business
 
How to utilize calculated properties in your HubSpot setups
How to utilize calculated properties in your HubSpot setupsHow to utilize calculated properties in your HubSpot setups
How to utilize calculated properties in your HubSpot setups
 
What is Google Search Console and What is it provide?
What is Google Search Console and What is it provide?What is Google Search Console and What is it provide?
What is Google Search Console and What is it provide?
 
How to Leverage Behavioral Science Insights for Direct Mail Success
How to Leverage Behavioral Science Insights for Direct Mail SuccessHow to Leverage Behavioral Science Insights for Direct Mail Success
How to Leverage Behavioral Science Insights for Direct Mail Success
 
SEO Master Class - Steve Wiideman, Wiideman Consulting Group
SEO Master Class - Steve Wiideman, Wiideman Consulting GroupSEO Master Class - Steve Wiideman, Wiideman Consulting Group
SEO Master Class - Steve Wiideman, Wiideman Consulting Group
 
Generative AI Master Class - Generative AI, Unleash Creative Opportunity - Pe...
Generative AI Master Class - Generative AI, Unleash Creative Opportunity - Pe...Generative AI Master Class - Generative AI, Unleash Creative Opportunity - Pe...
Generative AI Master Class - Generative AI, Unleash Creative Opportunity - Pe...
 
Google 3rd-Party Cookie Deprecation [Update] + 5 Best Strategies
Google 3rd-Party Cookie Deprecation [Update] + 5 Best StrategiesGoogle 3rd-Party Cookie Deprecation [Update] + 5 Best Strategies
Google 3rd-Party Cookie Deprecation [Update] + 5 Best Strategies
 
Foundation First - Why Your Website and Content Matters - David Pisarek
Foundation First - Why Your Website and Content Matters - David PisarekFoundation First - Why Your Website and Content Matters - David Pisarek
Foundation First - Why Your Website and Content Matters - David Pisarek
 

[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み

  • 1. Leverages Co., Ltd Data Strategy Office
 データドリブン施策による
 サービス品質向上の取り組み
 丸の内アナリティクスバンビーノ#23
 2021/07/28
 レバレジーズ株式会社
 データ戦略室 室長 阪上晃幸

  • 2. Leverages Co., Ltd Data Strategy Office
 自己紹介
 名前:阪上晃幸(さかうえ てるゆき)
 
 出身:兵庫県宝塚市
 
 バックグラウンド:経済学(計量経済学、マクロ経済学) 
 
 趣味:読書、ブログ作成、トランペット、料理 
 
 大学院修了後、2012年にレバレジーズに入社し、 
 SEM(検索エンジンマーケティング)を中心にマーケティング業務を行い、 2017年より社内の便利屋になり、2019年より 
 データ戦略室の発足と同時に室長に。
 
 丸の内アナリティクスバンビーノは2016年6月にLT以降、 
 5年ぶり2度目の発表。
 2

  • 3. レバレジーズ株式会社 Leverages co.,Ltd. 
 〒150-6190 東京都渋谷区渋谷 2-24-12  
 渋谷スクランブルスクエア 24・25階 
 2005年 4月 6日 
 27拠点(海外拠点を含む、2021年5月時点) 
 正規:1183名 非正規:675名(2021年5月時点) 
 5,000万円
 自社メディア事業・人材関連事業・システムエンジニアリング事業 
 M&Aコンサルティング事業・ ASP/ SaaS/クラウド関連事業 
 有料職業紹介事業  13-ユ-302698 
 労働派遣事業 派 13-302333 
 
 社会の課題を解決し、関係者全員の幸福を追求し続けることをミッションに、メディア・人材・システムエンジニアリング・M&Aの領域で 国や業界をまたいだ問題解決を行っています。各分野のスペシャリストが集うオールインハウスの組織構成と、業界を絞らないポート フォリオ経営で、時代を代表するグローバル企業を目指します。 
 経営判断を早め、実現性を上げるため、分社・子会社化を行っています。 
 
 Leverages Groupについて
 会社名
 所在地
 
 設立
 拠点数
 従業員数
 資本金
 事業内容
 
 認定
 ・レバテック株式会社 
 ・レバレジーズキャリア株式会社 
 ・レバレジーズメディカルケア株式会社 
 ・レバレジーズオフィスサポート株式会社 
 ・レバレジーズM&Aアドバイザリー株式会社 
 
 会社概要
 レバレジーズグループ会社一覧

  • 4. Leverages Co., Ltd Data Strategy Office
 ブログを始めました!
 4
 https://analytics.leverages.jp/

  • 5. Leverages Co., Ltd Data Strategy Office
 ブログを始めました!
 5

  • 6. Leverages Co., Ltd Data Strategy Office
 今回お話しする内容
 ● 0章:レバレジーズの課題/分析環境など
 ● 1章:LTV計算と広告投資
 ● 2章:職務経歴書の解析
 ● 3章:機械学習の解釈可能性を用いた入力補助(PoC)
 6

  • 7. Leverages Co., Ltd Data Strategy Office
 話すこと・話さないこと
 ● 対象リスナー
 ○ データを蓄積して何かできないかを知りたいマーケターやエンジニア
 
 ● 話すこと
 ○ 課題とデータを用いた施策の事例紹介
 
 ● 話さないこと
 ○ 手法の詳細(データやアルゴリズム)
 ○ 具体的にどのサービスで使っているか
 資料は公開します ので、メモは不要 7

  • 8. Leverages Co., Ltd Data Strategy Office
 
 ● 0章:レバレジーズの課題/分析環境など
 ● 1章:LTV計算と広告投資
 ● 2章:職務経歴書の解析
 ● 3章:機械学習の解釈可能性を用いた入力補助(PoC)
 8

  • 9. Leverages Co., Ltd Data Strategy Office
 0章:レバレジーズの課題/分析環境など
 ● 課題
 ○ 顧客体験を改善すること
 ■ やりたい仕事ができる/キャリアアップができる
 ■ プロジェクトが成功する
 ■ スキルアップできる
 
 ○ 社員の生産性向上
 ■ 情報検索にかける時間の短縮など
 
 ○ マーケティング
 ■ ROIの向上
 9

  • 10. Leverages Co., Ltd Data Strategy Office
 0章:レバレジーズの課題/分析環境など
 生成 データ 生成 データ 収集 データレイク データウェア ハウス レコメンドシス テム データ可視化 アドホック 分析 収集 蓄積 活用 利益向 上 意思決 定 構造化 データ 構造化 データ 非構造化 データ 赤線のデータ基盤を起点にデータ分析業務を行なっている
 10
 データ基盤

  • 11. Leverages Co., Ltd Data Strategy Office
 0章:レバレジーズの課題/分析環境など
 ● よく分析に用いる言語/ツールなど
 ○ Python
 ○ R
 ○ Stan
 ○ SQL(BigQuery)
 ○ MeCab
 11

  • 12. Leverages Co., Ltd Data Strategy Office
 
 ● 0章:レバレジーズの課題/分析環境など
 ● 1章:LTV計算と広告投資
 ● 2章:職務経歴書の解析
 ● 3章:機械学習の解釈可能性を用いた入力補助(PoC)
 12

  • 13. Leverages Co., Ltd Data Strategy Office
 1章:LTV計算と広告投資
 ● 問題設定
 ○ マーケティングにおける広告予算を決めるには
 顧客生涯価値(CLTV)を求める必要がある。
 ビジネスモデルによっては解約率次第でCLTVは大きく変わる。
 
 ● データ
 ○ 数年分の顧客との取引レコード(月単位)
 ○ それに紐づく情報
 13

  • 14. Leverages Co., Ltd Data Strategy Office
 1章:LTV計算と広告投資
 ● 手法
 ○ 生存時間分析
 ■ ベイズ統計学でのWeibull分布を用いた
 比例ハザードモデル
 ○ RやStanを使用
 14

  • 15. Leverages Co., Ltd Data Strategy Office
 1章:LTV計算と広告投資
 ● 評価指標
 ○ 1年間、2年間の顧客売上金額の
 RMSE(二乗平均平方根誤差)
 ■ 🤔。○(1~2年て生涯ではないのでは?)
 
 ● 進め方
 ○ データの整形
 ○ 離脱の定義の設定(N期経つと離脱とみなす)
 ○ モデルの当てはめ(様々なカテゴリデータで回帰)
 ○ 検証用データでの精度の比較
 ○ 従来手法(ルールオブサム)との比較
 15

  • 16. Leverages Co., Ltd Data Strategy Office
 1章:LTV計算と広告投資
 16
 LTVの計算方法と生存曲線
 月毎の継続確率の推定 
 割引現在価値に関しては事業部ご とに自由に設定。
  • 17. Leverages Co., Ltd Data Strategy Office
 1章:LTV計算と広告投資
 ● 結果
 ○ 検証用データにおいてルールオブサムよりもよくなったので、意思決定に利用している。
 17
 ルールオブサム では3年目を高く 見積もりすぎてい る。
  • 18. Leverages Co., Ltd Data Strategy Office
 今回お話しする内容
 ● 0章:レバレジーズの課題/分析環境など
 ● 1章:LTV計算と広告投資
 ● 2章:職務経歴書の解析
 ● 3章:機械学習の解釈可能性を用いた入力補助(PoC)
 18

  • 19. Leverages Co., Ltd Data Strategy Office
 2章:職務経歴書の解析
 ● 問題設定
 ○ 顧客の職務経歴情報はWord・PDF・Excelなどで
 蓄積しているが、データ化して活用することが十分に
 できていなかった。
 ■ 用途として求人とのマッチングや検索があげられる。
 
 ● データ
 ○ 顧客の職務経歴情報はWord・PDF・Excelなど
 ○ 顧客関連の別レコード情報
 19

  • 20. Leverages Co., Ltd Data Strategy Office
 2章:職務経歴書の解析
 20
 典型的な職務経歴書
 期間
 社名
 職務内容

  • 21. Leverages Co., Ltd Data Strategy Office
 2章:職務経歴書の解析
 ● 手法
 ○ daXtra(ダクストラ)というレジュメ解析に特化した
 SaaSのAPIを活用(有償)
 ■ 職務経歴書をアップロードするとJSON形式のデータが返される。(API のサーバにデータは残らないようになっている)
 ● そのJSONにはスキル名やその年数、
 最後に用いた年や、どの企業に何年在籍したのかが入っている。
 ○ ETLなど諸々、Pythonを使用
 21

  • 22. Leverages Co., Ltd Data Strategy Office
 2章:職務経歴書の解析
 ● 評価指標
 ○ なし
 ■ 一応、サンプリングしたデータでの
 職務経歴書と抽出結果との適合率は見ている。
 
 ● 進め方
 ○ 職務経歴書をPythonで読み込み、WebAPIを用いて解析
 ○ JSONを解析し、テーブルを生成
 ○ 解析した結果と職務経歴書を比較して、
 正しい値が入っているかチェック。(初回のみ)
 ○ DWHに日次でアップロードするワークフローを構築(初回以降)
 22

  • 23. Leverages Co., Ltd Data Strategy Office
 2章:職務経歴書の解析
 ● 結果
 ○ フォーマットとして苦手なものも一部あるが、だいたいの職務 経歴書において構造化データとして抽出することができた。
 23

  • 24. Leverages Co., Ltd Data Strategy Office
 2章:職務経歴書の解析
 24
 例:スキル情報を取得(DWHに蓄積されている)
 スキルの経験月数
 最後にそのスキルを使った年 

  • 25. Leverages Co., Ltd Data Strategy Office
 2章:職務経歴書の解析
 25
 例:職務経歴情報を時系列で取得(DWHに蓄積されている)
 会社名
 業務内容
 期間

  • 26. Leverages Co., Ltd Data Strategy Office
 2章:職務経歴書の解析
 26
 活用例1:ニッチなスキルの検索
 
 希少性の高いスキルが必要な求人が ある場合に、それを有する方を検索す ることが容易に。
 活用例2:年収の推定(機械学習)
 
 スキルの情報を使って年収をある程度 の精度で予測することが可能に。

  • 27. Leverages Co., Ltd Data Strategy Office
 
 ● 0章:レバレジーズの課題/分析環境など
 ● 1章:LTV計算と広告投資
 ● 2章:職務経歴書の解析
 ● 3章:機械学習の解釈可能性を用いた入力補助(PoC)
 27

  • 28. Leverages Co., Ltd Data Strategy Office
 3章:機械学習の解釈可能性を用いた入力補助
 ● 問題設定
 ○ 人の職種に関するデータをこれまで人間が判断して
 入力していたが、半自動化できればデータ入力が捗るのではないか。
 ■ ただし、半自動化するにも機械的に判断した際の根拠が欲しい。
 
 ● データ
 ○ 職種が付与されたユーザーデータ(職種は70種類以上)
 ○ 職務経歴データ
 28

  • 29. Leverages Co., Ltd Data Strategy Office
 3章:機械学習の解釈可能性を用いた入力補助
 29
 ● 手法
 ○ LIME
 ■ Local Interpretable Model-agnostic Explanationsの頭文字をとったもので、機械学習に よって構築したモデルに関して、その予測結果を人間が
 解釈しやすくする技術です。
 ● ゲーム理論の知見を応用したSHAPなどもある。
 ○ 多クラス分類のためにscikit-learnのLabelEncoderを利用
 ○ 今回扱うアルゴリズムはRandom Forest(RF)
 ■ このRFのモデルにLIMEを適用する。
 ○ Pythonを使用

  • 30. Leverages Co., Ltd Data Strategy Office
 3章:機械学習の解釈可能性を用いた入力補助
 30
 参照元:https://github.com/marcotcr/lime 
 猫を猫だと推論した根拠は黄緑の領域、 犬を犬だと推論した根拠は赤の領域
  • 31. Leverages Co., Ltd Data Strategy Office
 3章:機械学習の解釈可能性を用いた入力補助
 ● 評価指標
 ○ Precision(適合率)
 ■ 予測した職種が当たっているかどうかを評価
 
 ● 進め方
 ○ 前処理
 ○ 複数のクラスを分類するための特徴量を作成
 ○ 一定の精度に至るまで交差検証を続ける
 ○ 一定の精度に至ればLIMEを適用してみる
 31

  • 32. Leverages Co., Ltd Data Strategy Office
 3章:機械学習の解釈可能性を用いた入力補助
 ● 結果
 ○ テスト用データでの精度が77%となった。
 ■ 人間が100%に近いと思うとまだ低い水準。
 32

  • 33. Leverages Co., Ltd Data Strategy Office
 3章:機械学習の解釈可能性を用いた入力補助
 33
 【LIMEの結果】
 職務経歴書から抽出したスキル情報を特徴量に学習したモデルから、
 その予測の根拠としている特徴量を可視化している。
 YamahaやCisco のネットワーク系 の機器の経験か ら、 ネットワークという 職種を予測 納得感はありそう。
  • 34. Leverages Co., Ltd Data Strategy Office
 3章:機械学習の解釈可能性を用いた入力補助
 34

  • 35. Leverages Co., Ltd Data Strategy Office
 3章:機械学習の解釈可能性を用いた入力補助
 35
 ユーザー情報 の入力 機械学習での予測 + LIMEでの可視化 解釈可能性の情報 を見ながら、 職種のデータ を入力する ユーザー情報 の入力 ユーザーの過去に 取り組んだ 仕事内容を熟読 人手で、複数ある分 類表を見ながら職種 を決め入力する これまで
 これから
 今後の方向性

  • 36. Leverages Co., Ltd Data Strategy Office
 まとめ/今後の展望
 ● レバレジーズではマーケティング活動、
 営業活動の効率化、データ蓄積支援など幅広く
 データサイエンスを適用している。今回はその一部を紹介した。
 
 ● 今後は、データ基盤をより発展させ、データドリブン施策を低コストで実行す ること、
 より増加していく機械学習プロダクトを管理していく体制を構築していく。
 36

  • 37. Leverages Co., Ltd Data Strategy Office
 Appendix:発表していないが取り組んでいること
 ● 求人レコメンドシステム開発
 ● マーケティング施策の効果検証のための統計モデリング
 ● 機械学習を用いた、Google広告のためのオフラインコンバージョン値の予測
 ● オウンドメディアの評価向上のための自然言語処理技術の適用
 37

  • 38. Leverages Co., Ltd Data Strategy Office
 Q&A用
 ● 0章:レバレジーズの課題/分析環境など
 ○ データ基盤、OSSでの分析
 
 ● 1章:LTV計算と広告投資
 ○ 生存時間分析、CLTV
 
 ● 2章:職務経歴書の解析
 ○ 職務経歴書、解析、ETL、スキル検索、年収予測
 
 ● 3章:機械学習の解釈可能性を用いた入力補助(PoC)
 ○ 機械学習の解釈可能性、マルチクラス分類
 38