SlideShare uma empresa Scribd logo
1 de 26
Tableau + Pythonと
データのあり方
Tableau データサイエンス勉強会第4回
About Me
荒木 和也
Kazuya Araki
Knight of Tableau DATA Saber
受託開発 -> パッケージ開発 -> 某HR Tech & 個人事業
Engineer -> Data Analyst / Data Enginieer / Data Archtect
Love: Data
Hobby: J-Rock, Snow Sports, PC Game, Board Game etc(100+)https://www.facebook.com/kazuya.araki.tokyo
@kazuya_araki_jp
https://note.mu/jedi_trickstar
https://public.tableau.com/profile/kazuya.araki#!/
お話しすること
最近考えている、思っていることについて語ってみます。
(サイエンスよりは、エンジニアリングの与太話となります)
● データとTableau(Desktop)の関係
● TableauとPython
お話ししないこと
10分では足りないので。
● PythonのHow
● TabPyの細かい話(本当は語りたい)
データとTableau(Desktop)の関係
基本はETL(データパイプライン)の考え方
Tableau(Desktop)は優秀
優秀すぎるが故の罠
優秀すぎるが故の罠
例: 計算フィールド多すぎ問題
● 単純にパフォーマンスが劣化する。
● メジャーの視認性が悪くなる。
● メジャー名を正しく定義しないと使うときに困る。
● 計算式が正しくなかった場合のレビューがとても難しい。
○ レビュワーもCreatorユーザーでなければならない。
etc...
優秀すぎるが故の罠
優秀すぎるが故の罠
例: カスタムSQL
● SQLが実行できるデータソースで発生しうる。
○ データマート構築が進んでいない場合。
○ サービズデータを無加工でデータウェアハウスに格納して
いる場合。
○ 総じて、データエンジニアリングが未熟なフェーズ。
● Tableau Desktopのウインドウだと視認性が良くない。
● SQLが正しくなかった場合のレビューがとても難しい。
○ レビュワーもCreatorユーザーでなければならない。
○ 計算フィールドと複合していると原因特定に詰む。
○ SQLを書いた本人ですらわからない場合もある。
etc...
(フォーマッターかけて)
800行超あるSQL
気をつけないと痛い目を見る
構成を考えてみる🤔
最近の推しの構成
最近の推しの構成
役割分担と構成管理
データ加工とデータ可視化を分けた方がよさそう
● データ加工 = SQL / Python / Tableau Prep Builder
○ GitHubでコードを管理する。
■ データ定義を残す。
■ 再現性を担保する(= 誰が使っても同じ結果になる保証)。
○ SQLはデータベース、SQLでできないことはPythonに任せる。
○ API系はPython。
○ Tableau Prepは可能性しかない。今後に期待。
■ ただし、Prep Conductorまで使うには別途追加料金が必要。
● データ可視化 = Tableau Desktop
○ Tableau側はデータについて関与しない。
○ Tableauはデータ可視化にだけ、注力するようにする。
TableauとPython
Python IDEの構成 from あらき
TabPyの登場
Tableau内でPythonが記述可能に
TabPy
リプレース可能?
TabPy
🤔
一人Zen問答したメモ at 2019/10/01
● TabPyの位置付けは計算フィールドと変わらないので、データパイプライン
を考えると、役割分担ができない。
● 一方で、TabPyは構築さえできてしまえばTableau内で完結するので、楽とい
えば楽。
● どちらが優れているかは現時点では判断できない。
● 少なくとも、2人以上が関わるようになった場合は、Tableau内であれこれや
るよりも、ちゃんと思考開示して共有できるようにしないと属人化は進むだ
ろう。
○ Citizen Data Scientists向け?
○ Data Engineerをかかえている組織であれば、分業した方が効率は良い?
もう少し、ざっくばらんに
議論したいです
※背景画像はイメージです
まとめ
● データとTableau(Desktop)の関係
○ データパイプラインを意識する = ツールに適した役割分担をする。
○ データ定義はTableau(Desktop)内で行うべきではない(のが個人的見解)。
○ なんでもTableau(Desktop)で解決しようとしない。
● TableauとPythonTabPy
○ データパイプラインを意識すると、TabPyの導入意義が薄れてしまう(のが個人的見解)。
○ もう少し深掘りしていきたいです🙇
Tableau + Pythonとデータのあり方

Mais conteúdo relacionado

Mais procurados

Recommender system algorithm and architecture
Recommender system algorithm and architectureRecommender system algorithm and architecture
Recommender system algorithm and architecture
Liang Xiang
 
Interactive Recommender Systems with Netflix and Spotify
Interactive Recommender Systems with Netflix and SpotifyInteractive Recommender Systems with Netflix and Spotify
Interactive Recommender Systems with Netflix and Spotify
Chris Johnson
 

Mais procurados (20)

5 benefits of OpManager
5 benefits of OpManager5 benefits of OpManager
5 benefits of OpManager
 
Tableauのつまづきポイント
TableauのつまづきポイントTableauのつまづきポイント
Tableauのつまづきポイント
 
ログ分析で支えるゲームパラメータ設計 #denatechcon
ログ分析で支えるゲームパラメータ設計 #denatechconログ分析で支えるゲームパラメータ設計 #denatechcon
ログ分析で支えるゲームパラメータ設計 #denatechcon
 
Recommender system algorithm and architecture
Recommender system algorithm and architectureRecommender system algorithm and architecture
Recommender system algorithm and architecture
 
Data visualization
Data visualizationData visualization
Data visualization
 
Tableauから始める統計学の基礎
Tableauから始める統計学の基礎Tableauから始める統計学の基礎
Tableauから始める統計学の基礎
 
Data Visualization Tools in Python
Data Visualization Tools in PythonData Visualization Tools in Python
Data Visualization Tools in Python
 
Recommendation Systems
Recommendation SystemsRecommendation Systems
Recommendation Systems
 
Packet tracer 설치 및 사용법
Packet tracer 설치 및 사용법Packet tracer 설치 및 사용법
Packet tracer 설치 및 사용법
 
Collaborative Filtering 1: User-based CF
Collaborative Filtering 1: User-based CFCollaborative Filtering 1: User-based CF
Collaborative Filtering 1: User-based CF
 
初めてのVR/AR開発をUnityで
初めてのVR/AR開発をUnityで初めてのVR/AR開発をUnityで
初めてのVR/AR開発をUnityで
 
【Photon勉強会】1時間でわかるプラグイン開発とその実際(2017/3/23講演)
【Photon勉強会】1時間でわかるプラグイン開発とその実際(2017/3/23講演)【Photon勉強会】1時間でわかるプラグイン開発とその実際(2017/3/23講演)
【Photon勉強会】1時間でわかるプラグイン開発とその実際(2017/3/23講演)
 
[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드
 
Recommendation system
Recommendation systemRecommendation system
Recommendation system
 
Movie Recommendation engine
Movie Recommendation engineMovie Recommendation engine
Movie Recommendation engine
 
Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)
Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)
Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)
 
Interactive Recommender Systems with Netflix and Spotify
Interactive Recommender Systems with Netflix and SpotifyInteractive Recommender Systems with Netflix and Spotify
Interactive Recommender Systems with Netflix and Spotify
 
Learning-to-Rank meetup Vol. 1
Learning-to-Rank meetup Vol. 1Learning-to-Rank meetup Vol. 1
Learning-to-Rank meetup Vol. 1
 
Link prediction
Link predictionLink prediction
Link prediction
 
Movie recommendation system using collaborative filtering system
Movie recommendation system using collaborative filtering system Movie recommendation system using collaborative filtering system
Movie recommendation system using collaborative filtering system
 

Semelhante a Tableau + Pythonとデータのあり方

「R for Cloud Computing」の紹介
「R for Cloud Computing」の紹介「R for Cloud Computing」の紹介
「R for Cloud Computing」の紹介
Takekatsu Hiramura
 

Semelhante a Tableau + Pythonとデータのあり方 (20)

DBエンジニアに必要だったPythonのスキル
DBエンジニアに必要だったPythonのスキルDBエンジニアに必要だったPythonのスキル
DBエンジニアに必要だったPythonのスキル
 
Tableau r graph_theory
Tableau r graph_theoryTableau r graph_theory
Tableau r graph_theory
 
Tableau r graph_theory
Tableau r graph_theoryTableau r graph_theory
Tableau r graph_theory
 
Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1
Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1
Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1
 
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07
 
Tableauから始める機械学習ーやってみようPython連携_2019-05-23
Tableauから始める機械学習ーやってみようPython連携_2019-05-23Tableauから始める機械学習ーやってみようPython連携_2019-05-23
Tableauから始める機械学習ーやってみようPython連携_2019-05-23
 
データ分析プラットフォームの歩き方
データ分析プラットフォームの歩き方データ分析プラットフォームの歩き方
データ分析プラットフォームの歩き方
 
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
 
PyData入門(超初心者編)~野球のデータをカジュアルに可視化
PyData入門(超初心者編)~野球のデータをカジュアルに可視化PyData入門(超初心者編)~野球のデータをカジュアルに可視化
PyData入門(超初心者編)~野球のデータをカジュアルに可視化
 
Tableau人材を育てるには? ~truestar文化に学ぶエフォートレスな勉強会のすゝめ~
Tableau人材を育てるには? ~truestar文化に学ぶエフォートレスな勉強会のすゝめ~Tableau人材を育てるには? ~truestar文化に学ぶエフォートレスな勉強会のすゝめ~
Tableau人材を育てるには? ~truestar文化に学ぶエフォートレスな勉強会のすゝめ~
 
すごいタスク管理(仮)
すごいタスク管理(仮)すごいタスク管理(仮)
すごいタスク管理(仮)
 
Prepを使ってデータを武器にしよう!
Prepを使ってデータを武器にしよう!Prepを使ってデータを武器にしよう!
Prepを使ってデータを武器にしよう!
 
Prepを使ってデータを武器にしよう
Prepを使ってデータを武器にしようPrepを使ってデータを武器にしよう
Prepを使ってデータを武器にしよう
 
僕の考える最強のビックデータエンジニア
僕の考える最強のビックデータエンジニア僕の考える最強のビックデータエンジニア
僕の考える最強のビックデータエンジニア
 
「R for Cloud Computing」の紹介
「R for Cloud Computing」の紹介「R for Cloud Computing」の紹介
「R for Cloud Computing」の紹介
 
Pub tableau ladiesusergroup_14
Pub tableau ladiesusergroup_14Pub tableau ladiesusergroup_14
Pub tableau ladiesusergroup_14
 
れこめん道~とあるエンジニアの苦闘の日々
れこめん道~とあるエンジニアの苦闘の日々 れこめん道~とあるエンジニアの苦闘の日々
れこめん道~とあるエンジニアの苦闘の日々
 
「れこめん道」~とあるエンジニアの苦闘の日々
「れこめん道」~とあるエンジニアの苦闘の日々「れこめん道」~とあるエンジニアの苦闘の日々
「れこめん道」~とあるエンジニアの苦闘の日々
 
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
 
データサイエンティストの今
データサイエンティストの今データサイエンティストの今
データサイエンティストの今
 

Tableau + Pythonとデータのあり方