O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.

Tableau + Pythonとデータのあり方

1.828 visualizações

Publicada em

Tableauデータサイエンス勉強会 第4回 - 画像認識技術とBIの巻-
登壇資料
https://techplay.jp/event/750555

Publicada em: Dados e análise
  • DOWNLOAD THIS BOOKS INTO AVAILABLE FORMAT (2019 Update) ......................................................................................................................... ......................................................................................................................... Download Full PDF EBOOK here { https://soo.gd/irt2 } ......................................................................................................................... Download Full EPUB Ebook here { https://soo.gd/irt2 } ......................................................................................................................... Download Full doc Ebook here { https://soo.gd/irt2 } ......................................................................................................................... Download PDF EBOOK here { https://soo.gd/irt2 } ......................................................................................................................... Download EPUB Ebook here { https://soo.gd/irt2 } ......................................................................................................................... Download doc Ebook here { https://soo.gd/irt2 } ......................................................................................................................... ......................................................................................................................... ................................................................................................................................... eBook is an electronic version of a traditional print book THIS can be read by using a personal computer or by using an eBook reader. (An eBook reader can be a software application for use on a computer such as Microsoft's free Reader application, or a book-sized computer THIS is used solely as a reading device such as Nuvomedia's Rocket eBook.) Users can purchase an eBook on diskette or CD, but the most popular method of getting an eBook is to purchase a downloadable file of the eBook (or other reading material) from a Web site (such as Barnes and Noble) to be read from the user's computer or reading device. Generally, an eBook can be downloaded in five minutes or less ......................................................................................................................... .............. Browse by Genre Available eBooks .............................................................................................................................. Art, Biography, Business, Chick Lit, Children's, Christian, Classics, Comics, Contemporary, Cookbooks, Manga, Memoir, Music, Mystery, Non Fiction, Paranormal, Philosophy, Poetry, Psychology, Religion, Romance, Science, Science Fiction, Self Help, Suspense, Spirituality, Sports, Thriller, Travel, Young Adult, Crime, Ebooks, Fantasy, Fiction, Graphic Novels, Historical Fiction, History, Horror, Humor And Comedy, ......................................................................................................................... ......................................................................................................................... .....BEST SELLER FOR EBOOK RECOMMEND............................................................. ......................................................................................................................... Blowout: Corrupted Democracy, Rogue State Russia, and the Richest, Most Destructive Industry on Earth,-- The Ride of a Lifetime: Lessons Learned from 15 Years as CEO of the Walt Disney Company,-- Call Sign Chaos: Learning to Lead,-- StrengthsFinder 2.0,-- Stillness Is the Key,-- She Said: Breaking the Sexual Harassment Story THIS Helped Ignite a Movement,-- Atomic Habits: An Easy & Proven Way to Build Good Habits & Break Bad Ones,-- Everything Is Figureoutable,-- What It Takes: Lessons in the Pursuit of Excellence,-- Rich Dad Poor Dad: What the Rich Teach Their Kids About Money THIS the Poor and Middle Class Do Not!,-- The Total Money Makeover: Classic Edition: A Proven Plan for Financial Fitness,-- Shut Up and Listen!: Hard Business Truths THIS Will Help You Succeed, ......................................................................................................................... .........................................................................................................................
       Responder 
    Tem certeza que deseja  Sim  Não
    Insira sua mensagem aqui

Tableau + Pythonとデータのあり方

  1. 1. Tableau + Pythonと データのあり方 Tableau データサイエンス勉強会第4回
  2. 2. About Me 荒木 和也 Kazuya Araki Knight of Tableau DATA Saber 受託開発 -> パッケージ開発 -> 某HR Tech & 個人事業 Engineer -> Data Analyst / Data Enginieer / Data Archtect Love: Data Hobby: J-Rock, Snow Sports, PC Game, Board Game etc(100+)https://www.facebook.com/kazuya.araki.tokyo @kazuya_araki_jp https://note.mu/jedi_trickstar https://public.tableau.com/profile/kazuya.araki#!/
  3. 3. お話しすること 最近考えている、思っていることについて語ってみます。 (サイエンスよりは、エンジニアリングの与太話となります) ● データとTableau(Desktop)の関係 ● TableauとPython
  4. 4. お話ししないこと 10分では足りないので。 ● PythonのHow ● TabPyの細かい話(本当は語りたい)
  5. 5. データとTableau(Desktop)の関係
  6. 6. 基本はETL(データパイプライン)の考え方
  7. 7. Tableau(Desktop)は優秀
  8. 8. 優秀すぎるが故の罠
  9. 9. 優秀すぎるが故の罠 例: 計算フィールド多すぎ問題 ● 単純にパフォーマンスが劣化する。 ● メジャーの視認性が悪くなる。 ● メジャー名を正しく定義しないと使うときに困る。 ● 計算式が正しくなかった場合のレビューがとても難しい。 ○ レビュワーもCreatorユーザーでなければならない。 etc...
  10. 10. 優秀すぎるが故の罠
  11. 11. 優秀すぎるが故の罠 例: カスタムSQL ● SQLが実行できるデータソースで発生しうる。 ○ データマート構築が進んでいない場合。 ○ サービズデータを無加工でデータウェアハウスに格納して いる場合。 ○ 総じて、データエンジニアリングが未熟なフェーズ。 ● Tableau Desktopのウインドウだと視認性が良くない。 ● SQLが正しくなかった場合のレビューがとても難しい。 ○ レビュワーもCreatorユーザーでなければならない。 ○ 計算フィールドと複合していると原因特定に詰む。 ○ SQLを書いた本人ですらわからない場合もある。 etc... (フォーマッターかけて) 800行超あるSQL
  12. 12. 気をつけないと痛い目を見る
  13. 13. 構成を考えてみる🤔
  14. 14. 最近の推しの構成
  15. 15. 最近の推しの構成
  16. 16. 役割分担と構成管理
  17. 17. データ加工とデータ可視化を分けた方がよさそう ● データ加工 = SQL / Python / Tableau Prep Builder ○ GitHubでコードを管理する。 ■ データ定義を残す。 ■ 再現性を担保する(= 誰が使っても同じ結果になる保証)。 ○ SQLはデータベース、SQLでできないことはPythonに任せる。 ○ API系はPython。 ○ Tableau Prepは可能性しかない。今後に期待。 ■ ただし、Prep Conductorまで使うには別途追加料金が必要。 ● データ可視化 = Tableau Desktop ○ Tableau側はデータについて関与しない。 ○ Tableauはデータ可視化にだけ、注力するようにする。
  18. 18. TableauとPython
  19. 19. Python IDEの構成 from あらき
  20. 20. TabPyの登場
  21. 21. Tableau内でPythonが記述可能に TabPy
  22. 22. リプレース可能? TabPy 🤔
  23. 23. 一人Zen問答したメモ at 2019/10/01 ● TabPyの位置付けは計算フィールドと変わらないので、データパイプライン を考えると、役割分担ができない。 ● 一方で、TabPyは構築さえできてしまえばTableau内で完結するので、楽とい えば楽。 ● どちらが優れているかは現時点では判断できない。 ● 少なくとも、2人以上が関わるようになった場合は、Tableau内であれこれや るよりも、ちゃんと思考開示して共有できるようにしないと属人化は進むだ ろう。 ○ Citizen Data Scientists向け? ○ Data Engineerをかかえている組織であれば、分業した方が効率は良い?
  24. 24. もう少し、ざっくばらんに 議論したいです ※背景画像はイメージです
  25. 25. まとめ ● データとTableau(Desktop)の関係 ○ データパイプラインを意識する = ツールに適した役割分担をする。 ○ データ定義はTableau(Desktop)内で行うべきではない(のが個人的見解)。 ○ なんでもTableau(Desktop)で解決しようとしない。 ● TableauとPythonTabPy ○ データパイプラインを意識すると、TabPyの導入意義が薄れてしまう(のが個人的見解)。 ○ もう少し深掘りしていきたいです🙇

×