43. 分析例
1. 売上予測
・入力データ形式:時系列x予測対象(売上、伝票数、ユニークユーザ数他)
・手法:ARIMAとか
・アウトプット:予測曲線
2. who ざっくりどんな人たちがお客?
・入力データ形式:ヒトx商品
・手法:因子分析?主成分分析?⇒クラスタリング
・アウトプット:顧客(ニーズ)のラベル(クラスタリング結果に名前を付けたもの)
3. what よく似た(よく一緒に買われる)商品って何?
・入力データ形式:併買マトリクス(商品x商品)とか? リサーチデータで商品の要素データ見つけてくる感じ?
・手法:相関分析
・アウトプット:商品(ベネフィットや用途)のラベル(クラスタリング結果に名前を付けたもの)
4. who x what 販促反応予測(退職者予想、新規登録予測、ランクアップ、ランクダウン予測)
・入力データ形式:ヒトx予測対象(反応@特定のwhat)
・手法:ロジスティック回帰、決定木
・アウトプット:予測スコア、高反応セグメント条件式
5. who x when チャーン予測
・入力データ形式:ヒトxチャーン
・手法:ロジスティック回帰、決定木
・アウトプット:予測スコア、チャーンリスクセグメント条件式
48. マーケ x DSの勉強につかえるデータセット
• E-Commerce Data
Actual transactions from UK retailer
https://www.kaggle.com/carrie1/ecommerce-data
1. InvoiceNo: Invoice number. Nominal, a 6-digit integral number uniquely assigned to each transaction. If
this code starts with letter 'c', it indicates a cancellation.
2. StockCode: Product (item) code. Nominal, a 5-digit integral number uniquely assigned to each distinct
product.
3. Description: Product (item) name. Nominal.
4. Quantity: The quantities of each product (item) per transaction. Numeric.
5. InvoiceDate: Invice Date and time. Numeric, the day and time when each transaction was generated.
6. UnitPrice: Unit price. Numeric, Product price per unit in sterling.
7. CustomerID: Customer number. Nominal, a 5-digit integral number uniquely assigned to each customer.
Country: Country name. Nominal, the name of the country where each customer resides.
8. Descriptionが途中で変わったり、カードの支払いが入っていたりして面白い
49. マーケ x DSの勉強につかえるデータセット
• E-Commerce Data
Actual transactions from UK retailer
https://www.kaggle.com/carrie1/ecommerce-data
• Anime Recommendations Database
Recommendation data from 76,000 users at myanimelist.net
https://www.kaggle.com/CooperUnion/anime-recommendations-database
• Innerwear Data from Victoria's Secret and Others
600,000+ innerwear product data extracted from popular retail sites
https://www.kaggle.com/PromptCloudHQ/innerwear-data-from-victorias-
secret-and-others
50. マーケ x DSの勉強につかえるデータセット
• Hotel booking demand
From the paper: hotel booking demand datasets
https://www.kaggle.com/jessemostipak/hotel-booking-demand
• New York City Airbnb Open Data
Airbnb listings and metrics in NYC, NY, USA (2019)
https://www.kaggle.com/dgomonov/new-york-city-airbnb-open-data
• E-commerce - Users of a French C2C fashion store
Explore user behaviour of 98K users of a successful website
https://www.kaggle.com/jmmvutu/ecommerce-users-of-a-french-c2c-
fashion-store
51. マーケ x DSの勉強につかえるデータセット
• Amazon sales rank data for print and kindle books
61,000 unique ASINs and 200,000,000 salesrank data points (JSON / CSV)
https://www.kaggle.com/ucffool/amazon-sales-rank-data-for-print-and-
kindle-books
• Instacart Market Basket Analysis
Which products will an Instacart consumer purchase again?
https://www.kaggle.com/c/instacart-market-basket-analysis/data
• Zillow Prize: Zillow’s Home Value Prediction (Zestimate)
Can you improve the algorithm that changed the world of real estate?
https://www.kaggle.com/c/zillow-prize-1/overview