Mais conteúdo relacionado
Mais de Shuyo Nakatani (20)
機械の代わりに人間が学習入門
- 1. 機械 の代わりに人間が 学習入門
~エンジニアが機械学習を学ぶには~
2011/1/16
中谷 秀洋 (@shuyo / id:n_shuyo)
サイボウズ・ラボ株式会社
- 4. 機械学習講座には3コース!
• ウハウハコース
- ライブラリを使って即製します
- 難しい機械学習の知識はOJTで!
• しっかりコース
- あなたの分野にぴったりの本を読みます
• 自然言語処理、データマイニング、画像処理、……
- 即戦力を目指します!
• ガチンココース
- PRML読みます
- 論文を読める基礎力を身につけます!
詳しくは明日の朝刊の折り込みチラシにて
- 7. 年表で見る機械学習
1946 モンテカルロ法 PRML
1958 カルマン・フィルター PRML
1960s 隠れマルコフモデル PRML
-1961 ニューラルネットワーク PRML
1977 EM アルゴリズム PRML
1982 SOM (自己組織マップ) PRML
1984 CART (決定木の一手法) PRML
1994 ICA (独立成分分析) PRML
1995 サポートベクトルマシン PRML Mahout
1995 粒子フィルタ PRML
2000 FP-Growth Mahout
2001 アイテムベース協調フィルタリング Mahout
2001 Random Forest Mahout
2003 LDA (Latent Dirichlet Allocation) Mahout
• フルサイズの年表は http://d.hatena.ne.jp/n_shuyo/20110111/ml
- 10. 1946 モンテカルロ法 PRML
1958 カルマン・フィルター PRML
1960s 隠れマルコフモデル PRML
-1961 ニューラルネットワーク PRML
1977 書籍 EM アルゴリズム PRML
1982 SOM (自己組織マップ) PRML
1984 CART (決定木の一手法) PRML
1994 ICA (独立成分分析) PRML
1995 サポートベクトルマシン PRML Mahout
1995 粒子フィルタ PRML
2000 FP-Growth Mahout
2001 アイテムベース協調フィルタリング Mahout
2001 Random Forest 論文 Mahout
2003 LDA (Latent Dirichlet Allocation) Mahout
• フルサイズの年表は http://d.hatena.ne.jp/n_shuyo/20110111/ml
- 18. 「よいデータ」を用意するには?
• モデルに対する知識
- このモデルにあうのはこういうデータ……とい
う傾向がある
- 機械学習の知識があると有利
• データ・問題(ドメイン)に対する知識
- つまり業務知識
- エンジニアの勝負しどころ!!
• 機械学習の知識があってもなくても!
- 19. (例)言語判定
• テキストが何語で書かれたものかを判定
- モデルは3-gram+ナイーブベイズ(シンプル♪)
- http://code.google.com/p/language-detection/
• 当初、ペルシャ語の判定が全滅
- 高頻度で使われる ¥( یu06cc, Farsi yeh)がアラビア
語の文字コード CP-1256 にないため、 ¥(يu064a,
Arabic yeh)で代用する対処法が広まっている
• 対策:データ内の ¥u06cc を ¥u064a に正規化
こんにちは → 日本語
Hello → 英語
- 33. 機械学習を学習したいエンジニアへ
• 学習コースを正しく選びましょう
- 目的目標とかけられるコストをてんびんに
• 機械学習がわかりにくいのは、そういうもん
- 裏返せば「参入障壁が高い」と言うこと
- 勉強してみてわかんないことがあったら、こうい
う場でガンガン聞きましょう
• 「業務知識+機械学習」はマジ最強
- エンジニアが機械学習を学ぶ値打ちはここに!