Enviar pesquisa
Carregar
機械学習コン講評
•
2 gostaram
•
1,344 visualizações
Hiromu Yakura
Seguir
NPCA 2014 夏合宿
Leia menos
Leia mais
Tecnologia
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 40
Baixar agora
Baixar para ler offline
Recomendados
機械学習とその理論 (情報オリンピック2015春合宿講義資料)
機械学習とその理論 (情報オリンピック2015春合宿講義資料)
irrrrr
Human-AI communication for human-human communication / CHAI Workshop @ IJCAI ...
Human-AI communication for human-human communication / CHAI Workshop @ IJCAI ...
Hiromu Yakura
How to make good use of AI technologies? @ Tsukuba Conference 2021
How to make good use of AI technologies? @ Tsukuba Conference 2021
Hiromu Yakura
機械学習を"良く"使うには
機械学習を"良く"使うには
Hiromu Yakura
自己紹介@名状しがたいお茶会
自己紹介@名状しがたいお茶会
Hiromu Yakura
Python 3のWebシステムでDDDに入門してみた
Python 3のWebシステムでDDDに入門してみた
Hiromu Yakura
Robust Audio Adversarial Example for a Physical Attack
Robust Audio Adversarial Example for a Physical Attack
Hiromu Yakura
セキュリティ・キャンプのススメ
セキュリティ・キャンプのススメ
Hiromu Yakura
Recomendados
機械学習とその理論 (情報オリンピック2015春合宿講義資料)
機械学習とその理論 (情報オリンピック2015春合宿講義資料)
irrrrr
Human-AI communication for human-human communication / CHAI Workshop @ IJCAI ...
Human-AI communication for human-human communication / CHAI Workshop @ IJCAI ...
Hiromu Yakura
How to make good use of AI technologies? @ Tsukuba Conference 2021
How to make good use of AI technologies? @ Tsukuba Conference 2021
Hiromu Yakura
機械学習を"良く"使うには
機械学習を"良く"使うには
Hiromu Yakura
自己紹介@名状しがたいお茶会
自己紹介@名状しがたいお茶会
Hiromu Yakura
Python 3のWebシステムでDDDに入門してみた
Python 3のWebシステムでDDDに入門してみた
Hiromu Yakura
Robust Audio Adversarial Example for a Physical Attack
Robust Audio Adversarial Example for a Physical Attack
Hiromu Yakura
セキュリティ・キャンプのススメ
セキュリティ・キャンプのススメ
Hiromu Yakura
新しいライブ映像再生システムを研究してみた
新しいライブ映像再生システムを研究してみた
Hiromu Yakura
GAME ON 特別イベント 「ゲームってなんでプログラミング?」
GAME ON 特別イベント 「ゲームってなんでプログラミング?」
Hiromu Yakura
Arduinoでプログラミングに触れてみよう 続編
Arduinoでプログラミングに触れてみよう 続編
Hiromu Yakura
Arduinoでプログラミングに触れてみよう
Arduinoでプログラミングに触れてみよう
Hiromu Yakura
NPCA夏合宿 2014 講義資料
NPCA夏合宿 2014 講義資料
Hiromu Yakura
イタリアでパスタを食べた話
イタリアでパスタを食べた話
Hiromu Yakura
Why don't you learn programming?
Why don't you learn programming?
Hiromu Yakura
CTF, What's in it for me?
CTF, What's in it for me?
Hiromu Yakura
Arrow Judge
Arrow Judge
Hiromu Yakura
CTFとは
CTFとは
Hiromu Yakura
CTFはとんでもないものを 盗んでいきました。私の時間です…
CTFはとんでもないものを 盗んでいきました。私の時間です…
Hiromu Yakura
ぃぬ速@LKML
ぃぬ速@LKML
Hiromu Yakura
プラトン
プラトン
Hiromu Yakura
How to lick Miku
How to lick Miku
Hiromu Yakura
ICTのちから
ICTのちから
Hiromu Yakura
ナウいAndroidセキュリティ
ナウいAndroidセキュリティ
Hiromu Yakura
Trendmicro Security Award 2012 Final Presentation
Trendmicro Security Award 2012 Final Presentation
Hiromu Yakura
Androidにおける強制アクセス制御
Androidにおける強制アクセス制御
Hiromu Yakura
SEAndroid -AndroidのアーキテクチャとSE化について-
SEAndroid -AndroidのアーキテクチャとSE化について-
Hiromu Yakura
Nyarlathotep
Nyarlathotep
Hiromu Yakura
Mais conteúdo relacionado
Mais de Hiromu Yakura
新しいライブ映像再生システムを研究してみた
新しいライブ映像再生システムを研究してみた
Hiromu Yakura
GAME ON 特別イベント 「ゲームってなんでプログラミング?」
GAME ON 特別イベント 「ゲームってなんでプログラミング?」
Hiromu Yakura
Arduinoでプログラミングに触れてみよう 続編
Arduinoでプログラミングに触れてみよう 続編
Hiromu Yakura
Arduinoでプログラミングに触れてみよう
Arduinoでプログラミングに触れてみよう
Hiromu Yakura
NPCA夏合宿 2014 講義資料
NPCA夏合宿 2014 講義資料
Hiromu Yakura
イタリアでパスタを食べた話
イタリアでパスタを食べた話
Hiromu Yakura
Why don't you learn programming?
Why don't you learn programming?
Hiromu Yakura
CTF, What's in it for me?
CTF, What's in it for me?
Hiromu Yakura
Arrow Judge
Arrow Judge
Hiromu Yakura
CTFとは
CTFとは
Hiromu Yakura
CTFはとんでもないものを 盗んでいきました。私の時間です…
CTFはとんでもないものを 盗んでいきました。私の時間です…
Hiromu Yakura
ぃぬ速@LKML
ぃぬ速@LKML
Hiromu Yakura
プラトン
プラトン
Hiromu Yakura
How to lick Miku
How to lick Miku
Hiromu Yakura
ICTのちから
ICTのちから
Hiromu Yakura
ナウいAndroidセキュリティ
ナウいAndroidセキュリティ
Hiromu Yakura
Trendmicro Security Award 2012 Final Presentation
Trendmicro Security Award 2012 Final Presentation
Hiromu Yakura
Androidにおける強制アクセス制御
Androidにおける強制アクセス制御
Hiromu Yakura
SEAndroid -AndroidのアーキテクチャとSE化について-
SEAndroid -AndroidのアーキテクチャとSE化について-
Hiromu Yakura
Nyarlathotep
Nyarlathotep
Hiromu Yakura
Mais de Hiromu Yakura
(20)
新しいライブ映像再生システムを研究してみた
新しいライブ映像再生システムを研究してみた
GAME ON 特別イベント 「ゲームってなんでプログラミング?」
GAME ON 特別イベント 「ゲームってなんでプログラミング?」
Arduinoでプログラミングに触れてみよう 続編
Arduinoでプログラミングに触れてみよう 続編
Arduinoでプログラミングに触れてみよう
Arduinoでプログラミングに触れてみよう
NPCA夏合宿 2014 講義資料
NPCA夏合宿 2014 講義資料
イタリアでパスタを食べた話
イタリアでパスタを食べた話
Why don't you learn programming?
Why don't you learn programming?
CTF, What's in it for me?
CTF, What's in it for me?
Arrow Judge
Arrow Judge
CTFとは
CTFとは
CTFはとんでもないものを 盗んでいきました。私の時間です…
CTFはとんでもないものを 盗んでいきました。私の時間です…
ぃぬ速@LKML
ぃぬ速@LKML
プラトン
プラトン
How to lick Miku
How to lick Miku
ICTのちから
ICTのちから
ナウいAndroidセキュリティ
ナウいAndroidセキュリティ
Trendmicro Security Award 2012 Final Presentation
Trendmicro Security Award 2012 Final Presentation
Androidにおける強制アクセス制御
Androidにおける強制アクセス制御
SEAndroid -AndroidのアーキテクチャとSE化について-
SEAndroid -AndroidのアーキテクチャとSE化について-
Nyarlathotep
Nyarlathotep
機械学習コン講評
1.
機械学習コン講評 Hiromu Yakura
2.
概要 • https://mlcon.npca.jp/camp_2014/
• 日時: 2014/08/18 ~ • 問題数: 3問
3.
毒キノコを見つけろ • NPCAの尊敬すべき偉大なOBである博多市が毒キノコを
食べることのないように判別してあげる • 出典: http://archive.ics.uci.edu/ml/datasets/Mushroom
4.
毒キノコを見つけろ • 特徴が20個,カテゴリが2つ(有毒/無毒)
• 学習用データセットが1000件 • テスト用データセットが1000件
5.
Classification • データを幾つかのカテゴリに分ける
• 今回は有毒/無毒の2つに分けるのでBinary Classificationとも
6.
Classification • よくある手法
(それぞれの手法についての解説は割愛) • k-近傍法 • 決定木 (分類木) • サポートベクターマシン
7.
k-近傍法 • とりあえず1番簡単なk-近傍法で組んでみる
• https://gist.github.com/hiromu/d5ed079e98caea3b008c#file-mushroom- c • 10000点 (K = 3) • 抜群
8.
出題の意図 • 分類変数(カテゴリ)なのか連続変数なのかをよく見よう
• 今回の特徴量はすべてカテゴリ • ユークリッド距離とかを取ってはいけない!!!
9.
分類変数か連続変数か • e.g.
傘の色 • 0 = 茶色, 1 = 黄色, 2 = 白色, 3 = 灰色, 4 = 赤色, 5 = ピンク色, 6 = 黄褐色, 7 = 淡赤色 • 果たして, 茶色と灰色の違いは 茶色と黄色の違いの3倍大きいのか??
10.
分類変数か連続変数か • 類似度を取るときに
一致している特徴がどれだけあるかを見れば満点取れる • ユークリッド距離を取ったりすると9500点とかに
11.
ちなみに • サポートベクターマシンにそのまま投げると一発満点でした
• つよい
12.
不動産バブルを見極めろ • NPCAの尊敬すべき偉大なOBである博多市のために
物件の適切な家賃を計算する • 出典: Suumo
13.
不動産バブルを見極めろ • 特徴が7個,
家賃の誤差が5000円以内なら得点が生える • 学習用データセットは500件 • テスト用データセットは500件
14.
Regression • データの従属変数と連続尺度の独立変数が~(略)
• Classificationとの1番の違いは求めたいものが離散値か連続値か • 今回求めたいもの = 家賃は連続値
15.
Regression • よくある手法
• k-近傍法 • 決定木 (回帰木) • サポートベクターマシン (SVM万能説)
16.
k-近傍法 • とりあえずk-近傍法で組んでみる
• 4000点 • 絶望
17.
出題の意図 • 機械学習で重要なこと
• とりあえずデータを見ろ!! • なにをするにもとりあえずデータを見てみる
18.
データを見る • 特徴:
7個 • 都市: 大阪市内, 京都市内, 神戸市内, 奈良市内 • 間取り: ワンルーム, 1LDK, .... • 種別: マンション, 一戸建て, ...
19.
データを見る • 特徴:
7個 • 専有面積 • 築年数 • 最寄り駅までの所要時間 • 家賃
20.
データを見る • 最初の3つの特徴は分類変数
• 間取りはある程度ソートしてるのである程度連続っぽい(?) • 残りの4つは連続変数
21.
データを見る • 分類変数と連続変数が混ざっている
• うまい扱いを考えないといけない
22.
データを見る • さらによくデータを見てみる
• 実際のデータを手を動かして調べる
23.
データを見る • 都市はあんまり家賃と関係なさそう
• 逆にマンション,一戸建ての違いはかなり大きな影響がある • 間取りの分類番号がソートされているので 番号が高いほど家賃が高くなってそう
24.
k-近傍法 (2回目) •
とりあえず都市のデータは無視する • 建物の種別ごとに学習を分けてみる • つまり4回に分けて学習→テスト • これでk-近傍法をしてみる • 15000点くらい
25.
出題の意図 • 自分が物件を選ぶ時のことを想像してみる
• 部屋が10m2広いのと, 最寄り駅まで10分近いの どちらも同じ価値を持つだろうか?
26.
feature selection •
それぞれの特徴がどれくらい重要か(≒どれだけ相関があるか)を 調べてみる • 貪欲法 • 焼きなまし法
27.
feature selection •
それぞれの特徴の重要度を調べる • それぞれの特徴に対して係数を掛けてやる • この係数の最適値を焼きなましで見つける
28.
feature selection •
学習データの一部をさらに特徴選択のための学習データにする • 残りのデータで精度を調べる • これを繰り返しながら焼きなましをする
29.
k-近傍法 (3回目) •
https://gist.github.com/hiromu/d5ed079e98caea3b008c#file-estate-c • 学習データを2つに分けて10000回焼きなまし • 26000点 (K = 3) • どうしても誤差は出てくるのでこの辺で頭打ちに
30.
ちなみに • 種別ごとに決定木に投げてやる
• 28000点 • さっきより強いけどK-近傍法でもある程度迫れる
31.
ネットオークションを制覇せよ • NPCAの尊敬すべき偉大なOBである博多市のために
絵の判別をする • 出典: http://www.ioi2013.org/wp-content/uploads/tasks/day1/artclass/ Art%20class%20ja%20(JPN).pdf • IOI 2013の問題 (入力データは画像の生データ)
32.
ネットオークションを制覇せよ • 特徴が262144個
• 画像の色分布がそのままデータに突っ込まれてる • 4つのカテゴリに分類する
33.
データを見てみる • データがでかすぎる
• そのままk-近傍法に突っ込むのは大変 • モバイルで落とすことを考えずに 学習データが30MBくらいで申し訳なかったです...
34.
出題の意図 • さっきと同じくデータを見てみる
• すでに可視化されてる!!! • http://yumetaro.info/uploads/a3dcb4d229de6fde0db5686dee47145d/ a3dcb4d229de6fde0db5686dee47145d.zip
35.
出題の意図 • 色ごとにピクセルの数が列挙されていることに意味はあるの?
• そもそも画像のサイズがそれぞれ違う • データ量が大きすぎるので減らしたい
36.
データの前処理 • データ量を減らす
• 隣接するものをまとめてやって64分の1くらいに • 比較しやすい数値にする • ピクセル数ではなくピクセルの割合にする
37.
k-近傍法 • データの前処理をしてとりあえずk-近傍法してみる
• 10000点 • まあ多少はね
38.
データの前処理 • そもそもそれぞれのピクセルの色を学習データとするのが微妙
• 画像を見ると どれくらい色が使われているかとかのほうが重要そう
39.
データの前処理 • 色の分散とかを特徴にしてやればもっと良い点数が出そう
• 時間が足りなかったのでwriter解として作れてない • たぶんかなりいい点数になると思う
40.
おつかれさまでした • 1位
akourryプロ • 2位 catupperプロ • 3位 sugerpoyoプロ
Baixar agora