Enviar pesquisa
Carregar
R-3.0.0でGLM
•
12 gostaram
•
4,866 visualizações
Kazuya Wada
Seguir
第30回Tokyo.Rでの発表資料です
Leia menos
Leia mais
Educação
Vista de apresentação de diapositivos
Denunciar
Compartilhar
Vista de apresentação de diapositivos
Denunciar
Compartilhar
1 de 22
Recomendados
データサイエンティストカジュアルトーク by wdkz
データサイエンティストカジュアルトーク by wdkz
Kazuya Wada
Shiny-Serverあれこれ
Shiny-Serverあれこれ
Kazuya Wada
おばかアプリ選手権1-4 まとめ byシグマコンサルティング 橋本さん
おばかアプリ選手権1-4 まとめ byシグマコンサルティング 橋本さん
atmarkit
20180425 phpstudy-my-first-laravel
20180425 phpstudy-my-first-laravel
Masanori Hayashi
「var禁止」禁止
「var禁止」禁止
Ryota Murohoshi
ワイヤレスディスプレイをつかってみよう!
ワイヤレスディスプレイをつかってみよう!
Yoshitake Takata
「RSpec初心者に送るRSpec最強チュートリアル」発表資料 #sg_study
「RSpec初心者に送るRSpec最強チュートリアル」発表資料 #sg_study
Junichi Ito
Collaborativefilteringwith r
Collaborativefilteringwith r
Teito Nakagawa
Recomendados
データサイエンティストカジュアルトーク by wdkz
データサイエンティストカジュアルトーク by wdkz
Kazuya Wada
Shiny-Serverあれこれ
Shiny-Serverあれこれ
Kazuya Wada
おばかアプリ選手権1-4 まとめ byシグマコンサルティング 橋本さん
おばかアプリ選手権1-4 まとめ byシグマコンサルティング 橋本さん
atmarkit
20180425 phpstudy-my-first-laravel
20180425 phpstudy-my-first-laravel
Masanori Hayashi
「var禁止」禁止
「var禁止」禁止
Ryota Murohoshi
ワイヤレスディスプレイをつかってみよう!
ワイヤレスディスプレイをつかってみよう!
Yoshitake Takata
「RSpec初心者に送るRSpec最強チュートリアル」発表資料 #sg_study
「RSpec初心者に送るRSpec最強チュートリアル」発表資料 #sg_study
Junichi Ito
Collaborativefilteringwith r
Collaborativefilteringwith r
Teito Nakagawa
R3.0.0 is relased
R3.0.0 is relased
Shintaro Fukushima
Fluentd,mongo db,rでお手軽ログ解析環境
Fluentd,mongo db,rでお手軽ログ解析環境
Michitaka Iida
TokyoR:RMarkdownでレポート作成
TokyoR:RMarkdownでレポート作成
Takashi Minoda
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
Nagi Teramo
Rでコンジョイント分析
Rでコンジョイント分析
osamu morimoto
Tokyo r30 beginner
Tokyo r30 beginner
Takashi Minoda
オンラインTVサービスの分析事例
オンラインTVサービスの分析事例
Kazuya Wada
DeployR使ってみた話
DeployR使ってみた話
Kazuya Wada
道玄坂Lt#2 wdkz
道玄坂Lt#2 wdkz
Kazuya Wada
ハイレゾの話
ハイレゾの話
Kazuya Wada
はじめてのShiny
はじめてのShiny
Kazuya Wada
JuliaでGLM
JuliaでGLM
Kazuya Wada
Rで触れる日本経済~RでVAR編~
Rで触れる日本経済~RでVAR編~
Kazuya Wada
RのffでGLMしてみたけど...
RのffでGLMしてみたけど...
Kazuya Wada
そろそろRStudioの話
そろそろRStudioの話
Kazuya Wada
RでつくるWebアプリ~rApache編~
RでつくるWebアプリ~rApache編~
Kazuya Wada
Rでウォーリを探してみた
Rでウォーリを探してみた
Kazuya Wada
Rが苦手な人にもRを使って頂くために~RcommanderとRook~
Rが苦手な人にもRを使って頂くために~RcommanderとRook~
Kazuya Wada
RのffとbigmemoryとRevoScaleRとを比較してみた
RのffとbigmemoryとRevoScaleRとを比較してみた
Kazuya Wada
RでGPU使ってみた
RでGPU使ってみた
Kazuya Wada
Tokyo.R#16 wdkz
Tokyo.R#16 wdkz
Kazuya Wada
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
Ken Fukui
Mais conteúdo relacionado
Destaque
R3.0.0 is relased
R3.0.0 is relased
Shintaro Fukushima
Fluentd,mongo db,rでお手軽ログ解析環境
Fluentd,mongo db,rでお手軽ログ解析環境
Michitaka Iida
TokyoR:RMarkdownでレポート作成
TokyoR:RMarkdownでレポート作成
Takashi Minoda
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
Nagi Teramo
Rでコンジョイント分析
Rでコンジョイント分析
osamu morimoto
Tokyo r30 beginner
Tokyo r30 beginner
Takashi Minoda
Destaque
(6)
R3.0.0 is relased
R3.0.0 is relased
Fluentd,mongo db,rでお手軽ログ解析環境
Fluentd,mongo db,rでお手軽ログ解析環境
TokyoR:RMarkdownでレポート作成
TokyoR:RMarkdownでレポート作成
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
Rでコンジョイント分析
Rでコンジョイント分析
Tokyo r30 beginner
Tokyo r30 beginner
Mais de Kazuya Wada
オンラインTVサービスの分析事例
オンラインTVサービスの分析事例
Kazuya Wada
DeployR使ってみた話
DeployR使ってみた話
Kazuya Wada
道玄坂Lt#2 wdkz
道玄坂Lt#2 wdkz
Kazuya Wada
ハイレゾの話
ハイレゾの話
Kazuya Wada
はじめてのShiny
はじめてのShiny
Kazuya Wada
JuliaでGLM
JuliaでGLM
Kazuya Wada
Rで触れる日本経済~RでVAR編~
Rで触れる日本経済~RでVAR編~
Kazuya Wada
RのffでGLMしてみたけど...
RのffでGLMしてみたけど...
Kazuya Wada
そろそろRStudioの話
そろそろRStudioの話
Kazuya Wada
RでつくるWebアプリ~rApache編~
RでつくるWebアプリ~rApache編~
Kazuya Wada
Rでウォーリを探してみた
Rでウォーリを探してみた
Kazuya Wada
Rが苦手な人にもRを使って頂くために~RcommanderとRook~
Rが苦手な人にもRを使って頂くために~RcommanderとRook~
Kazuya Wada
RのffとbigmemoryとRevoScaleRとを比較してみた
RのffとbigmemoryとRevoScaleRとを比較してみた
Kazuya Wada
RでGPU使ってみた
RでGPU使ってみた
Kazuya Wada
Tokyo.R#16 wdkz
Tokyo.R#16 wdkz
Kazuya Wada
Mais de Kazuya Wada
(15)
オンラインTVサービスの分析事例
オンラインTVサービスの分析事例
DeployR使ってみた話
DeployR使ってみた話
道玄坂Lt#2 wdkz
道玄坂Lt#2 wdkz
ハイレゾの話
ハイレゾの話
はじめてのShiny
はじめてのShiny
JuliaでGLM
JuliaでGLM
Rで触れる日本経済~RでVAR編~
Rで触れる日本経済~RでVAR編~
RのffでGLMしてみたけど...
RのffでGLMしてみたけど...
そろそろRStudioの話
そろそろRStudioの話
RでつくるWebアプリ~rApache編~
RでつくるWebアプリ~rApache編~
Rでウォーリを探してみた
Rでウォーリを探してみた
Rが苦手な人にもRを使って頂くために~RcommanderとRook~
Rが苦手な人にもRを使って頂くために~RcommanderとRook~
RのffとbigmemoryとRevoScaleRとを比較してみた
RのffとbigmemoryとRevoScaleRとを比較してみた
RでGPU使ってみた
RでGPU使ってみた
Tokyo.R#16 wdkz
Tokyo.R#16 wdkz
Último
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
Ken Fukui
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
Ken Fukui
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
inspirehighstaff03
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
inspirehighstaff03
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
inspirehighstaff03
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
inspirehighstaff03
My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」
inspirehighstaff03
What I did before opening my business..pdf
What I did before opening my business..pdf
oganekyokoi
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
Ken Fukui
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
inspirehighstaff03
TEAMIN Service overview for customer_20240422.pdf
TEAMIN Service overview for customer_20240422.pdf
yukisuga3
My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」
inspirehighstaff03
My Inspire High Award 2024 「正義って存在するの?」
My Inspire High Award 2024 「正義って存在するの?」
inspirehighstaff03
My Inspire High Award 2024「なぜ議会への関心が低いのか?」
My Inspire High Award 2024「なぜ議会への関心が低いのか?」
inspirehighstaff03
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライド
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライド
Ken Fukui
Establishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdf
oganekyokoi
International Politics I - Lecture 1
International Politics I - Lecture 1
Toru Oga
Divorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdf
oganekyokoi
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライド
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライド
Ken Fukui
My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」
inspirehighstaff03
Último
(20)
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」
What I did before opening my business..pdf
What I did before opening my business..pdf
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
TEAMIN Service overview for customer_20240422.pdf
TEAMIN Service overview for customer_20240422.pdf
My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「正義って存在するの?」
My Inspire High Award 2024 「正義って存在するの?」
My Inspire High Award 2024「なぜ議会への関心が低いのか?」
My Inspire High Award 2024「なぜ議会への関心が低いのか?」
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライド
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライド
Establishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdf
International Politics I - Lecture 1
International Politics I - Lecture 1
Divorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdf
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライド
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライド
My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」
R-3.0.0でGLM
1.
R-3.0.0を使ってみてわかった1つのこと 2013/04/20 Tokyo.R#30 和田 計也 サイバー系
2.
2013/04/20 はじめに ※この発表は個人の見 解であり、所属する組 織の公式見解ではあり ません。 サイバー系 2
3.
2013/04/20 u和田 計也(@wdkz) u 静岡県袋井市出身 uサイバー系企業でデータマイニングエンジニア職 u
最近は奥華子ばっか聴いてます u前職はバイオベンチャー u バイオマーカ探索してた u 学生時代は枯草菌の研究 自己紹介 サイバー系 3
4.
2013/04/20 いきなりですが サイバー系 u祝!!Tokyo.R 30回達成 u祝!!R-3.0.0リリース 4
5.
2013/04/20 R-3.0.0の特徴 サイバー系 u 一番のハイライトは2^31-1以上の長さのベクトル対応 5 http://blog.revolutionanalytics.com/2012/07/big- vectors-coming-to-r.html
6.
2013/04/20 kohskeさんのまとめがめっちゃわかりやすい! サイバー系 6 http://qiita.com/items/2d21344ba11d030c3cf0 挙動が微妙って...
7.
2013/04/20 早速トライR-3.0.0 サイバー系 u 2^31-1の呪縛からの脱却っぷりを試してみよう! u 使用データはもちろんairline(からカラム選択した)データ ・約1.2億行
x 6列 ・使用マシンは244Gbyte メモリのやつ ・OSは64bit Ubuntu12.04 7
8.
2013/04/20 (参考)怪物マシンは サイバー系 u AWS利用した 8 スポットインスタンスなら$0.35/hrぐらい
9.
2013/04/20 UbuntuマシンにR-3.0.0をセットアップ サイバー系 u cranミラーとか利用するとapt-getで3.0.0が入らないよ 9 設定ファイルをちょいと変更 $ sudo
vi /etc/apt/sources.list deb http://ppa.launchpad.net/marutter/rdev/ubuntu precise main deb-src http://ppa.launchpad.net/marutter/rdev/ubuntu precise main #(12.10の場合はquantalね) $sudo add-apt-repository ppa:gwibber-daily/ppa $ sudo apt-get update $ sudo apt-get install r-base ↑これでR-3.0.0がインストールできる http://www.personal.psu.edu/mar36/blogs/the_ubuntu_r_blog/ 2013/03/moving-to-r-300-on-ubuntu.html (2013/04/19現在)
10.
2013/04/20 R-3.0.0起動 サイバー系 10 OSのメモリは240Gbyte弱
11.
2013/04/20 airline.csv(カラム選択済み)読み込み サイバー系 11 1.2億行程度なら2^31-1(≒21.4億) まで達してないからR-2系でも read.csv等でデータセットを読み込む ところまでは可能だった そもそもこのairlineどうやって作ってるよ? って疑問を持った人は→の資料を参照
12.
2013/04/20 (参考)R-2.15.3だともちろん爆死 サイバー系 12 Rのバージョンは2.15.3 読み込んだairlineは3Gbyte弱 読み込んだairlineは1.2億行 x 6列 はい爆死 OSのメモリは240Gbyte弱
13.
2013/04/20 待望のR-3.0.0だと... サイバー系 Rのバージョンは3.0.0 !? あとは一緒 13
14.
2013/04/20 待望のR-3.0.0だと... サイバー系 14 u tracebackを見ると、glm関数内で呼び出してる model.matrix関数でエラってるっぽい !? 確かにmodel.matrix関数でエラーが再現した
15.
2013/04/20 戦略 サイバー系 u R-3.0.0は2^31-1以上の要素数を持つmatrixを扱うことが できるようになったが、model.matrix関数でデザイン行列 を作成しようとすると(デカいmatrixの場合に)エラーになる u 仕方ないので以下のようにやってみた i)
Year毎にmatrixを分割して ii) それぞれでmodel.matrixを適用させデザイン行列を 作成して iii) それぞれcsvファイルに出力して iv) 全csvファイルを結合して v) ↑この結合したcsvファイルをread.csvで読み込む 15 model.matrix後の要素数が2^31以上
16.
2013/04/20 仕方ない... サイバー系 16 #formula object <- Cancelled
~ Year + Month + DayOfWeek + CRSElapsedTime + Distance #NA除外しとかないとmodel.matrixの返り値とnrowが異なっちゃう airline <- airline[-which(is.na(airline$CRSElapsedTime) | is.na(airline$Distance)),] chunk.level <- levels(as.factor(data[,chunk])) for(i in 1:length(chunk.level)){ assign(paste("airline", chunk.level[i], sep=""), subset(airline, Year==chunk.level[i])) assign(paste("mm", chunk.level[i], sep=""), model.matrix(object, data=get(paste("airline", chunk.level[i], sep="")))) write.table(get(paste("mm", chunk.level[i], sep="")), file=paste("mm", chunk.level[i], ".csv", sep=""), sep=",", col.names=ifelse(i==1,T,F), row.names=F, quote=F) } csv_files <- dir()[grep("^mmd{4}.csv$", dir())] cmd_str <- paste("cat ", paste(csv_files, collapse=" "), " > mm.csv", sep="") system(cmd_str) airline.mm <- read.table("mm.csv", sep=",", skip=1, header=F) clname <- as.character(read.table("mm.csv", sep=",", nrows=1, stringsAsFactors=F)) colnames(airline.mm) <- clname read.csv使うと(メモリ量が充分でない場合に)コケる場合があった。 その場合はカラム名なしでread.table後にカラム名を付けるとOKだった
17.
2013/04/20 デザイン行列のcsvファイルを作るまで サイバー系 17
18.
2013/04/20 デザイン行列を読み込む サイバー系 18
19.
2013/04/20 そしてGLMへ サイバー系 19
20.
2013/04/20 GLMの結果が出た!! サイバー系 20 48G byte !!
21.
2013/04/20 R-3.0.0の時代がやってきた。 サイバー系 21 u airlineのような1.2億行程度のミドルデータなら、メモリに データを載せてRの標準関数で分析できる時代が到来した!! ただし元データがR上で3Gbyte弱だったとしても、 glmするのに200G byte弱のメモリが必要...
22.
2013/04/20 最後に サイバー系 R-3.0.0を使ってみてわかった、ただ1つのこと 22 相変わらず memory not mapped
エラーは出ます!!