SlideShare uma empresa Scribd logo
1 de 2
Baixar para ler offline
# データのロード
data(state)
# 使用データは state.x77。50 データ 8 変数。
state.x77 # データ一覧
# 01A どのようなデータか眺めてみよう
summary(state.x77) ##### 基本統計量
pairs(state.x77) ##### 散布図行列描画
# 散布図行列を A4 サイズの png 形式で保存
png(filename="pairs_x77.png", width=1654, height=2339, pointsize = 32) #### 200 dpi A4 縦
pairs(state.x77) ##### 散布図行列描画
dev.off()
# 8 変数のヒストグラムを A4 サイズにまとめて描画、png 形式保存
require(MASS) # truehist 関数が収録されているパッケージ
png(filename="hist_x77.png", width=1654, height=2339, pointsize = 32) #### 200 dpi A4 縦
par(mfrow=c(4,2)) # 4 行 2 列に画面分割
for (i in 1:8) truehist(state.x77[,i], xlab=colnames(state.x77)[i])
dev.off()
# 因子分析
# R では因子の数はユーザが指定する
# いくつか試してみて、最適な数を決める
fac2 <- factanal(state.x77, factors=2)
fac3 <- factanal(state.x77, factors=3)
fac4 <- factanal(state.x77, factors=4)
fac5 <- factanal(state.x77, factors=5)
# 因子数を選ぶ
# ここでは元のデータの情報の大部分をカバーするよりも、
# 解釈しやすい因子を選択する方針とするので、まず因子負荷量
# をみて解釈可能性を検討する
# 因子負荷量: 各変数の因子への貢献
par(mfrow=c(1,2)) # 1 行 2 列に画面分割
barplot(fac2$loading[,1], las=2)
barplot(fac2$loading[,2], las=2)
par(mfrow=c(2,2)) # 2 行 2 列に画面分割
barplot(fac3$loading[,1], las=2)
barplot(fac3$loading[,2], las=2)
barplot(fac3$loading[,3], las=2)
par(mfrow=c(2,2)) # 2 行 2 列に画面分割
barplot(fac4$loading[,1], las=2)
barplot(fac4$loading[,2], las=2)
barplot(fac4$loading[,3], las=2)
barplot(fac4$loading[,4], las=2)
# 独自因子: モデルで説明できない情報の比率
round(fac2$uniquenesses, 3)
round(fac3$uniquenesses, 3)
round(fac4$uniquenesses, 3)
# 因子分析の因子得点(ここでは 2 因子)を res1 に格納
res1 <- factanal(state.x77, factors=2, scores="Bartlett")$scores
# クラスター分析
res1.hc <- hclust(dist(res1), method="single") # 最近隣法
#res1.hc <- hclust(dist(res1), method="ward.D2")
par(mfrow=c(1,1)) # 画面分割を元に戻す
plot(res1.hc) # デンドログラム表示
# デンドログラムを A4 横にファイル出力
png(filename="Dendrgram_x77.png", width=2339, height=1654, pointsize = 32) #### 200 dpi
A4 縦
plot(res1.hc) # デンドログラム表示
dev.off()
# とりあえずいくつかに分類してみる
res1.cl6 <- cutree(res1.hc,k=6)
res1.cl8 <- cutree(res1.hc,k=8)
res1.cl10 <- cutree(res1.hc,k=10)
# 因子負荷量のプロット、分類色分けで
plot(res1, col=rainbow(10)[res1.cl10], pch=20, ylim=c(-2,3.5), xlim=c(-2,2.5))
abline(h=-3:3, v=-3:3, col="gray", lty=3)
text(res1, rownames(state.x77))
points(res1, pch=20, col=rainbow(10)[res1.cl10])
############################################################

Mais conteúdo relacionado

Destaque (12)

Raufu Oluwatoyin cv ssss
Raufu Oluwatoyin cv ssssRaufu Oluwatoyin cv ssss
Raufu Oluwatoyin cv ssss
 
CTEC 2011
CTEC 2011CTEC 2011
CTEC 2011
 
Kingspan Range - Trinity 3c
Kingspan Range - Trinity 3cKingspan Range - Trinity 3c
Kingspan Range - Trinity 3c
 
Vicios del lenguaje
Vicios del lenguajeVicios del lenguaje
Vicios del lenguaje
 
PSU Clim Ch Sep 2 dft
PSU Clim Ch  Sep 2 dftPSU Clim Ch  Sep 2 dft
PSU Clim Ch Sep 2 dft
 
Ref ltr for Crystal Quinn
Ref ltr for Crystal QuinnRef ltr for Crystal Quinn
Ref ltr for Crystal Quinn
 
MilitaryAssistedUGVwithIntegratedRoboticArm
MilitaryAssistedUGVwithIntegratedRoboticArmMilitaryAssistedUGVwithIntegratedRoboticArm
MilitaryAssistedUGVwithIntegratedRoboticArm
 
Ed cívica 3ero plan de trabajo - dic 2015
Ed  cívica 3ero   plan de trabajo - dic 2015Ed  cívica 3ero   plan de trabajo - dic 2015
Ed cívica 3ero plan de trabajo - dic 2015
 
Origen del idioma español
Origen del idioma españolOrigen del idioma español
Origen del idioma español
 
Managing HR to Leading HR
Managing HR to Leading HRManaging HR to Leading HR
Managing HR to Leading HR
 
Phrasal verbs
Phrasal verbsPhrasal verbs
Phrasal verbs
 
Pgl ishareEV presentation Project Green Leaf
Pgl ishareEV presentation Project Green LeafPgl ishareEV presentation Project Green Leaf
Pgl ishareEV presentation Project Green Leaf
 

Semelhante a Rプログラミング03 「データ分析編」デモ

Rにおける大規模データ解析(第10回TokyoWebMining)
Rにおける大規模データ解析(第10回TokyoWebMining)Rにおける大規模データ解析(第10回TokyoWebMining)
Rにおける大規模データ解析(第10回TokyoWebMining)
Shintaro Fukushima
 
初心者講習会資料(Osaka.R#5)
初心者講習会資料(Osaka.R#5)初心者講習会資料(Osaka.R#5)
初心者講習会資料(Osaka.R#5)
Masahiro Hayashi
 

Semelhante a Rプログラミング03 「データ分析編」デモ (10)

dvipdfmxと3つのバッド・ノウハウ
dvipdfmxと3つのバッド・ノウハウdvipdfmxと3つのバッド・ノウハウ
dvipdfmxと3つのバッド・ノウハウ
 
統計環境R_データ入出力編2016
統計環境R_データ入出力編2016統計環境R_データ入出力編2016
統計環境R_データ入出力編2016
 
Rプログラミング02 データ入出力編
Rプログラミング02 データ入出力編Rプログラミング02 データ入出力編
Rプログラミング02 データ入出力編
 
R intro
R introR intro
R intro
 
Rにおける大規模データ解析(第10回TokyoWebMining)
Rにおける大規模データ解析(第10回TokyoWebMining)Rにおける大規模データ解析(第10回TokyoWebMining)
Rにおける大規模データ解析(第10回TokyoWebMining)
 
㉗HTML5+jQueryでお絵かき
㉗HTML5+jQueryでお絵かき㉗HTML5+jQueryでお絵かき
㉗HTML5+jQueryでお絵かき
 
RLアーキテクチャ勉強会 MERLIN
RLアーキテクチャ勉強会 MERLINRLアーキテクチャ勉強会 MERLIN
RLアーキテクチャ勉強会 MERLIN
 
R言語勉強会#10.pdf
R言語勉強会#10.pdfR言語勉強会#10.pdf
R言語勉強会#10.pdf
 
End challenge Part1
End challenge Part1End challenge Part1
End challenge Part1
 
初心者講習会資料(Osaka.R#5)
初心者講習会資料(Osaka.R#5)初心者講習会資料(Osaka.R#5)
初心者講習会資料(Osaka.R#5)
 

Mais de wada, kazumi

Mais de wada, kazumi (20)

Rによる繰り返しの並列処理
Rによる繰り返しの並列処理Rによる繰り返しの並列処理
Rによる繰り返しの並列処理
 
2018Rユーザ会用
2018Rユーザ会用2018Rユーザ会用
2018Rユーザ会用
 
Ⅳ. 可視化事例集 2017
Ⅳ. 可視化事例集 2017Ⅳ. 可視化事例集 2017
Ⅳ. 可視化事例集 2017
 
Ⅲ. 資料編 2017
Ⅲ. 資料編 2017Ⅲ. 資料編 2017
Ⅲ. 資料編 2017
 
Ⅱ. データ分析編 2017
Ⅱ. データ分析編 2017Ⅱ. データ分析編 2017
Ⅱ. データ分析編 2017
 
Ⅰ. Rの基礎 2017
Ⅰ. Rの基礎 2017Ⅰ. Rの基礎 2017
Ⅰ. Rの基礎 2017
 
2017Rユーザ会用
2017Rユーザ会用2017Rユーザ会用
2017Rユーザ会用
 
Rデモ03_データ分析編2016
Rデモ03_データ分析編2016Rデモ03_データ分析編2016
Rデモ03_データ分析編2016
 
Rデモ02_入出力編2016
Rデモ02_入出力編2016Rデモ02_入出力編2016
Rデモ02_入出力編2016
 
Rデモ01_はじめの一歩2016
Rデモ01_はじめの一歩2016Rデモ01_はじめの一歩2016
Rデモ01_はじめの一歩2016
 
統計環境R_データ分析編2016
統計環境R_データ分析編2016統計環境R_データ分析編2016
統計環境R_データ分析編2016
 
統計環境R_はじめの一歩2016
統計環境R_はじめの一歩2016統計環境R_はじめの一歩2016
統計環境R_はじめの一歩2016
 
自然科学の統計学2.2 slideshare
自然科学の統計学2.2 slideshare自然科学の統計学2.2 slideshare
自然科学の統計学2.2 slideshare
 
Rプログラミング03 データ分析編
Rプログラミング03 データ分析編Rプログラミング03 データ分析編
Rプログラミング03 データ分析編
 
Rプログラミング02 「データ入出力編」デモ
Rプログラミング02 「データ入出力編」デモRプログラミング02 「データ入出力編」デモ
Rプログラミング02 「データ入出力編」デモ
 
Rプログラミング01 「はじめの一歩」 演習デモ
Rプログラミング01 「はじめの一歩」 演習デモRプログラミング01 「はじめの一歩」 演習デモ
Rプログラミング01 「はじめの一歩」 演習デモ
 
Rプログラミング01 はじめの一歩
Rプログラミング01 はじめの一歩Rプログラミング01 はじめの一歩
Rプログラミング01 はじめの一歩
 
Rでのtry関数によるエラー処理
Rでのtry関数によるエラー処理Rでのtry関数によるエラー処理
Rでのtry関数によるエラー処理
 
Rによる大規模データのプロット
Rによる大規模データのプロットRによる大規模データのプロット
Rによる大規模データのプロット
 
擬似ミクロデータについて
擬似ミクロデータについて擬似ミクロデータについて
擬似ミクロデータについて
 

Último

The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
koheioishi1
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
YukiTerazawa
 

Último (7)

The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
 
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
 
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
 
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
 

Rプログラミング03 「データ分析編」デモ

  • 1. # データのロード data(state) # 使用データは state.x77。50 データ 8 変数。 state.x77 # データ一覧 # 01A どのようなデータか眺めてみよう summary(state.x77) ##### 基本統計量 pairs(state.x77) ##### 散布図行列描画 # 散布図行列を A4 サイズの png 形式で保存 png(filename="pairs_x77.png", width=1654, height=2339, pointsize = 32) #### 200 dpi A4 縦 pairs(state.x77) ##### 散布図行列描画 dev.off() # 8 変数のヒストグラムを A4 サイズにまとめて描画、png 形式保存 require(MASS) # truehist 関数が収録されているパッケージ png(filename="hist_x77.png", width=1654, height=2339, pointsize = 32) #### 200 dpi A4 縦 par(mfrow=c(4,2)) # 4 行 2 列に画面分割 for (i in 1:8) truehist(state.x77[,i], xlab=colnames(state.x77)[i]) dev.off() # 因子分析 # R では因子の数はユーザが指定する # いくつか試してみて、最適な数を決める fac2 <- factanal(state.x77, factors=2) fac3 <- factanal(state.x77, factors=3) fac4 <- factanal(state.x77, factors=4) fac5 <- factanal(state.x77, factors=5) # 因子数を選ぶ # ここでは元のデータの情報の大部分をカバーするよりも、 # 解釈しやすい因子を選択する方針とするので、まず因子負荷量 # をみて解釈可能性を検討する # 因子負荷量: 各変数の因子への貢献 par(mfrow=c(1,2)) # 1 行 2 列に画面分割 barplot(fac2$loading[,1], las=2) barplot(fac2$loading[,2], las=2) par(mfrow=c(2,2)) # 2 行 2 列に画面分割 barplot(fac3$loading[,1], las=2) barplot(fac3$loading[,2], las=2) barplot(fac3$loading[,3], las=2)
  • 2. par(mfrow=c(2,2)) # 2 行 2 列に画面分割 barplot(fac4$loading[,1], las=2) barplot(fac4$loading[,2], las=2) barplot(fac4$loading[,3], las=2) barplot(fac4$loading[,4], las=2) # 独自因子: モデルで説明できない情報の比率 round(fac2$uniquenesses, 3) round(fac3$uniquenesses, 3) round(fac4$uniquenesses, 3) # 因子分析の因子得点(ここでは 2 因子)を res1 に格納 res1 <- factanal(state.x77, factors=2, scores="Bartlett")$scores # クラスター分析 res1.hc <- hclust(dist(res1), method="single") # 最近隣法 #res1.hc <- hclust(dist(res1), method="ward.D2") par(mfrow=c(1,1)) # 画面分割を元に戻す plot(res1.hc) # デンドログラム表示 # デンドログラムを A4 横にファイル出力 png(filename="Dendrgram_x77.png", width=2339, height=1654, pointsize = 32) #### 200 dpi A4 縦 plot(res1.hc) # デンドログラム表示 dev.off() # とりあえずいくつかに分類してみる res1.cl6 <- cutree(res1.hc,k=6) res1.cl8 <- cutree(res1.hc,k=8) res1.cl10 <- cutree(res1.hc,k=10) # 因子負荷量のプロット、分類色分けで plot(res1, col=rainbow(10)[res1.cl10], pch=20, ylim=c(-2,3.5), xlim=c(-2,2.5)) abline(h=-3:3, v=-3:3, col="gray", lty=3) text(res1, rownames(state.x77)) points(res1, pch=20, col=rainbow(10)[res1.cl10]) ############################################################