Enviar pesquisa
Carregar
データベースのお話
•
Transferir como KEY, PDF
•
7 gostaram
•
3,176 visualizações
Hidekazu Tanaka
Seguir
第24回R勉強会@東京(#TokyoR)で発表したスライド
Leia menos
Leia mais
Tecnologia
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 30
Baixar agora
Recomendados
RとSQLiteで気軽にデータベース作成
RとSQLiteで気軽にデータベース作成
弘毅 露崎
R以外の研究ツール
R以外の研究ツール
弘毅 露崎
20120913 nosql@hikarie(okuyama fuse)
20120913 nosql@hikarie(okuyama fuse)
Takahiro Iwase
カジュアルにバックアップ - MySQL Casual Talks 福岡
カジュアルにバックアップ - MySQL Casual Talks 福岡
Aya Komuro
コード読経会報告書
コード読経会報告書
Masahiko Toyoshi
カウチなやつら CouchDB in the room
カウチなやつら CouchDB in the room
Makoto Ohnami
カジュアルにソースコードリーディング
カジュアルにソースコードリーディング
Akihiro Okuno
Bgworkerで簡易クラスタ管理
Bgworkerで簡易クラスタ管理
Masahiko Sawada
Recomendados
RとSQLiteで気軽にデータベース作成
RとSQLiteで気軽にデータベース作成
弘毅 露崎
R以外の研究ツール
R以外の研究ツール
弘毅 露崎
20120913 nosql@hikarie(okuyama fuse)
20120913 nosql@hikarie(okuyama fuse)
Takahiro Iwase
カジュアルにバックアップ - MySQL Casual Talks 福岡
カジュアルにバックアップ - MySQL Casual Talks 福岡
Aya Komuro
コード読経会報告書
コード読経会報告書
Masahiko Toyoshi
カウチなやつら CouchDB in the room
カウチなやつら CouchDB in the room
Makoto Ohnami
カジュアルにソースコードリーディング
カジュアルにソースコードリーディング
Akihiro Okuno
Bgworkerで簡易クラスタ管理
Bgworkerで簡易クラスタ管理
Masahiko Sawada
Programming under capability mode
Programming under capability mode
Yuichiro Naito
社内勉強会02 シリアライズ[公開用]
社内勉強会02 シリアライズ[公開用]
Keme Sato
MongoDB Configパラメータ解説
MongoDB Configパラメータ解説
Shoken Fujisaki
DeclarativeSql
DeclarativeSql
Takaaki Suzuki
WebAppDev勉強会 #2 at cafe? IKAGAWA DO
WebAppDev勉強会 #2 at cafe? IKAGAWA DO
Kohei Noda
CasualなMongoDBのサービス運用Tips
CasualなMongoDBのサービス運用Tips
Naoki Sega
月間10億pvを支えるmongo db
月間10億pvを支えるmongo db
Yuji Isobe
MySQL 初めてのチューニング
MySQL 初めてのチューニング
Craft works
MongoDBのアレをアレする
MongoDBのアレをアレする
Akihiro Kuwano
仮想ネットワーク構築8枚slide
仮想ネットワーク構築8枚slide
k009c1271
Pg14_sql_standard_function_body
Pg14_sql_standard_function_body
kasaharatt
Custom Package Building with Poudriere
Custom Package Building with Poudriere
Yuichiro Naito
Redis Intro Osc2010 Tokyo Spring
Redis Intro Osc2010 Tokyo Spring
Makoto Ohnami
HDPをWindowsで動かしてみた
HDPをWindowsで動かしてみた
adachij2002
カジュアルにMongo dbのbackup機能説明
カジュアルにMongo dbのbackup機能説明
Masakazu Matsushita
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
Postgre sql9.3 newlockmode_and_etc
Postgre sql9.3 newlockmode_and_etc
kasaharatt
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
Shinsuke Sugaya
Ctb57 with god7
Ctb57 with god7
kingtomo
hiding
hiding
cookies 146
アナリティクスをPostgreSQLで始めるべき10の理由@第6回 関西DB勉強会
アナリティクスをPostgreSQLで始めるべき10の理由@第6回 関西DB勉強会
Satoshi Nagayasu
1台から500台までのMySQL運用(YAPC::Asia編)
1台から500台までのMySQL運用(YAPC::Asia編)
Masahiro Nagano
Mais conteúdo relacionado
Mais procurados
Programming under capability mode
Programming under capability mode
Yuichiro Naito
社内勉強会02 シリアライズ[公開用]
社内勉強会02 シリアライズ[公開用]
Keme Sato
MongoDB Configパラメータ解説
MongoDB Configパラメータ解説
Shoken Fujisaki
DeclarativeSql
DeclarativeSql
Takaaki Suzuki
WebAppDev勉強会 #2 at cafe? IKAGAWA DO
WebAppDev勉強会 #2 at cafe? IKAGAWA DO
Kohei Noda
CasualなMongoDBのサービス運用Tips
CasualなMongoDBのサービス運用Tips
Naoki Sega
月間10億pvを支えるmongo db
月間10億pvを支えるmongo db
Yuji Isobe
MySQL 初めてのチューニング
MySQL 初めてのチューニング
Craft works
MongoDBのアレをアレする
MongoDBのアレをアレする
Akihiro Kuwano
仮想ネットワーク構築8枚slide
仮想ネットワーク構築8枚slide
k009c1271
Pg14_sql_standard_function_body
Pg14_sql_standard_function_body
kasaharatt
Custom Package Building with Poudriere
Custom Package Building with Poudriere
Yuichiro Naito
Redis Intro Osc2010 Tokyo Spring
Redis Intro Osc2010 Tokyo Spring
Makoto Ohnami
HDPをWindowsで動かしてみた
HDPをWindowsで動かしてみた
adachij2002
カジュアルにMongo dbのbackup機能説明
カジュアルにMongo dbのbackup機能説明
Masakazu Matsushita
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
Postgre sql9.3 newlockmode_and_etc
Postgre sql9.3 newlockmode_and_etc
kasaharatt
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
Shinsuke Sugaya
Ctb57 with god7
Ctb57 with god7
kingtomo
hiding
hiding
cookies 146
Mais procurados
(20)
Programming under capability mode
Programming under capability mode
社内勉強会02 シリアライズ[公開用]
社内勉強会02 シリアライズ[公開用]
MongoDB Configパラメータ解説
MongoDB Configパラメータ解説
DeclarativeSql
DeclarativeSql
WebAppDev勉強会 #2 at cafe? IKAGAWA DO
WebAppDev勉強会 #2 at cafe? IKAGAWA DO
CasualなMongoDBのサービス運用Tips
CasualなMongoDBのサービス運用Tips
月間10億pvを支えるmongo db
月間10億pvを支えるmongo db
MySQL 初めてのチューニング
MySQL 初めてのチューニング
MongoDBのアレをアレする
MongoDBのアレをアレする
仮想ネットワーク構築8枚slide
仮想ネットワーク構築8枚slide
Pg14_sql_standard_function_body
Pg14_sql_standard_function_body
Custom Package Building with Poudriere
Custom Package Building with Poudriere
Redis Intro Osc2010 Tokyo Spring
Redis Intro Osc2010 Tokyo Spring
HDPをWindowsで動かしてみた
HDPをWindowsで動かしてみた
カジュアルにMongo dbのbackup機能説明
カジュアルにMongo dbのbackup機能説明
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Postgre sql9.3 newlockmode_and_etc
Postgre sql9.3 newlockmode_and_etc
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
Ctb57 with god7
Ctb57 with god7
hiding
hiding
Semelhante a データベースのお話
アナリティクスをPostgreSQLで始めるべき10の理由@第6回 関西DB勉強会
アナリティクスをPostgreSQLで始めるべき10の理由@第6回 関西DB勉強会
Satoshi Nagayasu
1台から500台までのMySQL運用(YAPC::Asia編)
1台から500台までのMySQL運用(YAPC::Asia編)
Masahiro Nagano
データベースシステム論09 - SQL応用演習2 ビューとトリガ、アクセス権
データベースシステム論09 - SQL応用演習2 ビューとトリガ、アクセス権
Shohei Yokoyama
Dat009 クラウドでビック
Dat009 クラウドでビック
Tech Summit 2016
081108huge_data.ppt
081108huge_data.ppt
Naoya Ito
Dat009 クラウドでビック
Dat009 クラウドでビック
Tech Summit 2016
PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門
じゅん なかざ
2019年度 若手技術者向け講座 DBMSの機能
2019年度 若手技術者向け講座 DBMSの機能
keki3
Tokyo r47 beginner_2
Tokyo r47 beginner_2
Takashi Minoda
Impala 2.0 Update 日本語版 #impalajp
Impala 2.0 Update 日本語版 #impalajp
Cloudera Japan
20170329 D3 DBAが夜間メンテをしなくなった日 発表資料
20170329 D3 DBAが夜間メンテをしなくなった日 発表資料
dcubeio
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [実践編]
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [実践編]
Hideo Takagi
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤と
Toru Takahashi
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤と
Toru Takahashi
Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114
Satoru Ishikawa
[中国地方DB勉強会] 第22回 Webアプリ開発をデータベース側から変革していく - MySQL 8.0新機能
[中国地方DB勉強会] 第22回 Webアプリ開発をデータベース側から変革していく - MySQL 8.0新機能
Ryusuke Kajiyama
20160121 データサイエンティスト協会 木曜セミナー #5
20160121 データサイエンティスト協会 木曜セミナー #5
Koichiro Sasaki
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
Hideo Takagi
経済学のための実践的データ分析 4.SQL ことはじめ
経済学のための実践的データ分析 4.SQL ことはじめ
Yasushi Hara
Data consistency 入門 data partitioning ガイダンス
Data consistency 入門 data partitioning ガイダンス
Masayuki Ozawa
Semelhante a データベースのお話
(20)
アナリティクスをPostgreSQLで始めるべき10の理由@第6回 関西DB勉強会
アナリティクスをPostgreSQLで始めるべき10の理由@第6回 関西DB勉強会
1台から500台までのMySQL運用(YAPC::Asia編)
1台から500台までのMySQL運用(YAPC::Asia編)
データベースシステム論09 - SQL応用演習2 ビューとトリガ、アクセス権
データベースシステム論09 - SQL応用演習2 ビューとトリガ、アクセス権
Dat009 クラウドでビック
Dat009 クラウドでビック
081108huge_data.ppt
081108huge_data.ppt
Dat009 クラウドでビック
Dat009 クラウドでビック
PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門
2019年度 若手技術者向け講座 DBMSの機能
2019年度 若手技術者向け講座 DBMSの機能
Tokyo r47 beginner_2
Tokyo r47 beginner_2
Impala 2.0 Update 日本語版 #impalajp
Impala 2.0 Update 日本語版 #impalajp
20170329 D3 DBAが夜間メンテをしなくなった日 発表資料
20170329 D3 DBAが夜間メンテをしなくなった日 発表資料
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [実践編]
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [実践編]
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤と
Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114
[中国地方DB勉強会] 第22回 Webアプリ開発をデータベース側から変革していく - MySQL 8.0新機能
[中国地方DB勉強会] 第22回 Webアプリ開発をデータベース側から変革していく - MySQL 8.0新機能
20160121 データサイエンティスト協会 木曜セミナー #5
20160121 データサイエンティスト協会 木曜セミナー #5
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
経済学のための実践的データ分析 4.SQL ことはじめ
経済学のための実践的データ分析 4.SQL ことはじめ
Data consistency 入門 data partitioning ガイダンス
Data consistency 入門 data partitioning ガイダンス
Mais de Hidekazu Tanaka
ggplot2 に入門してみた
ggplot2 に入門してみた
Hidekazu Tanaka
フォントのお話
フォントのお話
Hidekazu Tanaka
フォントのお話
フォントのお話
Hidekazu Tanaka
バギングで構築された各決定木
バギングで構築された各決定木
Hidekazu Tanaka
アンサンブル学習
アンサンブル学習
Hidekazu Tanaka
RHadoop の紹介
RHadoop の紹介
Hidekazu Tanaka
Rの紹介
Rの紹介
Hidekazu Tanaka
Rで解く最適化問題 線型計画問題編
Rで解く最適化問題 線型計画問題編
Hidekazu Tanaka
R meets Hadoop
R meets Hadoop
Hidekazu Tanaka
RでMapreduce
RでMapreduce
Hidekazu Tanaka
Rによるやさしい統計学 第16章 : 因子分析
Rによるやさしい統計学 第16章 : 因子分析
Hidekazu Tanaka
Mais de Hidekazu Tanaka
(11)
ggplot2 に入門してみた
ggplot2 に入門してみた
フォントのお話
フォントのお話
フォントのお話
フォントのお話
バギングで構築された各決定木
バギングで構築された各決定木
アンサンブル学習
アンサンブル学習
RHadoop の紹介
RHadoop の紹介
Rの紹介
Rの紹介
Rで解く最適化問題 線型計画問題編
Rで解く最適化問題 線型計画問題編
R meets Hadoop
R meets Hadoop
RでMapreduce
RでMapreduce
Rによるやさしい統計学 第16章 : 因子分析
Rによるやさしい統計学 第16章 : 因子分析
Último
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
Ryo Sasaki
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
taisei2219
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Toru Tamaki
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
Toru Tamaki
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
danielhu54
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Toru Tamaki
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
sugiuralab
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Yuma Ohgami
Último
(10)
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
データベースのお話
1.
データベースのお話 2012.07.07 Tokyo.R
#24 by @holidayworking
2.
自己紹介 • Hidekazu Tanaka •
システムエンジニア • 好きなもの • T-SQUARE • F1
3.
Rを使っていると
4.
こんな経験がありますよね?
5.
ファイルがたくさん
6.
どのファイルにデータが あるのか分からない
7.
そんな人に今回紹介するのは
8.
データベース
9.
データベースとは? • 大量のデータを一定の規則に従って蓄積し、一元 的に管理できるようにしたもの •
データベースを構築することによって、データの 重複や散逸を防ぎ、ある項目に着目して特定の データを抽出するといった、効率的なデータ利用 が可能になる
10.
データモデル • データベースに格納するデータをどのように配置 するか理論的・物理的な側面から規定するもの •
代表的なデータモデル • 階層型データモデル • ネットワーク型データモデル • 関係モデル • オブジェクトデータモデル
11.
データモデル • データベースに格納するデータをどのように配置 するか理論的・物理的な側面から規定するもの •
代表的なデータモデル • 階層型データモデル • ネットワーク型データモデル • 関係モデル • オブジェクトデータモデル
12.
関係モデル • E.F.Codd が集合論と述語理論に基づいて考案し
たモデル • 基本的な前提は、あらゆるデータは n 項の関係で 表現されるということ • 詳細は Wikipedia で!!
13.
RDBMS • 関係モデルに基づいて設計されたデータが格納さ れ、管理されるシステムのこと •
データは2次元の表として格納し、データ間の関連 をデータを使って表現される • データの操作や定義を行うためには SQL と呼ば れる言語を使うのが一般的
14.
RDBMS • 商用、オープンソースを含め様々な実装が存在 •
Oracle Database • Microsoft SQL Server • MySQL • PostgreSQL • SQLite
15.
SQL • RDBMS において、データの操作や定義を行うた
めの問い合わせ言語 • ISO で言語仕様の標準化が行われているため、異 なる RDBMS でも同じように使うことができる • 標準規格の対応の程度は RDBMS によって異な ることがあるため、特定の RDBMS では使えな い構文もあることもある
16.
SQL • DDL :
Data Definition Language • CREATE • DROP • ALTER • TRUNCATE
17.
SQL • DML :
Data Manipulation Language • SELECT • INSERT • UPDATE • DELETE
18.
Rから操作する方法 • R から
RDBMS を操作する方法は2種類存在 • RODBC パッケージ • DBI パッケージ
19.
RODBC パッケージ • ODBC
で RDBMS を操作するパッケージ • ODBC : Open Database Connectivity • Microsoft が提案した RDBMS にアクセス するための共通インターフェイス • Windows 環境で利用されることが多い • Windows で R を使っている場合は、このパッ ケージを使ったほうが良い
20.
DBI パッケージ • R
から RDBMS を操作するためのインターフェ イスを定義したパッケージ • RDBMS に対応したパッケージのインストールが 必要 • Mac OS X や Linux を使っている場合は、この パッケージを使ったほうが良い
21.
ドライバパッケージ • RMySQL • RPostgreSQL •
RSQLite • ROracle • RJDBC
22.
RDBMS への接続方法 # 接続 >
conn <- dbConnect(MySQL(), host = "localhost", user = "scott", password = "tiger", dbname = "ellison") # 接続情報の確認 > summary(conn) <MySQLConnection:(49423,0)> User: scott Host: localhost Dbname: ellison Connection type: localhost via TCP/IP No resultSet available # 切断 > dbDisconnect(conn)
23.
簡単な使用方法 # データフレームをテーブルに保存 > dbWriteTable(conn,
name="iris", value=iris) [1] TRUE # テーブルからデータフレームを作成 > data <- dbReadTable(conn, name="iris") > head(data) Sepal_Length Sepal_Width Petal_Length Petal_Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa # テーブルの削除 > dbRemoveTable(conn, name="iris") [1] TRUE
24.
SQLの使用方法 # dbGetQuery 関数を使う方法 >
data <- dbGetQuery(conn, "select * from quakes") > dim(data) [1] 1000 6 # 大規模なデータを扱う場合は、クエリを分割して取得する dbSendQuery を使うのが安全 > rs <- dbSendQuery(conn, "select * from quakes") > data <- fetch(rs) > dim(data) [1] 500 6 # 残りの結果を全て取得 > data <- fetch(rs, n=-1) > dim(data) [1] 500 6 # 全て取得されているか > dbHasCompleted(rs) [1] TRUE
25.
実践編 • R と
RDBMS を組み合わせの例としてテキスト マイニングをやってみます • 「Rによるテキストマイニング入門」の第9章のテ キスト分類 • 上記の本では新聞記事をファイルに保存し解析し ているが、今回は RDBMS に保存し解析をする
26.
新聞記事収集スクリプト • 某新聞の RSS
から記事を取得、RDBMS に保存 • 収集スクリプトは Ruby で実装 • スクリプトは GitHub で公開 • http://github.com/holidayworking/ sankei
27.
テーブル構成
28.
テキスト分類 # 記事の取得 > news
<- dbGetQuery(conn, "select news.id, news.title, news.content, categories.name as category from news inner join categories on news.category_id = categories.id order by news.id") # ターム・文書行列の作成 > library(RMeCab) > res <- docMatrixDF(news[,"content"], pos=c("名詞","動詞","形容詞")) # クラスター分析 > hc <- hclust(dist(t(res))) > library(ggdendro) # デンドログラムの作成 > hcdata <- dendro_data(hc) > ggplot() + geom_segment(data=segment(hcdata), aes(x, y, xend=xend, yend=yend)) + geom_text(data=label(hcdata), aes(x, y, label=label, hjust=0), size=3) +coord_flip() + scale_y_reverse(expand=c(0.2, 0))
Notas do Editor
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
Baixar agora