Enviar pesquisa
Carregar
あんちべのすべらない話~俺のツイートがこんなにウケないはずがない~
•
23 gostaram
•
10,091 visualizações
A
antibayesian 俺がS式だ
Seguir
Rを用いたtwitterテキストマイニング
Leia menos
Leia mais
Tecnologia
Negócios
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 20
Baixar agora
Baixar para ler offline
Recomendados
Sakusaku svm
Sakusaku svm
antibayesian 俺がS式だ
言語処理学会へ遊びに行ったよ
言語処理学会へ遊びに行ったよ
antibayesian 俺がS式だ
全文検索入門
全文検索入門
antibayesian 俺がS式だ
協調フィルタリング with Mahout
協調フィルタリング with Mahout
Katsuhiro Takata
RでTwitterテキストマイニング
RでTwitterテキストマイニング
Yudai Shinbo
RではじめるTwitter解析
RではじめるTwitter解析
Takeshi Arabiki
JASELE2015-KumamotoWS
JASELE2015-KumamotoWS
SAKAUE, Tatsuya
どたばたかいぎ成果発表
どたばたかいぎ成果発表
Eric Sartre
Recomendados
Sakusaku svm
Sakusaku svm
antibayesian 俺がS式だ
言語処理学会へ遊びに行ったよ
言語処理学会へ遊びに行ったよ
antibayesian 俺がS式だ
全文検索入門
全文検索入門
antibayesian 俺がS式だ
協調フィルタリング with Mahout
協調フィルタリング with Mahout
Katsuhiro Takata
RでTwitterテキストマイニング
RでTwitterテキストマイニング
Yudai Shinbo
RではじめるTwitter解析
RではじめるTwitter解析
Takeshi Arabiki
JASELE2015-KumamotoWS
JASELE2015-KumamotoWS
SAKAUE, Tatsuya
どたばたかいぎ成果発表
どたばたかいぎ成果発表
Eric Sartre
teratailで秒速回答を目指す - GoogleAppsScript + SlackWebhook
teratailで秒速回答を目指す - GoogleAppsScript + SlackWebhook
Shohei Tai
Uec.R#3 YjdnJlpを使ってみた
Uec.R#3 YjdnJlpを使ってみた
Atsushi Hayakawa
はじめてのテスト技法
はじめてのテスト技法
Tatsuya Saito
Frequency with nltk
Frequency with nltk
Atsushi Hayakawa
Kpt×ナース(公開版)
Kpt×ナース(公開版)
Noriyuki Nemoto
Machine Learning Fundamentals IEEE
Machine Learning Fundamentals IEEE
Antonio Tejero de Pablos
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
Hajime Sasaki
情シスオフ 2nd Lt 20090620
情シスオフ 2nd Lt 20090620
atsuizo
企業における統計学入門
企業における統計学入門
antibayesian 俺がS式だ
SPSSで簡単テキストマイニング
SPSSで簡単テキストマイニング
antibayesian 俺がS式だ
ガチャとは心の所作
ガチャとは心の所作
antibayesian 俺がS式だ
チームラボ忘年会
チームラボ忘年会
antibayesian 俺がS式だ
テキストマイニングのイメージと実際
テキストマイニングのイメージと実際
antibayesian 俺がS式だ
さくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッション
antibayesian 俺がS式だ
神の言語による自然言語処理
神の言語による自然言語処理
antibayesian 俺がS式だ
Pythonで簡単ネットワーク分析
Pythonで簡単ネットワーク分析
antibayesian 俺がS式だ
第三回さくさくテキストマイニング勉強会 入門セッション
第三回さくさくテキストマイニング勉強会 入門セッション
antibayesian 俺がS式だ
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Mais conteúdo relacionado
Semelhante a あんちべのすべらない話~俺のツイートがこんなにウケないはずがない~
teratailで秒速回答を目指す - GoogleAppsScript + SlackWebhook
teratailで秒速回答を目指す - GoogleAppsScript + SlackWebhook
Shohei Tai
Uec.R#3 YjdnJlpを使ってみた
Uec.R#3 YjdnJlpを使ってみた
Atsushi Hayakawa
はじめてのテスト技法
はじめてのテスト技法
Tatsuya Saito
Frequency with nltk
Frequency with nltk
Atsushi Hayakawa
Kpt×ナース(公開版)
Kpt×ナース(公開版)
Noriyuki Nemoto
Machine Learning Fundamentals IEEE
Machine Learning Fundamentals IEEE
Antonio Tejero de Pablos
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
Hajime Sasaki
情シスオフ 2nd Lt 20090620
情シスオフ 2nd Lt 20090620
atsuizo
Semelhante a あんちべのすべらない話~俺のツイートがこんなにウケないはずがない~
(8)
teratailで秒速回答を目指す - GoogleAppsScript + SlackWebhook
teratailで秒速回答を目指す - GoogleAppsScript + SlackWebhook
Uec.R#3 YjdnJlpを使ってみた
Uec.R#3 YjdnJlpを使ってみた
はじめてのテスト技法
はじめてのテスト技法
Frequency with nltk
Frequency with nltk
Kpt×ナース(公開版)
Kpt×ナース(公開版)
Machine Learning Fundamentals IEEE
Machine Learning Fundamentals IEEE
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
情シスオフ 2nd Lt 20090620
情シスオフ 2nd Lt 20090620
Mais de antibayesian 俺がS式だ
企業における統計学入門
企業における統計学入門
antibayesian 俺がS式だ
SPSSで簡単テキストマイニング
SPSSで簡単テキストマイニング
antibayesian 俺がS式だ
ガチャとは心の所作
ガチャとは心の所作
antibayesian 俺がS式だ
チームラボ忘年会
チームラボ忘年会
antibayesian 俺がS式だ
テキストマイニングのイメージと実際
テキストマイニングのイメージと実際
antibayesian 俺がS式だ
さくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッション
antibayesian 俺がS式だ
神の言語による自然言語処理
神の言語による自然言語処理
antibayesian 俺がS式だ
Pythonで簡単ネットワーク分析
Pythonで簡単ネットワーク分析
antibayesian 俺がS式だ
第三回さくさくテキストマイニング勉強会 入門セッション
第三回さくさくテキストマイニング勉強会 入門セッション
antibayesian 俺がS式だ
Mais de antibayesian 俺がS式だ
(9)
企業における統計学入門
企業における統計学入門
SPSSで簡単テキストマイニング
SPSSで簡単テキストマイニング
ガチャとは心の所作
ガチャとは心の所作
チームラボ忘年会
チームラボ忘年会
テキストマイニングのイメージと実際
テキストマイニングのイメージと実際
さくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッション
神の言語による自然言語処理
神の言語による自然言語処理
Pythonで簡単ネットワーク分析
Pythonで簡単ネットワーク分析
第三回さくさくテキストマイニング勉強会 入門セッション
第三回さくさくテキストマイニング勉強会 入門セッション
Último
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
Último
(11)
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
あんちべのすべらない話~俺のツイートがこんなにウケないはずがない~
1.
あんちべの すべらない話 ~俺のツイートがこんなにウケないはずがない~
2.
目的
3.
twitter 渾身のネタが スルーされたり 何気ない呟きが めっちゃウケたり
4.
滑ったときの 恥ずかしさ マジパネェ
5.
tweetする前に ウケルかどうか 予測できれば!
6.
それ、Rなら 簡単ですよ!
7.
発表の目的 Rで自分のtweetが ウケるかどうか 予測をしよう!
8.
自己紹介 ●
ID:AntiBayesian ● あんちべ!とお呼び下さい ● 専門:テキストマイニング、自然言語処理 ● 職業:某ATMが○○な銀行で金融工学研究員とか いう胡散臭い素敵なことしてる ● 自然言語処理職大絶賛募集中!!!! ● math.empress@gmail.com
9.
なんで急にLTすることに??? ↑今日の0時くらいの話です
10.
分析手順 1.訓練データ(正例、負例)を用意する 2.訓練データから予測モデルを立てる 3.自分のtweetを予測モデルに放り込んで判定
11.
訓練データを集めよう ●
正例:favstarから人気tweetを取得 ● 負例:twitter Streaming APIから適当にサンプリン グ ● 6月中のtweetを各々約1500件ずつチョイス ● 正例にはfav、負例にはnonタグを付ける ※Tweetを取得するツール作ったよ! http://d.hatena.ne.jp/AntiBayesian/20110702
12.
13.
さくさくツイートマイニング こんな感じ→
14.
訓練データの加工
ttmの紹介 ● TinyTextMiner ● テキストを形態素解析に掛け、さらに分析ツールに 投げやすいよう整形してくれるフリーソフト ● ここからDL http://mtmr.jp/ttm/ ※MeCabもインストールしてね
15.
加工済みデータ ●
1行目が各単語。2行目以降は、各文章から表頭 の単語が何回出現したか ● 右端のTAG列がクラス。fav=正例、non=負 例、test=検証するtweet。 ● 要するに、testテキストがfav、nonどちらに分類さ れるか知りたい
16.
予測モデルを立てよう ●
RandomForestを使おう! ● 精度高いし汚いデータにも強い!Googleも利用! ● 詳細は下記ブログを参考に http://d.hatena.ne.jp/hamadakoichi/20110130/
17.
Rのコード twit <- read.csv(file="twit.csv") library(randomForest) train.data
<- twit[1:2877,]#訓練データが2877ある test.data <- twit[2878:2911,]#テストデータは33 rf.model <- randomForest(TAG~., data=train.data, na.a="na.omit", ntree=10)
18.
精度はどう??? rf.predict <- predict(rf.model,
train.data) (result <- table(train.data$TAG, rf.predict)) ● 緑色のセル=正しく分類 ● 行:予測 ● 列:実際 2*result[2,2] / (2*result[2,2]+result[1,2]+result[2,1]) ● F値:0.9019064 ※訓練データで高精度は当たり前。ただの目安
19.
学習結果 rf.predict <- predict(rf.model,
test.data) ● 2878行目のデータはfav、2879行目はnonと予測 ● favと予測されたtweetはウケルのでは???
20.
まとめ ●
人気tweetを収集し、人気tweetを判別するモデル を作る ● 自分のtweetをモデルで評価して、ウケル内容だ けtweetする ● これで広瀬香美や孫正義を超える人気ついっ たったーになれる!
Baixar agora