Mais conteúdo relacionado
Semelhante a 第28回Tokyo.R (20)
第28回Tokyo.R
- 1. 第 28 回 Tokyo.R
R を用いた CBBE モデルに基づく
ブランド資産の測定
@sanoche16
- 10. Introduction
BAR(Brand Asset Valuator)
・ヤングアンドルビカム社が開発(日本では電通と提携)
・ 44 ヶ国 50 万人の消費者調査に基づいて測定
・ブランドベースの比較アプローチ
・ Differentiation, Energy, Relevance, Esteem, Knowledge の
5項 目を測定
- 11. Introduction
BRANDZ
・ミルワードブラウン社と WPP 社が開発
・ 31 ヶ国 65 万人の消費者・専門家への調査に基づいて測定
・毎年出している TOP100 はかなり有名
・ブランド資産は段階的に構築されるものだと提唱
- 12. Introduction
アーカーモデル
・デビッド・アーカーが提唱
・ブランド資産は右図のように
5つの要素から構成される
・ブランドアイデンティティ
コンセプトを最も重視
- 23. HOWTO
やりたいこと
ピラミッ
WEB 上 テキスト ドのブロ
で文章 マイニング ック毎に
を収集 得点を集
計
- 30. テキスト収集
5段階評価に加
えてレビュー情
報を取得
CSV 形式に保存
- 34. テキスト収集
集計結果
LUMIX サイバーショット PowerShot
メーカー パナソニック SONY CANON
データ数 393 948 485
欠損値あり 34 83 54
満足度平均 4.35 4.51 4.48
ブランド・ライン 23 23 30
データ数 / ブランドラ
17 41 16
イン
- 39. TRY
YjdnJlp
Version: 0.9.8
Depends: XML, RCurl, methods
Published: 2012-10-29
Author: Yohei Sato
Maintainer: Yohei Sato <yokkuns at
tkul.jp>
License: BSD
CRAN checks: YjdnJlp results
- 44. TRY
使用例)
> mecab
すもももももももものうち
すもも 名詞 , 一般 ,*,*,*,*, すもも , スモモ , スモモ
も 助詞 , 係助詞 ,*,*,*,*, も , モ , モ
もも 名詞 , 一般 ,*,*,*,*, もも , モモ , モモ
も 助詞 , 係助詞 ,*,*,*,*, も , モ , モ
もも 名詞 , 一般 ,*,*,*,*, もも , モモ , モモ
の 助詞 , 連体化 ,*,*,*,*, の , ノ , ノ
うち 名詞 , 非自立 , 副詞可能 ,*,*,*, うち , ウチ , ウチ
EOS
- 46. TRY
辞書を追加(今回はユーザー辞書)
1、単語を定義する csv ファイルを作成
ミラーレス ,,,1000, 名詞 , 一般 ,*,*,*,*, ミラーレス , ミラーレス , ミラーレス
2、作成
- 48. TRY
重要語の探索
> library(RMeCab) # ライブラリ読み込み
> res <- docMatrix2("csv", pos = c(" 名詞 ", " 形容詞 "), minFreq = 100,
+ weight = "tf*idf*norm") # 頻度が 100 以上の単語を取得し、重み付け
> res <- data.frame(res) # データフレームに変換
> res$sum = apply(res, 1, function(row) row[1] + row[2] + row[3])
> res[order(res$sum),]
- 49. TRY
重み付け?
OcMatrix2 のイメージ
Term doc1 doc2 doc3
docMatrix2 の引数に weight = "tf*idf*norm"
は 1 1 1
を指定
学生 1 1 0
norm を かけて正規化することで、文章の 僕 1 0 0
量に基づく頻度の違いをなくすことができ 彼女 0 1 1
で 0 0 1
る
を 0 0 1
数学 0 0 1
doc1: 私は学生です
doc2: 彼女は学生です。
doc3: 彼女は数学を学んでいます。
- 51. TRY
重要語の探索
重要語のうち CBBE モデルに寄与して
いると思われる単語を選択し、分類して
いく
この時点で類似語もまとめていく
- 52. TRY
重要語の探索
よい方法があれば教えてください!
- 53. TRY
重要語の探索
> library(RMeCab) # ライブラリ読み込み
> res <- docMatrix2("csv", pos = c(" 名詞 ", " 形
容詞 "), minFreq = 100,
+ weight = "tf*idf*norm") # 頻度が 100 以上の
単語を取得し、重み付け
> res <- data.frame(res) # データフレームに
変換
> res$sum = apply(res, 1, function(row) row[1]
+ row[2] + row[3])
> res[order(res$sum),]
SUM でソート
- 54. TRY
57個の単語に絞り込み
好き、最高、優
秀、素晴らしい
速い、細かい、 好み、すごい、
キレイ、良好な 高級、面白い、
ど 見やすいなど
おまかせ、 USB 、 絵、進化、風景、気
ビデオ、パノラマ 軽、改善、シーン、
自動、反応、シンプ 場所、屋外など
ル、 HD など
- 55. TRY
57個の単語に絞り込み
単語と左図の分類に対
A
B D 応する CSV ファイルを
C E
作成
- 56. TRY
得点化
> definition <- read.csv('definition.csv', FALSE) # csv ファイル読み込み
> catA <- definition[definition[2] == "A", ] # ブロック A の単語ベクトル取得
> resA = res[which(row.names(res) %in% catA[["V1"]]),] # 該当単語を含むデータを切り取り
> cyberA <- sum(resA[[1]]) / nrow(resA) * 10000
> lumixA <- sum(resA[[2]]) / nrow(resA) * 10000
> powerA <- sum(resA[[3]]) / nrow(resA) * 10000
データフレームで重み付
けしているので、平均が
取れる!
- 59. TRY
130.3
66.2 119.9
67.6 59.7
サイバーショット
45.7 69.3
51.6 107.2 65.7 107.9
57.3 66.6 48.4 67.1
LUMIX PowerShot
- 61. TRY
130.3
66.2 119.9
67.6 59.7
205
サイバーショット 参考
45.7 69.3
51.6 107.2 65.7 107.9
57.3 66.6 48.4 67.1
70 80
LUMIX PowerShot