L'algoritmo di Twitter e il mondo delle news 03102015
La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma
1. Tesi di Laurea di:
Carla Lucignano
Relatore: Prof. Andrea Cioffi
2. • Oggetto: quali caratteristiche deve avere
affinchè quest’analisi risulti utile? Quali sono
gli obiettivi che la personal sentiment analysis
supporta?
• Come: Quale approccio all’analisi bisogna
prediligere, quello manuale, automatico o una
combinazione di entrambi?
• Dove: Quali luoghi virtuali bisogna mappare?
Quali sono i driver che devono guidare la scelta
dei luoghi da monitorare in base all’oggetto di
analisi e agli obiettivi dell’analisi stessa?
• Quando: Quale deve essere la frequenza di
analisi?
• Quanto: Quali sono i costi di quest’analisi?
In che modo è
possibile attuare una
personal sentiment
analysis? Come
cambia, nel caso in
cui ciò
avvenga, l’approccio
alla sentiment
analysis quando
l’oggetto dell’ analisi
non è un
prodotto, ma una
persona?
Personal Sentiment Analysis: domanda di ricerca
3. La metodologia del progetto prevede le seguenti macro fasi
Metodologia: presentazione della metodologia di ricerca
Fase 1: analisi della
letteratura mediante la
metodologia Systematic
Review
• Metodologia che prevede una
mappatura e un'analisi
approfondita della letteratura
disponibile. Conduce
all’estrazione di indicazioni
chiare e condivisibili relative
ad un preciso ambito di studi
• Vantaggi: rigore metodologico,
maggiori possibilità di
riproducibilità dei risultati
raggiunti
• Obiettivo: ricercare trend
emergenti dalla letteratura
nazionale e internazionale
disponibile sul tema oggetto
della ricerca
Fase 2: ricerca qualitativa -
delineare una metodologia di
sentiment analysis per un brand
personale.
• In questa fase sarà definito un
quadro di riferimento teorico che
guiderà l’implementazione della
sentiment analysis su un brand
associato non ad una azienda, ma
ad un cantante, quindi ad una
singola persona, per tale motivo si
parlerà di “personal sentiment
analysis”.
• L’obiettivo: misurare la
reputazione sul web di Marco
Mengoni e determinare se e in che
modo la dimensione personale del
cantante vada ad impattare sulla
dimensione professionale e quindi
sui risultati dell’analisi.
4.
5. Fase1
Fase 2
Fase 3
Definizione del dominio del brand
Individuazione delle le fonti web nelle quali individuare i
contenuti generati dagli utenti che parlano del brand e che
possono essere utili a determinarne la reputazione.
Costruzione del modello del brand
Definizione e validazione dei concetti da localizzare
all’interno delle opinioni degli utenti raccolte nel web.
Analisi linguistica delle opinioni
Classificazione dei contenuti rilevanti rispetto agli elementi
caratterizzanti il brand e valutazione del sentiment, attraverso
un approccio automatico, manuale o integrato.
Il processo di analisi della reputazione sul web prevede tre fasi principali:
Misurare la reputazione con la sentiment analysis: il caso Marco Mengoni
6. .
L’analisi è stata condotta
su quattro domini del
web, scelti in base alla
quantità e alla
concentrazione dei
discorsi presenti intorno
al cantante.
Twitter La pagina Facebook
ufficiale
Il canale ufficiale di
Youtube
Blogosfera
Fase 1 - Definizione del dominio del brand: la mappa dei luoghi da analizzare
7. Fase 2 - Costruzione del Modello del Brand: aspetti che definiscono la reputazione
REPUTAZIONE
DELL’ARTISTA
ASPETTI PROFESSIONALI
- Vocalità
- Doti interpretative
- Qualità complessiva album
- Qualità di scrittura di testi e musica
- Originalità di scrittura testi e musica
- Performance Live
- Carisma
- Presenza scenica
- Look
ASPETTI PERSONALI
- Il carattere (umiltà, semplicità,
autenticità e spontaneità )
- La personalità
- Il carisma
- Lo stile di vita fuori dal palco
8. Fase 3 - Analisi linguistica delle opinioni: gli approcci utilizzati
Twitter
Approccio
automatico:
Topsy
Approccio
manuale
analisi dei
tweet
contenenti le
parole chiave
Marco
Mengoni,
Pronto a
correre e i
relativi
Hashtag
Blogosfera
Approccio
manuale
analisi dei
primi trenta
risultati di
ricerca su
Google con le
parole chiave:
Marco
Mengoni,
Pronto a
correre e
Pronto a
correre
recensione
album
Facebook
Approccio
manuale:
analisi dei
post pubblicati
sulla bacheca
della pagina
ufficiale di
Marco Mengoni
Youtube
Approccio
manuale:
analisi dei
commenti ai
video ufficiali
dei singoli
estratti
dall’ultimo
album
dell’artista e
pubblicati su
canale
ufficiale
dell’artista
11. Considerazioni:
Twitter è utilizzato dagli utenti principalmente per
condividere informazioni e per promuovere i contenuti
pubblicati su altri media, ma poco per esprimere opinioni
rilevanti per la sentiment analysis.
I testi sono brevi (limite 140 caratteri, hashtag, link) e ciò
semplifica la classificazione.
Presentazione dei risultati: Twitter
12. PAROLE CHIAVE Positivo Negativo Neutrale Tot
Marco Mengoni 12 0 18 30
Marco Mengoni -Pronto a correre 20 1 9 30
Marco Mengoni -Pronto a correre
recensione 14 6 10 30
Totale 46 7 37 90
Neutrali
41,10%
Negativi
7,80%
Positivi
51,10%
Sentiment analysis Blogosfera
Sfera
privata
12%
Ambito di analisi
Sfera professionale
88%
Presentazione dei risultati: Blogosfera
13. Considerazioni:
Nella Blogosfera il numero di testi contenenti un’opinione
rilevante per l’analisi, rispetto a quelli neutrali, è più
elevato.
Le principali difficoltà riscontrate nell’analisi della
Blogosfera sono state quelle di aver dovuto analizzare
testi più lunghi e articolati rispetto a tutti gli altri
domini, all’interno dei quali, erano espresse diverse
opinioni su più aspetti del cantante.
Presentazione dei risultati: Blogosfera
14. Tipologia dei post Numero % sul tot.
Post dei sostenitori più coinvolti 992 49,6%
Foto 315 15,8%
Video 287 14,3%
Link 77 3,8%
Spam 49 2,4%
Neutrali 245 12,2%
Opinioni positive 31 1,5%
Opinioni negative 4 0,2%
Totale 2.000 100,0%
Marco ti
amo!
I più sentiti
complimenti per le
tue canzoni. Sono
una meglio dell’altra!
Presentazione dei risultati: Facebook
15. Presentazione dei risultati: Facebook
Considerazioni:
Facebook è il luogo dei fan e dei sostenitori più
coinvolti.
In questo spazio è difficile trovare contenuti che
esprimano opinioni obiettive che possano aiutare a
determinare la reputazione del cantante.
E’ necessario distinguere i contenuti positivi che
possono aiutare a determinare la reputazione dai
contenuti positivi estremamente di parte.
16. Presentazione dei risultati: Youtube
Neutrali
39%
Negativi
5%
Positivi
56%
Visualizzazioni Mi piace Non mi piace Commenti totali
Commenti
analizzati
27.963.477 93.804 5112 19.093 2666
.
Sentiment analysis commenti di Youtube
17. Presentazione dei risultati: Youtube
.
Considerazioni:
Youtube è uno spazio frequentato dai fan
dell’artista, ma rispetto agli altri due domini in questo
luogo la percentuale di utenti, che non si definisce
fan, ma che esprime un’opinione dopo aver visto il
video, è più elevata.
Il limite di YouTube e dei suoi commenti è che è molto
facile che si inneschino delle discussioni che poco
hanno a che fare con il brand oggetto del video.
I fan in questo spazio assumono un ruolo attivo nella
gestione della reputazione del cantante.
18. Conclusioni
.
Teoria Caso empirico
OGGETTO
Caratteristiche del brand:
- notorietà (celebrità, personaggi
pubblici)
Obiettivi supportati:
- monitoraggio e gestione della
reputazione
Non adatta ad un cantante:
- percentuale dei contenuti presenti sul web
per determinare la reputazione molto
bassa
- legame utente-brand personale molto forte
- bassa propensione degli utenti ad
esprimere opinioni negative
COME
Approccio integrato Approccio prevalentemente manuale:
- mancanza di strumenti per la sentiment in
alcuni domini (Facebook, Youtube)
- onerosità dei software presenti sul mercato
DOVE
I driver per la scelta dei luoghi:
- target di utenti da monitorare
- tema e argomenti discussi
- presenza di influencer
I driver utilizzati:
- target di utenti da monitorare
- tema e argomenti discussi
QUANDO
Monitoraggio di:
- breve periodo (analisi prepost
evento)
- lungo periodo (analisi costante)
Breve periodo: dopo l’uscita dell’ultimo album
QUANTO
Struttura dei costi:
- analisi manuale: flessibile
- analisi automatica: rigida
Analisi automatica: tool gratuito (Topsy)
Analisi manuale: costo legati al numero di ore
lavoro necessarie per effettuare l’analisi
19. Conclusioni
.
Teoria Caso empirico
OGGETTO
Caratteristiche del brand:
- notorietà (celebrità, personaggi
pubblici)
Obiettivi supportati:
- monitoraggio e gestione della
reputazione
Non adatta ad un cantante:
- percentuale dei contenuti presenti sul web
per determinare la reputazione molto
bassa
- legame utente-brand personale molto forte
- bassa propensione degli utenti ad
esprimere opinioni negative
COME
Approccio integrato Approccio prevalentemente manuale:
- mancanza di strumenti per la sentiment in
alcuni domini (Facebook, Youtube)
- onerosità dei software presenti sul mercato
DOVE
I driver per la scelta dei luoghi:
- target di utenti da monitorare
- tema e argomenti discussi
- presenza di influencer
I driver utilizzati:
- target di utenti da monitorare
- tema e argomenti discussi
QUANDO
Monitoraggio di:
- breve periodo (analisi prepost
evento)
- lungo periodo (analisi costante)
Breve periodo: dopo l’uscita dell’ultimo album
QUANTO
Struttura dei costi:
- analisi manuale: flessibile
- analisi automatica: rigida
Analisi automatica: tool gratuito (Topsy)
Analisi manuale: costo legati al numero di ore
lavoro necessarie per effettuare l’analisi
20. Conclusioni
Alla luce di quanto è emerso dunque …
La sentiment analysis non è lo strumento
più adatto per determinare la
reputazione di un brand personale, come
quello di un cantante, per la mancanza
di contenuti adatti ad ottenere un
risultato che rispecchi le reali percezioni
di un pubblico più ampio rispetto a
quello composto dai soli fan e
sostenitori.