1. 18/09/2014 Agnese Vardanega (Univ. Teramo) 1
TWITTER
Fra data mining ed
etnografia della rete
Agnese Vardanega
18 settembre 2014
2. Agnese Vardanega (Univ. Teramo) 2
Una piattaforma aperta e flessibile
• Tutti i profili ― e i messaggi ― sono pubblici di default
• Utilizzato per
• scambiare notizie ed informazioni in tempo reale
• collegare un blog e promuoverlo
• condividere links e files - incl. foto e video
• Geolocalizzabile
• Consente la ricerca per
• parole chiave
• hashtags (#esempio)
• nome utente
• diversi operatori
• Integrato con altre applicazioni e servizi
3. 18/09/2014 Agnese Vardanega (Univ. Teramo) 3
Coevolve con le pratiche degli utenti
• la funzione @reply è stata introdotta dagli utenti e solo
successivamente implementata
• gli utenti hanno poi iniziato ad aggiungere un carattere davanti
(.@username) per rendere pubbliche le «mentions»
• la funzione RT (retweet) è stata introdotta dagli utenti
• hashtags trending topics
• I «favoriti» vengono oramai usati come i «likes» di Facebook
4. 18/09/2014 Agnese Vardanega (Univ. Teramo) 4
Possibili domande di ricerca
• Chi è presente su Twitter? web presence
• Cosa dicono i politici, le stars, i vip, i giornalisti, le persone
comuni? analisi del contenuto
• Si formano gruppi e comunità? social network analysis
• Si sono venute a creare «culture» della presenza e della
comunicazione su Twitter? analisi etnografica
• Come viene presentato il Sé?
• In che modo aziende e brand costruiscono e promuovono la loro
identità?
• In che modo viene usato il mezzo?
• web production practices
5. 18/09/2014 Agnese Vardanega (Univ. Teramo) 5
Un ambiente complesso
• Il data mining deve tenere conto degli aspetti
culturali e «comunitari»
• linguaggio
• interazioni possibili
• L’approccio etnografico deve ricorrere a strumenti
e metriche del data mining
• come identificare una comunità?
• quanti parlano di un dato argomento, o condividono
determinate esperienze?
• cosa dicono? trovare e scaricare messaggi
6. 18/09/2014 Agnese Vardanega (Univ. Teramo) 6
Come si raccolgono i dati
• Attraverso le Application Programming Interfaces (APIs)
messe a disposizione dall’azienda:
• servono a far «dialogare» i server di Twitter con altre applicazioni
• le applicazioni «interrogano» i server, alla ricerca di informazioni
specifiche
• mediante tools e programmi, anche online, e spesso
gratuiti (open source, o liberi per uso non commerciale)
• tenendo conto dei limiti imposti da Twitter, e che possono
cambiare, senza preavviso
• quali dati sono disponibili
• numero di messaggi per ogni «call»
• numero di «call» all’ora o al minuto
7. 18/09/2014 Agnese Vardanega (Univ. Teramo) 7
Le tecniche utilizzate
• Data mining
• Social network analysis
• Text analysis, text
mining
• Analisi del contenuto
• Metodo etnografico
• Interviste agli utenti
• Interviste su Twitter
• Interviste online (email,
questionari online, chats,
Voip, ecc.)
• Interviste faccia a faccia
• Forum, focus groups online
9. 18/09/2014 Agnese Vardanega (Univ. Teramo) 9
http://search.twitter.com
Lingua
links (abbreviati)
elementi
multimediali
selezione di Twitter
10. 18/09/2014 Agnese Vardanega (Univ. Teramo) 10
Gli utenti
username
attività e grafo
sociale
Presentazione del Sé
11. 18/09/2014 Agnese Vardanega (Univ. Teramo) 11
Interazioni, conversazioni, comunità
@user = risposta, mention
(con il punto davanti)
Favorite = Bookmark, usato
spesso come il «like» di
Facebook
tags
emoticons
13. 18/09/2014 Agnese Vardanega (Univ. Teramo) 13
Web Presence: Analisi funzionale
• Obiettivi:
• Descrizione estensiva della presenza web di
determinati utenti (aziende, artisti, trasmissioni televise,
politici, ecc.): cosa possono trovare gli utenti sul web?
• Descrizione delle diverse strategie / in che modo sono
presenti le imprese? Che cosa offrono? Sono attive sui
social networks sites? Esistono differenze significative
fra di loro?
• Definizione dell’ambito della ricerca:
• Territoriali
• Temporali
14. 18/09/2014 Agnese Vardanega (Univ. Teramo) 14
Metriche: Utenti
• Data di creazione dell’account
• N. Messaggi
• N. Favoriti
• N. Followers
• N. Followees
Sono disponibili anche altre informazioni relative agli utenti,
quali le url delle immagini utilizzate nel profilo, che possono
dunque essere utilizzate
16. 18/09/2014 Agnese Vardanega (Univ. Teramo) 16
Presenza online dei candidati (amm. 2012 - %)
Website
/blog
FB Pers. page
FB List page
FB Publ.
account
FB Priv. account
FB group
Not present
A. Vardanega
Amministrative 2012: La presenza online dei candidati
17. 18/09/2014 Agnese Vardanega (Univ. Teramo) 17
Social networks analisys
• individuazione della comunità (definizione)
• utenti conosciuti (si crea una lista)
• topic: parola/e chiave o hashtag
• limiti temporali
• raccolta dei dati
• costruzione di una matrice di adiacenza
• grafo
18. 18/09/2014 Agnese Vardanega (Univ. Teramo) 18
Il network delle conversazioni su Twitter
• ricerca dei messaggi in base al tag #my2K
• (att.: gli altri messaggi non vengono rilevati)
• individuazione dei links fra messaggi, in base alle
risposte / menzioni contenute (utente @utente)
e costruzione della matrice
• individuazione di clusters
Smith, M., Rainie, L., Shneiderman, B., & Himelboim, I. (2014).
Mapping Twitter Topic Networks: From Polarized Crowds to
Community Clusters. Pew Internet & American Life Project
Washington, DC.
22. 18/09/2014 Agnese Vardanega (Univ. Teramo) 22
Text Mining
• Raccolta dei messaggi mediante parola chiave
(«Polverini»)
• (att.: gli altri messaggi non vengono rilevati)
• Ripulitura dei dati (ortografia, punteggiatura, links)
• Disambiguazione (es.: «Fiorito», «Casini» e relativi
giochi di parole)
• Lemmatizzazione
• (Selezione delle parole chiave)
• Matrice di adiacenza - lemma x lemma (co-occorrenze)
• Network Analysis
23. 18/09/2014 Agnese Vardanega (Univ. Teramo) 23
A. Vardanega
Le dimissioni di Renata Polverini: visualizzazioni delle reazioni di Twitter