Hugo Santos
GERÊNCIA DE DADOS DA WEB
1o. SEMESTRE DE 2014
Twitter mood predicts the stock market
Johan Bollen Huina Mao Xi...
Introdução
• Economia comportamental e a psicologia econômica nos dizem que as
emoções podem afetar o comportamento de ind...
Resumo
• Pesquisa se os estados de humor coletivos derivados da análise em grande
escala dos feeds do Twitter estão correl...
Introdução
• Segundo a Efficient Market Hypothesis (EMH) os preços do mercado de
ações são, em grande parte, impulsionado ...
Dados e Método
• Dados:
• 9,853,498 tweets postados por aproximadamente 2.7M usuários
• entre 28 de fevereiro de 2008 a 19...
Dados e Método
• 1a Etapa:
• OpinionFinder e GPOMS medem humor nos tweets de forma que são
geradas 7 series temporais
• Ex...
Dados e Método
Dados e Método
1. Geração das series temporais de humor: OpinionFinder e GPOMS
2. Validação das séries através de eventos ...
Séries Temporais e Validação com
eventos socioculturais
Granger Casuality Analysis vs DJIA Prices
Calm apresentou proximidade!
Granger Casuality Analysis vs DJIA Prices
Calm apresentou proximidade!
Notícias não são previstas pelo humor do público e
...
Modelo não-linear baseado em emoção
para a predição de ativos
• Granger casuality é baseado em regressão linear. Provavelm...
Modelo não-linear baseado em emoção
para a predição de ativos
Conclusões
• Alterações de humor demonstraram refletir no indice DJIA depois de 3 a 4 dias.
• A correlação não foi observa...
Dúvidas
Próximos SlideShares
Carregando em…5
×

Seminário: Twitter mood predicts the stock market

274 visualizações

Publicada em

(Seminário da Disciplina de GDW - DCC/UFMG à respeito do Artigo: http://arxiv.org/pdf/1010.3003&)
Abstract—Behavioral economics tells us that emotions can
profoundly affect individual behavior and decision-making. Does
this also apply to societies at large, i.e. can societies experience
mood states that affect their collective decision making? By
extension is the public mood correlated or even predictive of
economic indicators? Here we investigate whether measurements
of collective mood states derived from large-scale Twitter feeds
are correlated to the value of the Dow Jones Industrial Average
(DJIA) over time. We analyze the text content of daily Twitter
feeds by two mood tracking tools, namely OpinionFinder that
measures positive vs. negative mood and Google-Profile of Mood
States (GPOMS) that measures mood in terms of 6 dimensions
(Calm, Alert, Sure, Vital, Kind, and Happy). We cross-validate
the resulting mood time series by comparing their ability to
detect the public’s response to the presidential election and
Thanksgiving day in 2008. A Granger causality analysis and
a Self-Organizing Fuzzy Neural Network are then used to
investigate the hypothesis that public mood states, as measured by
the OpinionFinder and GPOMS mood time series, are predictive
of changes in DJIA closing values. Our results indicate that the
accuracy of DJIA predictions can be significantly improved by
the inclusion of specific public mood dimensions but not others.
We find an accuracy of 87.6% in predicting the daily up and
down changes in the closing values of the DJIA and a reduction
of the Mean Average Percentage Error by more than 6%.

Publicada em: Mídias sociais
0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
274
No SlideShare
0
A partir de incorporações
0
Número de incorporações
1
Ações
Compartilhamentos
0
Downloads
0
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Seminário: Twitter mood predicts the stock market

  1. 1. Hugo Santos GERÊNCIA DE DADOS DA WEB 1o. SEMESTRE DE 2014 Twitter mood predicts the stock market Johan Bollen Huina Mao Xiao-Jun Zeng Journal of Computational Science Volume 2, Issue 1, March 2011, Pages 1–8
  2. 2. Introdução • Economia comportamental e a psicologia econômica nos dizem que as emoções podem afetar o comportamento de individuos na tomada de decisão. • Isso se aplica às sociedades como um todo? • Pode o estado de humor coletivo de uma sociedade afetar sua tomada de decisão coletiva? • Ou ainda, o humor coletivo pode estar relacionado ou ser preditor de fatores econômicos?
  3. 3. Resumo • Pesquisa se os estados de humor coletivos derivados da análise em grande escala dos feeds do Twitter estão correlacionados com o valor do Dow Jones Industrial Average (DJIA) ao longo do tempo. • Usando duas ferramentas como base: • OpinionFinder: avalia em positivo e negativo; • Google-Profile of Mood States (GPOMS): avalia em 6 dimensões – Calm, Alert, Sure, Vital, Kind e Happy.
  4. 4. Introdução • Segundo a Efficient Market Hypothesis (EMH) os preços do mercado de ações são, em grande parte, impulsionado por novas informações, ou seja, notícias, em vez de os preços atuais e passados. • Pesquisas recentes têm demontrado que redes sociais online podem ser usadas para prever indicadores econômicos e sociais (venda de livros, venda de filmes etc). • Além disso, pesquisas na área de psicologia demonstram como emoções, além de informação, representam um importante papel na tomada de decisão humana.
  5. 5. Dados e Método • Dados: • 9,853,498 tweets postados por aproximadamente 2.7M usuários • entre 28 de fevereiro de 2008 a 19 de dezembro 2008. • Stop-words removidas • Agrupamento por dia (tweets postados no mesmo dia) • Somente foram considerados tweets que contém expressão de humor: • “I am feeling”, “I don’t feel”, “I am”, “makes me” • Ferramentas: • OpinionFinder, analisa o conteúdo do texto de tweets enviados em um determinado dia para prestar um positivo vs série histórica diária negativa de humor do público. a segunda; • GPOMS (Google-Profile of Mood States), da mesma forma analisa o conteúdo de texto de tweets para gerar uma série temporal diária de seis dimensões de humor.
  6. 6. Dados e Método • 1a Etapa: • OpinionFinder e GPOMS medem humor nos tweets de forma que são geradas 7 series temporais • Extração do Yahoo! Finance da série temporal que representa os fechamentos do DJIA • 2a Etapa: • Granger casuality analysis entre as séries para avaliar a hipótese de predição. • 3a Etapa: • Organizing Fuzzy Neural Network, testar a hipótese de que a acurácia do modelo de predição pode ser melhorada pela combinação das medidas (Não linear)
  7. 7. Dados e Método
  8. 8. Dados e Método 1. Geração das series temporais de humor: OpinionFinder e GPOMS 2. Validação das séries através de eventos culturais de grande escala: • Eleições • Thanksgiving 3. Granger Casuality Analysis vs DJIA Prices 4. Modelo não-linear baseado em emoção para a predição de ativos.
  9. 9. Séries Temporais e Validação com eventos socioculturais
  10. 10. Granger Casuality Analysis vs DJIA Prices Calm apresentou proximidade!
  11. 11. Granger Casuality Analysis vs DJIA Prices Calm apresentou proximidade! Notícias não são previstas pelo humor do público e apresentam grande impacto.
  12. 12. Modelo não-linear baseado em emoção para a predição de ativos • Granger casuality é baseado em regressão linear. Provavelmente a relação entre as emoções e os valores dos ativos é não linear. • SOFNN (Self-organizing Fuzzy Neural Network) tem sido usado para decodificar séries temporais que descrevem características do mercado de ações. • Um vez que Calm foi a mais aderente, é possível que a combinação com outras dimensões forneçam um melhor resultado?
  13. 13. Modelo não-linear baseado em emoção para a predição de ativos
  14. 14. Conclusões • Alterações de humor demonstraram refletir no indice DJIA depois de 3 a 4 dias. • A correlação não foi observada para as medições da OpinionFinder, mas somente para a dimensão “Calm” do GPOMS. • Calmness é mais relevante que Positive (OF) • Os resultados não se limitam a localizações geográficas, mas foram predominantemente realizadas em idioma Inglês e com usuários do EUA. • Os resultados são “um indicador forte de uma correlação preditiva”, mas não representa uma mecanismo de casualidade que conecta Emoções com o índice DJIA (Granger ?). • DISCUSSÃO • A latência de dias é suficiente para DJIA não determinar o Twitter? • 2008 foi um ano atípico: grandes ganhos e crise (de credibilidade). • A calma não seria o mais expressivo? • 15 de setembro de 2008 VERSUS período de análise. • Não valeria uma menção?
  15. 15. Dúvidas

×