SlideShare uma empresa Scribd logo
1 de 2
Baixar para ler offline
1
Análise de sentimento: uma visão geral
Igor Schoeller Sciliani(igor.siciliani@socialbase.com)
!
Para mais conteúdo acesse: https://medium.com/socialbase :Nessa mini revisão bibliográfica
sobre AS tento explicar um pouco do seu contexto e dar uma pincelada em algumas técnicas matemáticas mais comuns
para sua aplicação.
Na era da internet a Mineração de Textos (Text Mining) é
um campo de pesquisa que tem ganhado notoriedade como
consequência da grande quantidade de dados produzidos,
sobretudo, através das interações em redes socais, pesquisas
em saúde, notícias, transações bancárias, etc. Para se ter
uma ideia, estima-se que até 2020 esse volume de dados
atinja a marca de 40 zettabytes1
. Ainda, sabe-se que boa
parcela desses dados( em sua maioria não estruturados)
são armazenados na forma de texto, devido a facilidade
de processamento e otimização de armazenamento[1]. Isto
posto, o objetivo da Mineração de Texto é o de processar
dados não estruturadas (textuais) visando a obtenção de
informações importantes através da busca de padrões e
tendências.
Dentro desse escopo, uma técnica chamada de análise
sentimento (AS) ou mineração de opinião (MO) se destaca
devido a sua ampla aplicabilidade: classificação de opiniões
de um modo geral, análise de satisfação, métricas de rede
social, etc[2]. Sucintamente, a AS visa determinar a atitude
de um falante ou escritor com respeito a algum assunto
estabelecido ou a polaridade contextual geral ou reação
emocional a um documento, interação ou evento. Essa ati-
tude pode ser um julgamento, estado afetivo (isto é, o estado
emocional do autor ou falante), ou a comunicação emocional
pretendida (isto é, o efeito emocional pretendido pelo autor
ou interlocutor)[3].
A AS tecnicamente pode ser considerada um processo
de classificação em três níveis[4]:
1) Documento: Classifica a opinião expressa no docu-
mento quanto a sua polaridade (positiva ou nega-
tiva) ou sentimento;
2) Sentença: Classifica o sentimento expresso em cada
sentença, ou seja, em partes menores do documento;
3) Aspecto: Visa classificar o sentimento em relação
a aspectos específicos das entidades(palavras). Ou
seja, classifica as diversas opiniões do sujeito da
ação em relação a diferentes entidades (palavras).
Na figura 1 está representado uma arquitetura geral para
algoritmos dedicados a AS.
O pré-processamento textual é uma das chaves para
a maioria dos algoritmos de mineração de textos. Nessa
1. 1 ZB = 1021 bytes
Figura 1. Processo de Análise de Sentimento
Fonte: o próprio autor.
Adaptado de MEDHAT, W.; HASSAN, A.; KORASHY, H,
2014.
etapa são aplicadas algumas técnicas cruciais para o bom
desempenho do classificador[1]:
1) Tokenização: Tokenização (do inglês tokenization) é o
processo de particionar o texto em pedaços menores
(palavras/frases) chamadas de tokens;
2) Filtragem: Refere-se a remoção de algumas palavras
e caracteres do documento, tais como: pontuação,
nomes de pessoas e locais, preposições, conjunções,
etc;
3) Lematização: A lematização é o processo, efetiva-
mente, de deflexionar uma palavra para determinar
o seu lema (as flexões chamam-se lexemas);
4) Stemming: representa a tarefa de se tomar o radical
da palavra.
Vale ressaltar que nem todos os algoritmos de AS, necessari-
amente, utilizam as técnicas de pré-processamento citadas.
2
Uma vez que a partir delas são assumidas várias simpli-
ficações. Por exemplo, algoritmos que na etapa de pré-
processamento valem-se da técnica de Lematização, auto-
maticamente, desprezam a importância das flexões (gênero
e grau) de uma mesma palavra.
Ainda na Figura 1, tipicamente, para a etapa de identifi-
cação de termos opinativos são utilizados dicionários léxicos
de palavras e frases com suas respectivas polaridades (ou
sentimentos). Há vários métodos sofisticados para a identi-
ficação desses termos, onde muitos levam em consideração
o contexto o qual esses estão inseridos[5], [6].
Uma vez selecionados os termos opinativos, como pró-
ximo passo temos a seleção das características. Essa é rea-
lizada, sobretudo, através da: (a) Contagem de frequência:
contagem das palavras (individualmente ou um conjunto
delas) e suas frequências de ocorrência; (b) ponderação
binária, para cada palavra do texto atribui-se 1 se estiver
contida no dicionário léxico e 0 para o outro caso. Também,
é possível a inserção de pesos de frequência para identificar
a importância do termo; (c) Partes do discurso: Busca por
adjetivos como termos opinativos[4].
Em posse das características do texto (bag of features), já
na etapa de classificação, são utilizados métodos estatísticos
(Machine Learning) para a classificação e posterior aprendi-
zagem (supervisionada, não-supervisionada ou por reforço)
do algoritmo, dentre os quais destacaremos as mais comuns:
Naive Bayes (NB), Máxima Entropia (ME) e Máquina de
vetores de suporte (MVS)[7].
0.1 Métodos estatísticos de classificação
Para uma sucinta explanação sobre alguns dos principais
métodos estatísticos de classificação aplicados a AS, denota-
remos F = {f1, f2, ..., fm} como sendo o conjunto de m
pré-definidas características que podem aparecer em um
texto. Além disso, temos que ni(t) representa o número
de ocorrências da característica fi no texto t. Assim, cada
texto (documento) pode ser representado pelo vetor:t =
(n1(t), n2(t), ..., nm(t))[7].
0.1.1 Naive Bayes
O classificador NB e suas variações devido a boa perfor-
mance e precisão associados a simplicidade são, entre todos
os probabilísticos, os mais populares[1], [8], [9].
Em geral, em classificadores NB atribui-se a classe c
(polaridade,sentimento, entre outros) para um texto t a
partir da função c∗ = argmaxc(P(c|t)) , onde P(c|t) é dado
pela teorema de Bayes:
P(c|t) =
P(c)P(t|c)
P(t)
(1)
Na equação (1),por simplicidade, em grande parte das
vezes, omite-se P(t) na valoração da probabilidade condi-
cional. Assim, os termos restantes são estimados a partir da
suposição de que as fi s características são condicionalmente
independentes,i.e.,
PNB(c|t) =
P(c) m
i=1 P(fi|c)ni(t)
P(t)
. (2)
Apesar da simplicidade e da suposição da forte supo-
sição de independência das probabilidades o algorítimo
de Naive Bayes continua sendo uma ótima opção, espe-
cialmente, como primeiro tratamento devido a sua fácil
implementação.
0.1.2 Máxima Entropia
O conceito de entropia máxima originário do formalismo da
Mecânica Estatística e de problemas que envolvem Teoria
da Informação é uma técnica alternativa a NB e que, em
algumas vezes, é mais eficaz na classificação e mineração de
textos[10]. Nesse contexto, assumimos que a probabilidade
condicional P(c|t) segue uma distribuição exponencial da
forma:
P(c|t) =
1
Z(t)
exp(
i
λi,cFi,c(t, c)) (3)
onde a função Fi,c responsável pela relação entre a
característica fi e a classe ci é frequentemente definida como
uma função degrau do tipo:
F(t, c ) =
1 ni(t) > 0 , c = c
0 ni(t) 0
(4)
o parâmetro λi,cs é um peso estatístico a ser estimado
que indica o quão fortemente a característica fi e a classe c
estão relacionadas. Por fim, a expressão Z(t) representa um
fator de normalização.
Ainda existem outras técnicas que podem ser aplicadas
como as redes neurais por exemplo, mas paremos por aqui
para não ficar muito longo o texto, até a próxima...
REFERÊNCIAS
[1] ALLAHYARI, M. et al. A brief survey of text mining: Classification,
clustering and extraction techniques. arXiv, 2017.
[2] NISHAJEBASEELI, A.; KIRUBAKARAN, E. A survey on sentiment
analysis of (product) reviews. International Journal of Computer Appli-
cations, Foundation of Computer Science, v. 47, n. 11, p. 36–39, jun
2012.
[3] LI, N.; WU, D. D. Using text mining and sentiment analysis for on-
line forums hotspot detection and forecast. Decision Support Systems,
Elsevier BV, v. 48, n. 2, p. 354–368, jan 2010.
[4] MEDHAT, W.; HASSAN, A.; KORASHY, H. Sentiment analysis
algorithms and applications: A survey. Ain Shams Engineering Journal,
Elsevier BV, v. 5, n. 4, p. 1093–1113, dec 2014.
[5] WILSON, T.; WIEBE, J.; HOFFMANN, P. Recognizing contextual
polarity in phrase-level sentiment analysis. In: . Vancouver, CA:
[s.n.], 2005. Disponível em: <https://www.microsoft.com/en-
us/research/publication/recognizing-contextual-polarity-in-
phrase-level-sentiment-analysis/>.
[6] JAIN, T. I.; NEMADE, D. Recognizing contextual polarity in phrase-
level sentiment analysis. International Journal of Computer Applicati-
ons, Foundation of Computer Science, v. 7, n. 5, p. 12–21, sep 2010.
[7] PANG, B.; LEE, L.; VAITHYANATHAN, S. Thumbs up? In: Procee-
dings of the ACL-02 conference on Empirical methods in natural language
processing. [S.l.]: Association for Computational Linguistics, 2002.
[8] MCCALLUM, A.; NIGAM, K. A comparison of event models for
naive bayes text classification. AAAI Technical Report, 1998.
[9] PATODKAR, V. N.; I.R, S. Twitter as a corpus for sentiment analysis
and opinion mining. IJARCCE, Tejass Publisheers, v. 5, n. 12, p. 320–
322, dec 2016.
[10] NIGAM, K. Using maximum entropy for text classification. In: In
IJCAI-99 Workshop on Machine Learning for Information Filtering. [S.l.:
s.n.], 1999. p. 61–67.

Mais conteúdo relacionado

Semelhante a Igor.siciliani.socialbase

analisesdiscursoconteudozeze-140326084806-phpapp02.pdf
analisesdiscursoconteudozeze-140326084806-phpapp02.pdfanalisesdiscursoconteudozeze-140326084806-phpapp02.pdf
analisesdiscursoconteudozeze-140326084806-phpapp02.pdfDanNamise
 
Um sistema inteligente baseado em ontologia para apoio ao esclarecimento de...
Um sistema inteligente baseado em ontologia para  apoio  ao esclarecimento de...Um sistema inteligente baseado em ontologia para  apoio  ao esclarecimento de...
Um sistema inteligente baseado em ontologia para apoio ao esclarecimento de...Raul Lopes
 
análise de conteúdo de entrevista
análise de conteúdo de entrevistaanálise de conteúdo de entrevista
análise de conteúdo de entrevistaMichelle Silva
 
Ontologia x meta modelo
Ontologia x meta modeloOntologia x meta modelo
Ontologia x meta modelogenival21
 
Normas para Organização do TCC - CPS
Normas para Organização do TCC - CPSNormas para Organização do TCC - CPS
Normas para Organização do TCC - CPSMarcio Duarte
 
Aspectos teoricos de análise documentaria
Aspectos teoricos de análise documentariaAspectos teoricos de análise documentaria
Aspectos teoricos de análise documentariaAmanda Oliveira
 
analise de conteúdo.ppt
analise de conteúdo.pptanalise de conteúdo.ppt
analise de conteúdo.pptTiara Melo
 
Modelo tcc anhanguera
Modelo tcc anhangueraModelo tcc anhanguera
Modelo tcc anhangueraSonia Macedo
 
Como Publicar Um Artigo Numa Revista Cientifica
Como Publicar Um Artigo Numa Revista CientificaComo Publicar Um Artigo Numa Revista Cientifica
Como Publicar Um Artigo Numa Revista CientificaCarlos Lopes
 
Analise textual discursiva - Galiazzi & Moraes (2016)
Analise textual discursiva  - Galiazzi & Moraes (2016)Analise textual discursiva  - Galiazzi & Moraes (2016)
Analise textual discursiva - Galiazzi & Moraes (2016)UNIVERSIDADE DE PERNAMBUCO
 
Revisão Sistemática e Bases de Pesquisa
Revisão Sistemática e Bases de PesquisaRevisão Sistemática e Bases de Pesquisa
Revisão Sistemática e Bases de PesquisaEdson Oliveira Junior
 
Análise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAnálise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAdilmar Dantas
 
Aspectos Teoricos de Analise Documentaria
Aspectos Teoricos de Analise DocumentariaAspectos Teoricos de Analise Documentaria
Aspectos Teoricos de Analise DocumentariaKlicia Mendonca
 

Semelhante a Igor.siciliani.socialbase (20)

análise de conteudo
análise de conteudoanálise de conteudo
análise de conteudo
 
Análise de conteúdo ppc
Análise de conteúdo ppcAnálise de conteúdo ppc
Análise de conteúdo ppc
 
Análises Discurso e Conteúdo (Zezé)
Análises Discurso e Conteúdo (Zezé)Análises Discurso e Conteúdo (Zezé)
Análises Discurso e Conteúdo (Zezé)
 
analisesdiscursoconteudozeze-140326084806-phpapp02.pdf
analisesdiscursoconteudozeze-140326084806-phpapp02.pdfanalisesdiscursoconteudozeze-140326084806-phpapp02.pdf
analisesdiscursoconteudozeze-140326084806-phpapp02.pdf
 
Um sistema inteligente baseado em ontologia para apoio ao esclarecimento de...
Um sistema inteligente baseado em ontologia para  apoio  ao esclarecimento de...Um sistema inteligente baseado em ontologia para  apoio  ao esclarecimento de...
Um sistema inteligente baseado em ontologia para apoio ao esclarecimento de...
 
Texto_analise.pdf
Texto_analise.pdfTexto_analise.pdf
Texto_analise.pdf
 
análise de conteúdo de entrevista
análise de conteúdo de entrevistaanálise de conteúdo de entrevista
análise de conteúdo de entrevista
 
Ontologia x meta modelo
Ontologia x meta modeloOntologia x meta modelo
Ontologia x meta modelo
 
Atlas analise de dados
Atlas analise de dadosAtlas analise de dados
Atlas analise de dados
 
O uso da análise fatorial
O uso da análise fatorialO uso da análise fatorial
O uso da análise fatorial
 
Normas para Organização do TCC - CPS
Normas para Organização do TCC - CPSNormas para Organização do TCC - CPS
Normas para Organização do TCC - CPS
 
Aspectos teoricos de análise documentaria
Aspectos teoricos de análise documentariaAspectos teoricos de análise documentaria
Aspectos teoricos de análise documentaria
 
analise de conteúdo.ppt
analise de conteúdo.pptanalise de conteúdo.ppt
analise de conteúdo.ppt
 
Modelo tcc anhanguera
Modelo tcc anhangueraModelo tcc anhanguera
Modelo tcc anhanguera
 
Como Publicar Um Artigo Numa Revista Cientifica
Como Publicar Um Artigo Numa Revista CientificaComo Publicar Um Artigo Numa Revista Cientifica
Como Publicar Um Artigo Numa Revista Cientifica
 
Analise textual discursiva - Galiazzi & Moraes (2016)
Analise textual discursiva  - Galiazzi & Moraes (2016)Analise textual discursiva  - Galiazzi & Moraes (2016)
Analise textual discursiva - Galiazzi & Moraes (2016)
 
Revisão Sistemática e Bases de Pesquisa
Revisão Sistemática e Bases de PesquisaRevisão Sistemática e Bases de Pesquisa
Revisão Sistemática e Bases de Pesquisa
 
Análise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAnálise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de Emoções
 
Cap. 14 análise de conteúdo em comunicação política
Cap. 14   análise de conteúdo em comunicação políticaCap. 14   análise de conteúdo em comunicação política
Cap. 14 análise de conteúdo em comunicação política
 
Aspectos Teoricos de Analise Documentaria
Aspectos Teoricos de Analise DocumentariaAspectos Teoricos de Analise Documentaria
Aspectos Teoricos de Analise Documentaria
 

Igor.siciliani.socialbase

  • 1. 1 Análise de sentimento: uma visão geral Igor Schoeller Sciliani(igor.siciliani@socialbase.com) ! Para mais conteúdo acesse: https://medium.com/socialbase :Nessa mini revisão bibliográfica sobre AS tento explicar um pouco do seu contexto e dar uma pincelada em algumas técnicas matemáticas mais comuns para sua aplicação. Na era da internet a Mineração de Textos (Text Mining) é um campo de pesquisa que tem ganhado notoriedade como consequência da grande quantidade de dados produzidos, sobretudo, através das interações em redes socais, pesquisas em saúde, notícias, transações bancárias, etc. Para se ter uma ideia, estima-se que até 2020 esse volume de dados atinja a marca de 40 zettabytes1 . Ainda, sabe-se que boa parcela desses dados( em sua maioria não estruturados) são armazenados na forma de texto, devido a facilidade de processamento e otimização de armazenamento[1]. Isto posto, o objetivo da Mineração de Texto é o de processar dados não estruturadas (textuais) visando a obtenção de informações importantes através da busca de padrões e tendências. Dentro desse escopo, uma técnica chamada de análise sentimento (AS) ou mineração de opinião (MO) se destaca devido a sua ampla aplicabilidade: classificação de opiniões de um modo geral, análise de satisfação, métricas de rede social, etc[2]. Sucintamente, a AS visa determinar a atitude de um falante ou escritor com respeito a algum assunto estabelecido ou a polaridade contextual geral ou reação emocional a um documento, interação ou evento. Essa ati- tude pode ser um julgamento, estado afetivo (isto é, o estado emocional do autor ou falante), ou a comunicação emocional pretendida (isto é, o efeito emocional pretendido pelo autor ou interlocutor)[3]. A AS tecnicamente pode ser considerada um processo de classificação em três níveis[4]: 1) Documento: Classifica a opinião expressa no docu- mento quanto a sua polaridade (positiva ou nega- tiva) ou sentimento; 2) Sentença: Classifica o sentimento expresso em cada sentença, ou seja, em partes menores do documento; 3) Aspecto: Visa classificar o sentimento em relação a aspectos específicos das entidades(palavras). Ou seja, classifica as diversas opiniões do sujeito da ação em relação a diferentes entidades (palavras). Na figura 1 está representado uma arquitetura geral para algoritmos dedicados a AS. O pré-processamento textual é uma das chaves para a maioria dos algoritmos de mineração de textos. Nessa 1. 1 ZB = 1021 bytes Figura 1. Processo de Análise de Sentimento Fonte: o próprio autor. Adaptado de MEDHAT, W.; HASSAN, A.; KORASHY, H, 2014. etapa são aplicadas algumas técnicas cruciais para o bom desempenho do classificador[1]: 1) Tokenização: Tokenização (do inglês tokenization) é o processo de particionar o texto em pedaços menores (palavras/frases) chamadas de tokens; 2) Filtragem: Refere-se a remoção de algumas palavras e caracteres do documento, tais como: pontuação, nomes de pessoas e locais, preposições, conjunções, etc; 3) Lematização: A lematização é o processo, efetiva- mente, de deflexionar uma palavra para determinar o seu lema (as flexões chamam-se lexemas); 4) Stemming: representa a tarefa de se tomar o radical da palavra. Vale ressaltar que nem todos os algoritmos de AS, necessari- amente, utilizam as técnicas de pré-processamento citadas.
  • 2. 2 Uma vez que a partir delas são assumidas várias simpli- ficações. Por exemplo, algoritmos que na etapa de pré- processamento valem-se da técnica de Lematização, auto- maticamente, desprezam a importância das flexões (gênero e grau) de uma mesma palavra. Ainda na Figura 1, tipicamente, para a etapa de identifi- cação de termos opinativos são utilizados dicionários léxicos de palavras e frases com suas respectivas polaridades (ou sentimentos). Há vários métodos sofisticados para a identi- ficação desses termos, onde muitos levam em consideração o contexto o qual esses estão inseridos[5], [6]. Uma vez selecionados os termos opinativos, como pró- ximo passo temos a seleção das características. Essa é rea- lizada, sobretudo, através da: (a) Contagem de frequência: contagem das palavras (individualmente ou um conjunto delas) e suas frequências de ocorrência; (b) ponderação binária, para cada palavra do texto atribui-se 1 se estiver contida no dicionário léxico e 0 para o outro caso. Também, é possível a inserção de pesos de frequência para identificar a importância do termo; (c) Partes do discurso: Busca por adjetivos como termos opinativos[4]. Em posse das características do texto (bag of features), já na etapa de classificação, são utilizados métodos estatísticos (Machine Learning) para a classificação e posterior aprendi- zagem (supervisionada, não-supervisionada ou por reforço) do algoritmo, dentre os quais destacaremos as mais comuns: Naive Bayes (NB), Máxima Entropia (ME) e Máquina de vetores de suporte (MVS)[7]. 0.1 Métodos estatísticos de classificação Para uma sucinta explanação sobre alguns dos principais métodos estatísticos de classificação aplicados a AS, denota- remos F = {f1, f2, ..., fm} como sendo o conjunto de m pré-definidas características que podem aparecer em um texto. Além disso, temos que ni(t) representa o número de ocorrências da característica fi no texto t. Assim, cada texto (documento) pode ser representado pelo vetor:t = (n1(t), n2(t), ..., nm(t))[7]. 0.1.1 Naive Bayes O classificador NB e suas variações devido a boa perfor- mance e precisão associados a simplicidade são, entre todos os probabilísticos, os mais populares[1], [8], [9]. Em geral, em classificadores NB atribui-se a classe c (polaridade,sentimento, entre outros) para um texto t a partir da função c∗ = argmaxc(P(c|t)) , onde P(c|t) é dado pela teorema de Bayes: P(c|t) = P(c)P(t|c) P(t) (1) Na equação (1),por simplicidade, em grande parte das vezes, omite-se P(t) na valoração da probabilidade condi- cional. Assim, os termos restantes são estimados a partir da suposição de que as fi s características são condicionalmente independentes,i.e., PNB(c|t) = P(c) m i=1 P(fi|c)ni(t) P(t) . (2) Apesar da simplicidade e da suposição da forte supo- sição de independência das probabilidades o algorítimo de Naive Bayes continua sendo uma ótima opção, espe- cialmente, como primeiro tratamento devido a sua fácil implementação. 0.1.2 Máxima Entropia O conceito de entropia máxima originário do formalismo da Mecânica Estatística e de problemas que envolvem Teoria da Informação é uma técnica alternativa a NB e que, em algumas vezes, é mais eficaz na classificação e mineração de textos[10]. Nesse contexto, assumimos que a probabilidade condicional P(c|t) segue uma distribuição exponencial da forma: P(c|t) = 1 Z(t) exp( i λi,cFi,c(t, c)) (3) onde a função Fi,c responsável pela relação entre a característica fi e a classe ci é frequentemente definida como uma função degrau do tipo: F(t, c ) = 1 ni(t) > 0 , c = c 0 ni(t) 0 (4) o parâmetro λi,cs é um peso estatístico a ser estimado que indica o quão fortemente a característica fi e a classe c estão relacionadas. Por fim, a expressão Z(t) representa um fator de normalização. Ainda existem outras técnicas que podem ser aplicadas como as redes neurais por exemplo, mas paremos por aqui para não ficar muito longo o texto, até a próxima... REFERÊNCIAS [1] ALLAHYARI, M. et al. A brief survey of text mining: Classification, clustering and extraction techniques. arXiv, 2017. [2] NISHAJEBASEELI, A.; KIRUBAKARAN, E. A survey on sentiment analysis of (product) reviews. International Journal of Computer Appli- cations, Foundation of Computer Science, v. 47, n. 11, p. 36–39, jun 2012. [3] LI, N.; WU, D. D. Using text mining and sentiment analysis for on- line forums hotspot detection and forecast. Decision Support Systems, Elsevier BV, v. 48, n. 2, p. 354–368, jan 2010. [4] MEDHAT, W.; HASSAN, A.; KORASHY, H. Sentiment analysis algorithms and applications: A survey. Ain Shams Engineering Journal, Elsevier BV, v. 5, n. 4, p. 1093–1113, dec 2014. [5] WILSON, T.; WIEBE, J.; HOFFMANN, P. Recognizing contextual polarity in phrase-level sentiment analysis. In: . Vancouver, CA: [s.n.], 2005. Disponível em: <https://www.microsoft.com/en- us/research/publication/recognizing-contextual-polarity-in- phrase-level-sentiment-analysis/>. [6] JAIN, T. I.; NEMADE, D. Recognizing contextual polarity in phrase- level sentiment analysis. International Journal of Computer Applicati- ons, Foundation of Computer Science, v. 7, n. 5, p. 12–21, sep 2010. [7] PANG, B.; LEE, L.; VAITHYANATHAN, S. Thumbs up? In: Procee- dings of the ACL-02 conference on Empirical methods in natural language processing. [S.l.]: Association for Computational Linguistics, 2002. [8] MCCALLUM, A.; NIGAM, K. A comparison of event models for naive bayes text classification. AAAI Technical Report, 1998. [9] PATODKAR, V. N.; I.R, S. Twitter as a corpus for sentiment analysis and opinion mining. IJARCCE, Tejass Publisheers, v. 5, n. 12, p. 320– 322, dec 2016. [10] NIGAM, K. Using maximum entropy for text classification. In: In IJCAI-99 Workshop on Machine Learning for Information Filtering. [S.l.: s.n.], 1999. p. 61–67.