SlideShare uma empresa Scribd logo
ANÁLISE DE
SENTIMENTOS
Métodos Quantitativos para a Decisão
Económica e Empresarial
Joana Fernandes Figueira, nº 45286
Unidade Curricular: Gestão de Dados
Docente: Carlos Costa
1. INTRODUÇÃO
• Crescente dependência dos consumidores pela
internet e pelos serviços que esta disponibiliza;
• Quantidade de informação gerada diariamente tem vindo a aumentar;
• Comentários online ganharam uma estrema importância na decisão final,
quer dos consumidores quer das empresas;
• Com a chegada dos métodos de classificação automática tornou-se
possível analisar uma muito maior quantidade de informação num menor
espaço de tempo.
2. CONCEITOS FUNDAMENTAIS
• Nos problemas de classificação de textos, os documentos são normalmente
representados através de componentes menores
Palavras ou n-gramas (sequência de palavras ou caracteres consecutivos)
• Uma forma possível de representar as diversas componentes de um documento
textual é utilizando o modelo de espaço vetorial
Um determinado peso está associado a cada componente que é representado por um
vetor de características
 Word Embeddings
Amplamente utilizada hoje em dia para o
processamento de linguagem natural.
Nesta abordagem, as palavras são
representadas como vetores de grande
dimensão.
Palavras com vetores idênticos tendem a ser
semanticamente semelhantes.
Figura 1: Word Embedding projetados em
duas dimensões.
 Processamento de Linguagem Natural (PLN)
Campo específico dentro da área da computação e da inteligência artificial
que estuda a capacidade que os computadores têm de entender a linguagem
humana.
Função Softmax
Função exponencial normalizada que é muitas vezes usadas para classificar
os outputs das redes neuronais em valores entre 0 e 1. Esta função define a
probabilidade de uma determinada categoria, dentro de um problema com
várias classes.
Rede Neuronal
3. REVISÃO DE LITERATURA
Modelo fasttext
• Proposto por Joulin e colegas (grupo de investigadores do Facebook) ;
• Abordagem softmax baseada numa árvore binária;
• Representavam o documento como um conjunto de n-gramas e,
posteriormente, recolhiam o rótulo com maior probabilidade
Modelo hierárquico para
classificação textual
• Explorar duas características dos
documentos textuais:
- Natureza hierárquica dos inputs
considerados;
- A importância relativa das diferentes palavras
e frases no texto.
• Word encoder
- Substituem as palavras pelo seu word
embedding;
- Aplicam um codificador de palavras
GRU’s bidirecionais
xit = Wewit, t ∈ [1, T],
= , t ∈ [1, T],
= , t ∈ [T, 1].
Figura 3: Hierarchical Attention Model
• Word attention
- Extrair as palavras mais importantes no contexto de cada frase. Esta é
medida comparando cada palavra com o vetor de contexto.
• Sentence encoder e Sentence attention
• Exemplo
- Seleção das palavras com um
sentimento mais relevante para
a classificação;
- Previsão texto da direito com
5
estrelas
texto da esquerda
com 1 estrela
Figura 4: Documentos do Yelp 2013. Número 4 significa
5 estrelas, Número 0 significa 1 estrela.
4. PROPOSTA DE SOLUÇÃO
Standfor Sentiment Treebank baseado numa rede tensorial neuronal
regressiva (RNTN)
• Primeiro modelo que classifica os seus datasets com um rótulo mais
específico, permitindo a melhor análise das frases;
• Melhoria de 9,7% atingindo uma precisão de 80,7%;
• Melhorar a precisão de 80% para 85,4%;
• Calculo da representação vetorial de uma frase
através de um esquema em árvore binária. A
frase é dividida em palavras, e o sistema vai
analisá-la de forma ascendente.
• Cada palavra é representada por um vetor e,
posteriormente, o vetor representativo do nó
da árvore é calculado tendo em conta os
vetores das palavras que lhe estão associadas.
Figura 7: Classificação de sentimentos
através do modelo neuronal recursivos
• Cálculo dos vetores no nós da árvore
• Adição do tensor V para dividir as frases de forma bilinear
)
)
5. EXEMPLIFICAÇÃO
Figura 8: Análise do sentimento na frase - I had a terrible experience and I
will never come back to this horrible restaurant
Figura 9: Análise do sentimento na frase - I love that movie.
6. CONCLUSÃO
• A análise de sentimentos é uma técnica em franca expansão e com uma
aplicabilidade cada vez maior;
• Tanto os consumidores como as empresas se interessam por ter feedback
dos produtos e/ ou serviços que pretendem adquirir ou colocar à disposição
do público;
• Desenvolvimentos deste tipo de modelos é essencial para que a análise de
sentimentos seja cada vez mais eficazes e eficientes.
https://nlp.stanford.edu/sentiment/treebank.h
tml

Mais conteúdo relacionado

Semelhante a Análise de Sentimentos

Machine Learning e Artificial Intelligence para desenvolvedores .NET
Machine Learning e Artificial Intelligence para desenvolvedores .NETMachine Learning e Artificial Intelligence para desenvolvedores .NET
Machine Learning e Artificial Intelligence para desenvolvedores .NET
Renato Haddad
 
Banco de dados orientado a objetos
Banco de dados orientado a objetosBanco de dados orientado a objetos
Banco de dados orientado a objetos
Stefan Horochovec
 
01 Orientacao A Objetos Programacao
01   Orientacao A Objetos   Programacao01   Orientacao A Objetos   Programacao
01 Orientacao A Objetos Programacao
taniamaciel
 
DissertacaoBechara
DissertacaoBecharaDissertacaoBechara
DissertacaoBechara
Startup Cursos
 
Modelos Quantitativos de Recuperação da Informação
Modelos Quantitativos de Recuperação da InformaçãoModelos Quantitativos de Recuperação da Informação
Modelos Quantitativos de Recuperação da Informação
Viviane Santos Cunha
 
Análise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAnálise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de Emoções
Adilmar Dantas
 
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
tdc-globalcode
 
ID3 Algorithm
ID3 AlgorithmID3 Algorithm
ID3 Algorithm
Michel Alves
 
Normas para Organização do TCC - CPS
Normas para Organização do TCC - CPSNormas para Organização do TCC - CPS
Normas para Organização do TCC - CPS
Marcio Duarte
 
Algumas das principais características do NoSQL
Algumas das principais características do NoSQLAlgumas das principais características do NoSQL
Algumas das principais características do NoSQL
Eric Silva
 
Apresentação da Dissertação
Apresentação da DissertaçãoApresentação da Dissertação
Apresentação da Dissertação
Hélio Rodrigues de Oliveira
 
Algoritmos e-programacao-apostila-completa
Algoritmos e-programacao-apostila-completaAlgoritmos e-programacao-apostila-completa
Algoritmos e-programacao-apostila-completa
Assis Alcantara
 
Enteprise Integration Patterns
Enteprise Integration PatternsEnteprise Integration Patterns
Enteprise Integration Patterns
Alessandro Kieras
 
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
Ahirton Lopes
 
Proposta de uma Abordagem Formal para o Gerenciamento de Variabilidades em Mo...
Proposta de uma Abordagem Formal para o Gerenciamento de Variabilidades em Mo...Proposta de uma Abordagem Formal para o Gerenciamento de Variabilidades em Mo...
Proposta de uma Abordagem Formal para o Gerenciamento de Variabilidades em Mo...
Edson Oliveira Junior
 
Apresentação dissertação - modelagem semântica de ontologia do domínio EAD
Apresentação dissertação - modelagem semântica de ontologia do domínio EADApresentação dissertação - modelagem semântica de ontologia do domínio EAD
Apresentação dissertação - modelagem semântica de ontologia do domínio EAD
ienh
 
Portifolio grupo
Portifolio grupoPortifolio grupo
Portifolio grupo
scorpiontech
 
Fundamentos de banco dados
Fundamentos de banco dadosFundamentos de banco dados
Fundamentos de banco dados
Rogério Fernandes da Costa
 
Um Estudo sobre Gerenciamento de Variabilidade em Linhas de Processo de Software
Um Estudo sobre Gerenciamento de Variabilidade em Linhas de Processo de SoftwareUm Estudo sobre Gerenciamento de Variabilidade em Linhas de Processo de Software
Um Estudo sobre Gerenciamento de Variabilidade em Linhas de Processo de Software
Edson Oliveira Junior
 
Modelagem Dados - Introdução à Conceitos
Modelagem Dados - Introdução à ConceitosModelagem Dados - Introdução à Conceitos
Modelagem Dados - Introdução à Conceitos
paulocoob
 

Semelhante a Análise de Sentimentos (20)

Machine Learning e Artificial Intelligence para desenvolvedores .NET
Machine Learning e Artificial Intelligence para desenvolvedores .NETMachine Learning e Artificial Intelligence para desenvolvedores .NET
Machine Learning e Artificial Intelligence para desenvolvedores .NET
 
Banco de dados orientado a objetos
Banco de dados orientado a objetosBanco de dados orientado a objetos
Banco de dados orientado a objetos
 
01 Orientacao A Objetos Programacao
01   Orientacao A Objetos   Programacao01   Orientacao A Objetos   Programacao
01 Orientacao A Objetos Programacao
 
DissertacaoBechara
DissertacaoBecharaDissertacaoBechara
DissertacaoBechara
 
Modelos Quantitativos de Recuperação da Informação
Modelos Quantitativos de Recuperação da InformaçãoModelos Quantitativos de Recuperação da Informação
Modelos Quantitativos de Recuperação da Informação
 
Análise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAnálise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de Emoções
 
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
 
ID3 Algorithm
ID3 AlgorithmID3 Algorithm
ID3 Algorithm
 
Normas para Organização do TCC - CPS
Normas para Organização do TCC - CPSNormas para Organização do TCC - CPS
Normas para Organização do TCC - CPS
 
Algumas das principais características do NoSQL
Algumas das principais características do NoSQLAlgumas das principais características do NoSQL
Algumas das principais características do NoSQL
 
Apresentação da Dissertação
Apresentação da DissertaçãoApresentação da Dissertação
Apresentação da Dissertação
 
Algoritmos e-programacao-apostila-completa
Algoritmos e-programacao-apostila-completaAlgoritmos e-programacao-apostila-completa
Algoritmos e-programacao-apostila-completa
 
Enteprise Integration Patterns
Enteprise Integration PatternsEnteprise Integration Patterns
Enteprise Integration Patterns
 
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
 
Proposta de uma Abordagem Formal para o Gerenciamento de Variabilidades em Mo...
Proposta de uma Abordagem Formal para o Gerenciamento de Variabilidades em Mo...Proposta de uma Abordagem Formal para o Gerenciamento de Variabilidades em Mo...
Proposta de uma Abordagem Formal para o Gerenciamento de Variabilidades em Mo...
 
Apresentação dissertação - modelagem semântica de ontologia do domínio EAD
Apresentação dissertação - modelagem semântica de ontologia do domínio EADApresentação dissertação - modelagem semântica de ontologia do domínio EAD
Apresentação dissertação - modelagem semântica de ontologia do domínio EAD
 
Portifolio grupo
Portifolio grupoPortifolio grupo
Portifolio grupo
 
Fundamentos de banco dados
Fundamentos de banco dadosFundamentos de banco dados
Fundamentos de banco dados
 
Um Estudo sobre Gerenciamento de Variabilidade em Linhas de Processo de Software
Um Estudo sobre Gerenciamento de Variabilidade em Linhas de Processo de SoftwareUm Estudo sobre Gerenciamento de Variabilidade em Linhas de Processo de Software
Um Estudo sobre Gerenciamento de Variabilidade em Linhas de Processo de Software
 
Modelagem Dados - Introdução à Conceitos
Modelagem Dados - Introdução à ConceitosModelagem Dados - Introdução à Conceitos
Modelagem Dados - Introdução à Conceitos
 

Mais de eurosigdoc acm

Blockchain e o Futuro do Setor Financeiro
Blockchain e o Futuro do Setor FinanceiroBlockchain e o Futuro do Setor Financeiro
Blockchain e o Futuro do Setor Financeiro
eurosigdoc acm
 
No code – Caso Prático no App Inventor - BroTrip
No code – Caso Prático no App Inventor - BroTripNo code – Caso Prático no App Inventor - BroTrip
No code – Caso Prático no App Inventor - BroTrip
eurosigdoc acm
 
The oracle problem nos smart contracts
The oracle problem nos smart contractsThe oracle problem nos smart contracts
The oracle problem nos smart contracts
eurosigdoc acm
 
Robotic process automation
Robotic process automation Robotic process automation
Robotic process automation
eurosigdoc acm
 
Robotic Process Automation: caso de estudo Delloite
Robotic Process Automation: caso de estudo DelloiteRobotic Process Automation: caso de estudo Delloite
Robotic Process Automation: caso de estudo Delloite
eurosigdoc acm
 
Projeção do Crowdfunding em Portugal: a plataforma ppl
Projeção do Crowdfunding em Portugal: a plataforma pplProjeção do Crowdfunding em Portugal: a plataforma ppl
Projeção do Crowdfunding em Portugal: a plataforma ppl
eurosigdoc acm
 
Implementação de uma aplicação em Power Apps – Low Code
Implementação de uma aplicação em Power Apps – Low CodeImplementação de uma aplicação em Power Apps – Low Code
Implementação de uma aplicação em Power Apps – Low Code
eurosigdoc acm
 
Proteção de dados e redes sociais
Proteção de dados e redes sociaisProteção de dados e redes sociais
Proteção de dados e redes sociais
eurosigdoc acm
 
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIALCLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
eurosigdoc acm
 
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDINGCROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
eurosigdoc acm
 
Low code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicaçõesLow code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicações
eurosigdoc acm
 
Robotic Process Automation
Robotic Process AutomationRobotic Process Automation
Robotic Process Automation
eurosigdoc acm
 
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDECrowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
eurosigdoc acm
 
Business Intelligence e o Desporto
Business Intelligence e o DesportoBusiness Intelligence e o Desporto
Business Intelligence e o Desporto
eurosigdoc acm
 
Blockchain
Blockchain Blockchain
Blockchain
eurosigdoc acm
 
Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?
eurosigdoc acm
 
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
eurosigdoc acm
 
Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo
eurosigdoc acm
 
Outsystems e o Universo do Low-Code
Outsystems e o Universo do Low-CodeOutsystems e o Universo do Low-Code
Outsystems e o Universo do Low-Code
eurosigdoc acm
 
Erp
ErpErp

Mais de eurosigdoc acm (20)

Blockchain e o Futuro do Setor Financeiro
Blockchain e o Futuro do Setor FinanceiroBlockchain e o Futuro do Setor Financeiro
Blockchain e o Futuro do Setor Financeiro
 
No code – Caso Prático no App Inventor - BroTrip
No code – Caso Prático no App Inventor - BroTripNo code – Caso Prático no App Inventor - BroTrip
No code – Caso Prático no App Inventor - BroTrip
 
The oracle problem nos smart contracts
The oracle problem nos smart contractsThe oracle problem nos smart contracts
The oracle problem nos smart contracts
 
Robotic process automation
Robotic process automation Robotic process automation
Robotic process automation
 
Robotic Process Automation: caso de estudo Delloite
Robotic Process Automation: caso de estudo DelloiteRobotic Process Automation: caso de estudo Delloite
Robotic Process Automation: caso de estudo Delloite
 
Projeção do Crowdfunding em Portugal: a plataforma ppl
Projeção do Crowdfunding em Portugal: a plataforma pplProjeção do Crowdfunding em Portugal: a plataforma ppl
Projeção do Crowdfunding em Portugal: a plataforma ppl
 
Implementação de uma aplicação em Power Apps – Low Code
Implementação de uma aplicação em Power Apps – Low CodeImplementação de uma aplicação em Power Apps – Low Code
Implementação de uma aplicação em Power Apps – Low Code
 
Proteção de dados e redes sociais
Proteção de dados e redes sociaisProteção de dados e redes sociais
Proteção de dados e redes sociais
 
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIALCLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
 
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDINGCROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
 
Low code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicaçõesLow code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicações
 
Robotic Process Automation
Robotic Process AutomationRobotic Process Automation
Robotic Process Automation
 
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDECrowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
 
Business Intelligence e o Desporto
Business Intelligence e o DesportoBusiness Intelligence e o Desporto
Business Intelligence e o Desporto
 
Blockchain
Blockchain Blockchain
Blockchain
 
Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?
 
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
 
Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo
 
Outsystems e o Universo do Low-Code
Outsystems e o Universo do Low-CodeOutsystems e o Universo do Low-Code
Outsystems e o Universo do Low-Code
 
Erp
ErpErp
Erp
 

Análise de Sentimentos

  • 1. ANÁLISE DE SENTIMENTOS Métodos Quantitativos para a Decisão Económica e Empresarial Joana Fernandes Figueira, nº 45286 Unidade Curricular: Gestão de Dados Docente: Carlos Costa
  • 2. 1. INTRODUÇÃO • Crescente dependência dos consumidores pela internet e pelos serviços que esta disponibiliza; • Quantidade de informação gerada diariamente tem vindo a aumentar; • Comentários online ganharam uma estrema importância na decisão final, quer dos consumidores quer das empresas; • Com a chegada dos métodos de classificação automática tornou-se possível analisar uma muito maior quantidade de informação num menor espaço de tempo.
  • 3. 2. CONCEITOS FUNDAMENTAIS • Nos problemas de classificação de textos, os documentos são normalmente representados através de componentes menores Palavras ou n-gramas (sequência de palavras ou caracteres consecutivos) • Uma forma possível de representar as diversas componentes de um documento textual é utilizando o modelo de espaço vetorial Um determinado peso está associado a cada componente que é representado por um vetor de características
  • 4.  Word Embeddings Amplamente utilizada hoje em dia para o processamento de linguagem natural. Nesta abordagem, as palavras são representadas como vetores de grande dimensão. Palavras com vetores idênticos tendem a ser semanticamente semelhantes. Figura 1: Word Embedding projetados em duas dimensões.
  • 5.  Processamento de Linguagem Natural (PLN) Campo específico dentro da área da computação e da inteligência artificial que estuda a capacidade que os computadores têm de entender a linguagem humana. Função Softmax Função exponencial normalizada que é muitas vezes usadas para classificar os outputs das redes neuronais em valores entre 0 e 1. Esta função define a probabilidade de uma determinada categoria, dentro de um problema com várias classes. Rede Neuronal
  • 6. 3. REVISÃO DE LITERATURA Modelo fasttext • Proposto por Joulin e colegas (grupo de investigadores do Facebook) ; • Abordagem softmax baseada numa árvore binária; • Representavam o documento como um conjunto de n-gramas e, posteriormente, recolhiam o rótulo com maior probabilidade
  • 7. Modelo hierárquico para classificação textual • Explorar duas características dos documentos textuais: - Natureza hierárquica dos inputs considerados; - A importância relativa das diferentes palavras e frases no texto. • Word encoder - Substituem as palavras pelo seu word embedding; - Aplicam um codificador de palavras GRU’s bidirecionais xit = Wewit, t ∈ [1, T], = , t ∈ [1, T], = , t ∈ [T, 1]. Figura 3: Hierarchical Attention Model
  • 8. • Word attention - Extrair as palavras mais importantes no contexto de cada frase. Esta é medida comparando cada palavra com o vetor de contexto. • Sentence encoder e Sentence attention • Exemplo - Seleção das palavras com um sentimento mais relevante para a classificação; - Previsão texto da direito com 5 estrelas texto da esquerda com 1 estrela Figura 4: Documentos do Yelp 2013. Número 4 significa 5 estrelas, Número 0 significa 1 estrela.
  • 9. 4. PROPOSTA DE SOLUÇÃO Standfor Sentiment Treebank baseado numa rede tensorial neuronal regressiva (RNTN) • Primeiro modelo que classifica os seus datasets com um rótulo mais específico, permitindo a melhor análise das frases; • Melhoria de 9,7% atingindo uma precisão de 80,7%; • Melhorar a precisão de 80% para 85,4%;
  • 10. • Calculo da representação vetorial de uma frase através de um esquema em árvore binária. A frase é dividida em palavras, e o sistema vai analisá-la de forma ascendente. • Cada palavra é representada por um vetor e, posteriormente, o vetor representativo do nó da árvore é calculado tendo em conta os vetores das palavras que lhe estão associadas. Figura 7: Classificação de sentimentos através do modelo neuronal recursivos
  • 11. • Cálculo dos vetores no nós da árvore • Adição do tensor V para dividir as frases de forma bilinear ) )
  • 12. 5. EXEMPLIFICAÇÃO Figura 8: Análise do sentimento na frase - I had a terrible experience and I will never come back to this horrible restaurant
  • 13. Figura 9: Análise do sentimento na frase - I love that movie.
  • 14. 6. CONCLUSÃO • A análise de sentimentos é uma técnica em franca expansão e com uma aplicabilidade cada vez maior; • Tanto os consumidores como as empresas se interessam por ter feedback dos produtos e/ ou serviços que pretendem adquirir ou colocar à disposição do público; • Desenvolvimentos deste tipo de modelos é essencial para que a análise de sentimentos seja cada vez mais eficazes e eficientes.