SlideShare uma empresa Scribd logo
1 de 16
Baixar para ler offline
Desenvolvimento de um Protótipo
de Classificação Automática de
Opiniões
Paulo Henrique de Sousa
Orientador: Fernando Luiz de Oliveira
Introdução
• Mineração de dados;
• Descoberta de padrões e tendências;
• Provimento de vantagem competitiva.
Classificação de Opiniões
• Analise de Mídias Sociais;
• Automatização da classificação.
Processo KDD
KDD e KDT
Text Mining - Pré-processamento
• Tokenização;
• Limpeza – (Remoção de Stopwords);
• Stemming.
Tarefas de Text Mining
• Sumarização;
• Classificação;
• Clusterização;
• Associação.
Metodologia
• Referencial bibliográfico;
• Estudo da Weka API (algoritmo SVM e KNN);
• Base de Opiniões (APIs Facebook, Twitter e Google Plus);
• Desenvolvimento do Protótipo;
• Testes.
Protótipo de Classificação Automática
• Classificador de opiniões obtidas em tempo real.
– O resultado pode apoiar os gestores da empresa;
• Classifica as opiniões em 5 categorias.
– Positivas
– Muito positivas
– Negativas
– Muito negativas
– Neutras
Base de Conteúdo
• Facebook
Graph API - Search
• Twitter
API 1.1 - Search
• Google
Activities - Search
Arquitetura do Protótipo
• Biblioteca de mineração
– (Classe principal) ClassifierOptions
– TextDataBase
– TextReader
– WordProcessor
Arquitetura do Protótipo
Fluxo do projeto
Considerações Finais
• Para facilitar a análise das opiniões disponíveis na web é
importante a utilização de ferramentas adequadas, tal
como a apresentada neste trabalho;
• O trabalho foi muito importante por possibilitar o estudo
de uma área promissora que é a mineração de dados e
suas subáreas ;
• A utilização de palavras pré-classificadas com até 6
valores semânticos permite uma análise mais
abrangente;
• Em um trabalho futuro podem ser utilizadas as APIs de
streaming das redes sociais utilizadas.
Desenvolvimento de um Protótipo
de Classificação Automática de
Opiniões
Paulo Henrique de Sousa

Mais conteúdo relacionado

Semelhante a TCC - Classificação automática de opiniões

01/12 Introducao Workshop Atlas.ti 8
01/12 Introducao Workshop Atlas.ti 801/12 Introducao Workshop Atlas.ti 8
01/12 Introducao Workshop Atlas.ti 8Cícera Malheiro
 
Delphi Conference 2012 - Qualidade no Código
Delphi Conference 2012 - Qualidade no CódigoDelphi Conference 2012 - Qualidade no Código
Delphi Conference 2012 - Qualidade no CódigoJosé Araújo
 
SACV - Gestão de Candidaturas
SACV - Gestão de CandidaturasSACV - Gestão de Candidaturas
SACV - Gestão de CandidaturasMilourenco86
 
4 passos para PRODUZIR E PUBLICAR conteúdo na web
4 passos para PRODUZIR E PUBLICAR conteúdo na web4 passos para PRODUZIR E PUBLICAR conteúdo na web
4 passos para PRODUZIR E PUBLICAR conteúdo na webContentools
 
Roteamento de Perguntas em Redes Sociais
Roteamento de Perguntas em Redes SociaisRoteamento de Perguntas em Redes Sociais
Roteamento de Perguntas em Redes SociaisGuilherme
 
Pesquisa de Clima Organizacional
Pesquisa de Clima OrganizacionalPesquisa de Clima Organizacional
Pesquisa de Clima OrganizacionalBoog Consultoria
 
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho DuroTDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Durotdc-globalcode
 
Desenvolvimento ágil com Scrum e TFS 11 - Microsoft TechDay Sorocaba 2012
Desenvolvimento ágil com Scrum e TFS 11 - Microsoft TechDay Sorocaba 2012Desenvolvimento ágil com Scrum e TFS 11 - Microsoft TechDay Sorocaba 2012
Desenvolvimento ágil com Scrum e TFS 11 - Microsoft TechDay Sorocaba 2012Igor Abade
 
awari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdfawari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdfMarcos993896
 
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...Adolfo Guimaraes
 
Conhecendo SharePoint - Anhanguera IT Summit 2015
Conhecendo SharePoint - Anhanguera IT Summit 2015Conhecendo SharePoint - Anhanguera IT Summit 2015
Conhecendo SharePoint - Anhanguera IT Summit 2015Douglas Romão
 
Dheka - Apresentacao Institucional
Dheka - Apresentacao InstitucionalDheka - Apresentacao Institucional
Dheka - Apresentacao Institucionaldheka
 
SEO + Nova Plataforma de e-Commerce: Como escolher e Migrar com Sucesso
SEO + Nova Plataforma de e-Commerce: Como escolher e Migrar com SucessoSEO + Nova Plataforma de e-Commerce: Como escolher e Migrar com Sucesso
SEO + Nova Plataforma de e-Commerce: Como escolher e Migrar com SucessoGustavo Bacchin
 
Seo + Nova Plataforma de e-commerce: como escolher uma plataforma e migrar co...
Seo + Nova Plataforma de e-commerce: como escolher uma plataforma e migrar co...Seo + Nova Plataforma de e-commerce: como escolher uma plataforma e migrar co...
Seo + Nova Plataforma de e-commerce: como escolher uma plataforma e migrar co...E-Commerce Brasil
 
Estratégias de SEO Eficazes: como alcançar o máximo de resultados
Estratégias de SEO Eficazes: como alcançar o máximo de resultadosEstratégias de SEO Eficazes: como alcançar o máximo de resultados
Estratégias de SEO Eficazes: como alcançar o máximo de resultadosConversion
 
Descobrindo Conhecimento em Dados para Auxiliar a Tomada de Decisões
Descobrindo Conhecimento em Dados para Auxiliar a Tomada de DecisõesDescobrindo Conhecimento em Dados para Auxiliar a Tomada de Decisões
Descobrindo Conhecimento em Dados para Auxiliar a Tomada de DecisõesRodolfo Mendes
 

Semelhante a TCC - Classificação automática de opiniões (20)

01/12 Introducao Workshop Atlas.ti 8
01/12 Introducao Workshop Atlas.ti 801/12 Introducao Workshop Atlas.ti 8
01/12 Introducao Workshop Atlas.ti 8
 
Delphi Conference 2012 - Qualidade no Código
Delphi Conference 2012 - Qualidade no CódigoDelphi Conference 2012 - Qualidade no Código
Delphi Conference 2012 - Qualidade no Código
 
SACV - Gestão de Candidaturas
SACV - Gestão de CandidaturasSACV - Gestão de Candidaturas
SACV - Gestão de Candidaturas
 
BDD com Xamarin UI Test e Specflow
BDD com Xamarin UI Test e SpecflowBDD com Xamarin UI Test e Specflow
BDD com Xamarin UI Test e Specflow
 
4 passos para PRODUZIR E PUBLICAR conteúdo na web
4 passos para PRODUZIR E PUBLICAR conteúdo na web4 passos para PRODUZIR E PUBLICAR conteúdo na web
4 passos para PRODUZIR E PUBLICAR conteúdo na web
 
Roteamento de Perguntas em Redes Sociais
Roteamento de Perguntas em Redes SociaisRoteamento de Perguntas em Redes Sociais
Roteamento de Perguntas em Redes Sociais
 
Pesquisa de Clima Organizacional
Pesquisa de Clima OrganizacionalPesquisa de Clima Organizacional
Pesquisa de Clima Organizacional
 
Machine Learning Black Boxes
Machine Learning Black BoxesMachine Learning Black Boxes
Machine Learning Black Boxes
 
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho DuroTDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
 
Desenvolvimento ágil com Scrum e TFS 11 - Microsoft TechDay Sorocaba 2012
Desenvolvimento ágil com Scrum e TFS 11 - Microsoft TechDay Sorocaba 2012Desenvolvimento ágil com Scrum e TFS 11 - Microsoft TechDay Sorocaba 2012
Desenvolvimento ágil com Scrum e TFS 11 - Microsoft TechDay Sorocaba 2012
 
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
 
awari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdfawari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdf
 
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
 
Conhecendo SharePoint - Anhanguera IT Summit 2015
Conhecendo SharePoint - Anhanguera IT Summit 2015Conhecendo SharePoint - Anhanguera IT Summit 2015
Conhecendo SharePoint - Anhanguera IT Summit 2015
 
Dheka - Apresentacao Institucional
Dheka - Apresentacao InstitucionalDheka - Apresentacao Institucional
Dheka - Apresentacao Institucional
 
Pesquisa comportamento a2
Pesquisa comportamento a2Pesquisa comportamento a2
Pesquisa comportamento a2
 
SEO + Nova Plataforma de e-Commerce: Como escolher e Migrar com Sucesso
SEO + Nova Plataforma de e-Commerce: Como escolher e Migrar com SucessoSEO + Nova Plataforma de e-Commerce: Como escolher e Migrar com Sucesso
SEO + Nova Plataforma de e-Commerce: Como escolher e Migrar com Sucesso
 
Seo + Nova Plataforma de e-commerce: como escolher uma plataforma e migrar co...
Seo + Nova Plataforma de e-commerce: como escolher uma plataforma e migrar co...Seo + Nova Plataforma de e-commerce: como escolher uma plataforma e migrar co...
Seo + Nova Plataforma de e-commerce: como escolher uma plataforma e migrar co...
 
Estratégias de SEO Eficazes: como alcançar o máximo de resultados
Estratégias de SEO Eficazes: como alcançar o máximo de resultadosEstratégias de SEO Eficazes: como alcançar o máximo de resultados
Estratégias de SEO Eficazes: como alcançar o máximo de resultados
 
Descobrindo Conhecimento em Dados para Auxiliar a Tomada de Decisões
Descobrindo Conhecimento em Dados para Auxiliar a Tomada de DecisõesDescobrindo Conhecimento em Dados para Auxiliar a Tomada de Decisões
Descobrindo Conhecimento em Dados para Auxiliar a Tomada de Decisões
 

TCC - Classificação automática de opiniões

  • 1. Desenvolvimento de um Protótipo de Classificação Automática de Opiniões Paulo Henrique de Sousa Orientador: Fernando Luiz de Oliveira
  • 2. Introdução • Mineração de dados; • Descoberta de padrões e tendências; • Provimento de vantagem competitiva.
  • 3. Classificação de Opiniões • Analise de Mídias Sociais; • Automatização da classificação.
  • 6. Text Mining - Pré-processamento • Tokenização; • Limpeza – (Remoção de Stopwords); • Stemming.
  • 7. Tarefas de Text Mining • Sumarização; • Classificação; • Clusterização; • Associação.
  • 8. Metodologia • Referencial bibliográfico; • Estudo da Weka API (algoritmo SVM e KNN); • Base de Opiniões (APIs Facebook, Twitter e Google Plus); • Desenvolvimento do Protótipo; • Testes.
  • 9. Protótipo de Classificação Automática • Classificador de opiniões obtidas em tempo real. – O resultado pode apoiar os gestores da empresa; • Classifica as opiniões em 5 categorias. – Positivas – Muito positivas – Negativas – Muito negativas – Neutras
  • 10. Base de Conteúdo • Facebook Graph API - Search • Twitter API 1.1 - Search • Google Activities - Search
  • 11. Arquitetura do Protótipo • Biblioteca de mineração – (Classe principal) ClassifierOptions – TextDataBase – TextReader – WordProcessor
  • 14.
  • 15. Considerações Finais • Para facilitar a análise das opiniões disponíveis na web é importante a utilização de ferramentas adequadas, tal como a apresentada neste trabalho; • O trabalho foi muito importante por possibilitar o estudo de uma área promissora que é a mineração de dados e suas subáreas ; • A utilização de palavras pré-classificadas com até 6 valores semânticos permite uma análise mais abrangente; • Em um trabalho futuro podem ser utilizadas as APIs de streaming das redes sociais utilizadas.
  • 16. Desenvolvimento de um Protótipo de Classificação Automática de Opiniões Paulo Henrique de Sousa