6. Text Mining - Pré-processamento
• Tokenização;
• Limpeza – (Remoção de Stopwords);
• Stemming.
7. Tarefas de Text Mining
• Sumarização;
• Classificação;
• Clusterização;
• Associação.
8. Metodologia
• Referencial bibliográfico;
• Estudo da Weka API (algoritmo SVM e KNN);
• Base de Opiniões (APIs Facebook, Twitter e Google Plus);
• Desenvolvimento do Protótipo;
• Testes.
9. Protótipo de Classificação Automática
• Classificador de opiniões obtidas em tempo real.
– O resultado pode apoiar os gestores da empresa;
• Classifica as opiniões em 5 categorias.
– Positivas
– Muito positivas
– Negativas
– Muito negativas
– Neutras
10. Base de Conteúdo
• Facebook
Graph API - Search
• Twitter
API 1.1 - Search
• Google
Activities - Search
11. Arquitetura do Protótipo
• Biblioteca de mineração
– (Classe principal) ClassifierOptions
– TextDataBase
– TextReader
– WordProcessor
15. Considerações Finais
• Para facilitar a análise das opiniões disponíveis na web é
importante a utilização de ferramentas adequadas, tal
como a apresentada neste trabalho;
• O trabalho foi muito importante por possibilitar o estudo
de uma área promissora que é a mineração de dados e
suas subáreas ;
• A utilização de palavras pré-classificadas com até 6
valores semânticos permite uma análise mais
abrangente;
• Em um trabalho futuro podem ser utilizadas as APIs de
streaming das redes sociais utilizadas.
16. Desenvolvimento de um Protótipo
de Classificação Automática de
Opiniões
Paulo Henrique de Sousa