Business Intelligence & Data Mining - Knowledge Discovery in Databases
TDC 2018 - Florianópolis - Case sobre Text Mining
1. Globalcode – Open4education
TEXT MINING
UMA ABORDAGEM SIMPLIFICADA PARA DESCOBERTA DE PADRÕES EM UM SERVICE DESK
João G. Gutheil
Abril/2018
2.
3. • 11 unidades
• 3.695 empregados
AGCO
América do Sul
Santa Rosa - RSIbirubá - RS
Marau - RS Mogi das Cruzes - SPPasso Fundo - RS Jundiaí - SP
Campinas - SPRibeirão Preto - SP Gen. Rodriguez - ARG
• Colheitadeiras
• 510 empregados
• Implementos
• 200 empregados
• Proteína Animal
• 409 empregados
• Tratores, Cabines e
Motores
• 795 empregados
• Armazenagem de grãos
• 50 empregados
• Peças
• 104 empregados
• Centro de Treinamento
• 8 empregados
• Soluções Canavieiras
• 186 empregados
• Tratores e Motores
• 191 empregados
Canoas - RS
• Tratores e Pulverizadores
• 1.208 empregados
Ernestina - RS
• Peças
• 34 empregados
AGCO AMÉRICA DO SUL
4. 4 Gerentes de Projeto
~40 funcionários
~20 projetos no Portfolio/Ano
AGCO AMÉRICA DO SUL - TI
5. 5
Sales
NPI/PMO
MKT
Sales
Ciência da Computação - Feevale
Especialização em Gestão do Conhecimento e Int. Estratégica - UCS
AGCO – Data Tower Team
Vice-Coordenador do GUBI (Grupo de Usuários de BI) – Sucesu RS
MKT
Sales
Joao.gutheil@agcocorp.com
www.linkedin.com/in/joaogutheil
JOÃO G. GUTHEIL
8. • Quais as causas dos chamados ?
• Qual a natureza de problema reportado
pelas áreas de negócio ?
• Quais aplicações são responsáveis pelo
maior número de chamados ?
“O caos”
• Gerar indicadores para todas as plantas
• Classificação de chamados
SERVICE-DESK
Canoas
Santa
Rosa
9. • Quais as causas dos chamados ?
• Qual a natureza de problema reportado
pelas áreas de negócio ?
• Quais aplicações são responsáveis pelo
maior número de chamados ?
“O caos”
• Gerar indicadores para todas as plantas
• Classificação de chamados
SERVICE-DESK
Categorização?
JD? JDE?
Email?
Contabilidade?
RH?
Volume?
10. EUREKA
- Autonomia
- Baixo custo
- Simplicidade
- Escalabilidade
Premissas
- Análise visual
- Interatividade
Requisitos
Incident Manager
11. - Sistemas de recomendação
- Reconhecimento de SPAM
- Análise de sentimentos (ex. Redes Sociais)
- Descoberta de padrões de comportamento
(Ex: Anamnese nutricional e a correlação entre doenças e hábitos alimentar)
- ....
INCIDENTE MANAGER
Text Mining
“Text mining is a … new field that attempts to glean meaningful
information from natural language text. It may be loosely
characterized as the process of analyzing text to extract information
that is useful for particular purposes.”
Ian H. Witten Computer Science, University of Waikato, Hamilton, New Zealand
12. 12
NPI/PMO
INCIDENT MANAGER – VERSÃO I
Pacotes utilizados
- TM Mineração de textos
- Wordcloud Criação de nuvem de termos
- vizNetwork Interface R para library vis.js
- Sqldf Manipulação de dataframes usando SQL
- Shiny Criação de aplicações WEB
- Shinydashboard Criação de dashboards
₋ Amostra com ~3600 observações
₋ Correlação entre os termos
₋ RStudio
₋ Shiny
Questionamentos
- Escala?
- Interatividade para o usuário (Ex.filtros, self-service)?
- Volume de dados (performance)?
17. 17
NPI/PMO
INCIDENT MANAGER - PRÓXIMOS PASSOS
TF-IDF
Análise de Bi-Gramas
Classificação de chamados (Redes Bayesianas)
Acesso à base de dados do Service Now
Processo de deploy corporativo (Global)
Banco de dados de alta performance – Cassandra + Presto