O documento descreve um projeto de mineração de texto para analisar chamados de um serviço de suporte técnico da empresa AGCO com o objetivo de identificar padrões e melhorar a eficiência das operações. O projeto usa técnicas como nuvens de palavras e análise de bigramas para categorizar chamados e sistemas responsáveis. Próximos passos incluem classificação de chamados e implementação em escala global.
No TDC 2017 em POA, eu e a Carol Loureiro apresentamos o case de Self-Service BI & Metodos Ágeis na AGCO, e como a metodologia tem ajudado a cia na melhoria dos processos de análises de dados.
Curso de People Analytics que desenvolvi para várias empresas, com foco prioritário na área de Recursos Humanos e onde a proposta principal é desmistificar a metodologia.
No TDC 2017 em POA, eu e a Carol Loureiro apresentamos o case de Self-Service BI & Metodos Ágeis na AGCO, e como a metodologia tem ajudado a cia na melhoria dos processos de análises de dados.
Curso de People Analytics que desenvolvi para várias empresas, com foco prioritário na área de Recursos Humanos e onde a proposta principal é desmistificar a metodologia.
Programa de People Analytics que já é oferecido nas empresas, com foco prioritário na área de Recursos Humanos e onde a proposta principal é desmistificar a metodologia.
Programa de People Analytics que já é oferecido nas empresas, com foco prioritário na área de Recursos Humanos e onde a proposta principal é desmistificar a metodologia.
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
Apresentação da utilização do PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho realizada no PgDay 2016 de Curitiba. Slides em :
Estamos na era da geração exponencial de dados. Iremos explorar este cenário validando se efetivamente os dados podem ser considerados como o novo petróleo, o quanto podem representar em ganhos para as organizações, apresentando um roadmap de como adotá-los como uma estratégia de negócios visando desmistificar e ajudar a entender como cada diferente empresa e cultura deve encarar essa tendência e incorporar na sua realidade e limitações.
Palestra apresentada na Conexão Softsul 2019 .
Virtualização de dados para Advanced Analytics e Machine LearningDenodo
Watch full webinar here: https://bit.ly/31iF9Ot
Técnicas avançadas de ciência de dados, como o Machine Learning, provaram ser uma ferramenta extremamente útil para se obter valiosos insights a partir de dados existentes. Plataformas como RapidMiner e bibliotecas para R e Python simplificam partes do processo e colocam técnicas avançadas à disposição de cientistas de dados. Entretanto, estes profissionais passam até 80% de seu tempo procurando os dados corretos e preparando-os em um formato ideal para a aplicação do Machine Learning. Com isso, a virtualização de dados se torna uma nova alternativa para abordar estas questões de uma maneira mais eficiente e ágil.
Participe deste webinar e descubra:
- Como você pode usar a Plataforma Denodo com grandes volumes de dados de uma maneira eficiente
- Casos de uso do cliente e uma demonstração ao vivo de análise preditiva e virtualização de dados
Palestra: Cientista de Dados – Dominando o Big Data com Software LivreAmbiente Livre
Serão apresentados os conceitos gerais sobre Big Data, as características as atividades do profissional de Big Data ( Cientista de Dados ), como tornar-se um cientista de dados, as principais ferramentas de mercado, e como este profissional pode usar o potencial das ferramentas de software livre e software aberto para dominar esta área de atuação.
Excelente material, com uma linguagem simples e objetiva, na abordagem de um tema relevante em Supply.
Recomendo a leitura, agrega, recicla e serve como material de apoio.
A palestra apresenta o conceito de data lakes e big data, e como estas arquiteturas são formadas para o armazenamento e consumo de grande volumes de dados, sua relação com as arquiteturas distribuídas como é o caso do ecosistema Hadoop e como o a suíte Pentaho pode ajudar na gestão e extração de informações para tomada de decisão com recursos de big data analitycs.
Programa de People Analytics que já é oferecido nas empresas, com foco prioritário na área de Recursos Humanos e onde a proposta principal é desmistificar a metodologia.
Programa de People Analytics que já é oferecido nas empresas, com foco prioritário na área de Recursos Humanos e onde a proposta principal é desmistificar a metodologia.
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
Apresentação da utilização do PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho realizada no PgDay 2016 de Curitiba. Slides em :
Estamos na era da geração exponencial de dados. Iremos explorar este cenário validando se efetivamente os dados podem ser considerados como o novo petróleo, o quanto podem representar em ganhos para as organizações, apresentando um roadmap de como adotá-los como uma estratégia de negócios visando desmistificar e ajudar a entender como cada diferente empresa e cultura deve encarar essa tendência e incorporar na sua realidade e limitações.
Palestra apresentada na Conexão Softsul 2019 .
Virtualização de dados para Advanced Analytics e Machine LearningDenodo
Watch full webinar here: https://bit.ly/31iF9Ot
Técnicas avançadas de ciência de dados, como o Machine Learning, provaram ser uma ferramenta extremamente útil para se obter valiosos insights a partir de dados existentes. Plataformas como RapidMiner e bibliotecas para R e Python simplificam partes do processo e colocam técnicas avançadas à disposição de cientistas de dados. Entretanto, estes profissionais passam até 80% de seu tempo procurando os dados corretos e preparando-os em um formato ideal para a aplicação do Machine Learning. Com isso, a virtualização de dados se torna uma nova alternativa para abordar estas questões de uma maneira mais eficiente e ágil.
Participe deste webinar e descubra:
- Como você pode usar a Plataforma Denodo com grandes volumes de dados de uma maneira eficiente
- Casos de uso do cliente e uma demonstração ao vivo de análise preditiva e virtualização de dados
Palestra: Cientista de Dados – Dominando o Big Data com Software LivreAmbiente Livre
Serão apresentados os conceitos gerais sobre Big Data, as características as atividades do profissional de Big Data ( Cientista de Dados ), como tornar-se um cientista de dados, as principais ferramentas de mercado, e como este profissional pode usar o potencial das ferramentas de software livre e software aberto para dominar esta área de atuação.
Excelente material, com uma linguagem simples e objetiva, na abordagem de um tema relevante em Supply.
Recomendo a leitura, agrega, recicla e serve como material de apoio.
A palestra apresenta o conceito de data lakes e big data, e como estas arquiteturas são formadas para o armazenamento e consumo de grande volumes de dados, sua relação com as arquiteturas distribuídas como é o caso do ecosistema Hadoop e como o a suíte Pentaho pode ajudar na gestão e extração de informações para tomada de decisão com recursos de big data analitycs.
Business Intelligence & Data Mining - Knowledge Discovery in Databases
TDC 2018 - Florianópolis - Case sobre Text Mining
1. Globalcode – Open4education
TEXT MINING
UMA ABORDAGEM SIMPLIFICADA PARA DESCOBERTA DE PADRÕES EM UM SERVICE DESK
João G. Gutheil
Abril/2018
2.
3. • 11 unidades
• 3.695 empregados
AGCO
América do Sul
Santa Rosa - RSIbirubá - RS
Marau - RS Mogi das Cruzes - SPPasso Fundo - RS Jundiaí - SP
Campinas - SPRibeirão Preto - SP Gen. Rodriguez - ARG
• Colheitadeiras
• 510 empregados
• Implementos
• 200 empregados
• Proteína Animal
• 409 empregados
• Tratores, Cabines e
Motores
• 795 empregados
• Armazenagem de grãos
• 50 empregados
• Peças
• 104 empregados
• Centro de Treinamento
• 8 empregados
• Soluções Canavieiras
• 186 empregados
• Tratores e Motores
• 191 empregados
Canoas - RS
• Tratores e Pulverizadores
• 1.208 empregados
Ernestina - RS
• Peças
• 34 empregados
AGCO AMÉRICA DO SUL
4. 4 Gerentes de Projeto
~40 funcionários
~20 projetos no Portfolio/Ano
AGCO AMÉRICA DO SUL - TI
5. 5
Sales
NPI/PMO
MKT
Sales
Ciência da Computação - Feevale
Especialização em Gestão do Conhecimento e Int. Estratégica - UCS
AGCO – Data Tower Team
Vice-Coordenador do GUBI (Grupo de Usuários de BI) – Sucesu RS
MKT
Sales
Joao.gutheil@agcocorp.com
www.linkedin.com/in/joaogutheil
JOÃO G. GUTHEIL
8. • Quais as causas dos chamados ?
• Qual a natureza de problema reportado
pelas áreas de negócio ?
• Quais aplicações são responsáveis pelo
maior número de chamados ?
“O caos”
• Gerar indicadores para todas as plantas
• Classificação de chamados
SERVICE-DESK
Canoas
Santa
Rosa
9. • Quais as causas dos chamados ?
• Qual a natureza de problema reportado
pelas áreas de negócio ?
• Quais aplicações são responsáveis pelo
maior número de chamados ?
“O caos”
• Gerar indicadores para todas as plantas
• Classificação de chamados
SERVICE-DESK
Categorização?
JD? JDE?
Email?
Contabilidade?
RH?
Volume?
10. EUREKA
- Autonomia
- Baixo custo
- Simplicidade
- Escalabilidade
Premissas
- Análise visual
- Interatividade
Requisitos
Incident Manager
11. - Sistemas de recomendação
- Reconhecimento de SPAM
- Análise de sentimentos (ex. Redes Sociais)
- Descoberta de padrões de comportamento
(Ex: Anamnese nutricional e a correlação entre doenças e hábitos alimentar)
- ....
INCIDENTE MANAGER
Text Mining
“Text mining is a … new field that attempts to glean meaningful
information from natural language text. It may be loosely
characterized as the process of analyzing text to extract information
that is useful for particular purposes.”
Ian H. Witten Computer Science, University of Waikato, Hamilton, New Zealand
12. 12
NPI/PMO
INCIDENT MANAGER – VERSÃO I
Pacotes utilizados
- TM Mineração de textos
- Wordcloud Criação de nuvem de termos
- vizNetwork Interface R para library vis.js
- Sqldf Manipulação de dataframes usando SQL
- Shiny Criação de aplicações WEB
- Shinydashboard Criação de dashboards
₋ Amostra com ~3600 observações
₋ Correlação entre os termos
₋ RStudio
₋ Shiny
Questionamentos
- Escala?
- Interatividade para o usuário (Ex.filtros, self-service)?
- Volume de dados (performance)?
17. 17
NPI/PMO
INCIDENT MANAGER - PRÓXIMOS PASSOS
TF-IDF
Análise de Bi-Gramas
Classificação de chamados (Redes Bayesianas)
Acesso à base de dados do Service Now
Processo de deploy corporativo (Global)
Banco de dados de alta performance – Cassandra + Presto