O documento discute a aplicação de text mining em sistemas de atendimento on-line para melhorar a classificação de chamados e sugerir soluções. O sistema propõe usar processamento de linguagem natural nos registros de atendimento para alimentar uma base de conhecimento e permitir que o atendente consulte soluções similares. O documento descreve o processo de knowledge discovery in texts aplicado, incluindo pré-processamento, clustering com K-means e interpretação dos resultados.
2. Universidade Federal de Santa Catarina
Bacharelado em Sistemas de Informação
TEXT MINING APLICADO EM
SISTEMAS DE ATENDIMENTO ON-LINE
Aline Tereze Marchi
Marcos Antonio Ferreira Domingues
Orientador: Frank Siqueira
04 novembro de 2008
3. Contextualização
» Os negócios on-line tem tido um crescimento significativo de 2006
para 2007. Levando o percentual de empresas que possuem acesso
a Internet e já realizaram negócios on-line de 52% para 64% (*).
» Cerca 10% das pessoas que efetuaram negociações on-line tiveram
problemas/dúvidas ao adquirir produtos pela Internet (*).
» Diversidade de aplicações que oferecem chats para atendimento em
tempo real e/ou a abertura de chamados.
» Qualidade da classificação
conhecimento do atendente.
depende
muito
do
nível
de
» Registro dos atendimentos geralmente não é aproveitado
(processado) para facilitar a resolução de problemas semelhantes.
(*)Segundo CETIC.BR
4. CRM
» “Uma definição ampla de CRM incluiria todas as atividades
que transformam clientes eventuais em clientes
leais, satisfazendo ou excedendo as exigências deles”
Ronald Swift (2001).
» “As
comunicações
devem
ser
de
mão
dupla, integradas, registradas e gerenciadas. Sem dados
históricos, transações detalhadas, comunicações focalizadas
(...) um relacionamento não pode ser efetivamente mantido.”
» Atualmente, estamos vivenciando a valorização de
ferramentas de fácil utilização e que trazem grandes
benefícios aos usuários.
5. Proposta
» Proporcionar diferencial no atendimento de chamados e
ocorrências, atuando na retenção do cliente, sobretudo
em plataformas B2C.
» Tendo como característica o aproveitamento do
resultado do trabalho operacional na alimentação de
base de conhecimento.
» Atuação proativa na classificação dos atendimentos e
sugestões de soluções.
» Criação de uma arquitetura genérica que independa do
ramo de negócio.
6. Sistema de atendimentos on-line
Ocorrências
Usuário
BD
Oocorrências
Importação
das
conversas
Transformação
BD
Problemas
X
Soluções
Chat
Busca de
soluções
compatíveis
Atendente
Preparação dos
dados
Mineração
8. Sistema de atendimentos on-line
» Módulo operacional com finalidade de prover o
gerenciamento de atendimentos a serem reaproveitados
pelo módulo analítico.
» Sistema
Web
desenvolvido
utilizando
C#, JavaScript, AJAX, banco de dados SQL Server
2005, entre outros.
» Aplicação do processo de KDT.
» Proporcionar a conversação e sugestão de consultas ao
atendente.
10. Sistema de atendimentos on-line
» Dependendo do horário (pré-fixado) encaminha o cliente à
abertura de um chamado ou à conversação on-line.
» Na abertura de chamados o cliente informa o problema
ocorrido, informação base para a classificação.
» Implementação de fila de atendimentos, porém permite
liberdade ao atendente.
» O início do chat depende do atendimento
atendente, visando garantia de resposta..
pelo
11. Chat – Sugestão de soluções
» Atuação proativa, através da consulta na base de
soluções, utilizando palavras-chave digitadas pelo
atendente e cliente na consulta por problemas
semelhantes.
» Desconsideração das stop words.
» Registro de conversações para re-alimentação.
12. Processo de KDT
» O KDT (Knowledge Discovery in Texts) consiste em
algumas etapas:
Seleção da
informação
Préprocessamento
Transformação
Mineração
Interpretação
13. Seleção e Pré-processamento
» Generalização das
formas CHAT e
OCORRENCIA para
ATENDIMENTO.
» Remoção de
stopwords.
» Tokenização com
BrazilianAnalyzer
(Lucene).
» Utilização de
steeming.
14. K-Means
» A intenção do K-Means é gerar vários subconjuntos a
partir de um conjunto de dados, de modo que a
similaridade intra-grupo seja maior que a inter-grupos.
» Baseado em cálculo de distância relativa.
» Implementação
utilizada
é
opensource, disponibilizada no fórum KDKeys.net e
recebe como entrada uma matriz de double.
15. Transformação e Mineração
» Para viabilizar a utilização do K-Means foi aplicada uma
abordagem de palavras-chave, eleitas por um
especialista no negócio.
» Essas são pesquisadas na base, registrando o número
de ocorrências de cada palavra-chave em cada
atendimento.
» Como resultado obtém-se uma matriz de Atendimentos x
Keywords, que será a fonte de dados do K-Means.
17. Interpretação
» Após os clusters gerados, pode-se verificar a correlação
entre os Atendimentos atribuídos a um mesmo grupo.
Cluster
C12
C12
C12
Atendimento
Falei com a sueli do departamento juridico,renovei por mais 1 ano.
MODULO I E III,POR R$100,00 VIGENCIA DO CONTRATO:ANUAL
PERIODO:01/04/2008 A 31/03/2009 MENSAL 01 10 SUB
FECHEI COM ELAINE MÓDULOS I,II,III,IV R$100,00 CADA
VIGENCIA ANUAL PERIODO 01/05/2008 A 30/04/2009 LANÇ. 20
VENC.30 MÊS ATUAL
Cliente:1459 PREFEITURA MUNICIPAL DE CHAVANTES Renovei com
o Toninho(Antônio Lopes) Modulos I,II,III,IV 100,00 cada um e Modulo IX
250,00 Emisão:20 Venc:30 Vigencia:7 meses.(mensal) Periodo:01/05/2008 a
31/12/2008
Tokens em comum
assinaturas, módulos,
vigência
assinaturas, módulos,
vigência
assinaturas, módulos,
vigência
22. Conclusões
» Os resultados obtidos com a implementação do sistema
foram satisfatórios.
» A implementação da ferramenta mostrou que a proposta
tem possibilidades de agregar valor ao negócio, seja qual
for o ramo tratado nos atendimentos.
» O desempenho do K-Means com a abordagem de
palavras-chave
foi
bom,
gerando
grupos
concisos, que, com uma análise rápida já demonstram
grande semelhanças.
23. Trabalhos futuros
» Criação de relatórios
análise, como o Apriori.
com
» Criação
de
sinônimos
chave, proporcionando um
semântico.
outros
algoritmos
de
para
as
palavrasmelhor aproveitamento
» Análise dos chamados reabertos buscando identificar
soluções incompletas e/ou erradas.
25. Universidade Federal de Santa Catarina
Bacharelado em Sistemas de Informação
TEXT MINING APLICADO EM
SISTEMAS DE ATENDIMENTO ON-LINE
Aline Tereze Marchi
Marcos Antonio Ferreira Domingues
Orientador: Frank Siqueira
04 novembro de 2008