Como fizemos pra coletar e indexar 11 gigas de logs/documentos por dia, gerados a partir de um conjunto sistemas de missão crítica, proporcionando ao cliente uma forma de antecipar problemas e responder rapidamente sobre anomalias na sua operação, em tempo real.
8. Questões como:
ciandt.com
1. Quais são as funcionalidades mais acessadas?
2. Qual foi a quantidade de erros não tratados nos últimos
dias (instabilidade)? Onde estão os logs?
3. Quantos usuários estão acessando o sistema
simultaneamente e a partir qual região (IP)?
4. Existe degradação no tempo de resposta nos períodos
de pico?
9. “If you can not measure it, you can not
improve it” -Lord Kelvin
18. Crie alertas e seja proativo
Como ser proativo
ciandt.com
19. Acompanhamento
das execuções de
monitoração
Envia
notificações de
acordo com
resultado de
queries
Alertas:
● Expansão do Witix para envio de
notificações no Celular
● Possibilidade de criar novos pontos de
monitoração (qualquer query do WiTIX)
● Integrações com: Telegram, Slack, Jira,
Shell e etc.
Benefícios:
❖ Monitoração 24x7 sem necessidade de
time
❖ Encaminhamento de cenários de forma
mais rápida
Notificações (Watcher ou Elastalert)
20. Alertas nos últimos 7 dias => +50% em 3 itens
Notificações (Watcher ou Elastalert) - serviço indisponível em 15 minutos
type: frequency #(spike, flatline, blacklist, whitelist, any, change)
timeframe:
minutes: 15
# Query a ser executada
filter:
- query:
query_string:
query: '(environment: "*PRD") AND message: "E152" AND message:
"TIBCO"'
# Para onde será enviado o alerta
alert:
- "telegram"
27. Tip #2: Tenha identificação de
origem (host, server, service)
28. ● environment
● hostname
● servername
● application
● module
Identificação da origem
application instance identifier:
29. Tip #3: Use UUID para tracking
entre os diferentes
documentos
30. Rastreabilidade entre diferentes índices
O request b7cd80b7 gerou 4 logs
entradas no log e 1 chamada SQL.
Fica mais fácil achar o problema
agora!!!
36. “Nenhum sistema jamais teve esse nível de
informação e assertividade para encontrar os
problemas. Hoje é possível saber o que realmente
está acontecendo com o sistema em produção, em
tempo real"
Client's Feedback
ciandt.com