O documento discute a evolução da arquitetura de sistemas, de centralizados para distribuídos, e como isso impacta o monitoramento. Apresenta como sistemas antigamente eram constituídos por aplicações e bancos de dados em um servidor, e hoje são microserviços e nanoserviços distribuídos. Explica que é necessário monitorar cada componente e métricas como uso da CPU, memória, disco e rede para garantir desempenho e disponibilidade do sistema.
7. Como monitoramos isso ?
Aplicação Banco de Dados
CPU
MemÓria
Disco
REDE
CPU
MemÓria
Disco
REDE
CPU
MemÓria
Disco
REDE
CPU
MemÓria
Disco
REDE
CPU
MemÓria
Disco
REDE
CPU
MemÓria
Disco
REDE
8. Nasce um uma nova forma de
fazer as coisas
- Micro-serviços
- Nano-Serviços
- Distribuídos
- Pequenos
- Independentes
- Tecnologia heterogênea
CONTAINERS
13. E como monitoramos isso?
APP 1 CPU - 100%
APP 1 CPU - 100%
APP 1 CPU - 10%
APP 1 CPU - 12%
APP 1 CPU - 100%
APP 1 CPU - 2%
AVG CPU - 54%
14. E como monitoramos isso?
APP 1 CPU - 95%
APP 1 CPU - 90%
APP 1 CPU - 10%
APP 1 CPU - 12%
APP 1 CPU - 90%
APP 1 CPU - 2%
AVG CPU - 49%
15. Vamos analisar
- 50% dos usuários está
presenciando lentidão neste
momento
APP 1 CPU - 100%
APP 1 CPU - 100%
APP 1 CPU - 10%
APP 1 CPU - 12%
APP 1 CPU - 100%
APP 1 CPU - 2%
16. Vamos mudar a pergunta
Para seu usuário:
Qual o valor ideal para uso de CPU ?
Qual o valor ideal para uso de Memória ?
Qual o valor ideal para uso de Disco ?
Qual o valor ideal para uso de Rede ?
17. Vamos mudar a pergunta
Para seu usuário:
Qual o valor ideal para uso de CPU ?
Qual o valor ideal para uso de Memória ?
Qual o valor ideal para uso de Disco ?
Qual o valor ideal para uso de Rede ?
18. O sistema tem que estar disponível
O sistema tem que ser rápido
O sistema não pode ter erros
O que seu usuário quer...
23. SLI
Real system problems
1. Quantos ms leva pra adicionar um item no carrinho?
2. Quandos ms leva para aprovar a compra?
3. Média de erros ao aprovar uma compra
24. SLO vs SLA
O que queremos entregar (METAS)
vs
o que mínimo que temos de entregar (CONTRATO)
25. Quando indicadores que representam a
perspectivas do usuário estão ok
O que significa um sistema funcionando ?