O documento discute a implementação de telemetria em uma plataforma usando InfluxDB e Grafana para fornecer visibilidade sobre o desempenho. Ele descreve como a telemetria resolveu problemas de falta de métricas e tendências, permitindo que os desenvolvedores identificassem problemas antes dos clientes. Explica como o InfluxDB armazena e consulta dados de séries temporais e como o Grafana pode ser usado para criar gráficos que representam esses dados.
11. Healthcheck: OK / NOK
Não tínhamos números dos tempos da plataforma
Era muito difícil perceber tendências e casos
estranhos
Logs apenas mostram operações
Clientes percebiam problemas antes da gente
25. Equivale a uma tabela SQL
Chave primáriaTime
Measurement
Values
Tags
Chaves-valor da medida,
não indexados
Metadados indexados,
sempre strings
cpu_load
load=30,temperature=50
server=name1,region=EMEA
POINT
26. > SELECT * FROM policy_entry
name: policy_entry
------------------
time cache_hit host success time
1464013724 1 saasauth0005 1 0.35
Fetching data
27. > SELECT * FROM policy_entry
name: policy_entry
------------------
time cache_hit host success time
1464013724 1 saasauth0005 1 0.35
Fetching data