SlideShare uma empresa Scribd logo
Postmortem & Zabbix
“THE COST OF FAILURE IS EDUCATION.” DEVIN CARRAWAY
 Luiz Sales
 Owner at ServiceMonit
 Infrastructure Analyst
 Intelligence Of Things
 Zabbix Specialist and Professional
Eu
O que é? É de comer?
 O conceito postmortem é bem conhecido na indústria de tecnologia. Um
postmortem é um registro escrito de um incidente, seu impacto, as ações
tomadas para mitigá-lo ou resolvê-lo, a causa raiz e as ações de
acompanhamento para evitar que o incidente se repita.
Objetivos
 Os principais objetivos de escrever um postmortem são garantir que o incidente
seja documentado, que todas as causas básicas sejam bem compreendidas e,
especialmente, que ações preventivas efetivas sejam postas em prática para
reduzir a probabilidade e / ou o impacto da recorrência. Escrever um post-mortem
não é punição - é uma oportunidade de aprendizado para toda a empresa.
Gatilhos
 Degradação de acessso do usuario.
 Perda de dados de qualquer tipo
 Intervençao do Analista Senior, realizando qualquer atividade
 Resolução fora do tempo estabelecido
 A Monitoração fallhou (ou foi descoberto que não tinha monitoração ou não
estava bem definida)
ZABBIX
TOP 100 TRIGGERS
Como compartilhar o Postmortem
 Wiki
 Knowledge base
EXAMPLE POSTMORTEM
 Date:
 Authors: Luiz Sales
 Status: Complete.
 Summary: history syncer muito alto causando lentidão no ambiente e performance deteriorada
 Impact:Lentidão na interface web e monitoração de itens. Acesso a solução deteriorada, Clientes
reclmando que nao acesssam o portal.
 Root Causes: Lentidão em cascata quando ocorria o problema, com alto volume de incidentes
represados, ocasionado alta fila e lentidão nos seviços
 Trigger: History syncer is very high > 95%
 Resolution: Aumento de pollers padrões no Zabbix, ajustes de configuração no banco de dados. ,
melhorias no sistemas opercaional, prioridade de processos.
Referencias
 https://landing.google.com/sre/sre-book/chapters/postmortem/
 Luiz Sales
 +55 (11) 9 8832 5874
 luiz.sales@servicemonit.com.br
 https://www.linkedin.com/in/lsa1es/
 https://github.com/lsa1es
Contatos

Mais conteúdo relacionado

Semelhante a Postmortem & Zabbix

Desenvolvimento de exploits
Desenvolvimento de exploitsDesenvolvimento de exploits
Desenvolvimento de exploitsNaraBarros10
 
Post-mortems - aprendendo através de falhas
Post-mortems - aprendendo através de falhasPost-mortems - aprendendo através de falhas
Post-mortems - aprendendo através de falhasRiad Vargas
 
Monitoração - muito além do sistema operacional - WeOp 2014
Monitoração - muito além do sistema operacional - WeOp 2014Monitoração - muito além do sistema operacional - WeOp 2014
Monitoração - muito além do sistema operacional - WeOp 2014Marcus Vechiato
 
TDC2016SP - Equipes ágeis de infraestrutura
TDC2016SP - Equipes ágeis de infraestruturaTDC2016SP - Equipes ágeis de infraestrutura
TDC2016SP - Equipes ágeis de infraestruturatdc-globalcode
 
DXTEC: Uma breve abordagem sobre alta disponibilidade em bancos de dados
DXTEC: Uma breve abordagem sobre alta disponibilidade em bancos de dadosDXTEC: Uma breve abordagem sobre alta disponibilidade em bancos de dados
DXTEC: Uma breve abordagem sobre alta disponibilidade em bancos de dadosFranky Weber Faust
 
Os 10 maiores_erros_em_modelagem
Os 10 maiores_erros_em_modelagemOs 10 maiores_erros_em_modelagem
Os 10 maiores_erros_em_modelagemFabiola Mansur
 
Apresentação Workshop - Análise de Vulnerabilidades
Apresentação Workshop - Análise de VulnerabilidadesApresentação Workshop - Análise de Vulnerabilidades
Apresentação Workshop - Análise de VulnerabilidadesPetter Lopes
 
Palestra sobre Gestão de Riscos
Palestra sobre Gestão de RiscosPalestra sobre Gestão de Riscos
Palestra sobre Gestão de RiscosGLM Consultoria
 
Engenharia de Software - Unimep/Pronatec - Aula 4
Engenharia de Software - Unimep/Pronatec - Aula 4Engenharia de Software - Unimep/Pronatec - Aula 4
Engenharia de Software - Unimep/Pronatec - Aula 4André Phillip Bertoletti
 
Como começar na área de PenTest - Womcy Security Day Fatec
Como começar na área de PenTest - Womcy Security Day FatecComo começar na área de PenTest - Womcy Security Day Fatec
Como começar na área de PenTest - Womcy Security Day FatecJoas Antonio dos Santos
 
Importância dos Testes em Sistemas para Internet
Importância dos Testes em Sistemas para Internet Importância dos Testes em Sistemas para Internet
Importância dos Testes em Sistemas para Internet Elvis Fusco
 
Automatização de Centro de Ddos: Realidade ou Utopia
Automatização de Centro de Ddos: Realidade ou UtopiaAutomatização de Centro de Ddos: Realidade ou Utopia
Automatização de Centro de Ddos: Realidade ou Utopiaelliando dias
 

Semelhante a Postmortem & Zabbix (20)

Alats Seminario V03 3
Alats Seminario V03 3Alats Seminario V03 3
Alats Seminario V03 3
 
Desenvolvimento de exploits
Desenvolvimento de exploitsDesenvolvimento de exploits
Desenvolvimento de exploits
 
Ethical Hacking - Campus Party Brasília 2017
Ethical Hacking - Campus Party Brasília 2017Ethical Hacking - Campus Party Brasília 2017
Ethical Hacking - Campus Party Brasília 2017
 
Post-mortems - aprendendo através de falhas
Post-mortems - aprendendo através de falhasPost-mortems - aprendendo através de falhas
Post-mortems - aprendendo através de falhas
 
Monitoração - muito além do sistema operacional - WeOp 2014
Monitoração - muito além do sistema operacional - WeOp 2014Monitoração - muito além do sistema operacional - WeOp 2014
Monitoração - muito além do sistema operacional - WeOp 2014
 
TDC2016SP - Equipes ágeis de infraestrutura
TDC2016SP - Equipes ágeis de infraestruturaTDC2016SP - Equipes ágeis de infraestrutura
TDC2016SP - Equipes ágeis de infraestrutura
 
Tudo são Dados - PHP Conference 2008
Tudo são Dados - PHP Conference 2008Tudo são Dados - PHP Conference 2008
Tudo são Dados - PHP Conference 2008
 
Técnica de Planejamento
Técnica de PlanejamentoTécnica de Planejamento
Técnica de Planejamento
 
DXTEC: Uma breve abordagem sobre alta disponibilidade em bancos de dados
DXTEC: Uma breve abordagem sobre alta disponibilidade em bancos de dadosDXTEC: Uma breve abordagem sobre alta disponibilidade em bancos de dados
DXTEC: Uma breve abordagem sobre alta disponibilidade em bancos de dados
 
CNASI 2014 - Servicos Confiaveis
CNASI 2014 - Servicos ConfiaveisCNASI 2014 - Servicos Confiaveis
CNASI 2014 - Servicos Confiaveis
 
Os 10 maiores_erros_em_modelagem
Os 10 maiores_erros_em_modelagemOs 10 maiores_erros_em_modelagem
Os 10 maiores_erros_em_modelagem
 
Apresentação Workshop - Análise de Vulnerabilidades
Apresentação Workshop - Análise de VulnerabilidadesApresentação Workshop - Análise de Vulnerabilidades
Apresentação Workshop - Análise de Vulnerabilidades
 
Palestra sobre Gestão de Riscos
Palestra sobre Gestão de RiscosPalestra sobre Gestão de Riscos
Palestra sobre Gestão de Riscos
 
Método PACE
Método PACEMétodo PACE
Método PACE
 
Engenharia de Software - Unimep/Pronatec - Aula 4
Engenharia de Software - Unimep/Pronatec - Aula 4Engenharia de Software - Unimep/Pronatec - Aula 4
Engenharia de Software - Unimep/Pronatec - Aula 4
 
Como começar na área de PenTest - Womcy Security Day Fatec
Como começar na área de PenTest - Womcy Security Day FatecComo começar na área de PenTest - Womcy Security Day Fatec
Como começar na área de PenTest - Womcy Security Day Fatec
 
Importância dos Testes em Sistemas para Internet
Importância dos Testes em Sistemas para Internet Importância dos Testes em Sistemas para Internet
Importância dos Testes em Sistemas para Internet
 
MASP.pdf
MASP.pdfMASP.pdf
MASP.pdf
 
Palestras Como Ele Achou Estas Falhas V.1.0
Palestras Como Ele Achou Estas Falhas V.1.0Palestras Como Ele Achou Estas Falhas V.1.0
Palestras Como Ele Achou Estas Falhas V.1.0
 
Automatização de Centro de Ddos: Realidade ou Utopia
Automatização de Centro de Ddos: Realidade ou UtopiaAutomatização de Centro de Ddos: Realidade ou Utopia
Automatização de Centro de Ddos: Realidade ou Utopia
 

Mais de Luiz Sales

Comunidade Zabbix Brasil - Sendo um Colaborador Melhor
Comunidade Zabbix Brasil - Sendo um Colaborador MelhorComunidade Zabbix Brasil - Sendo um Colaborador Melhor
Comunidade Zabbix Brasil - Sendo um Colaborador MelhorLuiz Sales
 
Onde Podemos Chegar com Zabbix
Onde Podemos Chegar com ZabbixOnde Podemos Chegar com Zabbix
Onde Podemos Chegar com ZabbixLuiz Sales
 
Performando o Zabbix com o Hector
Performando o Zabbix com o HectorPerformando o Zabbix com o Hector
Performando o Zabbix com o HectorLuiz Sales
 
Westie - Um Framework canino em prol do Zabbix
Westie - Um Framework canino em prol do ZabbixWestie - Um Framework canino em prol do Zabbix
Westie - Um Framework canino em prol do ZabbixLuiz Sales
 
O que podemos fazer com o Zabbix
O que podemos fazer com o Zabbix O que podemos fazer com o Zabbix
O que podemos fazer com o Zabbix Luiz Sales
 
Inventariando ativos de rede com zabbix
Inventariando ativos de rede com zabbixInventariando ativos de rede com zabbix
Inventariando ativos de rede com zabbixLuiz Sales
 
Gerando Mapas de Rede Automatico - Zabbix API
Gerando Mapas de Rede Automatico - Zabbix API Gerando Mapas de Rede Automatico - Zabbix API
Gerando Mapas de Rede Automatico - Zabbix API Luiz Sales
 
Primeiros Passos na API do Zabbix com Python
Primeiros Passos na API do Zabbix com PythonPrimeiros Passos na API do Zabbix com Python
Primeiros Passos na API do Zabbix com PythonLuiz Sales
 
Zabbix under Docker - Meetup Campinas 2017
Zabbix under Docker - Meetup Campinas 2017Zabbix under Docker - Meetup Campinas 2017
Zabbix under Docker - Meetup Campinas 2017Luiz Sales
 
Qualidade de vida: Com Zabbix e API
Qualidade de vida: Com Zabbix e APIQualidade de vida: Com Zabbix e API
Qualidade de vida: Com Zabbix e APILuiz Sales
 
Hector - O melhor amigo do Homem também entende de Zabbix
Hector - O melhor amigo do Homem também entende de ZabbixHector - O melhor amigo do Homem também entende de Zabbix
Hector - O melhor amigo do Homem também entende de ZabbixLuiz Sales
 
Zabbix Meetup Sao Paulo 2017
Zabbix Meetup Sao Paulo 2017 Zabbix Meetup Sao Paulo 2017
Zabbix Meetup Sao Paulo 2017 Luiz Sales
 
Zabbix - Alem da Infraestrutura - Parte 2
Zabbix - Alem da Infraestrutura - Parte 2Zabbix - Alem da Infraestrutura - Parte 2
Zabbix - Alem da Infraestrutura - Parte 2Luiz Sales
 
ZABBIX - Além da Infraestrutura de TI - Meetup Zabbix Brasil - Sao Paulo
ZABBIX - Além da Infraestrutura de TI - Meetup Zabbix Brasil - Sao PauloZABBIX - Além da Infraestrutura de TI - Meetup Zabbix Brasil - Sao Paulo
ZABBIX - Além da Infraestrutura de TI - Meetup Zabbix Brasil - Sao PauloLuiz Sales
 

Mais de Luiz Sales (14)

Comunidade Zabbix Brasil - Sendo um Colaborador Melhor
Comunidade Zabbix Brasil - Sendo um Colaborador MelhorComunidade Zabbix Brasil - Sendo um Colaborador Melhor
Comunidade Zabbix Brasil - Sendo um Colaborador Melhor
 
Onde Podemos Chegar com Zabbix
Onde Podemos Chegar com ZabbixOnde Podemos Chegar com Zabbix
Onde Podemos Chegar com Zabbix
 
Performando o Zabbix com o Hector
Performando o Zabbix com o HectorPerformando o Zabbix com o Hector
Performando o Zabbix com o Hector
 
Westie - Um Framework canino em prol do Zabbix
Westie - Um Framework canino em prol do ZabbixWestie - Um Framework canino em prol do Zabbix
Westie - Um Framework canino em prol do Zabbix
 
O que podemos fazer com o Zabbix
O que podemos fazer com o Zabbix O que podemos fazer com o Zabbix
O que podemos fazer com o Zabbix
 
Inventariando ativos de rede com zabbix
Inventariando ativos de rede com zabbixInventariando ativos de rede com zabbix
Inventariando ativos de rede com zabbix
 
Gerando Mapas de Rede Automatico - Zabbix API
Gerando Mapas de Rede Automatico - Zabbix API Gerando Mapas de Rede Automatico - Zabbix API
Gerando Mapas de Rede Automatico - Zabbix API
 
Primeiros Passos na API do Zabbix com Python
Primeiros Passos na API do Zabbix com PythonPrimeiros Passos na API do Zabbix com Python
Primeiros Passos na API do Zabbix com Python
 
Zabbix under Docker - Meetup Campinas 2017
Zabbix under Docker - Meetup Campinas 2017Zabbix under Docker - Meetup Campinas 2017
Zabbix under Docker - Meetup Campinas 2017
 
Qualidade de vida: Com Zabbix e API
Qualidade de vida: Com Zabbix e APIQualidade de vida: Com Zabbix e API
Qualidade de vida: Com Zabbix e API
 
Hector - O melhor amigo do Homem também entende de Zabbix
Hector - O melhor amigo do Homem também entende de ZabbixHector - O melhor amigo do Homem também entende de Zabbix
Hector - O melhor amigo do Homem também entende de Zabbix
 
Zabbix Meetup Sao Paulo 2017
Zabbix Meetup Sao Paulo 2017 Zabbix Meetup Sao Paulo 2017
Zabbix Meetup Sao Paulo 2017
 
Zabbix - Alem da Infraestrutura - Parte 2
Zabbix - Alem da Infraestrutura - Parte 2Zabbix - Alem da Infraestrutura - Parte 2
Zabbix - Alem da Infraestrutura - Parte 2
 
ZABBIX - Além da Infraestrutura de TI - Meetup Zabbix Brasil - Sao Paulo
ZABBIX - Além da Infraestrutura de TI - Meetup Zabbix Brasil - Sao PauloZABBIX - Além da Infraestrutura de TI - Meetup Zabbix Brasil - Sao Paulo
ZABBIX - Além da Infraestrutura de TI - Meetup Zabbix Brasil - Sao Paulo
 

Postmortem & Zabbix

  • 1. Postmortem & Zabbix “THE COST OF FAILURE IS EDUCATION.” DEVIN CARRAWAY
  • 2.  Luiz Sales  Owner at ServiceMonit  Infrastructure Analyst  Intelligence Of Things  Zabbix Specialist and Professional Eu
  • 3. O que é? É de comer?  O conceito postmortem é bem conhecido na indústria de tecnologia. Um postmortem é um registro escrito de um incidente, seu impacto, as ações tomadas para mitigá-lo ou resolvê-lo, a causa raiz e as ações de acompanhamento para evitar que o incidente se repita.
  • 4. Objetivos  Os principais objetivos de escrever um postmortem são garantir que o incidente seja documentado, que todas as causas básicas sejam bem compreendidas e, especialmente, que ações preventivas efetivas sejam postas em prática para reduzir a probabilidade e / ou o impacto da recorrência. Escrever um post-mortem não é punição - é uma oportunidade de aprendizado para toda a empresa.
  • 5. Gatilhos  Degradação de acessso do usuario.  Perda de dados de qualquer tipo  Intervençao do Analista Senior, realizando qualquer atividade  Resolução fora do tempo estabelecido  A Monitoração fallhou (ou foi descoberto que não tinha monitoração ou não estava bem definida)
  • 8. Como compartilhar o Postmortem  Wiki  Knowledge base
  • 9. EXAMPLE POSTMORTEM  Date:  Authors: Luiz Sales  Status: Complete.  Summary: history syncer muito alto causando lentidão no ambiente e performance deteriorada  Impact:Lentidão na interface web e monitoração de itens. Acesso a solução deteriorada, Clientes reclmando que nao acesssam o portal.  Root Causes: Lentidão em cascata quando ocorria o problema, com alto volume de incidentes represados, ocasionado alta fila e lentidão nos seviços  Trigger: History syncer is very high > 95%  Resolution: Aumento de pollers padrões no Zabbix, ajustes de configuração no banco de dados. , melhorias no sistemas opercaional, prioridade de processos.
  • 11.  Luiz Sales  +55 (11) 9 8832 5874  luiz.sales@servicemonit.com.br  https://www.linkedin.com/in/lsa1es/  https://github.com/lsa1es Contatos