SlideShare uma empresa Scribd logo
1 de 51
Baixar para ler offline
Gerenciamento de incidentes
no mundo de microserviços
Quem sou eu ?
Felipe Signorini, SRE na Udemy, criador do
Maestro server, uma plataforma de
gerenciamento de servidores e aplicações
para ambientes multi cloud.
https://github.com/Signorini - @signorini
https://medium.com/@felipeklerkk
- Introdução
- O por que do microserviço
- SRE
- Gerenciamento de incidentes
- Por onde começar
- Oncall
- Post mortem
- Mudando a cultura
Agenda
Microserviço, a solução de todos os
problemas
Problemas de performance?
- Microserviço
Problemas de escalabilidade?
- Microserviço
Seu time está desmotivado
- Microserviço
Falta de resiliência?
- Microserviço
Precisa de uma tecnologia moderna?
- Microserviço = Kubernetes
Introduction
Caso 2 - Microserviços + nodejs
Carolina Pascale - Microservices using
Node.js and RabbitMQ - BrazilJS Conf 2017
https://www.youtube.com/watch?v=M7le0OEF9NQ
Introduction
Caso 2 - Borg até o Prometheus: SRE
Felipe Signorini e Paulo Castro - Borg até o
Prometheus: Site Reliability Engineering -
TDC2017
https://www.slideshare.net/felipesignorini/tdc-2017-b
org-at-o-prometheus-site-reliability-engineering
Introduction
Caso 3 - The way our backend works
It's because of the way our backend works -
Kraken.
https://www.youtube.com/watch?v=y8OnoxKotPQ
Introduction
μServices
Palavra para reunir tudo isso Microserviços.
Pensando em todo esse novo cenário procuramos uma maneira
de entender a operação como developers.
Prometheus apareceu de uma maneira natural já que foi
pensado em como monitorar aplicação publicadas no
Kubernetes.
Borg e SRE
Cargo Cult
O por que do
Microserviços
Qual a real vantagem do microserviço?
Microserviço Monolítico
Performance
Qual a real vantagem do microserviço?
Microserviço Monolítico
Performance Possível via engenharia Com uma boa arquitetura de
código
Qual a real vantagem do microserviço?
Microserviço Monolítico
Performance Possível via engenharia Com uma boa arquitetura de
código
Escalabilidade
Qual a real vantagem do microserviço?
Microserviço Monolítico
Performance Possível via engenharia Com uma boa arquitetura de
código
Escalabilidade Federação dos serviços por
natureza
Com uma boa arquitetura de
serviços
Qual a real vantagem do microserviço?
Microserviço Monolítico
Performance Possível via engenharia Com uma boa arquitetura de
código
Escalabilidade Federação dos serviços por
natureza
Com uma boa arquitetura de
serviços
Manutenção
Qual a real vantagem do microserviço?
Microserviço Monolítico
Performance Possível via engenharia Com uma boa arquitetura de
código
Escalabilidade Federação dos serviços por
natureza
Com uma boa arquitetura de
serviços
Manutenção Facilita para o desenvolvedor,
porém pesa para o arquitetura
Com uma boa arquitetura de
código
Qual a real vantagem do microserviço?
Microserviço Monolítico
Qual a real vantagem do microserviço?
Microserviço Monolítico
Performance Possível via engenharia Com uma boa arquitetura de
código
Escalabilidade Federação dos serviços por
natureza
Com uma boa arquitetura de
serviços
Manutenção Facilita para o desenvolvedor,
porém pesa para o arquitetura
Com uma boa arquitetura de
código
Capacidade de
evolução
Qual a real vantagem do microserviço?
Microserviço Monolítico
Performance Possível via engenharia Com uma boa arquitetura de
código
Escalabilidade Federação dos serviços por
natureza
Com uma boa arquitetura de
serviços
Manutenção Facilita para o desenvolvedor,
porém pesa para o arquitetura
Com uma boa arquitetura de
código
Capacidade de
evolução
Grande capacidade de escalar
pessoas e código.
Quanto maior o time, mais difícil
de manter todos na mesma
página.
Qual a real vantagem do microserviço?
Capacidade de evolução
=
Escalabilidade de pessoas, times e
funcionalidade
Qual a real vantagem do microserviço?
Capacidade de evolução
=
Escalabilidade de pessoas e times
SRE
class SRE implements DevOps
Sre como um time que habilita
outros times a operar
Sla como contratos a ser seguidos
- Não é o cargo do DevOps
- Não vai contra o DevOps
- Ownership entre os times de desenvolvimento
- SLA como um contrato a ser seguido
Gerenciamento de
incidentes
O gerenciamento de incidentes é um conjunto de processos
para restauração da operação normal de um ou mais serviços
o mais rápido possível durante um mal funcionamento.
O que é?
- Foco na tecnologia
- O herói solitário
- Istio tá tudo
vermelho
Incidente não gerenciado
- Escolha os canais de comunicação oficial
- Estabeleça alertas de acordo com os SLAs
- Composição do time de oncall
- Post mortem
Onde começar
Escolha os canais de comunicação oficial
Chats Video call Status page Email
Social
Alertas de acordo com o SLA
- Evite a fadiga de alertas
- Utilize poucos SLAs e depois vai
incrementando lentamente
- Seja pragmático
Alertas de acordo com o SLA
- Contrato para com os usuários
- Up and down
- Velocidade
- Contrato para com outros serviços
- Latência
- Capacidade de processamento
O time de suporte é responsável por gerenciar o incidente
não em resolve-lo.
Ownership
O time de suporte (aka oncall)
é a linha de frente de qualquer
incidente, quando algo
acontece ele é o primeiro a ser
alertado tendo como
responsabilidade estar alerta e
disponível a tomar qualquer
ação em qualquer momento.
Oncall
Baseados em senioridade
Oncall
Baseados em papéis
Oncall
O especialista é o engenheiro que deve-se
ficar alerta, estar disponível a qualquer
problema que ocorra em períodos dentro do
horário comercial bem como fora do mesmo.
- Ter autonomia
- Atender o chamado de forma rápida.
- Possuir conhecimentos técnicos e bom
senso.
O especialista - AKA Oncaller
O gerente de oncall deve-se oferecer suporte
ao engenheiro oncaller.
- Ter um grande bom senso de julgamento
- Durante um incidente, possui poderes
acima de diretores
O gerente de suporte - AKA Call leader
- Gerente de suporte
- Suplente
- Escriba
- Representante interno
- Representante externo
- Especialistas
Oncall - Pager Duty
Post mortem
- O momento certo para
discutir mudanças de
arquitetura
- Soluções para resolução
completa
Comparação SRE e ITILv4
O modelo de gerenciamento de incidentes SRE, foca em
suportar times ágil, com autonomia de operação de sistemas
por equipe, totalmente baseado em interações e com a total
descentralização das decisões, o ITIL foca mais na garantia de
governança na padronização de processos através de comando
controle.
- error budged
- oncall baseado em papéis
- flexibilização de processos
- registro de incidentes
- oncall baseado em senioridade
- comando controle
Mudança na
tecnologia cultura
Não mude tudo radicalmente, faça
mudanças incrementais juntamente
com a maturidade dos processos.
- Evite ao máximo o burnout
- Não cultive a cultura do herói
solitário
- Evite tentar fazer múltiplos papéis
- Confecção do post mortem deve
ser uma tarefa crítica
Boas práticas
Foque nas pessoas e não nas
ferramentas
Thanks
github.com/Signorini
medium.com/@felipeklerkk

Mais conteúdo relacionado

Mais procurados

Quebrando barreiras entre desenvolvimento e operação de software com DevOps
Quebrando barreiras entre desenvolvimento e operação de software com DevOpsQuebrando barreiras entre desenvolvimento e operação de software com DevOps
Quebrando barreiras entre desenvolvimento e operação de software com DevOpsJosé Alexandre Macedo
 
Cultura DevOps - Integração entre infra e devel
Cultura DevOps - Integração entre infra e develCultura DevOps - Integração entre infra e devel
Cultura DevOps - Integração entre infra e develJose Augusto Carvalho
 
DevOps - Estado da Arte
DevOps - Estado da ArteDevOps - Estado da Arte
DevOps - Estado da Arteilegra
 
Tornando se um DevOps sem perder a cabeça #SE7I2016
Tornando se um DevOps sem perder a cabeça #SE7I2016Tornando se um DevOps sem perder a cabeça #SE7I2016
Tornando se um DevOps sem perder a cabeça #SE7I2016Camilla Gomes
 
Arquitetura de Software para a Entrega Continua
Arquitetura de Software para a Entrega ContinuaArquitetura de Software para a Entrega Continua
Arquitetura de Software para a Entrega ContinuaOtávio Calaça Xavier
 
[DevOps Summit Brasil] Procura-se: DevOps!
[DevOps Summit Brasil] Procura-se: DevOps![DevOps Summit Brasil] Procura-se: DevOps!
[DevOps Summit Brasil] Procura-se: DevOps!Camilla Gomes
 
TDC2018FLN | Trilha Agile - Criando o produto certo usando Impact Mapping e t...
TDC2018FLN | Trilha Agile - Criando o produto certo usando Impact Mapping e t...TDC2018FLN | Trilha Agile - Criando o produto certo usando Impact Mapping e t...
TDC2018FLN | Trilha Agile - Criando o produto certo usando Impact Mapping e t...tdc-globalcode
 
TDC 2019 Cloud - Liberte sua arquitetura com cloud native
TDC 2019 Cloud - Liberte sua arquitetura com cloud nativeTDC 2019 Cloud - Liberte sua arquitetura com cloud native
TDC 2019 Cloud - Liberte sua arquitetura com cloud nativeAndré Paulovich
 
Sucesso e derrota na Arquitetura Agile
Sucesso e derrota na Arquitetura AgileSucesso e derrota na Arquitetura Agile
Sucesso e derrota na Arquitetura AgileSérgio Giraldo
 
Integração contínua - Rumo à automação e ao DEVOPS
Integração contínua - Rumo à automação e ao DEVOPSIntegração contínua - Rumo à automação e ao DEVOPS
Integração contínua - Rumo à automação e ao DEVOPSFabiano Souza
 
Phprs meetup - deploys automatizados com gitlab
Phprs   meetup - deploys automatizados com gitlabPhprs   meetup - deploys automatizados com gitlab
Phprs meetup - deploys automatizados com gitlabJackson F. de A. Mafra
 
Conceitos Básicos Sobre Metodologias Ágeis para Desenvolvimento de Software
Conceitos Básicos Sobre Metodologias Ágeis para Desenvolvimento de SoftwareConceitos Básicos Sobre Metodologias Ágeis para Desenvolvimento de Software
Conceitos Básicos Sobre Metodologias Ágeis para Desenvolvimento de SoftwareFelizardo Charles
 
Agile Trends Gov 2017 - Do repositório à producao
Agile Trends Gov 2017 - Do repositório à producaoAgile Trends Gov 2017 - Do repositório à producao
Agile Trends Gov 2017 - Do repositório à producaoStéfano H. dos Santos
 
Da Integração à Entrega Contínua
Da Integração à Entrega ContínuaDa Integração à Entrega Contínua
Da Integração à Entrega ContínuaMarlon Bernardes
 
IFSP 2015 - Cultura DevOps
IFSP 2015 - Cultura DevOpsIFSP 2015 - Cultura DevOps
IFSP 2015 - Cultura DevOpsLeonardo Comelli
 
Procura-se: DevOps #cpbr9
Procura-se: DevOps #cpbr9Procura-se: DevOps #cpbr9
Procura-se: DevOps #cpbr9Camilla Gomes
 
Alm e ATLM - A importância dos lifecycles no desenvolvimento de software
Alm e ATLM - A  importância dos lifecycles no desenvolvimento de softwareAlm e ATLM - A  importância dos lifecycles no desenvolvimento de software
Alm e ATLM - A importância dos lifecycles no desenvolvimento de softwareVandre Ramos, MSc, MBA, CSM
 
TDC2016SP - Versionando sua infraestrutura: Como e porque fazer, baseado em c...
TDC2016SP - Versionando sua infraestrutura: Como e porque fazer, baseado em c...TDC2016SP - Versionando sua infraestrutura: Como e porque fazer, baseado em c...
TDC2016SP - Versionando sua infraestrutura: Como e porque fazer, baseado em c...tdc-globalcode
 

Mais procurados (20)

Quebrando barreiras entre desenvolvimento e operação de software com DevOps
Quebrando barreiras entre desenvolvimento e operação de software com DevOpsQuebrando barreiras entre desenvolvimento e operação de software com DevOps
Quebrando barreiras entre desenvolvimento e operação de software com DevOps
 
Cultura DevOps - Integração entre infra e devel
Cultura DevOps - Integração entre infra e develCultura DevOps - Integração entre infra e devel
Cultura DevOps - Integração entre infra e devel
 
DevOps - Estado da Arte
DevOps - Estado da ArteDevOps - Estado da Arte
DevOps - Estado da Arte
 
Tornando se um DevOps sem perder a cabeça #SE7I2016
Tornando se um DevOps sem perder a cabeça #SE7I2016Tornando se um DevOps sem perder a cabeça #SE7I2016
Tornando se um DevOps sem perder a cabeça #SE7I2016
 
Apresentacao dev ops
Apresentacao dev opsApresentacao dev ops
Apresentacao dev ops
 
O que é DevOps afinal?
O que é DevOps afinal?O que é DevOps afinal?
O que é DevOps afinal?
 
Arquitetura de Software para a Entrega Continua
Arquitetura de Software para a Entrega ContinuaArquitetura de Software para a Entrega Continua
Arquitetura de Software para a Entrega Continua
 
[DevOps Summit Brasil] Procura-se: DevOps!
[DevOps Summit Brasil] Procura-se: DevOps![DevOps Summit Brasil] Procura-se: DevOps!
[DevOps Summit Brasil] Procura-se: DevOps!
 
TDC2018FLN | Trilha Agile - Criando o produto certo usando Impact Mapping e t...
TDC2018FLN | Trilha Agile - Criando o produto certo usando Impact Mapping e t...TDC2018FLN | Trilha Agile - Criando o produto certo usando Impact Mapping e t...
TDC2018FLN | Trilha Agile - Criando o produto certo usando Impact Mapping e t...
 
TDC 2019 Cloud - Liberte sua arquitetura com cloud native
TDC 2019 Cloud - Liberte sua arquitetura com cloud nativeTDC 2019 Cloud - Liberte sua arquitetura com cloud native
TDC 2019 Cloud - Liberte sua arquitetura com cloud native
 
Sucesso e derrota na Arquitetura Agile
Sucesso e derrota na Arquitetura AgileSucesso e derrota na Arquitetura Agile
Sucesso e derrota na Arquitetura Agile
 
Integração contínua - Rumo à automação e ao DEVOPS
Integração contínua - Rumo à automação e ao DEVOPSIntegração contínua - Rumo à automação e ao DEVOPS
Integração contínua - Rumo à automação e ao DEVOPS
 
Phprs meetup - deploys automatizados com gitlab
Phprs   meetup - deploys automatizados com gitlabPhprs   meetup - deploys automatizados com gitlab
Phprs meetup - deploys automatizados com gitlab
 
Conceitos Básicos Sobre Metodologias Ágeis para Desenvolvimento de Software
Conceitos Básicos Sobre Metodologias Ágeis para Desenvolvimento de SoftwareConceitos Básicos Sobre Metodologias Ágeis para Desenvolvimento de Software
Conceitos Básicos Sobre Metodologias Ágeis para Desenvolvimento de Software
 
Agile Trends Gov 2017 - Do repositório à producao
Agile Trends Gov 2017 - Do repositório à producaoAgile Trends Gov 2017 - Do repositório à producao
Agile Trends Gov 2017 - Do repositório à producao
 
Da Integração à Entrega Contínua
Da Integração à Entrega ContínuaDa Integração à Entrega Contínua
Da Integração à Entrega Contínua
 
IFSP 2015 - Cultura DevOps
IFSP 2015 - Cultura DevOpsIFSP 2015 - Cultura DevOps
IFSP 2015 - Cultura DevOps
 
Procura-se: DevOps #cpbr9
Procura-se: DevOps #cpbr9Procura-se: DevOps #cpbr9
Procura-se: DevOps #cpbr9
 
Alm e ATLM - A importância dos lifecycles no desenvolvimento de software
Alm e ATLM - A  importância dos lifecycles no desenvolvimento de softwareAlm e ATLM - A  importância dos lifecycles no desenvolvimento de software
Alm e ATLM - A importância dos lifecycles no desenvolvimento de software
 
TDC2016SP - Versionando sua infraestrutura: Como e porque fazer, baseado em c...
TDC2016SP - Versionando sua infraestrutura: Como e porque fazer, baseado em c...TDC2016SP - Versionando sua infraestrutura: Como e porque fazer, baseado em c...
TDC2016SP - Versionando sua infraestrutura: Como e porque fazer, baseado em c...
 

Semelhante a Gerenciamento de incidentes microserviços

Estruturando um SaaS Multi-tenant no ecossistema AWS
Estruturando um SaaS Multi-tenant no ecossistema AWSEstruturando um SaaS Multi-tenant no ecossistema AWS
Estruturando um SaaS Multi-tenant no ecossistema AWSmatheuscmpm
 
Gerenciando Portais Liferay com Soluções de Performance Digital
Gerenciando Portais Liferay com Soluções de Performance DigitalGerenciando Portais Liferay com Soluções de Performance Digital
Gerenciando Portais Liferay com Soluções de Performance DigitalDynatrace Latin America
 
Microserviços na vida real
Microserviços na vida realMicroserviços na vida real
Microserviços na vida realCriciúma Dev
 
[JS EXPERIENCE 2018] Do jQuery aos microfrontends: os desafios de manter uma ...
[JS EXPERIENCE 2018] Do jQuery aos microfrontends: os desafios de manter uma ...[JS EXPERIENCE 2018] Do jQuery aos microfrontends: os desafios de manter uma ...
[JS EXPERIENCE 2018] Do jQuery aos microfrontends: os desafios de manter uma ...iMasters
 
Um método para o desenvolvimento de software baseado em microsserviços
Um método para o desenvolvimento de software baseado em microsserviçosUm método para o desenvolvimento de software baseado em microsserviços
Um método para o desenvolvimento de software baseado em microsserviçosThiago Pereira
 
Skalena - Overview de Soluções
Skalena - Overview de Soluções Skalena - Overview de Soluções
Skalena - Overview de Soluções Edgar Silva
 
O futuro do arquiteto e das arquiteturas Java Enterprise
O futuro do arquiteto e das arquiteturas Java EnterpriseO futuro do arquiteto e das arquiteturas Java Enterprise
O futuro do arquiteto e das arquiteturas Java EnterpriseGlobalcode
 
Microserviços - Universidade Metodista - EETI 2016
Microserviços - Universidade Metodista - EETI 2016Microserviços - Universidade Metodista - EETI 2016
Microserviços - Universidade Metodista - EETI 2016Renato Groff
 
Arquitetura de Microservicos
Arquitetura de MicroservicosArquitetura de Microservicos
Arquitetura de MicroservicosNorberto Enomoto
 
Azure Bootcamp 2018 - DevOps para profissionais de Infra - Infomach / Goiânia
Azure Bootcamp 2018 - DevOps para profissionais de Infra - Infomach / GoiâniaAzure Bootcamp 2018 - DevOps para profissionais de Infra - Infomach / Goiânia
Azure Bootcamp 2018 - DevOps para profissionais de Infra - Infomach / GoiâniaRodrigo Marques Teixeira
 
Microservices: uma abordagem para arquitetura de aplicações (Devcamp 2015)
Microservices: uma abordagem para arquitetura de aplicações (Devcamp 2015)Microservices: uma abordagem para arquitetura de aplicações (Devcamp 2015)
Microservices: uma abordagem para arquitetura de aplicações (Devcamp 2015)Tiago Marchetti Dolphine
 
MIT DevOps IaC - Infra como Código
MIT DevOps IaC - Infra como CódigoMIT DevOps IaC - Infra como Código
MIT DevOps IaC - Infra como CódigoCaio Candido
 
ConnectionDay 2019 - Divinópolis - Transformação digital turbinada
ConnectionDay 2019 - Divinópolis - Transformação digital turbinadaConnectionDay 2019 - Divinópolis - Transformação digital turbinada
ConnectionDay 2019 - Divinópolis - Transformação digital turbinadaAndré Paulovich
 
Arquitetura de Microserviços - Tecnologia na Prática - Julho/2017
Arquitetura de Microserviços - Tecnologia na Prática - Julho/2017Arquitetura de Microserviços - Tecnologia na Prática - Julho/2017
Arquitetura de Microserviços - Tecnologia na Prática - Julho/2017Renato Groff
 
Go e Microserviços - Nascidos um para o outro
Go e Microserviços - Nascidos um para o outroGo e Microserviços - Nascidos um para o outro
Go e Microserviços - Nascidos um para o outroElton Minetto
 
Webinar Segurança de DevOps
Webinar Segurança de DevOpsWebinar Segurança de DevOps
Webinar Segurança de DevOpsTenchi Security
 
Event Driven Architecture & Complex Event Processing
Event Driven Architecture & Complex Event ProcessingEvent Driven Architecture & Complex Event Processing
Event Driven Architecture & Complex Event Processinglogus2k
 

Semelhante a Gerenciamento de incidentes microserviços (20)

Estruturando um SaaS Multi-tenant no ecossistema AWS
Estruturando um SaaS Multi-tenant no ecossistema AWSEstruturando um SaaS Multi-tenant no ecossistema AWS
Estruturando um SaaS Multi-tenant no ecossistema AWS
 
Gerenciando Portais Liferay com Soluções de Performance Digital
Gerenciando Portais Liferay com Soluções de Performance DigitalGerenciando Portais Liferay com Soluções de Performance Digital
Gerenciando Portais Liferay com Soluções de Performance Digital
 
Microserviços na vida real
Microserviços na vida realMicroserviços na vida real
Microserviços na vida real
 
[JS EXPERIENCE 2018] Do jQuery aos microfrontends: os desafios de manter uma ...
[JS EXPERIENCE 2018] Do jQuery aos microfrontends: os desafios de manter uma ...[JS EXPERIENCE 2018] Do jQuery aos microfrontends: os desafios de manter uma ...
[JS EXPERIENCE 2018] Do jQuery aos microfrontends: os desafios de manter uma ...
 
Um método para o desenvolvimento de software baseado em microsserviços
Um método para o desenvolvimento de software baseado em microsserviçosUm método para o desenvolvimento de software baseado em microsserviços
Um método para o desenvolvimento de software baseado em microsserviços
 
Skalena - Overview de Soluções
Skalena - Overview de Soluções Skalena - Overview de Soluções
Skalena - Overview de Soluções
 
O futuro do arquiteto e das arquiteturas Java Enterprise
O futuro do arquiteto e das arquiteturas Java EnterpriseO futuro do arquiteto e das arquiteturas Java Enterprise
O futuro do arquiteto e das arquiteturas Java Enterprise
 
Microserviços - Universidade Metodista - EETI 2016
Microserviços - Universidade Metodista - EETI 2016Microserviços - Universidade Metodista - EETI 2016
Microserviços - Universidade Metodista - EETI 2016
 
SAFe - Como escalar algo artesanal?
SAFe - Como escalar algo artesanal?SAFe - Como escalar algo artesanal?
SAFe - Como escalar algo artesanal?
 
Arquitetura de Microservicos
Arquitetura de MicroservicosArquitetura de Microservicos
Arquitetura de Microservicos
 
Azure Bootcamp 2018 - DevOps para profissionais de Infra - Infomach / Goiânia
Azure Bootcamp 2018 - DevOps para profissionais de Infra - Infomach / GoiâniaAzure Bootcamp 2018 - DevOps para profissionais de Infra - Infomach / Goiânia
Azure Bootcamp 2018 - DevOps para profissionais de Infra - Infomach / Goiânia
 
Microservices: uma abordagem para arquitetura de aplicações (Devcamp 2015)
Microservices: uma abordagem para arquitetura de aplicações (Devcamp 2015)Microservices: uma abordagem para arquitetura de aplicações (Devcamp 2015)
Microservices: uma abordagem para arquitetura de aplicações (Devcamp 2015)
 
Microservices
MicroservicesMicroservices
Microservices
 
MIT DevOps IaC - Infra como Código
MIT DevOps IaC - Infra como CódigoMIT DevOps IaC - Infra como Código
MIT DevOps IaC - Infra como Código
 
ConnectionDay 2019 - Divinópolis - Transformação digital turbinada
ConnectionDay 2019 - Divinópolis - Transformação digital turbinadaConnectionDay 2019 - Divinópolis - Transformação digital turbinada
ConnectionDay 2019 - Divinópolis - Transformação digital turbinada
 
Arquitetura de Microserviços - Tecnologia na Prática - Julho/2017
Arquitetura de Microserviços - Tecnologia na Prática - Julho/2017Arquitetura de Microserviços - Tecnologia na Prática - Julho/2017
Arquitetura de Microserviços - Tecnologia na Prática - Julho/2017
 
Webinar DevOps - Encontros Ágeis
Webinar DevOps - Encontros ÁgeisWebinar DevOps - Encontros Ágeis
Webinar DevOps - Encontros Ágeis
 
Go e Microserviços - Nascidos um para o outro
Go e Microserviços - Nascidos um para o outroGo e Microserviços - Nascidos um para o outro
Go e Microserviços - Nascidos um para o outro
 
Webinar Segurança de DevOps
Webinar Segurança de DevOpsWebinar Segurança de DevOps
Webinar Segurança de DevOps
 
Event Driven Architecture & Complex Event Processing
Event Driven Architecture & Complex Event ProcessingEvent Driven Architecture & Complex Event Processing
Event Driven Architecture & Complex Event Processing
 

Gerenciamento de incidentes microserviços

  • 1. Gerenciamento de incidentes no mundo de microserviços
  • 2.
  • 3. Quem sou eu ? Felipe Signorini, SRE na Udemy, criador do Maestro server, uma plataforma de gerenciamento de servidores e aplicações para ambientes multi cloud. https://github.com/Signorini - @signorini https://medium.com/@felipeklerkk
  • 4. - Introdução - O por que do microserviço - SRE - Gerenciamento de incidentes - Por onde começar - Oncall - Post mortem - Mudando a cultura Agenda
  • 5. Microserviço, a solução de todos os problemas Problemas de performance? - Microserviço Problemas de escalabilidade? - Microserviço Seu time está desmotivado - Microserviço Falta de resiliência? - Microserviço Precisa de uma tecnologia moderna? - Microserviço = Kubernetes Introduction
  • 6. Caso 2 - Microserviços + nodejs Carolina Pascale - Microservices using Node.js and RabbitMQ - BrazilJS Conf 2017 https://www.youtube.com/watch?v=M7le0OEF9NQ Introduction
  • 7. Caso 2 - Borg até o Prometheus: SRE Felipe Signorini e Paulo Castro - Borg até o Prometheus: Site Reliability Engineering - TDC2017 https://www.slideshare.net/felipesignorini/tdc-2017-b org-at-o-prometheus-site-reliability-engineering Introduction
  • 8. Caso 3 - The way our backend works It's because of the way our backend works - Kraken. https://www.youtube.com/watch?v=y8OnoxKotPQ Introduction
  • 9. μServices Palavra para reunir tudo isso Microserviços. Pensando em todo esse novo cenário procuramos uma maneira de entender a operação como developers. Prometheus apareceu de uma maneira natural já que foi pensado em como monitorar aplicação publicadas no Kubernetes. Borg e SRE
  • 11.
  • 12.
  • 13. O por que do Microserviços
  • 14. Qual a real vantagem do microserviço? Microserviço Monolítico Performance
  • 15. Qual a real vantagem do microserviço? Microserviço Monolítico Performance Possível via engenharia Com uma boa arquitetura de código
  • 16. Qual a real vantagem do microserviço? Microserviço Monolítico Performance Possível via engenharia Com uma boa arquitetura de código Escalabilidade
  • 17. Qual a real vantagem do microserviço? Microserviço Monolítico Performance Possível via engenharia Com uma boa arquitetura de código Escalabilidade Federação dos serviços por natureza Com uma boa arquitetura de serviços
  • 18. Qual a real vantagem do microserviço? Microserviço Monolítico Performance Possível via engenharia Com uma boa arquitetura de código Escalabilidade Federação dos serviços por natureza Com uma boa arquitetura de serviços Manutenção
  • 19. Qual a real vantagem do microserviço? Microserviço Monolítico Performance Possível via engenharia Com uma boa arquitetura de código Escalabilidade Federação dos serviços por natureza Com uma boa arquitetura de serviços Manutenção Facilita para o desenvolvedor, porém pesa para o arquitetura Com uma boa arquitetura de código
  • 20. Qual a real vantagem do microserviço? Microserviço Monolítico
  • 21. Qual a real vantagem do microserviço? Microserviço Monolítico Performance Possível via engenharia Com uma boa arquitetura de código Escalabilidade Federação dos serviços por natureza Com uma boa arquitetura de serviços Manutenção Facilita para o desenvolvedor, porém pesa para o arquitetura Com uma boa arquitetura de código Capacidade de evolução
  • 22. Qual a real vantagem do microserviço? Microserviço Monolítico Performance Possível via engenharia Com uma boa arquitetura de código Escalabilidade Federação dos serviços por natureza Com uma boa arquitetura de serviços Manutenção Facilita para o desenvolvedor, porém pesa para o arquitetura Com uma boa arquitetura de código Capacidade de evolução Grande capacidade de escalar pessoas e código. Quanto maior o time, mais difícil de manter todos na mesma página.
  • 23. Qual a real vantagem do microserviço? Capacidade de evolução = Escalabilidade de pessoas, times e funcionalidade
  • 24. Qual a real vantagem do microserviço? Capacidade de evolução = Escalabilidade de pessoas e times
  • 25. SRE
  • 27.
  • 28. Sre como um time que habilita outros times a operar
  • 29. Sla como contratos a ser seguidos
  • 30. - Não é o cargo do DevOps - Não vai contra o DevOps - Ownership entre os times de desenvolvimento - SLA como um contrato a ser seguido
  • 32. O gerenciamento de incidentes é um conjunto de processos para restauração da operação normal de um ou mais serviços o mais rápido possível durante um mal funcionamento. O que é?
  • 33. - Foco na tecnologia - O herói solitário - Istio tá tudo vermelho Incidente não gerenciado
  • 34. - Escolha os canais de comunicação oficial - Estabeleça alertas de acordo com os SLAs - Composição do time de oncall - Post mortem Onde começar
  • 35. Escolha os canais de comunicação oficial Chats Video call Status page Email Social
  • 36. Alertas de acordo com o SLA - Evite a fadiga de alertas - Utilize poucos SLAs e depois vai incrementando lentamente - Seja pragmático
  • 37. Alertas de acordo com o SLA - Contrato para com os usuários - Up and down - Velocidade - Contrato para com outros serviços - Latência - Capacidade de processamento
  • 38. O time de suporte é responsável por gerenciar o incidente não em resolve-lo. Ownership
  • 39. O time de suporte (aka oncall) é a linha de frente de qualquer incidente, quando algo acontece ele é o primeiro a ser alertado tendo como responsabilidade estar alerta e disponível a tomar qualquer ação em qualquer momento. Oncall
  • 42. O especialista é o engenheiro que deve-se ficar alerta, estar disponível a qualquer problema que ocorra em períodos dentro do horário comercial bem como fora do mesmo. - Ter autonomia - Atender o chamado de forma rápida. - Possuir conhecimentos técnicos e bom senso. O especialista - AKA Oncaller
  • 43. O gerente de oncall deve-se oferecer suporte ao engenheiro oncaller. - Ter um grande bom senso de julgamento - Durante um incidente, possui poderes acima de diretores O gerente de suporte - AKA Call leader
  • 44. - Gerente de suporte - Suplente - Escriba - Representante interno - Representante externo - Especialistas Oncall - Pager Duty
  • 45. Post mortem - O momento certo para discutir mudanças de arquitetura - Soluções para resolução completa
  • 46. Comparação SRE e ITILv4 O modelo de gerenciamento de incidentes SRE, foca em suportar times ágil, com autonomia de operação de sistemas por equipe, totalmente baseado em interações e com a total descentralização das decisões, o ITIL foca mais na garantia de governança na padronização de processos através de comando controle. - error budged - oncall baseado em papéis - flexibilização de processos - registro de incidentes - oncall baseado em senioridade - comando controle
  • 48. Não mude tudo radicalmente, faça mudanças incrementais juntamente com a maturidade dos processos.
  • 49. - Evite ao máximo o burnout - Não cultive a cultura do herói solitário - Evite tentar fazer múltiplos papéis - Confecção do post mortem deve ser uma tarefa crítica Boas práticas
  • 50. Foque nas pessoas e não nas ferramentas