SlideShare uma empresa Scribd logo
1 de 29
globo   Nagios
 .com   Leandro Souza
        Luis H. Okama
Agenda
‣   soluções avaliadas
‣   escalando o nagios
‣   instalação automatizada
‣   topologia
‣   roadmap
‣   virtualização
breve história
‣   monitoração descentralizada
‣   open source
‣   não escalável
‣   alta disponibilidade
‣   não customizável
soluções avaliadas
Requisitos
‣   Monitoramento
‣   integração com ferramentas externas
‣   interface web de administração
‣   perfil de usuário e grupo
‣   planejamento de excessões ( downtime )
‣   notificações
‣   hierarquia de objetos
destaque
‣   integração com ferramentas externas
‣   schedule downtime
‣   hierarquia de objetos
‣   customizável
escalando
como escalar ?
‣   standalone
‣   DNX (Distributed Nagios Executor)
‣   gearman + mod_gearman
standalone
dnx e gearman
comparativo
          check de 7500 serviços
   standalone



Execution Time: Avg: 128ms

  Checks (last min): 38%

 CPU Idle Avg: 30 ~ 35%
comparativo
          check de 7500 serviços
   standalone                        DNX


                             server
                               Execution Time: Avg: 6ms
Execution Time: Avg: 128ms
                               Checks (last min): 100%
  Checks (last min): 38%
                                 CPU Idle Avg: 90%
 CPU Idle Avg: 30 ~ 35%
                             worker(2)
                                 CPU Idle Avg: 92%
comparativo
          check de 7500 serviços
   standalone                        DNX                       gearman


                             server                       server
                               Execution Time: Avg: 6ms    Execution Time: Avg: 71ms
Execution Time: Avg: 128ms
                               Checks (last min): 100%      Checks (last min): 100%
  Checks (last min): 38%
                                 CPU Idle Avg: 90%            CPU Idle Avg: 90%
 CPU Idle Avg: 30 ~ 35%
                             worker(2)                    worker(2)
                                 CPU Idle Avg: 92%            CPU Idle Avg: 95%
comparativo
          check de 7500 serviços
   standalone                        DNX                       gearman


                             server                       server
                               Execution Time: Avg: 6ms    Execution Time: Avg: 71ms
Execution Time: Avg: 128ms
                               Checks (last min): 100%      Checks (last min): 100%
  Checks (last min): 38%
                                 CPU Idle Avg: 90%            CPU Idle Avg: 90%
 CPU Idle Avg: 30 ~ 35%
                             worker(2)                    worker(2)
                                 CPU Idle Avg: 92%            CPU Idle Avg: 95%
comparativo
          check de 7500 serviços
   standalone                        DNX                       gearman




                                                                  ?
                             server                       server
                               Execution Time: Avg: 6ms    Execution Time: Avg: 71ms
Execution Time: Avg: 128ms
                               Checks (last min): 100%      Checks (last min): 100%
  Checks (last min): 38%
                                 CPU Idle Avg: 90%            CPU Idle Avg: 90%
 CPU Idle Avg: 30 ~ 35%
                             worker(2)                    worker(2)
                                 CPU Idle Avg: 92%            CPU Idle Avg: 95%
tunning
tunning

# Minimum number of worker processes
min-worker=30

# Maximum number of worker processes
max-worker=30

# Controls the amount of jobs a worker will do before he exits
max-jobs=400
instalação automatizada
Server e Worker
‣   instalação via puppet
    ‣   nagios::server      nagios::worker
Topologia
Roadmap
•   Automatizar a alta disponibilidade do Nagios
    server

•   MultiSite ( cada POP terá o seu worker )
Referências
Nagios - http://www.nagios.org/
Nagiosql - http://www.nagiosql.org/
Gearman - http://labs.consol.de/nagios/mod-gearman/
DNX - http://dnx.sourceforge.net/
Virtualização
Orquestra
API Restful
APIRestful
‣   baseado no NagiosQL 3.2.-0
‣   criação de host
‣   criação de serviço
‣   (des)associar host do serviço
‣   remove host e/ou serviço
‣   command plugin help
‣   schedule downtime
APIRestful


http://opensource.globo.com/
Perguntas?
lsouzarj@gmail.com
lokama@gmail.com

Mais conteúdo relacionado

Destaque

La castanera
La castaneraLa castanera
La castaneralemon79
 
Colectia toamna- iarna Mama Boutique
Colectia toamna- iarna Mama BoutiqueColectia toamna- iarna Mama Boutique
Colectia toamna- iarna Mama BoutiqueMama Boutique
 
wiki_frevinnies531
wiki_frevinnies531wiki_frevinnies531
wiki_frevinnies531Nadiia33
 
Signs you may need a bed bug exterminator
Signs you may need a bed bug exterminatorSigns you may need a bed bug exterminator
Signs you may need a bed bug exterminatorkevinyoung324
 
Caravella Cruises Presentation
Caravella Cruises PresentationCaravella Cruises Presentation
Caravella Cruises Presentationcaravellacruises
 
Crear un boton con relieve
Crear  un boton con relieveCrear  un boton con relieve
Crear un boton con relieveMaryfer' Ortega
 
Crear un boton con relieve
Crear  un boton con relieveCrear  un boton con relieve
Crear un boton con relieveMaryfer' Ortega
 
Diapositivas de spiking furia de titanes
Diapositivas de spiking furia de titanesDiapositivas de spiking furia de titanes
Diapositivas de spiking furia de titanesJuan David Molinares
 
Repasamos las canciones del mes
Repasamos las canciones del mesRepasamos las canciones del mes
Repasamos las canciones del mesanfuhe1
 
Shs fr 3 oat 1
Shs fr 3 oat 1Shs fr 3 oat 1
Shs fr 3 oat 1Doug Doug
 
Sistemes operatius
Sistemes operatiusSistemes operatius
Sistemes operatiusirenee23
 
Viaje a Cordoba
Viaje a CordobaViaje a Cordoba
Viaje a Cordobaameliaag2
 

Destaque (20)

La castanera
La castaneraLa castanera
La castanera
 
Colectia toamna- iarna Mama Boutique
Colectia toamna- iarna Mama BoutiqueColectia toamna- iarna Mama Boutique
Colectia toamna- iarna Mama Boutique
 
Centro de Apoyo Familiar
Centro de Apoyo FamiliarCentro de Apoyo Familiar
Centro de Apoyo Familiar
 
Lautaro lowian
Lautaro lowianLautaro lowian
Lautaro lowian
 
collector rewa
collector rewacollector rewa
collector rewa
 
wiki_frevinnies531
wiki_frevinnies531wiki_frevinnies531
wiki_frevinnies531
 
Signs you may need a bed bug exterminator
Signs you may need a bed bug exterminatorSigns you may need a bed bug exterminator
Signs you may need a bed bug exterminator
 
Caravella Cruises Presentation
Caravella Cruises PresentationCaravella Cruises Presentation
Caravella Cruises Presentation
 
Stratustb2401
Stratustb2401Stratustb2401
Stratustb2401
 
Crear un boton con relieve
Crear  un boton con relieveCrear  un boton con relieve
Crear un boton con relieve
 
Shoutlet ppt
Shoutlet pptShoutlet ppt
Shoutlet ppt
 
Crear un boton con relieve
Crear  un boton con relieveCrear  un boton con relieve
Crear un boton con relieve
 
Madrid
MadridMadrid
Madrid
 
Diapositivas de spiking furia de titanes
Diapositivas de spiking furia de titanesDiapositivas de spiking furia de titanes
Diapositivas de spiking furia de titanes
 
Swissotel Tallinn
Swissotel TallinnSwissotel Tallinn
Swissotel Tallinn
 
Repasamos las canciones del mes
Repasamos las canciones del mesRepasamos las canciones del mes
Repasamos las canciones del mes
 
Plastica
PlasticaPlastica
Plastica
 
Shs fr 3 oat 1
Shs fr 3 oat 1Shs fr 3 oat 1
Shs fr 3 oat 1
 
Sistemes operatius
Sistemes operatiusSistemes operatius
Sistemes operatius
 
Viaje a Cordoba
Viaje a CordobaViaje a Cordoba
Viaje a Cordoba
 

Semelhante a Nagios em grande escala

[CLASS 2014] Palestra Técnica - Marcelo Branquinho e Jan Seidl
[CLASS 2014] Palestra Técnica - Marcelo Branquinho e Jan Seidl[CLASS 2014] Palestra Técnica - Marcelo Branquinho e Jan Seidl
[CLASS 2014] Palestra Técnica - Marcelo Branquinho e Jan SeidlTI Safe
 
Teste de performance mrg realtime
Teste de performance mrg realtimeTeste de performance mrg realtime
Teste de performance mrg realtimeRodrigo Missiaggia
 
Alta Disponibilidade na Prática utilizando servidores Linux
Alta Disponibilidade na Prática utilizando servidores LinuxAlta Disponibilidade na Prática utilizando servidores Linux
Alta Disponibilidade na Prática utilizando servidores Linuxelliando dias
 
Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)
Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)
Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)Fabiano Weimar
 
Projeto de otimização de Performance e Redução de Custos Sistema On-Line
Projeto de otimização de Performance e Redução de Custos Sistema On-LineProjeto de otimização de Performance e Redução de Custos Sistema On-Line
Projeto de otimização de Performance e Redução de Custos Sistema On-LineJoao Galdino Mello de Souza
 
Lista 221 Comandos Executar do Windows.docx
Lista 221 Comandos Executar do Windows.docxLista 221 Comandos Executar do Windows.docx
Lista 221 Comandos Executar do Windows.docxSLVIOPAIVADOSANTOSSI
 
Descobrindo os limites de um Sip Proxy
Descobrindo os limites de um Sip ProxyDescobrindo os limites de um Sip Proxy
Descobrindo os limites de um Sip ProxyAntonio Anderson Souza
 
Linux - Inicialização e Gerenciamento de Processos
Linux - Inicialização e Gerenciamento de ProcessosLinux - Inicialização e Gerenciamento de Processos
Linux - Inicialização e Gerenciamento de ProcessosFrederico Madeira
 
Estratégias de escablabilidade para serviços online
Estratégias de escablabilidade para serviços onlineEstratégias de escablabilidade para serviços online
Estratégias de escablabilidade para serviços onlineGuto Xavier
 
A Arte do Deployment - WebDevCamp
A Arte do Deployment - WebDevCampA Arte do Deployment - WebDevCamp
A Arte do Deployment - WebDevCampGeorge Guimarães
 
Troca de contexto segura em sistemas operacionais embarcados utilizando de té...
Troca de contexto segura em sistemas operacionais embarcados utilizando de té...Troca de contexto segura em sistemas operacionais embarcados utilizando de té...
Troca de contexto segura em sistemas operacionais embarcados utilizando de té...Rodrigo Almeida
 
Troca de contexto segura em sistemas operacionais embarcados utilizando técni...
Troca de contexto segura em sistemas operacionais embarcados utilizando técni...Troca de contexto segura em sistemas operacionais embarcados utilizando técni...
Troca de contexto segura em sistemas operacionais embarcados utilizando técni...Rodrigo Almeida
 

Semelhante a Nagios em grande escala (14)

[CLASS 2014] Palestra Técnica - Marcelo Branquinho e Jan Seidl
[CLASS 2014] Palestra Técnica - Marcelo Branquinho e Jan Seidl[CLASS 2014] Palestra Técnica - Marcelo Branquinho e Jan Seidl
[CLASS 2014] Palestra Técnica - Marcelo Branquinho e Jan Seidl
 
Teste de performance mrg realtime
Teste de performance mrg realtimeTeste de performance mrg realtime
Teste de performance mrg realtime
 
Alta Disponibilidade na Prática utilizando servidores Linux
Alta Disponibilidade na Prática utilizando servidores LinuxAlta Disponibilidade na Prática utilizando servidores Linux
Alta Disponibilidade na Prática utilizando servidores Linux
 
Mainframe Performance Review
Mainframe Performance ReviewMainframe Performance Review
Mainframe Performance Review
 
Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)
Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)
Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)
 
Projeto de otimização de Performance e Redução de Custos Sistema On-Line
Projeto de otimização de Performance e Redução de Custos Sistema On-LineProjeto de otimização de Performance e Redução de Custos Sistema On-Line
Projeto de otimização de Performance e Redução de Custos Sistema On-Line
 
Lista 221 Comandos Executar do Windows.docx
Lista 221 Comandos Executar do Windows.docxLista 221 Comandos Executar do Windows.docx
Lista 221 Comandos Executar do Windows.docx
 
Descobrindo os limites de um Sip Proxy
Descobrindo os limites de um Sip ProxyDescobrindo os limites de um Sip Proxy
Descobrindo os limites de um Sip Proxy
 
Linux - Inicialização e Gerenciamento de Processos
Linux - Inicialização e Gerenciamento de ProcessosLinux - Inicialização e Gerenciamento de Processos
Linux - Inicialização e Gerenciamento de Processos
 
Estratégias de escablabilidade para serviços online
Estratégias de escablabilidade para serviços onlineEstratégias de escablabilidade para serviços online
Estratégias de escablabilidade para serviços online
 
A Arte do Deployment - WebDevCamp
A Arte do Deployment - WebDevCampA Arte do Deployment - WebDevCamp
A Arte do Deployment - WebDevCamp
 
Troca de contexto segura em sistemas operacionais embarcados utilizando de té...
Troca de contexto segura em sistemas operacionais embarcados utilizando de té...Troca de contexto segura em sistemas operacionais embarcados utilizando de té...
Troca de contexto segura em sistemas operacionais embarcados utilizando de té...
 
Troca de contexto segura em sistemas operacionais embarcados utilizando técni...
Troca de contexto segura em sistemas operacionais embarcados utilizando técni...Troca de contexto segura em sistemas operacionais embarcados utilizando técni...
Troca de contexto segura em sistemas operacionais embarcados utilizando técni...
 
Monitoração com Nagios
Monitoração com NagiosMonitoração com Nagios
Monitoração com Nagios
 

Nagios em grande escala

  • 1. globo Nagios .com Leandro Souza Luis H. Okama
  • 2. Agenda ‣ soluções avaliadas ‣ escalando o nagios ‣ instalação automatizada ‣ topologia ‣ roadmap ‣ virtualização
  • 3. breve história ‣ monitoração descentralizada ‣ open source ‣ não escalável ‣ alta disponibilidade ‣ não customizável
  • 5. Requisitos ‣ Monitoramento ‣ integração com ferramentas externas ‣ interface web de administração ‣ perfil de usuário e grupo ‣ planejamento de excessões ( downtime ) ‣ notificações ‣ hierarquia de objetos
  • 6. destaque ‣ integração com ferramentas externas ‣ schedule downtime ‣ hierarquia de objetos ‣ customizável
  • 8. como escalar ? ‣ standalone ‣ DNX (Distributed Nagios Executor) ‣ gearman + mod_gearman
  • 11. comparativo check de 7500 serviços standalone Execution Time: Avg: 128ms Checks (last min): 38% CPU Idle Avg: 30 ~ 35%
  • 12. comparativo check de 7500 serviços standalone DNX server Execution Time: Avg: 6ms Execution Time: Avg: 128ms Checks (last min): 100% Checks (last min): 38% CPU Idle Avg: 90% CPU Idle Avg: 30 ~ 35% worker(2) CPU Idle Avg: 92%
  • 13. comparativo check de 7500 serviços standalone DNX gearman server server Execution Time: Avg: 6ms Execution Time: Avg: 71ms Execution Time: Avg: 128ms Checks (last min): 100% Checks (last min): 100% Checks (last min): 38% CPU Idle Avg: 90% CPU Idle Avg: 90% CPU Idle Avg: 30 ~ 35% worker(2) worker(2) CPU Idle Avg: 92% CPU Idle Avg: 95%
  • 14. comparativo check de 7500 serviços standalone DNX gearman server server Execution Time: Avg: 6ms Execution Time: Avg: 71ms Execution Time: Avg: 128ms Checks (last min): 100% Checks (last min): 100% Checks (last min): 38% CPU Idle Avg: 90% CPU Idle Avg: 90% CPU Idle Avg: 30 ~ 35% worker(2) worker(2) CPU Idle Avg: 92% CPU Idle Avg: 95%
  • 15. comparativo check de 7500 serviços standalone DNX gearman ? server server Execution Time: Avg: 6ms Execution Time: Avg: 71ms Execution Time: Avg: 128ms Checks (last min): 100% Checks (last min): 100% Checks (last min): 38% CPU Idle Avg: 90% CPU Idle Avg: 90% CPU Idle Avg: 30 ~ 35% worker(2) worker(2) CPU Idle Avg: 92% CPU Idle Avg: 95%
  • 17. tunning # Minimum number of worker processes min-worker=30 # Maximum number of worker processes max-worker=30 # Controls the amount of jobs a worker will do before he exits max-jobs=400
  • 19. Server e Worker ‣ instalação via puppet ‣ nagios::server nagios::worker
  • 21.
  • 22. Roadmap • Automatizar a alta disponibilidade do Nagios server • MultiSite ( cada POP terá o seu worker )
  • 23. Referências Nagios - http://www.nagios.org/ Nagiosql - http://www.nagiosql.org/ Gearman - http://labs.consol.de/nagios/mod-gearman/ DNX - http://dnx.sourceforge.net/
  • 27. APIRestful ‣ baseado no NagiosQL 3.2.-0 ‣ criação de host ‣ criação de serviço ‣ (des)associar host do serviço ‣ remove host e/ou serviço ‣ command plugin help ‣ schedule downtime

Notas do Editor

  1. apresentar-se\n
  2. \n
  3. 1. remover/adicionar em varios software de monitoracao, visualizacao e admin\n2. economia no software de X% e sistema operacional\n3. 5 min para checks\n\n
  4. \n
  5. monitoramento: SO, banco de dados, app server, web, equi. de rede \nnotificacoes: email, celular, plugin de browsers\n
  6. \n
  7. \n
  8. solucoes mais conhecidas no mercado\n\n
  9. \n
  10. \n
  11. mod gearman - 1.0 ( testes ) - 1.3.6 ( prod ), gearman 0.14 - 0.35( prod ) \nnagios 3.2.3 ( teste )\ndnx : 0.20.1\nEscolha: comunidade do gearman mais ativa\n
  12. mod gearman - 1.0 ( testes ) - 1.3.6 ( prod ), gearman 0.14 - 0.35( prod ) \nnagios 3.2.3 ( teste )\ndnx : 0.20.1\nEscolha: comunidade do gearman mais ativa\n
  13. mod gearman - 1.0 ( testes ) - 1.3.6 ( prod ), gearman 0.14 - 0.35( prod ) \nnagios 3.2.3 ( teste )\ndnx : 0.20.1\nEscolha: comunidade do gearman mais ativa\n
  14. mod gearman - 1.0 ( testes ) - 1.3.6 ( prod ), gearman 0.14 - 0.35( prod ) \nnagios 3.2.3 ( teste )\ndnx : 0.20.1\nEscolha: comunidade do gearman mais ativa\n
  15. \n
  16. \n
  17. \n
  18. palestra - Leonardo Rodrigues 13hrs espaço chile\n
  19. \n
  20. \n
  21. \n
  22. \n
  23. \n
  24. Sistema de cloud para gerenciar a infra da glb. Ele é responsavel por criar maquinas virtuais\npalestra do Silvano - amanha 16hrs no espaço Paraguai\n
  25. \n
  26. checa sintaxe e caracteres válidos no hostname e serviço\ngera o arquivo de pre-cache\ncada acao de servico gera um reload no nagios\n
  27. \n
  28. \n