TCC_RONIEGILBERTOHENRICH_PRESENTATION

133 visualizações

Publicada em

0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
133
No SlideShare
0
A partir de incorporações
0
Número de incorporações
5
Ações
Compartilhamentos
0
Downloads
0
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

TCC_RONIEGILBERTOHENRICH_PRESENTATION

  1. 1. Alta Disponibilidade:Alta Disponibilidade: Garantia para a Continuidade do NegócioGarantia para a Continuidade do Negócio Ronie Gilberto Henrich ronie@ronie.com.br Universidade do Vale do Rio dos Sinos (UNISINOS) São Leopoldo – RS – Brasil Trabalho de Conclusão de Curso Graduação em Informática – Análise de Sistemas Orientador: Professor Mestre Candido Fonseca da Silva cfsilva@unisinos.br
  2. 2. 1 – Introdução1 – Introdução  Teofrasto (300-287 a.C.): “Tempo é a coisa mais valiosa que um homem pode gastar.”  Benjamin Franklin (1748): “Lembre-se que tempo é dinheiro.”  Evolução da área de TI: 1960 CPDs e processamento em lotes (Batch)  hoje com processamento distribuído e on-line.  Segurança de TI (IS 7498-2): autenticidade, não repúdio, confidencialidade, integridade e Disponibilidade.
  3. 3. 1.1 – Objetivos  Propor soluções alternativas que ofereçam um nível alto de disponibilidade com TCO (Total Cost of Ownership ou Custo Total de Propriedade) abaixo do TCO das soluções existentes atualmente no mercado.
  4. 4. 1.2 – Metodologia  Etapa teórica: pesquisa teórica  Etapa prática: Estudo de caso qualitativo em uma empresa de pequeno porte do ramo de serviços de TI. Foi dividida em três fases: • 1 – Diagnóstico: Levantamento de processos chave e pontos únicos de falha. • 2 – Soluções: Desenvolvimento e documentação de soluções para eliminação dos pontos únicos de falha. • 3 – Testes: Realizados testes das soluções e atualização da documentação.
  5. 5. 2 – Revisão da literatura
  6. 6. 2.1 – Plataformas de hardware para sistemas críticos De acordo com Buchanan, existem basicamente quatro plataformas de hardware e software para sistemas críticos:  Restauração a frio (Cold restoration);  Restauração a quente (Hot restoration);  Reserva (Standby);  Co-localização (co-location).
  7. 7. 2.2 – Disponibilidade2.2 – Disponibilidade  Disponibilidade de um sistema computacional = Probabilidade sistema funcionando e pronto para o uso em um tempo “t”. Expressa em percentual.  Fórmula: (t serviço disponível / t total) * 100.  Divide-se em: – Básica: de 99% a 99,9% – Alta: de 99,99% a 99,999% – Contínua: 99,9999 em diante
  8. 8. 2.3 – Técnicas para aumento da Disponibilidade  Objetivo: eliminação de SPOFs (Single Point of Failure) ou pontos únicos de falhas.  Alguns exemplos: – Cluster; – ECC (Error Checking and Correcting); – Espelhamento (Mirroring); – RAID (Redundant Array of Inexpensive Disks).
  9. 9. 3 – Estudo de caso – Grupo Intelligence
  10. 10. 3.1 – Introdução  Empresa prestadora de serviços de informática com foco no desenvolvimento de softwares e fornecimento de conteúdo para área de mobile (telefonia móvel).
  11. 11. 3.1.1 – Metodologia Proposta 1. Levantamento dos processos-chave; 2. Levantamento da estrutura de TI atual (ativos de rede, conexões, estações de trabalho, fornecimento de energia e servidores); 3. Análise dos SPOFs X processos-chave afetados; 4. Estudo de soluções padrão do mercado; 5. Proposta de soluções alternativas; 6. Elaboração do quadro de falhas X ações; 7. Testes de desempenho de replicação de dados; 8. Análise Custo X Benefício (Qual componente à investir?).
  12. 12. 3.2 – Processos-chave do negócio  Desenvolvimento de software;  Gateway de SMS (Short Message Service);  IDC;  Serviços de e-mail;  Serviços WWW (HTTP).
  13. 13. 3.3 – Estrutura atual
  14. 14. 3.3.1 – Equipamentos e infra- estrutura
  15. 15. 3.3.1.1 – Ativos de rede  Hub de sensores marca AKCP modelo Sensor Probe 8  Hub Ethernet marca Encore modelo 8 portas 10 Mbps TP 3.3.1.2 – Conexões Conexão com a Internet através do provedor Maais (www.maais.com.br)
  16. 16. 3.3.1.3 – Estações de trabalho  Darth-Vader • Desenvolvimento de softwares.  Leia-Organa • Testes de softwares. 3.3.1.4 – Fornecimento de energia  2 Estabilizadores marca SMS modelo 1KVA  No-break marca SMS modelo 1.2 KVA  No-break marca SMS modelo 600 VA
  17. 17. 3.3.1.5 – Servidores  Chewbacca • Gateway de SMS; • Roteador; • VPN e proxy reverso; • Banco de dados; • E-mail; • WWW; • DNS.  Yoda • IDC; • NFS; • Servidor de impressão.
  18. 18. 3.3.1.6 – SPOFs Componentes que havendo falha  Interrupção/Degradação processos-chave negócio. SPOF Itens afetados - Hub Ethernet marca Encore modelo 8 portas 10/100 TP Todos os processos-chave do negócio. - No-Break marca SMS modelo 600 VA Todos os processos-chave do negócio. - Link de conexão com a Internet Processos-chave Gateway de SMS, IDC, serviços de e-mail e WWW. - No-Break marca SMS modelo 1.2 KVA Processos-chave Gateway de SMS, IDC, serviços de e-mail e WWW.
  19. 19. 3.4 – SPOFs (continuação) SPOF Itens afetados - Servidor Chewbacca Processos-chave Gateway de SMS, IDC, serviços de e-mail e WWW. - Servidor Yoda Processo-chave IDC. - Estabilizadores marca SMS modelo 1 KVA Processo-chave desenvolvimento de softwares. - Estação de trabalho Darth-Vader Processo-chave desenvolvimento de softwares. - Estação de trabalho Leia-Organa Processo-chave desenvolvimento de softwares.
  20. 20. 3.5 – Soluções existentes no mercado Consistem, basicamente, de um cluster com dois ou mais servidores ligados a uma SAN (Storage Area Network), composta por switches fibre channel, conjuntos de armazenamento (storage) e links de fibra óptica proporcionando redundância total.
  21. 21. 3.5.1 – Orçamento Dell Computadores 2 Servidores marca Dell modelo PowerEdge 2650  2 Storages marca Dell EMC modelo CX300  2 Switches SAN 8 portas 2 GB fibre channel marca Dell modelo DS-8B2  4 Placas 2 GB fibre channel marca Dell EMC modelo HBA FC-2  1 Unidade de backup autoloader marca Dell modelo PowerVault 122T LTO1  Valor Total: US$ 165.000,00
  22. 22. 3.5.2 – Orçamento IBM  2 Servidores marca IBM modelo xSeries 345  2 Storages marca IBM modelo TotalStorage FAStT600  2 Switches SAN 16 portas 2GB fibre channel marca IBM modelo TotalStorage SAN Switch F16  4 Placas 2 GB fibre channel marca IBM  1 Unidade de backup autoloader marca IBM modelo LTO2 Ultrium Tape Library 3582  Valor Total: US$ 310.344,83
  23. 23. 3.6 – Estrutura proposta 3.6.1 – Programas 3.6.2 – Equipamentos e infra-estrutura
  24. 24. 3.6.1 – Programas  Gateway de SMS;  LVS (Linux Virtual Server);
  25. 25. 3.6.1.1 – Gateway de SMS  Desenvolvido pelo Grupo Intelligence;  Balanceamento de carga das conexões com as operadoras de telefonia celular;  Servidores se monitoram através de heartbeat.
  26. 26. 3.6.1.2 – LVS (Linux Virtual Server)  “Servidor virtual” baseado em cluster de servidores reais. Proporciona Alta Disponibilidade e escalabilidade.  Pode ser implementado de três modos: • Via NAT (LAN); – Balanceador de cargas envia requisições para os nodos do cluster, recebe resposta e encaminha para o cliente. Funciona somente na LAN. • Via IP Tunneling (LAN e WAN); – Balanceador de cargas envia requisições para os nodos do cluster e estes enviam resposta diretamente para o cliente, sem passar pelo servidor balanceador de cargas. Funciona na LAN e WAN. • Via Direct Routing (LAN). – Mesma forma que IP Tunneling porém restrito à LAN.
  27. 27. 3.6.1.2 – LVS (Continuação) Diagrama de uma solução de Alta Disponibilidade utilizando LVS.
  28. 28. 3.6.1.2 – LVS (Continuação)  É dividida em três camadas: – balanceamento de carga; – servidores de aplicação; – sistema de armazenamento.  OBS.: Neste estudo de caso, as camadas de aplicação e armazenamento foram agrupadas em um servidor para redução de custos.
  29. 29. 3.6.1.3 – Pound 1.7  Balanceamento de carga HTTP (substituída pelo LVS) e serviço de proxy reverso;  Permite que se estabeleçam VPNs com apenas um endereço IP para vários servidores.
  30. 30. 3.6.1.4 – Slony 1.0.5  Replicação assíncrona de banco de dados PostgreSQL;  Realiza replicações de um servidor mestre para um escravo (réplica).
  31. 31. 3.6.1.5 – Unison 2.10.2  Replicação assíncrona de pastas e arquivos de um computador para dois ou mais computadores e vice-versa;  Leitura e escrita em todos os computadores;  Replica somente os bytes alterados;  Quando é movido ou renomeado algum arquivo ou pasta, realiza a mesma operação nos computadores replicados.
  32. 32. 3.6.2 – Equipamentos e infra- estrutura  1 Hub de sensores;  2 Switches Ethernet;  2 Conexões com a Internet;  3 Conexões de rádio;  2 Estações de trabalho;  2 No-Breaks;  4 Servidores.
  33. 33. 3.3.1 – Equipamentos e infra- estrutura
  34. 34. 3.6.2.1 – Ativos de rede  Hub de sensores marca AKCP modelo Sensor Probe 8  Switch_Principal • QoS, SNMP, VLAN; • Internet_Principal, estações de trabalho Darth-Vader / Leia- Organa, Hub de sensores e servidores Skywalker / Yoda.  Switch_Backup • QoS, SNMP, VLAN; • Internet_Backup e servidores Chewbacca / Tatooine.
  35. 35. 3.6.2.2 - Conexões  Internet_Principal  Internet_Backup (Previsão)  Link_Dados (Previsão) • SNMP; • LAN (empresa)  LAN (casa sócio).  Link_Internet (Previsão) • SNMP; • Internet_Principal (empresa)  Internet_Backup (casa sócio).  Link_Replicação (Previsão) • SNMP; • Replicação servidores empresa  servidores casa sócio.
  36. 36. 3.6.2.3 – Estações de trabalho  Darth-Vader • Desenvolvimento de softwares; • Servidor de impressão; • Testes de softwares.  Leia-Organa • Testes de softwares; • Servidor de impressão; • Testes de softwares.
  37. 37. 3.6.2.4 – Fornecimento de energia  NoBreak_Principal (Previsão) • 10KVA, monofásico, SNMP; • Estações de trabalho Darth-Vader / Leia-Organa, Hub de sensores, servidores Skywalker / Yoda e Switch_Principal.  NoBreak_Backup (Previsão) • 10KVA, monofásico, SNMP; • Servidores Chewbacca / Tatooine e Switch_Backup.
  38. 38. 3.6.2.5 - Servidores  Chewbacca (LVS Backup) • Heartbeat; • Roteador; • LVS; • Firewall; • VPN e proxy reverso; • DNS.  Yoda (LVS Principal) • Heartbeat; • Roteador; • LVS; • Firewall; • VPN e proxy reverso; • DNS.
  39. 39. 3.6.2.5 – Servidores (Continuação)  Skywalker • Gateway de SMS; • IDC; • Banco de dados; • E-mail; • WWW; • NTP secundário.  Tatooine • Gateway de SMS; • IDC; • Banco de dados; • E-mail; • WWW; • NTP mestre.
  40. 40. 3.6.3 – Funcionamento das soluções Optou-se por duas soluções baseadas em duas técnicas descritas no capítulo 2.1 deste trabalho:  Solução 1 – Topologia Reserva;  Solução 2 – Topologia Co-localização.
  41. 41. 3.6.3.1 – Solução 1 (Topologia Reserva)  Pares de equipamentos – principal e reserva; – Conexões Internet, energia, rede e servidores.  Reserva monitora principal por heartbeat;  LVS (IP único) balanceamento de carga e failover;  Round Robin DNS entre conexões Internet;  VLANs Port-based: – Segurança e redes virtuais menores; – Dados (1), Internet (2) e Replicação (3);  SNMP: reconfigurar VLANs e enviar avisos.
  42. 42. 3.6.3.1 – Solução 1 (Diagrama de rede)
  43. 43. 3.6.3.2 – Solução 2 (Topologia Co-localização)  Equipamentos distribuídos em diferentes localizações;  Neste estudo, sede da empresa e casa de um dos sócios distantes 8 Km;  VLANs (Dados, Internet e replicação) interligadas cada uma por um canal de rádio.
  44. 44. 3.6.3.2 – Solução 2 (Diagrama de rede)
  45. 45. 3.6.3.2 – Solução 2 (Diagrama de monitoração)
  46. 46. 3.6.4 – Quadro de Falhas e Ações  Servidor LVS Principal monitora todos equipamentos através de heartbeat, alguns diretamente (Ex.: servidores), outros indiretamente (Ex.: no-breaks);  Detectada a falha  envia mensagem SNMP para rede;  Console SNMP reconhece a falha, executa ação de correção (se houver) e alerta a área técnica;  Servidor LVS Backup monitora o servidor LVS Principal, para em uma falha assumir o seu lugar.
  47. 47. 3.6.5 – Console de Gerenciamento SNMP  Em desenvolvimento pelo Grupo Intelligence;  Tratamento mensagens de monitoramento;  Envio de comandos SNMP;  Exemplos: – Mensagem servidor não respondendo; – Envio comando reconfiguração de VLAN.
  48. 48. 3.6.6 – Testes de desempenho de replicação de dados Software Interconexão Origem Destino Tempo SCP Hub 10 Mbps Skywalker Tatooine 7m17.735s SCP Hub 10 Mbps Tatooine Skywalker 5m04.014s SCP Switch 1Gbps Skywalker Tatooine 0m14.966s SCP Switch 1Gbps Tatooine Skywalker 0m15.400s Unison Switch 1Gbps Skywalker Tatooine 0m30.000s Unison Switch 1Gbps Tatooine Skywalker 0m21.000s Arquivo office.tar.gz com 314 MB
  49. 49. 3.6.7 – Estimativa de Investimentos Valores estimados, cotados no mercado brasileiro entre os meses de Abril e Maio de 2005. Transformados então em dólares considerando a taxa do dólar do dia em que foi recebida a cotação do fornecedor.
  50. 50. 3.6.7.1 – Solução 1  2 No-breaks APC Smart UPS RT 10 KVA (US$ 5.612,07);  2 Servidores Dell PowerEdge 750 (US$ 6.306,56);  2 Switches Dell PowerConnect 5324, 24 portas 10/100/1000 Mbps TP (US$ 2.767,88).  Total Geral: US$ 14.686,51
  51. 51. 3.6.7.2 – Solução 2 Acrescenta-se os seguintes equipamentos ao orçamento da Solução 1:  3 Conjuntos de rádio Proxim Tsunami 5054-R, 5.8 GHz, 54 Mbps (US$ 12.627,15).  Total Geral: US$ 27.313,66
  52. 52. 3.6.8 – Relação Custo x3.6.8 – Relação Custo x BenefícioBenefício Com base na teoria de Lucros Cessantes:Com base na teoria de Lucros Cessantes:  VPH = BRGA / HUSAVPH = BRGA / HUSA – VPH: Valor das perdas por hora de interrupção do serviço – BRGA: Benefício relacionado gerado anualmente – HUSA: Horas de utilização do serviço no ano  VSI = VPH * MTTRMVSI = VPH * MTTRM – VSI: Valor sugerido de investimento para aumentar a disponibilidade do serviço – MTTRM: MTTR médio dos componentes envolvidos  Em qual componente investir? – Relação MTTR/MTTF (horas parada/horas funcionamento), quanto mais alto o valor, mais crítico é o componente
  53. 53. 4 – Conclusão4 – Conclusão  Eliminação de praticamente todos SPOFs;  SPOF da conexão Internet, soluções: – BGP: viável tecnicamente e custo elevado; (http://www.networkmagazine.com/shared/article/ showArticle.jhtml?articleId=10818260&classroom=) – Sugestão do autor: Envio de mensagens de invalidação de cache DNS. Necessário avaliar viabilidade técnica.  Solução alternativa com boa relação Custo x Benefício.

×