SlideShare uma empresa Scribd logo
1 de 20
Baixar para ler offline
Planejamento de Capacidade em Ambiente
              Virtualizado




            Bruno Domingues
             bruno.domingues@intel.com
             Sr. Solution Architect
               Intel Corporation
Agenda

•   Introdução
•   Entendendo os usuários
•   Entendendo as aplicações
•   Entendendo a infraestrutura
•   A “Tragédia” do planejamento de capacidade
Introdução




Escher– Unbelievable
Natureza do Ambiente Virtualizado


• Múltiplos usuários de         Software as a Service
  diferentes aplicações
• Múltiplas aplicações com      Platform as a Service
  características distintas
• …Compartilhando a           Infrastructure as a Service
  mesma infraestrutura
A arte de acomodar “picos” e “vales”
Acomodar recursos computacionais de
         natureza distintas (método Ad Hoc)
                              Memoria
                CPU (MHz)               Rede (Mbps)   Disco (IOPs)
                               (MB)
  Aplicação A    1500         4096        1000           400
  Aplicação B    2000         4096        1500           520
  Aplicação C    3000         8192        2000           880
  …                …            …           …              …

                 Ʃ MHz        Ʃ MB       Ʃ Mbps         Ʃ IOPs
 Capacidade
                                                                     = ������, ������, ������, ������
instalada em
cada servidor
                 xMhz          yMB       zMbps         wIOPs


                   ������������������ ������, ������, ������, ������ = número de servidores

                            Será que é simples assim?
Entendendo os Usuários




 Michelangelo – A aliança entre Deus e os homens
Requisições de Acesso
Entender a distribuição de demanda                                          Carga na aplicação
sobre o sistema na linha do tempo é                   25000

o primeiro passo.                                     20000




                                      Hits por hora
                                                      15000

                                                      10000
      Hits por hora      Horário
           500             6:00                       5000
          1000             7:00                           0
          11000            8:00                               6:00   7:00    8:00   9:00   10:00     11:00   12:00   13:00   14:00
          20000            9:00                                                            Horário
          5000            10:00
          1850            11:00
           500            12:00
           100            13:00
            50            14:00

    Total de usuários:        40000

    x:                        20000                   Equação da curva de Gauss (σ = desvio padrão, µ =
    média (µ):
    desvio padrão (α):
                           4444.444
                           6829.689
                                                      média aritmética)

    Normal (y):             0.98863
    hits/seg:              12.20526
Concorrência de Acesso
                                                   0.12000000
Assumindo que a pior situação haja
20mil usuários acessando o sistema                 0.10000000

em um período de 1h, não significa
que haja 5,5 requisições/segundos                  0.08000000




                                     Probability
(ex. 20mil/3600 segundos)                          0.06000000


                                                   0.04000000



A maior probabilidade é que se
                                                   0.02000000


tenha que lidar com 12 requisições                 0.00000000
simultâneas e em intervalos de 0,5                              0   2   4   6   8   10 12 14 16 18 20 22 24 26

segundos e a probabilidade de
atender mais de 20
requisições/segundo é menor de 2%

                                                          Distribuição de probabilidade de Poisson
Entendendo as Aplicações
Capacidades da Aplicação



Aplicação do LT (λ=taxa de requisição de Poisson, μ=capacidade de processamento de
requisições, p=λ/μ
Entendendo a Infraestrutura

Tópicos:

•   Processadores
•   Memória
•   Rede
•   Armazenamento
Memória
                          12GB          24GB          36GB           48GB         72GB         96GB         144GB           192GB           256GB       512GB          1TB
Blade Half Height 2S   $   8,126.00 $ 8,566.00                    $   9,846.00              $ 17,766.00
Blade Full Height 2S   $   9,308.00 $ 9,888.00     $ 10,748.00    $ 11,028.00 $ 12,348.00 $ 18,948.00 $ 23,748.00       $ 64,948.00
Rack 2S                $   8,165.00 $ 8,605.00     $   9,605.00   $   9,885.00 $ 11,205.00 $ 17,805.00 $ 22,605.00
Rack 4S                $ 22,763.00 $ 23,243.00     $ 23,563.00    $ 24,203.00 $ 25,163.00 $ 26,123.00 $ 28,523.00       $    31,883.00   $ 36,363.00
Rack 8S                $ 45,480.00 $ 45,960.00     $ 46,440.00    $ 46,920.00 $ 47,880.00 $ 48,840.00 $ 50,760.00       $    52,680.00   $ 55,240.00
Rack 16S               $ 180,480.00 $ 180,960.00   $ 181,440.00   $ 181,920.00 $ 182,880.00 $ 183,840.00 $ 185,760.00   $   187,680.00   $ 190,240.00 $ 200,480.00
Rack 32S               $ 300,480.00 $ 300,960.00   $ 301,440.00   $ 301,920.00 $ 302,880.00 $ 303,840.00 $ 305,760.00   $   307,680.00   $ 310,240.00 $ 320,480.00 $ 340,000.00




    Considerando um template básico de VM com 1 vCPU e 4GB de memória RAM
Rede unificada para ambiente virtualizado



         DAS                                                                                 FCoE

                           NAS




                                                            iSCSI SAN
                                                                                        FC SAN

 Direct Attached        Network Attached Storage        iSCSI Storage Area     Fibre Channel Storage Area
     Storage                                                 Network                    Network
   Discos Locais         Armazenamento baseado        Ethernet block storage     Legacy Block Storage
Baixa Utilização, não         em arquivos            Crescimento de 72%/ano    Declinio na participação de
 conectado a rede       Crescimento de 52%/ano            em capacidade          unidades/capacidade
                             em capacidade


         Núvem Publica                           Núvem Privada                          Legado
Arquitetura padrão de indústria para
         scale-out storage (NFSv4.1)

                                                                          Examplo de Leitura
                     Servidores de Aplicação
                                    app

                       1                                                  1   Aplicação requisita
                                              6                               objeto

                            Cliente storage                               2   Endereço do local
             2
                                                           5
                        3                 4                               3   Requisição de local

     Servidores de                                Servidores de Storage
      Metadados                                                           4   Requisita dado
        metadata                                            storage
        services                                           services

                                                                          5   Resposta com o dado

                                                                              Resposta do objeto
                                                                          6   para a aplicação


15
A “Tragédia” do Planejamento de
          Capacidade
Impacto da Virtualização em OLTP




                           VMM assistido por
                              hardware




                               VMM usando
                             paravirtualização
A raiz do problema

•   Com o VMM C o impacto maior foi o limite de vCPUs
•   Com o VMM D o problema foi com a tecnologia de disco virtual
•   Em todos eles o mesmo problema se apresentou:
     • Tempos altos de read latches
     • Banda de I/O para o redo

                                                  Event                Waits      Time(s)   Avg wait (ms)       % DB time    Wait Class

Basicamente, um servidores de         DB CPU
                                      log file sync                  2,488,836
                                                                                    6,179
                                                                                    3,051                   1
                                                                                                                     59.89
                                                                                                                     29.57 Commit
4 CPUs virtualizado, apresentou       latch: cache buffers chains       50,724        210                   4         2.04 Concurrency

o mesmo desempenho de um              latch: In memory undo latch
                                      cursor: mutex S
                                                                       168,928
                                                                       178,372
                                                                                      150
                                                                                      148
                                                                                                            1
                                                                                                            1
                                                                                                                      1.45 Concurrency
                                                                                                                      1.44 Concurrency

servidor de 2 CPUs não-                                                 Desempenho Nativo
virtualizado                                    Event                Waits       Time(s)    Avg wait (ms)       % DB time    Wait Class
                                      log file sync                 1,510,872      9,488                6           64.75 Commit
                                      DB CPU                                       4,345                            29.66
                                      latch: cache buffers chains     83,000         387                5            2.64 Concurrency
                                      latch: enqueue hash chains      15,921          72                5            0.49 Other
                                      latch: In memory undo latch     74,511          70                1            0.48 Concurrency


                                                                       Desempenho Virtualizado
A Consequência do Problema




•   A maioria dos servidores web são configurados para alocar 25 threads por CPU;
•   Maior tempo no round-trip entre o servidor e de aplicação e o banco de dados,
    mais tempo a thread fica alocada, logo menos thread disponível para novos
    usuários = HTTP ERROR 500 (Server is too busy)
•   Maior o número de locks no banco de dados (especialmente para os altamente
    normalizados), logo potencial impacto no desempenho e funcionamento da
    aplicação.
Seja Cético!
• Planejamento de Capacidade
  somente no “papel” raramente
  funciona – teste em laboratório
• Confira sempre se os valores
  esperados estão de fato sendo
  realizados no laboratório:
    – Configuração de gerenciamento de
      energia na BIOS pode derrubar o
      desempenho de servidor de BD em 50%!
    – Configurações de extensões de
      virtualizações podem conter “truques”;
    – Configuração de HBA (i.e. queuedetph e
      queuelength) possuem um impacto
      enorme no I/O
    – Etc…
                                               Carl Sagan

Mais conteúdo relacionado

Destaque (20)

PPCP07 Cap03 Parte B
PPCP07 Cap03 Parte BPPCP07 Cap03 Parte B
PPCP07 Cap03 Parte B
 
Planejamento de Capacidade e Desempenho de Backup em Disco
Planejamento de Capacidade e Desempenho de Backup em DiscoPlanejamento de Capacidade e Desempenho de Backup em Disco
Planejamento de Capacidade e Desempenho de Backup em Disco
 
Adm Producao
Adm ProducaoAdm Producao
Adm Producao
 
Aula Gestão da Produção e Logística 2014
Aula Gestão da Produção e Logística 2014Aula Gestão da Produção e Logística 2014
Aula Gestão da Produção e Logística 2014
 
Planejamento Familiar
Planejamento FamiliarPlanejamento Familiar
Planejamento Familiar
 
Gestão da Produção e logística Projeto da Capacidade Produtiva
Gestão da Produção e logística   Projeto da Capacidade ProdutivaGestão da Produção e logística   Projeto da Capacidade Produtiva
Gestão da Produção e logística Projeto da Capacidade Produtiva
 
PCP
PCPPCP
PCP
 
Planejamento Tático de Produção
Planejamento Tático de ProduçãoPlanejamento Tático de Produção
Planejamento Tático de Produção
 
Treine com seu Mestre Cão
Treine com seu Mestre CãoTreine com seu Mestre Cão
Treine com seu Mestre Cão
 
Visual
VisualVisual
Visual
 
Generaciondes de la tecnologia educativa
Generaciondes de la tecnologia educativaGeneraciondes de la tecnologia educativa
Generaciondes de la tecnologia educativa
 
Nossas práticas
Nossas práticasNossas práticas
Nossas práticas
 
Sinais De Otimismo frente a crise
Sinais De Otimismo frente a criseSinais De Otimismo frente a crise
Sinais De Otimismo frente a crise
 
MPS Portfolio
MPS PortfolioMPS Portfolio
MPS Portfolio
 
Sistema Operativo Android
Sistema Operativo AndroidSistema Operativo Android
Sistema Operativo Android
 
Life XP
Life XPLife XP
Life XP
 
Tesis1
Tesis1Tesis1
Tesis1
 
Ondas del electrocardiograma
Ondas del electrocardiogramaOndas del electrocardiograma
Ondas del electrocardiograma
 
A vida é uma escola
A vida é uma escolaA vida é uma escola
A vida é uma escola
 
Generaciondes de la tecnologia educativa
Generaciondes de la tecnologia educativaGeneraciondes de la tecnologia educativa
Generaciondes de la tecnologia educativa
 

Semelhante a Planejamento de Capacidade em Ambiente Virtualizado

Planejamento de Capacidade - Técnicas e Ferramentas
Planejamento de Capacidade - Técnicas e FerramentasPlanejamento de Capacidade - Técnicas e Ferramentas
Planejamento de Capacidade - Técnicas e FerramentasRodrigo Campos
 
Otimização holistica de ambiente computacional
Otimização holistica de ambiente computacionalOtimização holistica de ambiente computacional
Otimização holistica de ambiente computacionalRodrigo Campos
 
Cloud Server Embratel
Cloud Server EmbratelCloud Server Embratel
Cloud Server EmbratelAlex Hübner
 
Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)
Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)
Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)Fabiano Weimar
 
TDC 2017 - Borg até o Prometheus: Site Reliability Engineering
TDC 2017 - Borg até o Prometheus: Site Reliability EngineeringTDC 2017 - Borg até o Prometheus: Site Reliability Engineering
TDC 2017 - Borg até o Prometheus: Site Reliability EngineeringFelipe Klerk Signorini
 
Planejamento de Capacidade Técnicas e Ferramentas
Planejamento de Capacidade Técnicas e FerramentasPlanejamento de Capacidade Técnicas e Ferramentas
Planejamento de Capacidade Técnicas e Ferramentasluanrjesus
 
Cloud IaaS - Detalhes da Infraestrutura como Serviço
Cloud IaaS - Detalhes da Infraestrutura como ServiçoCloud IaaS - Detalhes da Infraestrutura como Serviço
Cloud IaaS - Detalhes da Infraestrutura como ServiçoFabio Kung
 
Isolamento de Recursos na Nuvem
Isolamento de Recursos na NuvemIsolamento de Recursos na Nuvem
Isolamento de Recursos na NuvemRodrigo Campos
 
NoSQL e Big Data na Nuvem
NoSQL e Big Data na NuvemNoSQL e Big Data na Nuvem
NoSQL e Big Data na NuvemJose Papo, MSc
 
Arquiteturas híbridas de atendimento em Cloud Computing para otimizar o uso d...
Arquiteturas híbridas de atendimento em Cloud Computing para otimizar o uso d...Arquiteturas híbridas de atendimento em Cloud Computing para otimizar o uso d...
Arquiteturas híbridas de atendimento em Cloud Computing para otimizar o uso d...Diego Santos
 
Qcon 2013 - Walmart Frontend Solution using Node.js
Qcon 2013 - Walmart Frontend Solution using Node.jsQcon 2013 - Walmart Frontend Solution using Node.js
Qcon 2013 - Walmart Frontend Solution using Node.jsJorge Walendowsky
 
Seu futuro está na Nuvem! Oportunidades com Computação em Nuvem
Seu futuro está na Nuvem! Oportunidades com Computação em NuvemSeu futuro está na Nuvem! Oportunidades com Computação em Nuvem
Seu futuro está na Nuvem! Oportunidades com Computação em NuvemJose Papo, MSc
 
TCO (Total Cost of Ownership) e a Nuvem: Como os clientes da AWS estão econom...
TCO (Total Cost of Ownership) e a Nuvem: Como os clientes da AWS estão econom...TCO (Total Cost of Ownership) e a Nuvem: Como os clientes da AWS estão econom...
TCO (Total Cost of Ownership) e a Nuvem: Como os clientes da AWS estão econom...Jose Papo, MSc
 
HTTP, Requisição e Resposta
HTTP, Requisição e RespostaHTTP, Requisição e Resposta
HTTP, Requisição e RespostaThiago Rondon
 
RubyMasters 2011 - Beyond Ruby with NodeJS
RubyMasters 2011 - Beyond Ruby with NodeJSRubyMasters 2011 - Beyond Ruby with NodeJS
RubyMasters 2011 - Beyond Ruby with NodeJSEmerson Macedo
 
Arquiteturas Cloud: Uma Introdução
Arquiteturas Cloud: Uma IntroduçãoArquiteturas Cloud: Uma Introdução
Arquiteturas Cloud: Uma IntroduçãoJose Papo, MSc
 

Semelhante a Planejamento de Capacidade em Ambiente Virtualizado (20)

Planejamento de Capacidade - Técnicas e Ferramentas
Planejamento de Capacidade - Técnicas e FerramentasPlanejamento de Capacidade - Técnicas e Ferramentas
Planejamento de Capacidade - Técnicas e Ferramentas
 
Otimização holistica de ambiente computacional
Otimização holistica de ambiente computacionalOtimização holistica de ambiente computacional
Otimização holistica de ambiente computacional
 
Cloud Server Embratel
Cloud Server EmbratelCloud Server Embratel
Cloud Server Embratel
 
Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)
Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)
Performance Tuning de Clusters Plone - PyConBrasil 2 (2006)
 
TDC 2017 - Borg até o Prometheus: Site Reliability Engineering
TDC 2017 - Borg até o Prometheus: Site Reliability EngineeringTDC 2017 - Borg até o Prometheus: Site Reliability Engineering
TDC 2017 - Borg até o Prometheus: Site Reliability Engineering
 
Planejamento de Capacidade Técnicas e Ferramentas
Planejamento de Capacidade Técnicas e FerramentasPlanejamento de Capacidade Técnicas e Ferramentas
Planejamento de Capacidade Técnicas e Ferramentas
 
Cloud IaaS - Detalhes da Infraestrutura como Serviço
Cloud IaaS - Detalhes da Infraestrutura como ServiçoCloud IaaS - Detalhes da Infraestrutura como Serviço
Cloud IaaS - Detalhes da Infraestrutura como Serviço
 
Isolamento de Recursos na Nuvem
Isolamento de Recursos na NuvemIsolamento de Recursos na Nuvem
Isolamento de Recursos na Nuvem
 
Tco Nuvem Economia
Tco Nuvem EconomiaTco Nuvem Economia
Tco Nuvem Economia
 
NoSQL e Big Data na Nuvem
NoSQL e Big Data na NuvemNoSQL e Big Data na Nuvem
NoSQL e Big Data na Nuvem
 
Arquiteturas híbridas de atendimento em Cloud Computing para otimizar o uso d...
Arquiteturas híbridas de atendimento em Cloud Computing para otimizar o uso d...Arquiteturas híbridas de atendimento em Cloud Computing para otimizar o uso d...
Arquiteturas híbridas de atendimento em Cloud Computing para otimizar o uso d...
 
Qcon 2013 - Walmart Frontend Solution using Node.js
Qcon 2013 - Walmart Frontend Solution using Node.jsQcon 2013 - Walmart Frontend Solution using Node.js
Qcon 2013 - Walmart Frontend Solution using Node.js
 
Phonegap
PhonegapPhonegap
Phonegap
 
Seu futuro está na Nuvem! Oportunidades com Computação em Nuvem
Seu futuro está na Nuvem! Oportunidades com Computação em NuvemSeu futuro está na Nuvem! Oportunidades com Computação em Nuvem
Seu futuro está na Nuvem! Oportunidades com Computação em Nuvem
 
TCO e a Nuvem
TCO e a NuvemTCO e a Nuvem
TCO e a Nuvem
 
TCO (Total Cost of Ownership) e a Nuvem: Como os clientes da AWS estão econom...
TCO (Total Cost of Ownership) e a Nuvem: Como os clientes da AWS estão econom...TCO (Total Cost of Ownership) e a Nuvem: Como os clientes da AWS estão econom...
TCO (Total Cost of Ownership) e a Nuvem: Como os clientes da AWS estão econom...
 
Rodando SAP na AWS
Rodando SAP na AWSRodando SAP na AWS
Rodando SAP na AWS
 
HTTP, Requisição e Resposta
HTTP, Requisição e RespostaHTTP, Requisição e Resposta
HTTP, Requisição e Resposta
 
RubyMasters 2011 - Beyond Ruby with NodeJS
RubyMasters 2011 - Beyond Ruby with NodeJSRubyMasters 2011 - Beyond Ruby with NodeJS
RubyMasters 2011 - Beyond Ruby with NodeJS
 
Arquiteturas Cloud: Uma Introdução
Arquiteturas Cloud: Uma IntroduçãoArquiteturas Cloud: Uma Introdução
Arquiteturas Cloud: Uma Introdução
 

Mais de Joao Galdino Mello de Souza

Enterprise computing for modern business workloads por Lívio Sousa (IBM)
Enterprise computing for modern business workloads por Lívio Sousa (IBM)Enterprise computing for modern business workloads por Lívio Sousa (IBM)
Enterprise computing for modern business workloads por Lívio Sousa (IBM)Joao Galdino Mello de Souza
 
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)Joao Galdino Mello de Souza
 
Scaling Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
Scaling  Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...Scaling  Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
Scaling Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...Joao Galdino Mello de Souza
 
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)Joao Galdino Mello de Souza
 
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...Joao Galdino Mello de Souza
 
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)Joao Galdino Mello de Souza
 
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)Joao Galdino Mello de Souza
 
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...Joao Galdino Mello de Souza
 
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)Joao Galdino Mello de Souza
 
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)Joao Galdino Mello de Souza
 
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)Joao Galdino Mello de Souza
 
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)Joao Galdino Mello de Souza
 
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...Joao Galdino Mello de Souza
 
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)Joao Galdino Mello de Souza
 
Pervasive Encryption por Eugênio Fernandes (IBM)
Pervasive Encryption por Eugênio Fernandes (IBM)Pervasive Encryption por Eugênio Fernandes (IBM)
Pervasive Encryption por Eugênio Fernandes (IBM)Joao Galdino Mello de Souza
 
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)Joao Galdino Mello de Souza
 
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...Joao Galdino Mello de Souza
 
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)Joao Galdino Mello de Souza
 
Lei geral de proteção de dados por Kleber Silva e Ricardo Navarro (Pise4)
Lei geral de proteção de dados por Kleber Silva  e Ricardo Navarro (Pise4)Lei geral de proteção de dados por Kleber Silva  e Ricardo Navarro (Pise4)
Lei geral de proteção de dados por Kleber Silva e Ricardo Navarro (Pise4)Joao Galdino Mello de Souza
 

Mais de Joao Galdino Mello de Souza (20)

Explorando a API Rest Jira Cloud
Explorando a API Rest Jira CloudExplorando a API Rest Jira Cloud
Explorando a API Rest Jira Cloud
 
Enterprise computing for modern business workloads por Lívio Sousa (IBM)
Enterprise computing for modern business workloads por Lívio Sousa (IBM)Enterprise computing for modern business workloads por Lívio Sousa (IBM)
Enterprise computing for modern business workloads por Lívio Sousa (IBM)
 
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
 
Scaling Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
Scaling  Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...Scaling  Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
Scaling Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
 
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
 
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
 
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
 
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
 
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
 
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
 
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
 
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
 
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
 
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
 
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
 
Pervasive Encryption por Eugênio Fernandes (IBM)
Pervasive Encryption por Eugênio Fernandes (IBM)Pervasive Encryption por Eugênio Fernandes (IBM)
Pervasive Encryption por Eugênio Fernandes (IBM)
 
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
 
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
 
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
 
Lei geral de proteção de dados por Kleber Silva e Ricardo Navarro (Pise4)
Lei geral de proteção de dados por Kleber Silva  e Ricardo Navarro (Pise4)Lei geral de proteção de dados por Kleber Silva  e Ricardo Navarro (Pise4)
Lei geral de proteção de dados por Kleber Silva e Ricardo Navarro (Pise4)
 

Planejamento de Capacidade em Ambiente Virtualizado

  • 1. Planejamento de Capacidade em Ambiente Virtualizado Bruno Domingues bruno.domingues@intel.com Sr. Solution Architect Intel Corporation
  • 2. Agenda • Introdução • Entendendo os usuários • Entendendo as aplicações • Entendendo a infraestrutura • A “Tragédia” do planejamento de capacidade
  • 4. Natureza do Ambiente Virtualizado • Múltiplos usuários de Software as a Service diferentes aplicações • Múltiplas aplicações com Platform as a Service características distintas • …Compartilhando a Infrastructure as a Service mesma infraestrutura
  • 5. A arte de acomodar “picos” e “vales”
  • 6. Acomodar recursos computacionais de natureza distintas (método Ad Hoc) Memoria CPU (MHz) Rede (Mbps) Disco (IOPs) (MB) Aplicação A 1500 4096 1000 400 Aplicação B 2000 4096 1500 520 Aplicação C 3000 8192 2000 880 … … … … … Ʃ MHz Ʃ MB Ʃ Mbps Ʃ IOPs Capacidade = ������, ������, ������, ������ instalada em cada servidor xMhz yMB zMbps wIOPs ������������������ ������, ������, ������, ������ = número de servidores Será que é simples assim?
  • 7. Entendendo os Usuários Michelangelo – A aliança entre Deus e os homens
  • 8. Requisições de Acesso Entender a distribuição de demanda Carga na aplicação sobre o sistema na linha do tempo é 25000 o primeiro passo. 20000 Hits por hora 15000 10000 Hits por hora Horário 500 6:00 5000 1000 7:00 0 11000 8:00 6:00 7:00 8:00 9:00 10:00 11:00 12:00 13:00 14:00 20000 9:00 Horário 5000 10:00 1850 11:00 500 12:00 100 13:00 50 14:00 Total de usuários: 40000 x: 20000 Equação da curva de Gauss (σ = desvio padrão, µ = média (µ): desvio padrão (α): 4444.444 6829.689 média aritmética) Normal (y): 0.98863 hits/seg: 12.20526
  • 9. Concorrência de Acesso 0.12000000 Assumindo que a pior situação haja 20mil usuários acessando o sistema 0.10000000 em um período de 1h, não significa que haja 5,5 requisições/segundos 0.08000000 Probability (ex. 20mil/3600 segundos) 0.06000000 0.04000000 A maior probabilidade é que se 0.02000000 tenha que lidar com 12 requisições 0.00000000 simultâneas e em intervalos de 0,5 0 2 4 6 8 10 12 14 16 18 20 22 24 26 segundos e a probabilidade de atender mais de 20 requisições/segundo é menor de 2% Distribuição de probabilidade de Poisson
  • 11. Capacidades da Aplicação Aplicação do LT (λ=taxa de requisição de Poisson, μ=capacidade de processamento de requisições, p=λ/μ
  • 12. Entendendo a Infraestrutura Tópicos: • Processadores • Memória • Rede • Armazenamento
  • 13. Memória 12GB 24GB 36GB 48GB 72GB 96GB 144GB 192GB 256GB 512GB 1TB Blade Half Height 2S $ 8,126.00 $ 8,566.00 $ 9,846.00 $ 17,766.00 Blade Full Height 2S $ 9,308.00 $ 9,888.00 $ 10,748.00 $ 11,028.00 $ 12,348.00 $ 18,948.00 $ 23,748.00 $ 64,948.00 Rack 2S $ 8,165.00 $ 8,605.00 $ 9,605.00 $ 9,885.00 $ 11,205.00 $ 17,805.00 $ 22,605.00 Rack 4S $ 22,763.00 $ 23,243.00 $ 23,563.00 $ 24,203.00 $ 25,163.00 $ 26,123.00 $ 28,523.00 $ 31,883.00 $ 36,363.00 Rack 8S $ 45,480.00 $ 45,960.00 $ 46,440.00 $ 46,920.00 $ 47,880.00 $ 48,840.00 $ 50,760.00 $ 52,680.00 $ 55,240.00 Rack 16S $ 180,480.00 $ 180,960.00 $ 181,440.00 $ 181,920.00 $ 182,880.00 $ 183,840.00 $ 185,760.00 $ 187,680.00 $ 190,240.00 $ 200,480.00 Rack 32S $ 300,480.00 $ 300,960.00 $ 301,440.00 $ 301,920.00 $ 302,880.00 $ 303,840.00 $ 305,760.00 $ 307,680.00 $ 310,240.00 $ 320,480.00 $ 340,000.00 Considerando um template básico de VM com 1 vCPU e 4GB de memória RAM
  • 14. Rede unificada para ambiente virtualizado DAS FCoE NAS iSCSI SAN FC SAN Direct Attached Network Attached Storage iSCSI Storage Area Fibre Channel Storage Area Storage Network Network Discos Locais Armazenamento baseado Ethernet block storage Legacy Block Storage Baixa Utilização, não em arquivos Crescimento de 72%/ano Declinio na participação de conectado a rede Crescimento de 52%/ano em capacidade unidades/capacidade em capacidade Núvem Publica Núvem Privada Legado
  • 15. Arquitetura padrão de indústria para scale-out storage (NFSv4.1) Examplo de Leitura Servidores de Aplicação app 1 1 Aplicação requisita 6 objeto Cliente storage 2 Endereço do local 2 5 3 4 3 Requisição de local Servidores de Servidores de Storage Metadados 4 Requisita dado metadata storage services services 5 Resposta com o dado Resposta do objeto 6 para a aplicação 15
  • 16. A “Tragédia” do Planejamento de Capacidade
  • 17. Impacto da Virtualização em OLTP VMM assistido por hardware VMM usando paravirtualização
  • 18. A raiz do problema • Com o VMM C o impacto maior foi o limite de vCPUs • Com o VMM D o problema foi com a tecnologia de disco virtual • Em todos eles o mesmo problema se apresentou: • Tempos altos de read latches • Banda de I/O para o redo Event Waits Time(s) Avg wait (ms) % DB time Wait Class Basicamente, um servidores de DB CPU log file sync 2,488,836 6,179 3,051 1 59.89 29.57 Commit 4 CPUs virtualizado, apresentou latch: cache buffers chains 50,724 210 4 2.04 Concurrency o mesmo desempenho de um latch: In memory undo latch cursor: mutex S 168,928 178,372 150 148 1 1 1.45 Concurrency 1.44 Concurrency servidor de 2 CPUs não- Desempenho Nativo virtualizado Event Waits Time(s) Avg wait (ms) % DB time Wait Class log file sync 1,510,872 9,488 6 64.75 Commit DB CPU 4,345 29.66 latch: cache buffers chains 83,000 387 5 2.64 Concurrency latch: enqueue hash chains 15,921 72 5 0.49 Other latch: In memory undo latch 74,511 70 1 0.48 Concurrency Desempenho Virtualizado
  • 19. A Consequência do Problema • A maioria dos servidores web são configurados para alocar 25 threads por CPU; • Maior tempo no round-trip entre o servidor e de aplicação e o banco de dados, mais tempo a thread fica alocada, logo menos thread disponível para novos usuários = HTTP ERROR 500 (Server is too busy) • Maior o número de locks no banco de dados (especialmente para os altamente normalizados), logo potencial impacto no desempenho e funcionamento da aplicação.
  • 20. Seja Cético! • Planejamento de Capacidade somente no “papel” raramente funciona – teste em laboratório • Confira sempre se os valores esperados estão de fato sendo realizados no laboratório: – Configuração de gerenciamento de energia na BIOS pode derrubar o desempenho de servidor de BD em 50%! – Configurações de extensões de virtualizações podem conter “truques”; – Configuração de HBA (i.e. queuedetph e queuelength) possuem um impacto enorme no I/O – Etc… Carl Sagan