Segurança no Armazenamento

2.376 visualizações

Publicada em

Publicada em: Tecnologia, Turismo, Negócios
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
2.376
No SlideShare
0
A partir de incorporações
0
Número de incorporações
5
Ações
Compartilhamentos
0
Downloads
58
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide
  • Segurança no Armazenamento

    1. 1. Segurança no Armazenamento 1. Introdução Márcio Aurélio Ribeiro Moreira [email_address] http://si.uniminas.br/~marcio/ Pós-SI – 3ª Turma – 2008
    2. 2. Objetivos do capítulo <ul><li>Explicitar a necessidade de armazenamento </li></ul><ul><li>Avaliar as alternativas de solução </li></ul><ul><li>Revisar os principais conceitos de armazenamento </li></ul><ul><li>Explorar os tipos de RAID </li></ul><ul><li>Mostrar as alternativas de redes de armazenamento </li></ul>Márcio Moreira 1. Introdução – Slide
    3. 3. O armazenamento não está resolvido? <ul><li>O número total de livros produzidos desde o começo da impressa não passa de 1 bilhão: </li></ul><ul><ul><li>Se cada livro tiver em média 500 páginas com 2000 caracteres cada. Logo, 1 MB é suficiente para armazenar cada livro sem compressão </li></ul></ul><ul><li>Para armazenar todos os livros precisamos de 1 bilhão de MB ou 1 PetaByte (PB) </li></ul><ul><li>Considerando Us$20 / GB, 1 PB pode ser comprado por Us$20 milhões </li></ul>Márcio Moreira 1. Introdução – Slide
    4. 4. O armazenamento nas organizações <ul><li>Banco da Índia: </li></ul><ul><ul><li>14.000 filiais em todo o país </li></ul></ul><ul><ul><li>11.000 escritórios conectados ao Data Center </li></ul></ul><ul><ul><li>Mais de 20 milhões de clientes </li></ul></ul><ul><ul><li>≈ 100 TB armazenados </li></ul></ul><ul><ul><ul><li>Crescimento exponencial </li></ul></ul></ul><ul><ul><li>Questões de segurança: </li></ul></ul><ul><ul><ul><li>Compressão / Cifragem </li></ul></ul></ul><ul><ul><ul><li>Antivírus </li></ul></ul></ul><ul><ul><ul><li>Firewall e IDS </li></ul></ul></ul>Márcio Moreira 1. Introdução – Slide Fonte: Ramakrishnan
    5. 5. Demanda de performance e espaço Márcio Moreira 1. Introdução – Slide Fonte: Ramakrishnan 1X 2X 3X 4X 5X 6X 7X 8X Hoje 1 Ano 2 anos 3 anos 4 anos 5 anos 50% 100% 150% 200% 250% 300% Demanda Performance Demanda Espaço Demanda anual de 50% de espaço e performance 1X 1.5X 2.3X 3.4X 5.1X 7.6X 253% 169% 113% 75% 50%
    6. 6. Alternativas para a demanda <ul><li>Podemos resolver com RAMs? </li></ul><ul><ul><li>Caras e voláteis  só para processamento </li></ul></ul><ul><li>Podemos utilizar fitas? </li></ul><ul><ul><li>Baratas e lentas por serem seqüenciais  backups </li></ul></ul><ul><li>Podemos resolver com CDs e DVDs? </li></ul><ul><ul><li>Baratos e aleatórios. Mas, lentos  distribuição </li></ul></ul><ul><li>Podemos resolver com HDs? </li></ul><ul><ul><li>Preço justo, aleatórios e rápidos  muitos HDs </li></ul></ul><ul><ul><li>Onde colocar tantos HDs? Fora do gabinete </li></ul></ul>Márcio Moreira 1. Introdução – Slide
    7. 7. Camadas de dados Márcio Moreira 1. Introdução – Slide Computadores Notebooks Dispositivos Pessoas e Coisas Camada de Banco de Dados Camada web Camada Aplicações Fonte: Ramakrishnan Camada de Storage
    8. 8. 1º dispositivo magnético Márcio Moreira 1. Introdução – Slide <ul><li>A superfície do disco (ou fita) é coberta com uma substância magnética </li></ul><ul><li>Movimento mecânico posiciona cabeça do dispositivo para: </li></ul><ul><ul><li>Gravação: definir a polarização. Leitura: testar a polarização </li></ul></ul><ul><li>Por ser magnética, a polarização é mantida mesmo sem energia </li></ul>
    9. 9. Armazenamento em discos <ul><li>Organiza os dados em áreas endereçáveis </li></ul><ul><li>Devem ser formatados para serem endereçáveis pelos sistemas operacionais </li></ul><ul><li>O acesso direto provê performance adequada para acessos seqüencial ou randômico </li></ul><ul><li>O desempenho do disco é impactado pelo tempo de posicionamento da cabeça para o acesso </li></ul><ul><li>Os discos são conectados fisicamente ao sistema: </li></ul><ul><ul><li>É inviável movê-los para um novo local ou novo sistema </li></ul></ul><ul><ul><li>Como conectar vários discos num mesmo sistema? </li></ul></ul>Márcio Moreira 1. Introdução – Slide
    10. 10. Vamos olhar os discos de perto Márcio Moreira 1. Introdução – Slide
    11. 11. Formatação para acesso direto Márcio Moreira 1. Introdução – Slide Fonte: EMC Trilha Cada prato do disco é segmentado em vários anéis concêntricos chamados trilhas O endereço único de uma área em um drive de disco é composto de: Cilindro, Cabeça e Setor. Um setor é a menor parte endereçável de uma trilha Setor Cilindro Um cilindro é o conjunto formato por uma trilha específica em todos os pratos juntas
    12. 12. Tempo de acesso ao drive de disco <ul><li>Seek Time : </li></ul><ul><ul><li>Tempo de busca </li></ul></ul><ul><ul><li>Média de tempo gasto para mover o braço do atuador para a posição de leitura ou gravação da cabeça na trilha </li></ul></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC
    13. 13. Tempo de acesso ao drive de disco <ul><li>Latency : </li></ul><ul><ul><li>Tempo de Latência </li></ul></ul><ul><ul><li>Média de tempo gasto para esperar o disco girar e o setor desejado chegar o início da posição de acesso </li></ul></ul><ul><ul><li>Também conhecido como espera racional </li></ul></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC
    14. 14. Tempo de acesso ao drive de disco <ul><li>Transfer Rate : </li></ul><ul><ul><li>Taxa de Transferência </li></ul></ul><ul><ul><li>Média de tempo gasto para ler (ou escrever) e enviar (ou receber) os dados do setor para o drive de disco </li></ul></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC
    15. 15. Variáveis da performance de discos <ul><li>Tempo de busca </li></ul><ul><li>Velocidade rotação RPM: </li></ul><ul><ul><li> RPM   Latência </li></ul></ul><ul><ul><li> RPM tem menor impacto na Taxa de Transferência </li></ul></ul><ul><li>Velocidade da interface do drive: </li></ul><ul><ul><li>Ultra SCSI: 40 MB/sec </li></ul></ul><ul><ul><li>Canal de fibra: 100 MB/sec </li></ul></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC
    16. 16. Evolução da tecnologia de discos <ul><li>A capacidade continua aumentando muito com o aumento da densidade dos dados </li></ul><ul><li>A performance aumenta marginalmente com: </li></ul><ul><ul><li>Aumento da velocidade de rotação (RPM) </li></ul></ul><ul><ul><li>Aumento do uso da memória e cache no nível de drive </li></ul></ul><ul><li>As interfaces são dirigidas por padrões da indústria: </li></ul><ul><ul><li>ATA ( Advanced Technology Attachment ) </li></ul></ul><ul><ul><li>Ultra SCSI ( Small Computer System Interface ) </li></ul></ul><ul><ul><li>Canal de Fibra </li></ul></ul><ul><li>Desafios da indústria: </li></ul><ul><ul><li>Aumentar a capacidade por disco reduzindo custo. Mas, … </li></ul></ul><ul><ul><li>Reduzir o número de atuadores mantendo a capacidade </li></ul></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC
    17. 17. Necessidades de armazenamento Márcio Moreira 1. Introdução – Slide Fonte: Ramakrishnan High-End Us$40/GB Deman-da do negócio Alta Performance Tempo Crítico Midrange Us$20/GB SATA Us$5/GB Tape Us$0.5/GB Alta Capacidade Custo Crítico 100% 99.999% 99.9% Longo Prazo
    18. 18. Tecnologia RAID <ul><li>Como obter performance e confiabilidade? </li></ul><ul><ul><li>RAID: </li></ul></ul><ul><ul><ul><li>R edundant A rray of I ndependent D isks </li></ul></ul></ul><ul><ul><ul><li>Um conjunto de HDs é visto pelo SO como uma única unidade de disco </li></ul></ul></ul><ul><ul><li>Vantagens: </li></ul></ul><ul><ul><ul><li>Grande capacidade de armazenamento </li></ul></ul></ul><ul><ul><ul><li>Acesso paralelo  melhor performance </li></ul></ul></ul><ul><ul><ul><li>Permite o espelhamento de dados </li></ul></ul></ul><ul><ul><li>Desvantagens: </li></ul></ul><ul><ul><ul><li>Custo: requer hardware ou software especial </li></ul></ul></ul><ul><ul><ul><li>Se espelhado: requer o dobro de espaço </li></ul></ul></ul>Márcio Moreira 1. Introdução – Slide
    19. 19. Conexões físicas dos discos <ul><li>Variáveis para conexões físicas: </li></ul><ul><ul><li>Tipos de cabos </li></ul></ul><ul><ul><li>Número de vias </li></ul></ul><ul><ul><li>Conectores físicos </li></ul></ul><ul><li>Regras para conexões lógicas: </li></ul><ul><ul><li>Identificar os comandos (de leitura e gravação) e os dados </li></ul></ul><ul><li>Formato do drive: </li></ul><ul><ul><li>Esquema de endereçamento </li></ul></ul><ul><li>Sistema </li></ul><ul><li>controlador ou </li></ul><ul><li>placa de circuito: </li></ul><ul><ul><li>ESCON para mainframe </li></ul></ul><ul><ul><li>H ost B us A dapter (placas para fibra ótica) para sistemas abertos </li></ul></ul><ul><ul><li>Placas proprietárias para o AS/400 </li></ul></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA
    20. 20. Como a operação de I/O ocorre <ul><li>Iniciando uma requisição de leitura: </li></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA
    21. 21. Como a operação de I/O ocorre <ul><li>Completando a requisição de leitura: </li></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA
    22. 22. Usando melhor a CPU e a memória <ul><li>“ Vamos ver”: </li></ul><ul><ul><li>Acessamos o cliente 1 </li></ul></ul><ul><ul><li>Depois o cliente 2 </li></ul></ul><ul><ul><li>Qual será o próximo? </li></ul></ul><ul><ul><li>Presumo o cliente 3 </li></ul></ul><ul><li>Técnica: </li></ul><ul><ul><li>Cache </li></ul></ul><ul><ul><li>Read ahead </li></ul></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading CACHE System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading
    23. 23. <ul><li>Usar controladora no RAID: </li></ul><ul><ul><li>Libera processamento </li></ul></ul><ul><ul><li>Libera memória RAM </li></ul></ul>Melhorando ainda mais Márcio Moreira 1. Introdução – Slide Fonte: EMC Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading CACHE CPU System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading
    24. 24. <ul><li>Iniciando um comando de escrita: </li></ul>Como a operação de I/O ocorre Márcio Moreira 1. Introdução – Slide Fonte: EMC System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA
    25. 25. <ul><li>Completando o comando de escrita: </li></ul>Como a operação de I/O ocorre Márcio Moreira 1. Introdução – Slide Fonte: EMC System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA
    26. 26. Melhor uso da CPU e memória Márcio Moreira 1. Introdução – Slide Fonte: EMC Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading CACHE CPU System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA Comando de escrita: “ Grave a conta mensal do cliente no disco”. A confirmação de escrita é emitida assim que os dados e o comando de gravação estão seguros dentro de uma área completamente tolerante à falha
    27. 27. Por dentro dos Disk Arrays Márcio Moreira 1. Introdução – Slide Fonte: EMC Gaveta do sistema operacional Gavetas de discos Fault Tolerant Cache Memory Array Controller Array Controller Disk Directors Disk Directors Host Interface Host Interface
    28. 28. RAID 0 - Striping ou Fracionamento <ul><li>Os dados são divididos em segmentos e estes são colocados nos HDs </li></ul><ul><li>Não há redundância </li></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC Volume 1 End Com RAID 0: Os volumes são divididos em blocos e movidos para balancear a carga de atividades. Volume 1 Middle Volume 1 Beginning Sem RAID: 3 HDs num mesmo host. Cada HD contem um volume Volume 2 End Volume 2 Middle Volume 2 Beginning Volume 3 End Volume 3 Middle Volume 3 Beginning Volume 1 End Volume 2 End Volume 3 End Volume 1 Middle Volume 2 Middle Volume 3 Middle Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning
    29. 29. RAID 1 - Mirroring ou Espelhamento <ul><li>Os dados de um HD são espelhados em outro gerando redundância </li></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC Sem RAID: 3 HDs num mesmo host. Com RAID 1: Um espelho de cada HD é criado gerando um para de HDs. Volume 1 End Volume 1 Middle Volume 1 Beginning Volume 2 End Volume 2 Middle Volume 2 Beginning Volume 3 End Volume 3 Middle Volume 3 Beginning Volume 1 End Volume 1 Middle Volume 1 Beginning Volume 1 End Volume 1 Middle Volume 1 Beginning Volume 2 End Volume 2 Middle Volume 2 Beginning Volume 2 End Volume 2 Middle Volume 2 Beginning Volume 3 End Volume 3 Middle Volume 3 Beginning Volume 3 End Volume 3 Middle Volume 3 Beginning
    30. 30. RAID 1+0 - Performance e Redundância <ul><li>Os HDs (volumes físicos) são espelhados e os volumes lógicos divididos </li></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC Sem RAID: 3 HDs num mesmo host. Com RAID 1+0: HDs espelhados. Volumes lógicos fracionados para balancear carga. Volume 1 End Volume 1 Middle Volume 1 Beginning Volume 2 End Volume 2 Middle Volume 2 Beginning Volume 3 End Volume 3 Middle Volume 3 Beginning Volume 1 End Volume 2 End Volume 3 End Volume 1 End Volume 2 End Volume 3 End Volume 1 Middle Volume 2 Middle Volume 3 Middle Volume 1 Middle Volume 2 Middle Volume 3 Middle Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning
    31. 31. Paridade de dados <ul><li>A paridade é utilizada para tentar recuperar dados perdidos </li></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC Parity for 3 rd Group = 1 1 LOST DATA 1 Parity for 2nd Group = 1 0 1 0 Parity for 1 st Group = 0 0 1 1 Group 1 Group 2 Group 3 Group 1 0 + 1 + 1 = 0 Group 2 0 + 1 + 0 = 1 Group 3 1 + 1 + ? = 1 DATA + DATA + DATA = Parity
    32. 32. RAID 5 - Fracionamento e paridade <ul><li>Divide os dados no nível de bloco e acrescenta um bloco de paridade </li></ul><ul><li>Requer no mínimo 3 discos </li></ul>Márcio Moreira 1. Introdução – Slide Fonte: EMC Parity for 1st Group Volume 1 End Volume 2 End Volume 3 End Parity for 2nd Group Volume 1 Middle Volume 2 Middle Volume 3 Middle Parity for 3rd Group Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning Sem RAID: 3 HDs num mesmo host. Volume 1 End Volume 1 Middle Volume 1 Beginning Volume 2 End Volume 2 Middle Volume 2 Beginning Volume 3 End Volume 3 Middle Volume 3 Beginning Com RAID 5: Um grupo de drives são agrupados como um volume físico.
    33. 33. Níveis de RAID Márcio Moreira 1. Introdução – Slide Fonte: EMC, IBM, Wikipedia e experiência. <ul><li>Níveis mais usados comercialmente: 0, 1, 3, 5 e 10 (1+0): </li></ul><ul><li>Múltiplos I/O  Independência de leitura e gravação (acesso múltiplo). </li></ul><ul><li>Custo comparado para níveis que oferecem mesmos benefícios. </li></ul>Nível Técnica Mínimo Discos Aplicação Comentários 0 Fracionamento em blocos 2 Alta performance Sem redundância 1 Espelhamento 2 Alta disponibilidade e performance Implantação simples 2 Fracionamento em bits Monitoramento em RAM 2 Alta performance e disponibilidade Nenhum uso comercial 3 Fracionamento em bytes Disco de paridade 3 Alta performance e disponibilidade Menor custo 4 Fracionamento em blocos (Múltiplos I/O) Disco de paridade 3 Processamento de transações Alta disponibilidade Alta taxa de leitura Baixo uso comercial 5 Fracionamento em blocos (Múltiplos I/O) Discos de paridade independentes 3 Processamento de transações Alta disponibilidade Alta taxa de leitura 6 Fracionamento em blocos (Múltiplos I/O) Múltiplos discos de paridade independentes 4 Processamento de transações Alta disponibilidade Alta taxa de leitura Baixo uso comercial
    34. 34. Arquiteturas típicas de storage <ul><li>DAS: </li></ul><ul><ul><li>Direct Attached Storage </li></ul></ul><ul><li>NAS: </li></ul><ul><ul><li>Network Attached Storage </li></ul></ul><ul><li>SAN: </li></ul><ul><ul><li>Storage Area Network </li></ul></ul>Direct Attached Storage (DAS) Windows NT/2K Linux/Unix Netware Network Attached Storage (NAS) Windows NT/2K Linux/Unix Netware Storage Area Network (SAN) Netware Windows NT/2K Linux/Unix Storage FC Switch NAS
    35. 35. Conexões típicas HBA HBA NIC HBA Storage Array Tape Drive Device Network Router SAN Switch System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory)
    36. 36. Produtos de Storage da EMC Symmetrix CLARiiON Centera SAN / NAS SAN / NAS / Backup- to-Disk CAS Tape & Tape Emulation DMX800 DMX1000-M2 DMX1000 DMX2000-M2 DMX2000 DMX3000-M2 DMX3000 CX700 CX500 CX300 Centera AX 100 Netwin 110 NS700/G Celerra CNS ADIC Scalar Series DL700
    37. 37. Referências <ul><li>EMC. Storage Basics . EMC. Jun-2006. </li></ul><ul><li>S. Ramakrishnan. Management of large scale Terabyte Store information servers . IACITS 2007. Jul-2007. </li></ul><ul><li>Khattar, Murphy, Tarella e Nystrom. Introduction to Storage Area Network, SAN . IBM. Redbooks. SG24-5470-00. 1999. </li></ul>Márcio Moreira 1. Introdução – Slide

    ×