Hd’s e armazenamento

360 visualizações

Publicada em

Hd's e armazenamento

Publicada em: Tecnologia
0 comentários
2 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
360
No SlideShare
0
A partir de incorporações
0
Número de incorporações
3
Ações
Compartilhamentos
0
Downloads
15
Comentários
0
Gostaram
2
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Hd’s e armazenamento

  1. 1. Fundamentos de Hardware HD’s e Armazenamento Prof. Washington Batista
  2. 2. HD’s e Armazenamento • Sem dúvida, o disco rígido foi um dos componentes que mais evoluiu na história da informática. O primeiro disco rígido (o IBM 350) foi construído em 1956 e era formado por um conjunto de nada menos que 50 discos de 24 polegadas de diâmetro, com uma capacidade total de 4.36 MB. • Características: 1,70 mt de altura Quase 1.000 kg Conhecido como “unidade de disco” Custo: 35 mil dólares
  3. 3. Como um HD funciona • Disco rígido ou disco duro, no Brasil popularmente também HD é a parte do computador onde são armazenadas as informações, ou seja, é a "memória permanente" propriamente dita. É caracterizado como memória física, não-volátil, que é aquela na qual as informações não são perdidas quando o computador é desligado.
  4. 4. Como um HD funciona • O disco é constituído de ligas de vidro ou materias híbridos de vidro e cerâmica, e precisa ser completamente plano, pois, o mesmo gira a grandes velocidades e as cabeças de leitura trabalham extremamente próximas da superfície magnética, logo, qualquer variação seria fatal. • Para atingir a perfeição necessária, o disco é polido em uma sala limpa, até que se torne perfeitamente plano. Vem então a parte final, que é a colocação da superfície magnética nos dois lados do disco.
  5. 5. Como um HD funciona Os discos são montados em um eixo feito de alumínio, que deve ser sólido o suficiente para evitar qualquer vibração dos discos, mesmo a altas rotações. No caso de HDs com vários discos, eles são separados usando espaçadores, novamente feitos de ligas de alumínio. Finalmente, temos o motor de rotação, responsável por manter uma rotação constante.
  6. 6. Como um HD funciona • Velocidade dos discos: • 3.600 RPM; • 5.400 RPM; • 7.200 RPM ou • 10.000 RPM. • Para ler e gravar dados no disco, são usadas cabeças de leitura eletromagnéticas (heads) que são presas a um braço móvel(arm), o que permite seu acesso a todo o disco.
  7. 7. Principais componentes de um HD
  8. 8. Ao ler um arquivo, a controladora posiciona a cabeça de leitura sobre a trilha onde está o primeiro setor referente a ele e espera que o disco gire até o setor correto. Este tempo inicial, necessário para iniciar a leitura, é chamado de tempo de acesso, e mesmo os HDs atuais de 7.200 RPM fica em torno de 12 ms. • O HD é relativamente rápido ao ler setores seqüenciais, mas ao ler vários pequenos arquivos espalhados pelo HD, o desempenho pode “despencar”. • Desfragmentadores: São softwares que que procuram reorganizar a ordem dos arquivos, de forma que eles sejam gravados em setores contínuos.
  9. 9. Como um HD funciona O HD possui duas cabeças de leitura para cada disco (uma para cada face), de forma que um HD com 4 discos utilizaria 8 cabeças de leitura, presas ao mesmo braço móvel. Embora usar mais discos permita construir HDs de maior capacidade, não é comum que os fabricantes utilizem mais de 4, pois a partir daí torna-se muito difícil (e caro) produzir componentes com a precisão necessária para manter todos os discos alinhados.
  10. 10. Discos rígidos
  11. 11. A placa controladora • A placa lógica, ou placa controladora, é a parte "pensante" do HD. Com exceção dela, o HD é um dispositivo relativamente simples, composto por uma série de dispositivos mecânicos. • É a controladora que faz a interface com a placa-mãe, controla a rotação do motor e o movimento das cabeças de leitura, de forma que elas leiam os setores corretos, faz a verificação das leituras, de forma a identificar erros (e se possível corrigi-los, usando os bits de ECC disponíveis em cada setor), atualiza e usa sempre que possível os dados armazenados no cache de disco.
  12. 12. A placa controladora
  13. 13. Organização dos discos Para organizar o processo de gravação e leitura dos dados, a superfície dos discos é dividida em trilhas e setores. As trilhas são círculos concêntricos, que começam no final do disco e vão se tornando menores conforme se aproximam do centro, e cada uma recebe um número de endereçamento, que permite sua localização. A trilha mais externa recebe o número 0 e as seguintes recebem os números 1, 2, 3, e assim por diante. As trilhas se dividem em setores, que são pequenos trechos de 512 bytes cada um, onde são armazenados os dados.
  14. 14. Organização dos discos • As cabeças de leitura estão presas no mesmo braço móvel e não possuem movimento independente, portanto, todas as cabeças de leitura sempre estarão na mesma trilha de seus respectivos discos, deixamos de chamá- las de trilhas e passamos a usar o termo "cilindro".
  15. 15. Organização dos discos Um cilindro nada mais é do que o conjunto de trilhas com o mesmo número nos vários discos.
  16. 16. Correção de erros e badblocks • Por melhor que seja sua qualidade, nenhuma mídia magnética é 100% confiável (como pode confirmar quem já teve o desprazer de trabalhar com disquetes). • Pequenas falhas na superfície da mídia podem levar a erros de leitura.
  17. 17. Correção de erros e badblocks • Caso seja verificado um erro, os bytes de ECC são usados para tentar corrigir o problema, na qual, a maioria dos casos é eficiente. • Estes erros transitórios, que são corrigidos com a ajuda dos códigos ECC são chamados de "soft errors" e não causam nenhum efeito colateral além de um delay de alguns milissegundos na leitura.
  18. 18. Correção de erros e badblocks • Em um HD, cada setor armazena, 512 bytes de dados e alguns bytes contendo os códigos ECC; • Os bytes de ECC são criados pela placa lógica; • Ao ler um setor a cabeça de leitura lê também os códigos de ECC, que visam apenas verificar se os dados que estão sendo lidos são os mesmos que foram gravados
  19. 19. Correção de erros e badblocks • Badblocks: São defeitos físicos na mídia magnética, onde não é mais possível gravar dados. • O jeito é marcar os badblocks, de forma que eles não sejam mais usados. • Os HDs atuais são capazes de marcar automaticamente os setores defeituosos. • A própria controladora faz isso, independentemente do sistema operacional.
  20. 20. Correção de erros e badblocks • Existe uma área reservada no início do disco chamada "defect map" (mapa de defeitos) com alguns milhares de setores que ficam reservados para alocação posterior. • Sempre que a controladora do HD encontra um erro ao ler ou gravar num determinado setor, ela remapeia o setor defeituoso, substituindo-o pelo endereço de um setor "bom", dentro do defect map. • Como a alocação é feita pela própria controladora, o HD continua parecendo intacto para o sistema operacional.
  21. 21. Parâmetros de desempenho • Tempo de Busca (Seek Time) O tempo de busca indica o tempo que a cabeça de leitura demora para ir de uma trilha à outra do disco, ou seja, indica a performance do actuator usado no HD. O tempo de busca é importante, pois ele é o fator que mais influencia no tempo de acesso e consequentemente na performance geral do HD.
  22. 22. Parâmetros de desempenho • Tempo de Latência (Latency Time) Dentro do disco rígido, os discos magnéticos giram continuamente. Por isso, dificilmente os setores a serem lidos estarão sob a cabeça de leitura/gravação no exato momento de executar a operação. No pior dos casos, pode ser necessária uma volta completa do disco até o setor desejado passar novamente sob a cabeça de leitura.
  23. 23. Parâmetros de desempenho • Tempo de Acesso (Access Time) O tempo de acesso é a combinação do tempo de busca e do tempo de latência, o tempo médio necessário para realizar um acesso a um setor aleatório do HD. Assim que o comando é processado, a cabeça de leitura é movida para a trilha especificada (tempo de busca) e aguarda até que a rotação dos discos a faça passar pelo setor especificado (tempo de latência).
  24. 24. Parâmetros de desempenho • NCQ • A grande maioria dos HDs SATA atuais suporta o NCQ, onde a controladora utiliza o tempo ocioso, entre uma leitura e outra, para estudar e reorganizar a ordem das leituras seguintes, de forma que elas possam ser executadas na ordem em que seja necessário o menor movimento possível dos discos.
  25. 25. Parâmetros de desempenho NCQ - Native Command Queuing (Comando Nativo de Enfileiramento)
  26. 26. Parâmetros de desempenho • CACHE DE DISCO Permite à controladora executar um conjunto de operações úteis para melhorar o desempenho. Geralmente ao ler um arquivo, serão lidos vários setores seqüenciais. A forma mais rápida de fazer isso é, fazer com que a cabeça de leitura leia de uma vez todos os setores da trilha, passe para a trilha seguinte, passe para a terceira e assim por diante.
  27. 27. Parâmetros de desempenho • MTBF e service life • MTBF significa "Medium Time Between Failures" ou "tempo médio entre falhas". • A maioria dos HDs de baixo custo, destinados ao mercado doméstico, possuem MTBF de 300.000 ou 600.000 horas, enquanto os modelos high-end, ou destinados a servidores, normalmente ostentam um MTBF de 1.200.000 horas.
  28. 28. Parâmetros de desempenho • O service life indica o tempo de vida "recomendado" pelo fabricante, que normalmente é de 5 anos. • Como o HD é composto por componentes mecânicos, um certo desgaste é acumulado durante o uso, culminando na falha do HD. • Um service life de 5 anos indica que o HD é projetado para durar 5 anos e que a grande maioria das unidades deve realmente resistir ao tempo especificado.
  29. 29. Interfaces/IDE As interfaces usadas como meio de conexão para os HDs passaram por um longo caminho evolutivo. As placas-mãe usadas nos primeiros PCs sequer possuíam interfaces de disco embutidas. Naquela época, as interfaces IDE ainda não existiam, de forma que novas interfaces eram vendidas junto com os HDs e instaladas em slots ISA disponíveis.
  30. 30. Interfaces/IDE • Desenvolvido pela Quantum e a Western Digital, os primeiros HDs e interfaces IDE chegaram ao mercado em 1986. Em 1990 o padrão foi ratificado pelo ANSI(American National Standards Institute - "Instituto Nacional Americano de Padrões") dando origem ao padrão ATA(Advanced Technology Attachment). Como o nome "IDE" já estava mais difundido, muita gente continuou usando o termo "IDE", e outros passaram a usar "IDE/ATA" ou simplesmente “PATA".
  31. 31. Interfaces/IDE • Na placa-mãe encontravamos duas portas IDE. Após a popularização das interfaces SATA, as portas IDE ainda continuaram sendo incluídas nas placas recentes (muitas placas passaram a trazer apenas uma porta IDE) mas estima-se que não demore a desaparecer completamente.
  32. 32. Interfaces/IDE Master Slave
  33. 33. Interfaces/SATA • A partir de um certo ponto, ficou claro que o padrão IDE/ATA estava chegando ao seu limite e que mudanças mais profundas só poderiam ser feitas com a introdução de um novo padrão. Surgiu então o SATA (Serial ATA). • O SATA é um barramento serial, onde é transmitido um único bit por vez em cada sentido (Full-duplex). Isso elimina os problemas de sincronização e interferência encontrados nas interfaces paralelas, permitindo que sejam usadas freqüências mais altas.
  34. 34. Interfaces/SATA • Existem três padrões de controladoras SATA, o • SATA 150 (também chamado de SATA 1.5 Gbit/s ou SATA 1500); • SATA 300 (SATA 3.0 Gbit/s ou SATA 3000); • SATA 600 (ou SATA 6.0 Gbit/s); • Como o SATA utiliza dois canais separados, um para enviar e outro para receber dados, temos 150 ou 300 MB/s em cada sentido, e não 133 MB/s compartilhados, como no caso das interfaces ATA/133.
  35. 35. • Os cabos SATA são bem mais práticos que os cabos IDE e não prejudicam o fluxo de ar dentro do gabinete. • Os cabos podem ter até um metro de comprimento e cada porta SATA suporta um único dispositivo, ao contrário do padrão master/slave do IDE/ATA. • Por isso, é comum que as placas-mãe ofereçam 4 portas SATA (ou mais), com apenas as placas de mais baixo custo incluindo apenas duas.
  36. 36. Interfaces/SCSI (Small Computer Systems Interface) • Foi originalmente definido como uma interface paralela universal a nível de sistema para conectar vários dispositivos através de um único cabo, chamado barramento SCSI. • Os dispositivos recebem números de identificação (IDs) que são números de 0 a 7 (nas controladoras de 8 bits) ou de 0 a 15 nas de 16 bits. Um dos IDs disponíveis é destinado à própria controladora, deixando 7 ou 15 endereços disponíveis para os dispositivos.
  37. 37. Interfaces/SCSI • O ID de cada dispositivo é configurado através de uma chave ou jumper, ou (nos mais atuais), via software. A regra básica é que dois dispositivos não podem utilizar o mesmo endereço, caso contrário você tem um conflito similar ao que acontece ao tentar instalar dois HDs jumpeados como master na mesma porta IDE.
  38. 38. Barramento SCSI
  39. 39. Interfaces/SAS • Com a introdução do Serial ATA, o barramento SCSI perdeu grande parte de seus atrativos, já que o SATA oferece uma grande parte das vantagens que antes eram atribuídas ao SCSI e, ao mesmo tempo, oferece um sistema de cabeamento mais simples. • Para preencher a lacuna, surgiu o SAS (Serial Attached SCSI), um barramento serial, muito similar ao SATA em diversos aspectos, que adiciona várias possibilidades interessantes voltadas para o uso em servidores.
  40. 40. Interfaces/SAS • Assim como o SCSI conviveu com o padrão IDE por mais de duas décadas, o SAS está destinado a concorrer com o SATA, com cada um em seu respectivo nicho: • O SATA nos micros domésticos e servidores de baixo custo. • O SAS em servidores maiores e estações de trabalho. • As versões iniciais do SAS suportavam taxas de transferência de 150 e 300 MB/s, posteriormente foi introduzido o padrão de 600 MB/s e passou a ser desenvolvido o padrão seguinte, de 1.2 GB/s.
  41. 41. Interfaces/SAS • A maior velocidade é necessária, pois o SAS permite o uso de extensores (expanders), dispositivos que permitem ligar diversos discos SAS a uma única porta. Existem dois tipos de extensores SAS. • “Edge Expanders” que permitem ligar até 128 discos na mesma porta, e • “Fanout Expanders” que permitem conectar até 128 Edge Expanders (cada um com seus 128 discos!), chegando a um limite teórico de até 16.384 discos por porta SAS.
  42. 42. Maior Velocidade Fácil Expansão Hot swap
  43. 43. RAID • Devido à sua natureza mecânica, o HD é um dos componentes mais lentos de qualquer PC. Embora o desempenho venha crescendo a cada nova geração, os ganhos não têm acompanhado o aumento na capacidade de armazenamento; • Ex; HD de 1 TB X HD de 40 GB; • Ao invés de criar HDs muito rápidos, ou com um número muito grande de discos, os fabricantes de HDs se especializaram em fabricar modelos padronizados, utilizando um único braço de leitura e de 1 a 4 platters, fabricados em grande quantidade e a um custo relativamente baixo.
  44. 44. RAID • Para quem precisa de HDs mais rápidos, ou com uma capacidade muito maior, a melhor opção é montar um sistema RAID, onde é possível somar a capacidade e o desempenho de vários HDs, ou então sacrificar parte do espaço de armazenamento em troca de mais confiabilidade. • O termo RAID significa "Redundant Array of Inexpensive Disks", indicando justamente o uso de HDs padronizados e baratos como "blocos de montagem" para a criação de sistemas que se comportam como um único disco, maior, mais rápido e/ou mais confiável do que suas peças individuais.
  45. 45. RAID 0 (Striping) – Técnica de divisão de dados • O RAID 0 é um "RAID pra inglês ver", onde o objetivo é unicamente melhorar o desempenho, sacrificando a confiabilidade. • Ao usar o RAID 0, todos os HDs passam a ser acessados como se fossem um único drive. • Ao serem gravados, os arquivos são fragmentados nos vários discos, permitindo que os fragmentos possam ser lidos e gravados simultaneamente, com cada HD realizando parte do trabalho. • Usando RAID 0 a performance fica em um patamar próximo da velocidade de todos os HDs somada.
  46. 46. RAID 0 (Striping) – Técnica de divisão de dados • O RAID 0 é possivelmente o mais usado em desktops e também em alguns servidores de alto desempenho; • Utilização de HDs idênticos não obrigatória, mas aconselhável; • Ao utilizar um HD de 500 GB e outro de 300 GB em RAID 0, o sistema ignora os últimos 200 GB do HD maior; • Vantagem • Acesso rápido as informações (até 50% mais rápido). • Custo baixo para expansão. • Desvantagens; • Se um HD pifar, as informações são perdidas; • Não há paridade.
  47. 47. RAID 0 (Striping) – Técnica de divisão de dados - Os arquivos são divididos entre os discos; - Melhor desempenho; - Não é a melhor maneira de se fazer redundância
  48. 48. RAID 1 (Mirroring) – Técnica de espelhamento de dados • Permite usar dois HDs, sendo que o segundo armazenará uma imagem idêntica do primeiro. • Na prática, será como se você tivesse apenas um disco rígido instalado, mas caso o disco titular falhe por qualquer motivo, você terá uma cópia de segurança armazenada no segundo disco. O objetivo é aumentar a confiabilidade do sistema. • Também é possível utilizar RAID 1 com quatro ou mais discos (desde que seja utilizado sempre um número par). Nesse caso, um dos discos de cada par é visto pelo sistema como um HD separado e o outro fica oculto, guardando a cópia atualizada do primeiro. Ao utilizar 4 HDs de 500 GB em RAID 1, por exemplo, o sistema enxergaria 2 HDs, de 500 GB cada um.
  49. 49. RAID 1 (Mirroring) – Técnica de espelhamento de dados • Usar RAID 1 não proporciona qualquer ganho de desempenho. Pelo contrário, ele acaba causando uma pequena perda em comparação com usar um único drive, já que todas as alterações precisam ser duplicadas e realizadas em ambos os drives. • Caso um dos HDs titulares falhe, o segundo entra em ação automaticamente, substituindo-o até que você possa substituir o drive; • É um sistema dedicado a aumentar a disponibilidade; • Segurança nos dados (com relação a possíveis falhas que possam ocorrer no HD).
  50. 50. RAID 1 (Mirroring) – Técnica de espelhamento de dados - Os arquivos são duplicados entre os discos; - Consome o dobro de espaço; - Alta redundância;
  51. 51. RAID 1+0 (Mirroring/striping) – Técnica de espelhamento e divisão de dados • Este modo pode ser usado apenas caso você tenha a partir de 4 discos rígidos e o módulo total seja um número par (6, 8, etc.); • Neste modo, metade dos HDs serão usados em modo striping (RAID 0), enquanto a segunda metade armazena uma cópia dos dados dos primeiros, assegurando a segurança; • Este modo é na verdade uma combinação do RAID 0 e RAID 1, daí o nome; • O ponto fraco é que você sacrifica metade da capacidade total. Usando 4 HDs de 500 GB, por exemplo, você fica com apenas 1 TB de espaço disponível.
  52. 52. RAID 1+0 (Mirroring/striping) – Técnica de espelhamento e divisão de dados.
  53. 53. RAID 5 (distribuição com paridade) • Este modo é muito utilizado em servidores com um grande número de HDs. Ele utiliza um método bastante engenhoso para criar uma camada de redundância, sacrificando apenas uma fração do espaço total, ao invés de simplesmente usar metade dos HDs para armazenar cópias completas, como no caso do RAID 1. • O RAID 5 usa um sistema de paridade para manter a integridade dos dados. Os arquivos são divididos em fragmentos de tamanho configurável e, para cada grupo de fragmentos, é gerado um fragmento adicional, contendo códigos de paridade.
  54. 54. RAID 5 (distribuição com paridade)
  55. 55. RAID 6 • O ponto fraco do RAID 5 é que ele suporta a falha de um único HD. • Se por ventura um segundo HD falhar antes que o primeiro seja substituído, ou antes que a controladora tenha tempo de regravar os dados, você perde tudo, assim como acontece ao perder um dos HDs num array RAID 0.
  56. 56. RAID 6 • O RAID 6 é semelhante ao RAID 5, porém usa o dobro de bits de paridade, garantindo a integridade dos dados caso até 2 dos HDs falhem ao mesmo tempo. • Ao usar 7 HDs de 500 GB em RAID 6, por exemplo, teríamos 2.5 TB para dados mais 1 TB de códigos de paridade.
  57. 57. RAID 6
  58. 58. Categorias de RAID. No RAID via hardware uma controladora realiza todas as operações, o que inclui a maior parte das controladoras SCSI e SAS. Esse modo é o ideal tanto do ponto de vista do desempenho quanto do ponto de vista da compatibilidade e confiabilidade, já que a própria controladora executa todas as funções necessárias, de forma independente. O sistema operacional apenas acessa os dados, como se houvesse um único HD instalado.
  59. 59. Categorias de RAID. • No RAID via software, todas as funções são executadas diretamente pelo sistema operacional e os HDs são ligados diretamente às interfaces da placa- mãe. Neste caso, temos um trabalho adicional de configuração, mas em compensação não é preciso gastar com uma controladora dedicada. É possível criar arrays RAID via software tanto no Linux quanto no Windows.
  60. 60. SSDs e HHDs • Além da popularização dos pendrives e cartões, a queda no preço da memória Flash possibilitou o surgimento dos primeiros SSDs ou "Solid State Disks" de grande capacidade. • Um SSD é um "HD" que utiliza chips de memória Flash no lugar de discos magnéticos, é projetado para substituir o HD, sendo conectados a uma porta SATA ou IDE.
  61. 61. Hybrid Hard Drives • Todos os HDs atuais incluem uma pequena quantidade de memória SDRAM, usada como cache de disco. O cache é bastante rápido, mas é limitado por dois fatores: é muito pequeno (16 MB na maioria dos HDs atuais) e perde os dados armazenados quando o micro é desligado. • Um meio termo entre os SSDs e os HDs tradicionais são os HHDs (Hybrid Hard Drives), que são HDs tradicionais, que incorporam chips de memória Flash, usados como um buffer de dados.
  62. 62. O gigabyte de 1 bilhão de bytes • Nós, como seres humanos, estamos acostumados a pensar em valores segundo o padrão decimal, por isso temos muito mais facilidade em lidar com números múltiplos de 10. • Os computadores, por outro lado, trabalham utilizando o sistema binário, ou seja, com potências do número 2. Um único bit permite duas combinações possíveis, dois bits permitem 4, oito bits permitem 256, 16 bits permitem 65.536 e assim por diante.
  63. 63. O gigabyte de 1 bilhão de bytes • Diversos dispositivos seguem essa notação binária, incluindo módulos de memória e CD-ROMs. • Um módulo de memória de 1 GB possui exatamente 1.073.741.824 bytes, enquanto um CD-ROM de 650 MB é dividido em 333.000 setores de 2048 bytes cada um, totalizando 681.984.000 bytes, ou 650.39 MB.
  64. 64. O gigabyte de 1 bilhão de bytes • O ponto de discórdia são os fabricantes de HDs, que comodamente adotaram o padrão decimal para medir a capacidade dos seus produtos. • A discordância começou muito antes do que se imagina, datando dos primeiros discos fabricados pela IBM. O IBM 350 não armazenava 5 megabytes, mas sim 5 milhões de caracteres, com 7 bits cada um. • Concordando ou não, todos os fabricantes acabaram sendo obrigados a aderir à idéia, já que qualquer fabricante que preferisse seguir o padrão binário teria a capacidade de seus produtos "encolhida" em relação à concorrência. • Querendo ou não, o anúncio de um HD de "1 terabyte" soa melhor do que o anúncio de um HD de "931 gigabytes binários".
  65. 65. O gigabyte de 1 bilhão de bytes

×