Armazenamento em massa

Universidade Zambeze
Faculdade de Ciências e Tecnologia
Departamento de Engenharia Informática (3º ano)
SISTEMAS OPERATIVOS
AMAZENAMENTO EM MASSA
Discentes: Docente:
Manuel Mponda; Rui Miguel
Manuel Gravata
Nelson Omar
Simba Chanessa
Beira, Abril de 2021

2
ÍNDICE
Resumo ..........................................................................................................................................................I
Introdução .....................................................................................................................................................1
Custo...........................................................................................................................................................20
Conclusão....................................................................................................................................................21
Referencia Bibliográfica.............................................................................................................................22

I
Resumo
Para fazer a gerência de armazenamento sistemas operacionais deve-se escolher o tipo de sistema de
arquivo a ser utilizado pela partição, assim, na instalação do sistema o disco é particionada de
acordo com a necessidade do usuario.
Palavras-chave: Assistente, Assistente Virtual, Inteligência Artificial, Reconhecimento de voz

1
INTRODUÇÃO
Um sistema operacional é um software de sistema que gerencia o hardware do computador ,
recursos de software e fornece serviços comuns para programas de computador .Os sistemas
operacionais de compartilhamento de tempo programam tarefas para o uso eficiente do sistema e
também podem incluir software de contabilidade para alocação de custos de tempo de
processador , armazenamento em massa , impressão e outros recursos.Para funções de hardware,
como entrada e saída e alocação de memória , o sistema operacional atua como um intermediário
entre os programas e o hardware do computador, embora o código do aplicativo seja geralmente
executado diretamente pelo hardware e frequentemente faça chamadas de sistema para um
Função do SO ou é interrompido por ela. Os sistemas operacionais são encontrados em muitos
dispositivos que contêm um computador de telefones celulares e consoles de videogame a
servidores da Web e supercomputadores

2
Estrutura de Armazenamento em Massa
Discos Magnéticos
Uma ou mais travessas em forma de discos cobertos com mídia magnética. Os pratos do disco
rígido são feitos de metal rígido, enquanto os discos "flexíveis" são feitos de um plástico mais
flexível.
Cada prato possui duas superfícies de trabalho. As unidades de disco rígido mais antigas às vezes
não usavam a superfície superior ou inferior de uma pilha de pratos, pois essas superfícies eram
mais suscetíveis a danos potenciais.
Cada superfície de trabalho é dividida em vários anéis concêntricos chamados trilhas. A coleção
de todas as trilhas que estão à mesma distância da borda do prato (ou seja, todas as trilhas
imediatamente acima umas das outras no diagrama a seguir) é chamada de cilindro.
Cada trilha é dividida em setores, tradicionalmente contendo 512 bytes de dados cada, embora
alguns discos modernos usem ocasionalmente tamanhos de setor maiores. (Os setores também
incluem um cabeçalho e um trailer, incluindo informações de soma de verificação, entre outras
coisas. Os tamanhos de setor maiores reduzem a fração do disco consumida por cabeçalhos e
trailers, mas aumentam a fragmentação interna e a quantidade de disco que deve ser marcada
como incorreta no caso de erros.)
Os dados em um disco rígido são lidos por cabeças de leitura e gravação. A configuração padrão
(mostrada abaixo) usa um cabeçote por superfície, cada um em um braço separado e controlado
por um conjunto de braço comum que move todos os cabeçotes simultaneamente de um cilindro
para outro. (Outras configurações, incluindo cabeças de leitura e gravação independentes, podem
acelerar o acesso ao disco, mas envolvem sérias dificuldades técnicas.)
A capacidade de armazenamento de uma unidade de disco tradicional é igual ao número de
cabeças (ou seja, o número de superfícies de trabalho), vezes o número de trilhas por superfície,
vezes o número de setores por trilha, vezes o número de bytes por setor. Um determinado bloco
físico de dados é especificado fornecendo o número do cilindro do setor da cabeça no qual está
localizado

3
Em operação, o disco gira em alta velocidade, como 7200 rpm (120 rotações por segundo). A
taxa na qual os dados podem ser transferidos do disco para o computador é composta de várias
etapas:
O tempo de posicionamento, também conhecido como tempo de busca ou tempo de acesso
aleatório, é o tempo necessário para mover as cabeças de um cilindro para outro e para que as
cabeças se acomodem após o movimento. Normalmente, essa é a etapa mais lenta do processo e
o gargalo predominante nas taxas de transferência gerais. A latência rotacional é a quantidade de
tempo necessária para que o setor desejado gire e fique sob o cabeçote de leitura e gravação. Isso
pode variar de zero a uma revolução completa e, em média, será igual a meia revolução. Esta é
outra etapa física e geralmente é a segunda etapa mais lenta atrás do tempo de busca. (Para um
disco girando a 7200 rpm, a latência rotacional média seria 1/2 revolução / 120 revoluções por
segundo, ou pouco mais de 4 milissegundos, um longo tempo para os padrões do computador.
A taxa de transferência, que é o tempo necessário para mover os dados eletronicamente do disco
para o computador. (Alguns autores também podem usar o termo taxa de transferência para se
referir à taxa de transferência geral, incluindo tempo de busca e latência rotacional, bem como a
taxa de transferência eletrônica de dados.)As cabeças do disco "voam" sobre a superfície em uma
almofada de ar muito fina. Se eles entrarem em contato acidentalmente com o disco, ocorrerá um
colapso de cabeça, que pode ou não danificar permanentemente o disco ou até mesmo destruí-lo
completamente. Por este motivo, é normal estacionar as cabeças do disco ao desligar um
computador, o que significa mover as cabeças do disco ou para uma área do disco onde não haja
dados armazenados.
As disquetes são normalmente removíveis. Os discos rígidos também podem ser removíveis e
alguns podem ser trocados a quente, o que significa que podem ser removidos enquanto o
computador está funcionando e um novo disco rígido pode ser inserido em seu lugar.
As unidades de disco são conectadas ao computador por meio de um cabo conhecido como
Barramento de E / S. Alguns dos formatos de interface comuns incluem Enhanced Integrated
Drive Electronics, EIDE; Anexo de tecnologia avançada, ATA; Serial ATA, SATA, Universal
Serial Bus, USB; Fibre Channel, FC e Interface de sistemas de computador pequeno, SCSI.
O controlador de host está na extremidade do computador do barramento de E / S e o controlador
de disco está embutido no próprio disco. A CPU emite comandos para o controlador de host por
meio de portas de E / S. Os dados são transferidos entre a superfície magnética e o cache

4
onboard pelo controlador de disco e, em seguida, os dados são transferidos desse cache para o
controlador host e a memória da placa-mãe em velocidades eletrônicas.
Discos de estado sólido
À medida que as tecnologias melhoram e a economia muda, as tecnologias antigas costumam ser
usadas de maneiras diferentes. Um exemplo disso é o uso crescente de discos de estado sólido,
ou SSDs.
SSDs usam tecnologia de memória como um pequeno disco rígido rápido. Implementações
específicas podem usar memória flash ou chips DRAM protegidos por uma bateria para manter
as informações durante os ciclos de energia.Como os SSDs não têm partes móveis, eles são
muito mais rápidos do que os discos rígidos tradicionais e certos problemas, como o
agendamento de acessos ao disco, simplesmente não se aplicam.
No entanto, os SSDs também têm seus pontos fracos: eles são mais caros do que os discos
rígidos, geralmente não são tão grandes e podem ter uma vida útil mais curta.
Os SSDs são especialmente úteis como um cache de alta velocidade de informações do disco
rígido que deve ser acessado rapidamente. Um exemplo é armazenar metadados do sistema de
arquivos, por exemplo, informações de diretório e inode, que devem ser acessadas de forma
rápida e frequente. Outra variação é um disco de inicialização que contém o sistema operacional
e alguns executáveis de aplicativos, mas nenhum dado vital do usuário. SSDs também são usados
em laptops para torná-los menores, mais rápidos e mais leves.Como os SSDs são muito mais
rápidos do que os discos rígidos tradicionais, a taxa de transferência do barramento pode se
tornar um fator limitante, fazendo com que alguns SSDs sejam conectados diretamente ao
barramento PCI do sistema, por exemplo
Fitas Magnéticas
As fitas magnéticas já foram usadas para armazenamento secundário comum antes dos dias das
unidades de disco rígido, mas hoje são usadas principalmente para backups.
O acesso a um ponto específico em uma fita magnética pode ser lento, mas uma vez que a leitura
ou gravação começa, as velocidades de acesso são comparáveis às dos drives de disco.
As capacidades das unidades de fita podem variar de 20 a 200 GB, e a compactação pode dobrar
essa capacidade.
Estrutura do Disco
O cilindro de setor de cabeça tradicional, os números HSC são mapeados para endereços de
bloco linear numerando o primeiro setor na primeira cabeça na trilha mais externa como setor 0.
A numeração prossegue com o resto dos setores na mesma trilha e, em seguida, o resto das
trilhas no mesmo cilindro antes de prosseguir com o restante dos cilindros até o centro do disco.
Na prática moderna, esses endereços de bloco linear são usados no lugar dos números HSC por
uma variedade de razões:
O comprimento linear das trilhas perto da borda externa do disco é muito maior do que para as
trilhas localizadas perto do centro e, portanto, é possível espremer muitos mais setores nas trilhas

5
externas do que nas internas.Todos os discos têm alguns setores defeituosos e, portanto, os
discos mantêm alguns setores sobressalentes que podem ser usados no lugar dos defeituosos. O
mapeamento de setores sobressalentes para setores defeituosos é gerenciado internamente para o
controlador de disco.
Os discos rígidos modernos podem ter milhares de cilindros e centenas de setores por trilha em
suas trilhas mais externas. Esses números excedem a faixa de números HSC para muitos
sistemas operacionais (mais antigos) e, portanto, os discos podem ser configurados para qualquer
combinação conveniente de valores HSC que caiam dentro do número total de setores
fisicamente na unidade.
Há um limite para o quanto bits individuais compactados podem ser colocados em uma mídia
física, mas esse limite está ficando cada vez mais compactado à medida que os avanços
tecnológicos são feitos.
Os discos modernos empacotam muito mais setores em cilindros externos do que internos,
usando uma das duas abordagens:
Com velocidade linear constante, CLV, a densidade das brocas é uniforme de cilindro para
cilindro. Como há mais setores nos cilindros externos, o disco gira mais devagar ao ler esses
cilindros, fazendo com que a taxa de bits que passam sob o cabeçote de leitura e gravação
permaneça constante. Esta é a abordagem usada pelos CDs e DVDs modernos.Com Constant
Angular Velocity, CAV, o disco gira a uma velocidade angular constante, com a densidade da
broca diminuindo nos cilindros externos. (Esses discos teriam um número constante de setores
por trilha em todos os cilindros.)
Anexo de disco
As unidades de disco podem ser conectadas diretamente a um host específico (um disco local) ou
a uma rede.
Armazenamento anexado ao host
Os discos locais são acessados por meio de portas de E / S conforme descrito anteriormente.As
interfaces mais comuns são IDE ou ATA, cada uma das quais permite até duas unidades por
controlador de host.
SATA é semelhante com cabeamento mais simples.
Estações de trabalho de última geração ou outros sistemas que precisam de um número maior de
discos geralmente usam discos SCSI:
O padrão SCSI suporta até 16 destinos em cada barramento SCSI, um dos quais geralmente é o
adaptador host e os outros 15 podem ser unidades de disco ou fita.
Um destino SCSI geralmente é uma única unidade, mas o padrão também oferece suporte a até 8
unidades em cada destino. Geralmente, eles seriam usados para acessar discos individuais em
uma matriz RAID.
O padrão SCSI também oferece suporte a vários adaptadores de host em um único computador,
ou seja, vários barramentos SCSI.
Os avanços modernos em SCSI incluem versões "rápidas" e "amplas", bem como SCSI-2.
Os cabos SCSI podem ser 50 ou 68 condutores. Os dispositivos SCSI podem ser externos ou
internos.

6
FC é uma arquitetura serial de alta velocidade que pode operar sobre fibra óptica ou fios de cobre
de quatro condutores e tem duas variantes:
Uma grande malha comutada com um espaço de endereço de 24 bits. Essa variante permite que
vários dispositivos e vários hosts se interconectem, formando a base para as redes de área de
armazenamento, SANs, que serão discutidas em uma seção futura.O loop arbitrado, FC-AL, que
pode endereçar até 126 dispositivos (drives e controladores).
Armazenamento conectado à rede
O armazenamento anexado à rede conecta dispositivos de armazenamento a computadores
usando uma chamada de procedimento remoto, RPC, interface, normalmente com algo como
montagens de sistema de arquivos NFS. Isso é conveniente para permitir que vários
computadores em um grupo tenham acesso comum e convenções de nomenclatura para
armazenamento compartilhado.NAS pode ser implementado usando cabeamento SCSI, ou ISCSI
usa protocolos de Internet e conexões de rede padrão, permitindo acesso remoto de longa
distância a arquivos compartilhados.
O NAS permite que os computadores compartilhem facilmente o armazenamento de dados, mas
tende a ser menos eficiente do que o armazenamento conectado ao host padrão
SAN
Conecta computadores e dispositivos de armazenamento em uma rede, usando protocolos de
armazenamento em vez de protocolos de rede.
Uma vantagem disso é que o acesso ao armazenamento não restringe a largura de banda regular
da rede.
A SAN é muito flexível e dinâmica, permitindo que hosts e dispositivos se conectem e
desconectem rapidamente.
SAN também é controlável, permitindo acesso restrito a determinados hosts e dispositivos.

7
Agendamento de disco
Conforme mencionado anteriormente, as velocidades de transferência de disco são limitadas
principalmente pelos tempos de busca e latência rotacional. Quando vários pedidos devem ser
processados, também há algum atraso inerente na espera pelo processamento de outros pedidos.
A largura de banda é medida pela quantidade de dados transferidos dividida pela quantidade total
de tempo desde a primeira solicitação feita até a última transferência concluída (para uma série
de solicitações de disco).
Tanto a largura de banda quanto o tempo de acesso podem ser melhorados pelo processamento
das solicitações em boa ordem.
As solicitações de disco incluem o endereço do disco, o endereço da memória, o número de
setores a serem transferidos e se a solicitação é para leitura ou gravação
Agendamento FCFS
First-Come First-Serve é simples e intrinsecamente justo, mas não muito eficiente. Considere na
seguinte sequência a oscilação selvagem do cilindro 122 para o 14 e depois de volta para o 124:

8
Shortest Seek Time First
A programação é mais eficiente, mas pode levar à inanição se um fluxo constante de solicitações
chegar para a mesma área geral do disco.
O SSTF reduz o movimento total da cabeça para 236 cilindros, abaixo dos 640 necessários para
o mesmo conjunto de solicitações no FCFS. Observe, no entanto, que a distância pode ser
reduzida ainda mais para 208 começando com 37 e, em seguida, 14 antes de processar o restante
das solicitações.
Gerenciamento de Disco
Antes que um disco possa ser usado, ele deve ser formatado em baixo nível, o que significa
colocar todos os cabeçalhos e trailers marcando o início e o fim de cada setor. Incluídos no
cabeçalho e no trailer estão os números de setor linear e códigos de correção de erros, ECC, que
permitem que setores danificados não apenas sejam detectados, mas, em muitos casos, que os
dados danificados sejam recuperados (dependendo da extensão do dano. ) Os tamanhos dos
setores são tradicionalmente de 512 bytes, mas podem ser maiores, especialmente em unidades
maiores.
O cálculo ECC é executado com cada leitura ou gravação de disco e, se o dano for detectado,
mas os dados forem recuperáveis, então ocorreu um erro de software. Erros de software são
geralmente tratados pelo controlador de disco integrado e nunca vistos pelo sistema operacional.
( Veja abaixo. )
Depois que o disco estiver formatado em baixo nível, a próxima etapa é particionar a unidade
em uma ou mais partições separadas. Esta etapa deve ser concluída mesmo se o disco for usado
como uma única partição grande, para que a tabela de partição possa ser gravada no início do
disco.
Após o particionamento, os sistemas de arquivos devem ser formatados logicamente, o que
envolve estabelecer as informações do diretório mestre (tabela FAT ou estrutura inode),
inicializar listas livres e criar pelo menos o diretório raiz do sistema de arquivos. (As partições de
disco que devem ser usadas como dispositivos brutos não são formatadas logicamente. Isso
economiza a sobrecarga e o espaço em disco da estrutura do sistema de arquivos, mas requer que
o programa aplicativo gerencie seus próprios requisitos de armazenamento em disco.)

9
Bloco de inicialização
A ROM do computador contém um programa de bootstrap (independente do sistema
operacional) com código apenas o suficiente para localizar o primeiro setor no primeiro disco
rígido do primeiro controlador, carregar esse setor na memória e transferir o controle para ele. (O
programa de inicialização da ROM pode procurar nas unidades de disquete e / ou CD antes de
acessar o disco rígido e é inteligente o suficiente para reconhecer se encontrou um código de
inicialização válido ou não.)
O primeiro setor do disco rígido é conhecido como Master Boot Record, MBR, e contém uma
quantidade muito pequena de código além da tabela de partição. A tabela de partição documenta
como o disco é particionado em discos lógicos e indica especificamente qual partição é a
partição ativa ou de inicialização.
O programa de inicialização então procura a partição ativa para encontrar um sistema
operacional, possivelmente carregando um programa de inicialização um pouco maior / mais
avançado ao longo do caminho.
Em um sistema de inicialização dupla (ou inicialização múltipla maior), o usuário pode escolher
qual sistema operacional inicializar, com uma ação padrão a ser realizada no caso de nenhuma
resposta dentro de algum tempo.
Assim que o kernel é encontrado pelo programa de inicialização, ele é carregado na memória e o
controle é transferido para o sistema operacional. O kernel normalmente continuará o processo
de inicialização inicializando todas as estruturas de dados importantes do kernel, lançando
serviços de sistema importantes (por exemplo, daemons de rede, sched, init, etc.) e, finalmente,
fornecendo um ou mais prompts de login. As opções de inicialização neste estágio podem incluir
modos de manutenção ou de segurança de usuário único a.k.a., nos quais muito poucos serviços
do sistema são iniciados - Esses modos são projetados para que os administradores do sistema
reparem problemas ou mantenham o sistema de outra forma.
Uso de espaço de troca
A quantidade de espaço de troca necessária para um sistema operacional varia muito de acordo
com a forma como ele é usado. Alguns sistemas requerem uma quantidade igual à RAM física;

10
alguns querem um múltiplo disso; alguns querem uma quantidade igual à quantidade pela qual a
memória virtual excede a RAM física, e alguns sistemas usam pouca ou nenhuma.
Alguns sistemas oferecem suporte a vários espaços de troca em discos separados para acelerar o
sistema de memória virtual.
Localização de espaço de troca
O espaço de troca pode estar fisicamente localizado em um dos dois locais:
Como um arquivo grande que faz parte do sistema de arquivos regular. Isso é fácil de
implementar, mas ineficiente. Não apenas o espaço de troca deve ser acessado por meio do
sistema de diretório, o arquivo também está sujeito a problemas de fragmentação. Armazenar o
local do bloco em cache ajuda a encontrar os blocos físicos, mas isso não é uma solução
completa.
Como uma partição bruta, possivelmente em um disco separado ou pouco usado. Isso permite
que o sistema operacional tenha mais controle sobre o gerenciamento do espaço de troca, que
geralmente é mais rápido e eficiente. A fragmentação do espaço de troca geralmente não é um
grande problema, pois o espaço é reinicializado toda vez que o sistema é reinicializado. A
desvantagem de manter o espaço de swap em uma partição bruta é que ele só pode ser
aumentado reparticionando o disco rígido
Gerenciamento de espaço de troca
Historicamente, os sistemas operacionais trocavam processos inteiros conforme necessário. Os
sistemas modernos trocam apenas páginas individuais e somente quando necessário. (Por
exemplo, blocos de código de processo e outros blocos que não foram alterados desde que foram
carregados originalmente são normalmente apenas liberados do sistema de memória virtual em
vez de copiá-los para o espaço de troca, porque é mais rápido encontrá-los novamente no sistema
de arquivos e ler de volta a partir daí do que escrevê-los para trocar de espaço e depois lê-los de
volta.)
No sistema de mapeamento mostrado abaixo para sistemas Linux, um mapa do espaço de troca é
mantido na memória, onde cada entrada corresponde a um bloco de 4 K no espaço de troca.
Zeros indicam slots livres e não zeros referem-se a quantos processos têm um mapeamento para
esse bloco específico (> 1 para páginas compartilhadas apenas).
Estrutura RAID

11
A ideia geral por trás do RAID é empregar um grupo de discos rígidos junto com alguma forma
de duplicação, seja para aumentar a confiabilidade ou para acelerar as operações (ou às vezes
ambos).
RAID originalmente significava Redundant Array of Inexpensive Disks, e foi projetado para usar
um monte de pequenos discos baratos no lugar de um ou dois maiores e mais caros. Hoje, os
sistemas RAID empregam discos grandes, possivelmente caros, como seus componentes,
mudando a definição para discos independentes.
Melhoria da confiabilidade via redundância
Quanto mais discos um sistema tiver, maior a probabilidade de um deles estragar a qualquer
momento. Consequentemente, aumentar os discos em um sistema realmente diminui o tempo
médio até a falha, MTTF do sistema.
Se, no entanto, os mesmos dados foram copiados em vários discos, então os dados não seriam
perdidos a menos que ambas (ou todas) as cópias dos dados fossem danificadas
simultaneamente, o que é uma probabilidade MUITO menor do que para um único disco
estragar. Mais especificamente, o segundo disco teria que estragar antes que o primeiro disco
fosse reparado, o que traz o Tempo Médio para Reparar em jogo. Por exemplo, se dois discos
estivessem envolvidos, cada um com um MTTF de 100.000 horas e um MTTR de 10 horas, o
Tempo Médio para Perda de Dados seria 500 * 10 ^ 6 horas ou 57.000 anos!
Esta é a ideia básica por trás do espelhamento de disco, em que um sistema contém dados
idênticos em dois ou mais discos.
Observe que uma falha de energia durante uma operação de gravação pode fazer com que ambos
os discos contenham dados corrompidos, se ambos os discos estiverem gravando
simultaneamente no momento da falha de energia. Uma solução é gravar nos dois discos em
série, de modo que não sejam corrompidos (pelo menos não da mesma forma) por uma queda de
energia. E a solução alternativa envolve RAM não volátil como cache de gravação, que não é
perdida em caso de falha de energia e que é protegida por códigos de correção de erros.
Melhoria no desempenho via paralelismo
Tem benefício de desempenho para o espelhamento, especialmente com respeito às leituras.
Como cada bloco de dados é duplicado em vários discos, as operações de leitura podem ser
satisfeitas a partir de qualquer cópia disponível e vários discos podem ler diferentes blocos de
dados simultaneamente em paralelo. (As gravações também poderiam ser aceleradas por meio de
algoritmos de programação cuidadosos, mas seria complicado na prática.)
Outra maneira de melhorar o tempo de acesso ao disco é com striping, que basicamente significa
espalhar dados em vários discos que podem ser acessados simultaneamente.
Com a distribuição em nível de bit, os bits de cada byte são distribuídos em vários discos. Por
exemplo, se 8 discos estivessem envolvidos, cada byte de 8 bits seria lido em paralelo por 8
cabeças em discos separados. Uma única leitura de disco acessaria 8 * 512 bytes = 4K de valor
de dados no tempo normalmente necessário para ler 512 bytes. Da mesma forma, se 4 discos
estivessem envolvidos, dois bits de cada byte poderiam ser armazenados em cada disco, por 2K
de acesso ao disco por operação de leitura ou gravação.

12
A distribuição em nível de bloco espalha um sistema de arquivos por vários discos bloco a bloco,
portanto, se o bloco N estivesse localizado no disco 0, o bloco N + 1 estaria no disco 1 e assim
por diante. Isso é particularmente útil quando os sistemas de arquivos são acessados em grupos
de blocos físicos. Existem outras possibilidades de distribuição, sendo a distribuição em nível de
bloco a mais comum.
Níveis RAID
O espelhamento oferece confiabilidade, mas é caro; O striping melhora o desempenho, mas não
melhora a confiabilidade. Conseqüentemente, há uma série de esquemas diferentes que
combinam os princípios de espelhamento e striping de maneiras diferentes, a fim de equilibrar
confiabilidade versus desempenho versus custo. Eles são descritos por diferentes níveis de
RAID, como segue: (No diagrama a seguir, "C" indica uma cópia e "P" indica paridade, ou seja,
bits de soma de verificação.)
 Raid Level 0 - Este nível inclui apenas striping, sem espelhamento.
 Raid Nível 1 - Este nível inclui apenas espelhamento, sem distribuição.
 Raid Nível 2 - este nível armazena códigos de correção de erros em discos adicionais,
permitindo que quaisquer dados danificados sejam reconstruídos por subtração dos dados
não danificados restantes.
Observe que este esquema requer apenas três discos extras para proteger 4 discos de dados, em
oposição ao espelhamento completo. (O número de discos necessários é uma função dos
algoritmos de correção de erros e dos meios pelos quais o (s) bit (s) inválido (s) específico (s) é
(são) identificado (s).)
 Raid Nível 3 - Este nível é semelhante ao nível 2, exceto que aproveita o fato de que cada
disco ainda está fazendo sua própria detecção de erro, de modo que quando ocorre um
erro, não há dúvida sobre qual disco na matriz tem os dados ruins.
Como resultado, um único bit de paridade é tudo o que é necessário para recuperar os dados
perdidos de uma série de discos. O nível 3 também inclui striping, o que melhora o desempenho.
A desvantagem da abordagem de paridade é que cada disco deve participar de cada acesso ao
disco, e os bits de paridade devem ser calculados e verificados constantemente, reduzindo o
desempenho. Cálculos de paridade em nível de hardware e cache NVRAM podem ajudar com
esses dois problemas. Na prática, o nível 3 é bastante preferido em relação ao nível 2.
 Raid Level 4 - Este nível é semelhante ao nível 3, empregando striping em nível de bloco
em vez de striping em nível de bit.
Os benefícios são que vários blocos podem ser lidos independentemente e as alterações em um
bloco exigem apenas a gravação de dois blocos (dados e paridade), em vez de envolver todos os
discos. Observe que novos discos podem ser adicionados sem problemas ao sistema, desde que
sejam inicializados com zeros, pois isso não afeta os resultados de paridade.
 Raid Nível 5 - Este nível é semelhante ao nível 4, exceto que os blocos de paridade são
distribuídos por todos os discos, equilibrando, assim, de maneira mais uniforme a carga
no sistema.
Para qualquer bloco específico no (s) disco (s), um dos discos conterá as informações de
paridade para esse bloco e os outros discos N-1 conterão os dados. Observe que o mesmo disco
não pode conter dados e paridade para o mesmo bloco, pois ambos seriam perdidos no caso de
falha do disco.

13
 Nível 6 de raid - este nível estende o nível 5 de raid armazenando vários bits de códigos
de recuperação de erro (como os códigos Reed-Solomon), para cada posição de bit de
dados, em vez de um único bit de paridade.
No exemplo mostrado abaixo, 2 bits de ECC são armazenados para cada 4 bits de dados,
permitindo a recuperação de dados em caso de até duas falhas de disco simultâneas. Observe que
isso ainda envolve apenas 50% de aumento nas necessidades de armazenamento, em oposição a
100% para espelhamento simples, que só poderia tolerar uma única falha de disco.
Selecionando um nível de RAID
Na seleção do nível RAID ideal para um aplicativo específico incluem custo, volume de dados,
necessidade de confiabilidade, necessidade de desempenho e tempo de reconstrução, o último
dos quais pode afetar a probabilidade de que um segundo disco irá falhar enquanto o primeiro
falhou disco está sendo reconstruído.
Outras decisões incluem quantos discos estão envolvidos em um conjunto RAID e quantos
discos proteger com um único bit de paridade. Mais discos no conjunto aumentam o
desempenho, mas aumentam os custos. Proteger mais discos por bit de paridade economiza
custos, mas aumenta a probabilidade de que um segundo disco falhe antes que o primeiro disco
danificado seja reparado.
Extensões
Os conceitos de RAID foram estendidos para unidades de fita (por exemplo, striping fitas para
backups mais rápidos ou fitas de verificação de paridade para confiabilidade) e para a
transmissão de dados.
Problemas com RAID
O RAID protege contra erros físicos, mas não contra qualquer número de bugs ou outros erros
que podem gravar dados incorretos.
O ZFS adiciona um nível extra de proteção, incluindo somas de verificação de bloco de dados
em todos os inodes, juntamente com os ponteiros para os blocos de dados. Se os dados forem
espelhados e uma cópia tiver a soma de verificação correta e a outra não, os dados com a soma
de verificação inválida serão substituídos por uma cópia dos dados com a soma de verificação
boa. Isso aumenta muito a confiabilidade em relação ao RAID sozinho, a um custo de um
impacto de desempenho que é aceitável porque o ZFS é muito rápido para começar.

14
Outro problema com os sistemas de arquivos tradicionais é que os tamanhos são fixos e
relativamente difíceis de mudar. Onde conjuntos de RAID estão envolvidos, torna-se ainda mais
difícil ajustar os tamanhos do sistema de arquivos, porque um sistema de arquivos não pode se
estender por vários sistemas de arquivos.
O ZFS resolve esses problemas agrupando conjuntos RAID e alocando espaço dinamicamente
aos sistemas de arquivos conforme necessário. Os tamanhos do sistema de arquivos podem ser
limitados por cotas e espaço também pode ser reservado para garantir que um sistema de
arquivos será capaz de crescer mais tarde, mas esses parâmetros podem ser alterados a qualquer
momento pelo proprietário do sistema de arquivos. Caso contrário, os sistemas de arquivos
aumentam e diminuem dinamicamente conforme necessário.

15
Nenhum disco pode ser fabricado com 100% de perfeição e todos os objetos físicos se desgastam
com o tempo. Por esses motivos, todos os discos são enviados com alguns blocos defeituosos e
pode-se esperar que os blocos adicionais se danifiquem lentamente com o tempo. Se um grande
número de blocos não funcionar, todo o disco precisará ser substituído, mas alguns aqui e ali
podem ser manuseados por outros meios.
Antigamente, os blocos defeituosos tinham que ser verificados manualmente. A formatação do
disco ou a execução de certas ferramentas de análise de disco identificaria os blocos defeituosos
e tentaria ler os dados deles uma última vez por meio de tentativas repetidas. Em seguida, os
blocos defeituosos seriam mapeados e retirados do serviço futuro. Às vezes, os dados podiam ser
recuperados e às vezes eram perdidos para sempre. (As ferramentas de análise de disco podem
ser destrutivas ou não destrutivas.)
Os controladores de disco modernos fazem um uso muito melhor dos códigos de correção de
erros, de modo que blocos defeituosos podem ser detectados mais cedo e os dados geralmente
recuperados. (Lembre-se de que os blocos são testados com cada gravação, bem como com cada
leitura, portanto, muitas vezes os erros podem ser detectados antes que a operação de gravação
seja concluída e os dados simplesmente gravados em um setor diferente.)
Observe que o remapeamento dos setores de sua progressão linear normal pode prejudicar a
otimização do agendamento do disco do sistema operacional, especialmente se o setor de
substituição estiver fisicamente longe do setor que está substituindo. Por esse motivo, a maioria
dos discos normalmente mantém alguns setores sobressalentes em cada cilindro, bem como pelo
menos um cilindro sobressalente. Sempre que possível, um setor defeituoso será mapeado para
outro setor no mesmo cilindro, ou pelo menos um cilindro o mais próximo possível. O
deslizamento de setor também pode ser realizado, no qual todos os setores entre o setor ruim e o
setor de reposição são movidos para baixo em um, de modo que a progressão linear dos números
dos setores possa ser mantida.
Se os dados de um bloco inválido não puderem ser recuperados, é porque ocorreu um erro
grave, que requer a substituição do (s) arquivo (s) dos backups ou sua reconstrução do zero.
Implementação de armazenamento estável
O conceito de armazenamento estável (apresentado pela primeira vez no capítulo 6) envolve um
meio de armazenamento no qual os dados nunca são perdidos, mesmo em caso de falha do
equipamento no meio de uma operação de gravação.
Para implementar isso, são necessárias duas (ou mais) cópias dos dados, com modos de falha
separados.
Uma tentativa de gravação em disco resulta em um dos três resultados possíveis:
Os dados são gravados com sucesso e completamente. Os dados são parcialmente gravados, mas
não completamente. O último bloco escrito pode estar truncado.
Nenhuma escrita ocorre.
Sempre que ocorre uma falha de equipamento durante uma gravação, o sistema deve detectá-la e
retornar o sistema a um estado consistente. Para fazer isso, são necessários dois blocos físicos
para cada bloco lógico e o seguinte procedimento:

16
Grave os dados no primeiro bloco físico.
Após a conclusão da etapa 1, grave os dados no segundo bloco físico.
Declare a operação concluída somente depois que as duas gravações físicas forem concluídas
com êxito.
Durante a recuperação, o par de blocos é examinado. Se os dois blocos forem idênticos e não
houver nenhum sinal de dano, nenhuma outra ação será necessária. Se um bloco contiver um erro
detectável, mas o outro não, o bloco danificado será substituído pela cópia em boas condições.
(Isso irá desfazer ou concluir a operação, dependendo de qual bloco está danificado e qual não
está danificado).Se nenhum dos blocos mostrar danos, mas os dados nos blocos forem diferentes,
substitua os dados do primeiro bloco pelos dados do segundo bloco. (Desfaça a operação.)
Como a sequência de operações descrita acima é lenta, o armazenamento estável geralmente
inclui NVRAM como cache e declara uma operação de gravação concluída depois de gravada na
NVRAM.
Estrutura de armazenamento terciário
Armazenamento primário refere-se a chips de memória de computador; Armazenamento
secundário refere-se a sistemas de armazenamento de disco fixo (discos rígidos); E o
armazenamento terciário se refere a mídia removível, como unidades de fita, CDs, DVDs e, em
menor extensão, disquetes, pen drives e outros dispositivos removíveis.
O armazenamento terciário é tipicamente caracterizado por grande capacidade, baixo custo por
MB e tempos de acesso lentos, embora haja exceções em qualquer uma dessas categorias.
O armazenamento terciário é normalmente usado para backups e para armazenamento de arquivo
de longo prazo do trabalho concluído. Outro uso comum para armazenamento terciário é trocar
arquivos grandes e pouco usados (ou grupos de arquivos) do disco rígido e, em seguida, trocá-los
de volta conforme necessário de uma forma semelhante ao armazenamento secundário,
fornecendo espaço de troca para o armazenamento primário
Discos removíveis
Os discos magnéticos removíveis (por exemplo, disquetes) podem ser quase tão rápidos quanto
os discos rígidos, mas apresentam maior risco de danos devido a arranhões. Foram desenvolvidas
variações de discos magnéticos removíveis de até GB ou mais. (Discos rígidos hot-swappable?)
Um disco magneto-óptico usa um disco magnético coberto por um revestimento de plástico
transparente que protege a superfície.
As cabeças ficam a uma distância considerável da superfície magnética e, como resultado, não
têm força magnética suficiente para trocar bits em temperatura ambiente normal.
Para escrever, um laser é usado para aquecer um ponto específico no disco, a uma temperatura na
qual o campo magnético fraco da cabeça de gravação é capaz de inverter os bits.
Para leitura, um laser é direcionado ao disco, e o efeito Kerr faz com que a polarização da luz
seja girada no sentido horário ou anti-horário, dependendo da orientação do campo magnético.

17
Os discos óticos não usam magnetismo, em vez disso, usam materiais especiais que podem ser
alterados (por lasers) para ter pontos relativamente claros ou escuros.
Por exemplo, o disco de mudança de fase tem um material que pode ser congelado em um estado
cristalino ou amorfo, o último dos quais é menos transparente e reflete menos luz quando um
laser é refletido em uma superfície reflexiva sob o material.
Três potências de lasers são usadas com discos de mudança de fase: (1) um laser de baixa
potência é usado para ler o disco, sem afetar os materiais. (2) Uma potência média apaga o disco,
derretendo e recongelando o meio em um estado cristalino, e (3) uma potência alta grava no
disco derretendo o meio e recongelando-o no estado amorfo.
Os exemplos mais comuns desses discos são CD-RWs e DVD-RWs regraváveis.
Uma alternativa aos discos descritos acima são as unidades WORM Write-Once Read-Many.
A versão original dos drives WORM envolvia uma fina camada de alumínio imprensada entre
duas camadas protetoras de vidro ou plástico.Buracos foram feitos no alumínio para escrever
pedaços.
Como os buracos não puderam ser preenchidos, não havia como reescrever no disco. (Embora os
dados possam ser apagados ao queimar mais buracos.)
As unidades WORM têm ramificações legais importantes para dados que devem ser
armazenados por muito tempo e devem ser provados em tribunal como inalterados desde que
foram originalmente escritos. (Como armazenamento de longo prazo de registros médicos.)
Os discos CD-R e DVD-R modernos são exemplos de unidades WORM que usam tintas de
polímero orgânico em vez de uma camada de alumínio.
Os discos somente leitura são semelhantes aos discos WORM, exceto que os bits são
pressionados no disco na fábrica, em vez de serem gravados um por um.
Fitas
As unidades de fita normalmente custam mais do que as unidades de disco, mas o custo por MB
das próprias fitas é menor.
As fitas são normalmente usadas hoje para backups e para enormes volumes de dados
armazenados por certos estabelecimentos científicos. (Por exemplo, o arquivo de sondas
espaciais e imagens de satélite da NASA, que atualmente está sendo baixado de várias fontes
mais rápido do que qualquer um pode realmente ver.
Os trocadores de fita robóticos movem as fitas de unidades para bibliotecas de fitas de
arquivamento sob demanda.
Tecnologia do Futuro
Os discos de estado sólido, SSDs, estão se tornando cada vez mais populares.
O armazenamento holográfico usa luz laser para armazenar imagens em uma estrutura 3-D, e
toda a estrutura de dados pode ser transferida em um único flash de luz laser.

18
Micro-Electronic Mechanical Systems, MEMS, emprega a tecnologia usada na fabricação de
chips de computador para criar máquinas MUITO minúsculas. Um exemplo embala 10.000
cabeças de leitura e gravação em um centímetro quadrado de espaço e, conforme a mídia é
passada sobre ele, todas as 10.000 cabeças podem ler dados em paralelo
Suporte ao sistema operacional
O SO deve fornecer suporte para armazenamento terciário como mídia removível, incluindo o
suporte para transferência de dados entre sistemas diferentes.
Interface do aplicativo
Os sistemas de arquivos normalmente não são armazenados em fitas. (Pode ser tecnicamente
possível, mas não é prático.)
As fitas também não são formatadas em baixo nível e não usam blocos de comprimento fixo. Em
vez disso, os dados são gravados em fitas em blocos de comprimento variável, conforme
necessário. As fitas são normalmente acessadas como dispositivos brutos, exigindo que cada
aplicativo determine como os dados devem ser armazenados e lidos. Problemas como conteúdo
do cabeçalho e ASCII versus codificação binária (e ordenação de bytes) são geralmente
específicos do aplicativo. As operações básicas com suporte para fitas incluem locate (), read (),
write () e read_position ().
(Por causa das gravações de comprimento variável), gravar em uma fita apaga todos os dados
que seguem aquele ponto na fita.
Gravar em uma fita coloca o marcador de Fim da Fita (EOT) no final dos dados gravados. Não é
possível localizar () em qualquer ponto após o marcador EOT.
Nomenclatura de arquivos
As convenções de nomenclatura de arquivos para mídia removível não são inteiramente
específicas, nem são necessariamente consistentes entre sistemas diferentes. (Dois discos
removíveis podem conter arquivos com o mesmo nome e não há uma maneira clara de o sistema
de nomenclatura distingui-los.)
Felizmente, os CDs de música têm um formato comum, legível por todos os sistemas. Os CDs e
DVDs de dados têm apenas algumas opções de formato, tornando mais fácil para um sistema
suportar todos os formatos conhecidos.
Gerenciamento de armazenamento hierárquico

19
O armazenamento hierárquico envolve a extensão dos sistemas de arquivos para o
armazenamento terciário, trocando arquivos de discos rígidos para fitas da mesma maneira que
os blocos de dados são trocados da memória para os discos rígidos.
Geralmente, um espaço reservado é deixado no disco rígido, armazenando informações sobre a
fita específica (ou outra mídia removível) para a qual o arquivo foi trocado.
Um sistema robótico transfere dados de e para o armazenamento terciário conforme necessário,
geralmente automaticamente sob demanda do arquivo envolvido.
Velocidade
Largura de banda sustentada é a taxa de transferência de dados durante uma grande transferência
de arquivo, uma vez que a fita apropriada é carregada e o arquivo localizado.
Largura de banda efetiva é a taxa geral efetiva de transferência de dados, incluindo qualquer
sobrecarga necessária para carregar a fita apropriada e localizar o arquivo na fita.
Latência de acesso é todo o tempo de espera acumulado antes que um arquivo possa ser
realmente lido da fita. Isso inclui o tempo que leva para localizar o arquivo na fita, o tempo para
carregar a fita da biblioteca de fitas e o tempo gasto esperando na fila para que a unidade de fita
fique disponível.
Claramente, o acesso ao armazenamento terciário é muito mais lento do que o acesso secundário,
embora os discos removíveis (por exemplo, uma jukebox de CD) tenham um acesso um pouco
mais rápido do que uma biblioteca de fitas.
Confiabilidade
Os discos rígidos fixos são geralmente mais confiáveis do que os removíveis, porque são menos
suscetíveis ao ambiente.
Os discos óticos são geralmente mais confiáveis do que a mídia magnética.
Uma falha consertada no disco rígido pode destruir todos os dados, enquanto uma falha na
unidade óptica ou na unidade de fita geralmente não danifica a mídia de dados (e certamente não
pode danificar nenhuma mídia que não esteja na unidade no momento da falha).
As unidades de fita são dispositivos mecânicos e podem desgastar as fitas com o tempo (já que o
cabeçote da fita geralmente está em contato físico muito mais próximo com a fita do que os
cabeçotes do disco com os pratos).
Algumas unidades podem ser capazes de ler fitas apenas algumas vezes, enquanto outras
unidades podem ser capazes de reutilizar as mesmas fitas milhões de vezes.
As fitas de backup devem ser lidas após a gravação, para verificar se a fita de backup pode ser
lida. (Infelizmente essa pode ter sido a ÚLTIMA vez que uma fita específica foi lida, e a única
maneira de ter certeza é lê-la novamente...)

20
O armazenamento de fita de longo prazo pode causar degradação, pois os campos magnéticos
"flutuam" de uma camada da fita para as camadas adjacentes. O avanço rápido e o retrocesso
periódico das fitas podem ajudar, alterando a seção da fita contra a qual outras camadas.
Custo
O custo por megabyte para mídia removível é seu recurso de venda mais forte, especialmente à
medida que a quantidade de armazenamento envolvida (ou seja, o número de fitas, CDs, etc.)
aumenta.
No entanto, o custo por megabyte para discos rígidos caiu mais rapidamente ao longo dos anos
do que o custo da mídia removível, de forma que a solução de backup mais econômica para
muitos sistemas é simplesmente um disco rígido adicional (externo).
(Um bom uso para PCs antigos indesejados é colocá-los em uma rede como um servidor de
backup e / ou servidor de impressão. A desvantagem dessa solução de backup é que os backups
são armazenados no local com os dados originais e, em caso de incêndio, inundação , ou o roubo
pode destruir os dados originais e os backups.)

21
CONCLUSÃO
Este trabalho se propôs a apresentar visão geral sobre armazenamento em massa:
 Escalonamento em disco duro;
 Escalonamento em memórias não volátil;
 Detenção e Correção de Erros;
 Gestão de Dispositivos de Armazenamento;
 Gestão de Espaço de Swapping;
 Unidades de Armazenamentos Anexados;
 Estrutura RAID..

22
Referencia Bibliográfica
1. SILBERSCHATZ, Abraham, GALVIN, Peter, GAGNE, Greg. Fundamentos de Sistemas
Operacionais. 8ª. Ed. Rio de Janeiro : LTC, 2010.
2.MACHADO, Francis B.; MAIA, Luiz Paulo. Arquitetura de Sistemas Operacionais. 3ª ed. Rio
de Janeiro : LTC, 2002
http://en.wikipedia.org/wiki/CD_manufacturing#Premastering for more information on CD
manufacturing techniques. )

Armazenamento em massa

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a Armazenamento em massa

Semelhante a Armazenamento em massa (20)

Armazenamento em massa