SlideShare uma empresa Scribd logo
1 de 13
Baixar para ler offline
Introdução
Uma SAN é, de modo simplificado, uma rede dedicada ao armazenamento de dados,
que conecta dispositivos armazenadores de discos conhecidos por storages aos
servidores da rede. É uma tecnologia relativamente nova e que vem se popularizando
bastante no meio corporativo nos últimos anos, trazendo cada vez mais benefícios para
as empresas que a adotam.
Em linhas gerais, podemos definir SAN como uma infraestrutura que permite que
diversos servidores tenham acesso a discos externos de modo rápido e confiável. O
conceito de discos externos já é, há algum tempo, uma tendência mundial, e vem sendo
cada vez mais adotado. Os discos externos não são limitados em espaço como um disco
interno, são mais fáceis de manusear quando necessário e trazem facilidades para o
compartilhamento por vários servidores. A figura central de uma SAN, de fato, é o
servidor de discos ou, como é popularmente conhecido, o storage.
A centralização das operações de armazenamento de dados e seu gerenciamento são as
razões principais pela popularização das SANs. Administrar todos os recursos de
armazenamento em ambientes críticos e de crescimento elevado não é uma tarefa fácil e
pode ser muito dispendioso. Imagine, por exemplo, uma empresa com centenas de
servidores que possuem importante demanda por espaço em disco. Acompanhar
máquina a máquina e gerenciar seus volumes, com certeza não será um tarefa fácil.
Com a centralização oferecida pela SAN, tanto o tempo quanto o custo de
gerenciamento destes ambientes é muito reduzido. Além disso, uma SAN provê uma
série de outras vantagens para o acesso a áreas de discos, como sua alta escalabilidade e
confiabilidade.
Uma SAN é implementada utilizando-se componentes de hardware e também
importantes softwares, sem os quais a SAN não traria tantos benefícios quanto
conhecemos hoje. Como veremos no decorrer deste trabalho o conjunto de hardware e
software certo é que vai definir a qualidade da SAN.
Abaixo, vemos uma SAN, representada por uma nuvem e diversos de seus
equipamentos, ao lado de outras redes. A figura nos dá uma idéia de como as
tecnologias não são isoladas, mas se integram.
Benefícios
Podemos citar como principais benefícios proporcionados por uma arquitetura de SAN:
 Alta performance no acesso aos dados: as taxas de transferência nas SAN mais
modernas podem chegar a até 2 Gb/s. Além disso, dependendo do arranjo dos
discos (RAID), pode haver grande ganho de performance na leitura e/ou escrita,
como veremos adiante neste trabalho;
 Alta disponibilidade e confiabilidade: uma SAN possui diversas formas de
aumentar a disponibilidade dos dados de modo que, mesmo em caso de falha de
alguns discos, a produção na seja interrompida. Opções como caminhos
redundantes para acesso aos dados e espelhamento de dados em tempo real pode
assegurar a disponibilidade dos dados e aplicações.
 Escalabilidade: capacidade de adicionar mais capacidade de armazenamento e
outros recursos à infraestrutura já existente. Isto é feito facilmente dentro de uma
SAN, freqüentemente sem a necessidade de desligar o(s) servidore(s) ou seus
clientes de rede;
 Centralizar a administração dos recursos: nos ambientes atuais, cada vez mais
complexos, isto pode ser a única solução para a administração dos recursos de
discos, trazendo grandes economias para as empresas.
 Descongestionamento da LAN: em muitos casos a rede local é lenta devido ao
grande fluxo de informações que trafega por ela. Com uma SAN, este fluxo é
bastante reduzido, o que alivia a rede local, beneficiando os usuários. Isto
também é muito importante para o backup corporativo, que também pode ser
feito sem utilizar a rede local.
Além destes ganhos, há outros que variam um pouco dependendo da solução adotada e
dos fornecedores escolhidos, tal como balanceamento de carga e facilidades para
backup. Estas facilidades focam em alternativas para aplicações em que não há janela
para backup disponível, já que elas exigem disponibilidade integral. Veremos algumas
destas mais adiante.
Enfim, as características das SAN podem trazer grandes economias, alta disponibilidade
dos dados, fácil expansão do storage, poucas paradas da rede, e redução de seu tráfego.
História
A idéia da SAN nasceu em 1987, quando Patterson, Gibson e Katz, da Universidade da
Califórnia, publicaram o artigo A Case for Redundant Arrays of Inexpensive Disks
(RAID). As idéias apresentadas e explicadas no artigo sugeriam combinar vários
pequenos discos, não muito caros, em uma matriz a fim de obter características que
discos isolados não eram capazes de oferecer. Estas novas características tratavam-se,
principalmente, de melhorar a performance de leitura e escrita e preservar
automaticamente o conteúdo dos discos durante e depois da falha de componentes do
disco. Com os discos em RAID, nasceram os servidores de discos, os storages, que são
o centro de uma SAN.
Um acontecimento que também foi muito importante para o surgimento desta
arquitetura foi o desenvolvimento do padrão Fibre Channel (FC), utilizado nas
SANs. Fibre Channel é um protocolo de transferência de dados, que faz uso do meio
físico de fibra ótica. Acompanhando o processo de popularização das SANs, os
diferentes fornecedores começaram a tentar definir seus próprios padrões FC, o que
estava atrapalhando o desenvolvimento do padrão. Assim, foram criadas algumas
organizações para definir as regras para o novo padrão. Entre elas, destacam-se a FCIA
(Fibre Channel Industry Organization) e a SNIA (Storage Networking Industry
Association).
A FCIA foi criada em agosto de 1999, da fusão da Fibre Channel Association e Fibre
Channel Community. É uma organização de benefício mútuo, sem fins lucrativos,
formada por fabricantes, integradores de sistemas, desenvolvedores, vendedores,
profissionais da indústria e usuários. O objetivo da FCIA é criar bases para a tecnologia
de infra-estrutura FC, a fim de que várias aplicações dentro dos complicados mercados
de Storage e TI possam ser suportadas.
A SNIA foi criada em Dezembro de 1997 e também é uma associação sem fins
lucrativos e dedica-se a garantir que as redes de armazenamento de dados tornem-se
soluções completas e confiáveis dentro da comunidade de TI.
Protocolos
SANs podem ser implementadas utilizando interfaces de diferentes tipos. Os protocolos
suportados por SAN são os seguintes:
 FCP: Fibre Channel Protocol
 FCIP: Fibre Channel sobre TCP/IP
 IFCP: Internet Fibre Channel Protocol
 SCSI: Small Computer System Interface
 ISCSI: Internet Small Computer System Interface
 ISNS: Internet Storage Name Service
 SAS: Serial Attached SCSI
Atualmente, Fibre Channel é o padrão utilizado na maioria das SANs. Fibre Channel é
uma interface serial que possui uma alta largura de banda e permite que um grande
número de dispositivos possam ser anexados a ela de uma vez. Os dispositivos Fibre
Channel são conectados, principalmente, a um cabo de fibra ótica, mas pode ser
utilizado também em cabos de cobre. As velocidades das SANs atuais vão até 2 Gb/s.
A Fibre Channel pode se comunicar com vários protocolos diferentes, incluindo SCSI, e
até mesmo IP. Os dispositivos do Fibre Channel são identificados por um número de ID
fisicamente gravado denominado World Wide Name, análogo a um endereço de
Ethernet MAC.
Hardware
Talvez a parte mais importante para a implantação de uma SAN seja referente
ao hardware. É importante selecionar com cuidado os dispositivos de hardware para
uma SAN pois há diferenças muito grandes entre os equipamentos fornecidos por
diferentes empresas do ramo. Além disso, devido às SANs serem bastante dependentes
de alguns softwares para funcionar corretamente, é muito importante garantir as
atualizações de softwares, firmwares e outras questões ligadas a compatibilidade. Os
fabricantes de equipamentos para SAN costumam divulgar matrizes de compatibilidade
para seus produtos em seus sites. Nelas há uma qunatidade muito grande de
informações, contendo diversas combinações de hardware e software,
como storage, switch, HBA, servidor e sistema operacional, que foram homologados
pelo fabricante. Entre as principais empresas do mercado especializadas em projeto de
SAN destacam-se: EMC, Sun Microsystems, IBM, HP, Network Appliance e Brocade.
Os principais componentes de hardware são:
 Servidor de discos: Servidores de discos, também chamados
de storages ou frames, são dispositivos que armazenam discos compartilhados
pelos hosts da rede. Eles possuem, em geral, diversas áreas diferentes, com
esquemas de RAID diferentes ou discos específicos para a realização de
espelhamentos para backup, os chamados BCV (business continuance volumes).
Os BCVs facilitam muito tanto o backup quanto a restauração dos dados. O seu
conteúdo é sincronizado com o conteúdo do disco principal, até que se faça uma
quebra do sincronismo, o chamado split. Neste momento, o BCV guarda uma
imagem do disco antes do split, e pode ser usado para backup, enquanto o
servidor continua trabalhando, sem impactos na produção. Este procedimento
pode ser feito com a freqüência mais conveniente para o usuário e, em muitos
casos, o BCV é utilizado também para restauração de dados perdidos, que é
muito mais rápido do que acessar fitas de backup. Muitos storages, além de
discos, possuem também uma espécie de processador e memórias nvram e/ou
flash, onde é armazenado o firmware do equipamento.
 Hubs:
Assim como hubs de uma rede local, os hubs FC permite que todos os
dispositivos conectados a ele se enxerguem e possam trocar informações entre
si. Possuem as vantagens de possuir baixo preço e baixa complexidade. Permite
ainda que dispositivos possam ser inseridos ou removidos sem interrupção
alguma, o que torna o ambiente bastante dinâmico. Entretanto, os hubs dividem
a largura de banda por todos os dispositivos conectados a ele, o que pode
representar uma perda muito grande de velocidade. Os hubs podem ser
cascateados, a fim de fornecer mais portas para aumentar ainda mais a
conectividade. Teoricamente, o hub suporta até 127 dispositivos conectados a
ele, mas na prática, deve-se restringir o total de dispositivos a 30, no máximo.
Para pequenos grupos de trabalho os hubs são mais atrativos, pois fornecem um
alto grau de interoperabilidade por um preço menor. Existem hubs fibre
channel de 4 a 16 portas e possuem uma largura de banda de, no máximo, 100
MB por segundo, compartilhado entre os servidores conectados às suas portas.
 Switches: Switches fibre channel são bem mais complexos que os hubs, tanto em
seu projeto quanto em funcionalidade. Enquanto os hubs são apenas um
concentrador de cabos para um segmento compartilhado, um switch é um
dispositivo de rápido roteamento dos dados e possui uma taxa de transferência
de dados exclusiva para cada porta. As taxas de transferência variam bastante
dependendo do switch, que vêm evoluindo rapidamente. Atualmente, a
velocidade máxima está em 400 MB/s para cada porta. Enquanto os hubs não
participam de atividades no nível do protocolo Fibre Channel,
os switches participam ativamente, tanto para fornecer serviços quanto para
supervisionar o fluxo de frames entre a origem e o destino.
 Bridges Fibre Channel-SCSI: As chamadas bridges em uma SAN são
equipamentos que realizam a conversão entre dispositivos SCSI e Fibre
Channel, interfaces de diferentes padrões elétricos e diferentes protocolos. Isto
permite a manutenção dos dispositivos SCSI na SAN, como drives de fita
de backup, integrando-o aos novos ambientes de tecnologia Fibre Channel.
 HBA (Host Bus Adapter): Uma HBA é um dispositivo capaz de conectar
dispositivos externos a um servidor. Por exemplo: para conectarmos um disco
SCSI a um micro (barramento interno PCI), será necessário utilizar uma HBA
SCSI-PCI. No caso da SAN, é necessário instalar em todos os servidores
participantes dela uma HBA Fibre Channel, que se encarregará de fazer as
conversões dos diferentes meios internos e externos ao servidor.
As HBAs FC possuem, ainda, uma espécie de processador (um chip) capaz de
fazer a conversão de protocolos para poupar a CPU do servidor deste trabalho.
RAID
A maior parte das SANs atuais utiliza sistemas de RAID em seus principais
equipamentos de armazenamento de dados. Estes sistemas oferecem proteção dos
dados, tolerância a falhas, no caso de um componente ou um caminho de I/O falhar, alta
performance, capacidade de armazenamento e escalabilidade. Outras características para
garantir a confiabilidade dos sistemas de RAID mais modernos incluem redundância de
sistemas de refrigeração, fontes de alimentação, controladoras e até de circuitos de
monitoramento.
A idéia do RAID é combinar múltiplos discos em uma matriz a fim de obter
características que discos isolados não poderiam fornecer, como alto desempenho e
tolerância a falhas. Os computadores conectados a um servidor RAID enxergam suas
áreas como um disco físico, que, para o servidor RAID é uma unidade lógica de
armazenamento (Logical Storage Unit - LUN). Existem várias maneiras de obter as
características de tolerância a falhas, redundância dos dados e alta performance, que
constituem os chamados níveis de RAID. Existem 6 níveis de RAID, sendo que os
principais são:
 RAID 0: Os dados são distribuídos através dos discos, método conhecido
por data striping, sem gerar paridade ou redundância. A gravação e a leitura dos
dados é feita paralelamente, uma vez que cada disco possui a sua controladora.
Com isto, há um grande ganho de performance, porém, por não haver
redundância alguma, se um dos discos falhar, os dados são perdidos. RAID 0 é
utilizado quando máxima performance é mais importante do que possíveis
perdas de dados.
 RAID 1: Os discos da matriz são divididos em 2 grupos. Na escrita, os dados são
gravados igualmente nos 2 grupos. Na leitura, os dados podem ser lidos de
qualquer um dos grupos. Normalmente, ela é feita alternando-se os discos,
processo conhecido por round robin, mas pode haver um disco preferencial para
leitura, no caso de haver um disco mais rápido que outro. Não há geração de
paridade, mas sim uma redundância completa dos dados. Este método tem se
tornado popular pela sua simplicidade e praticidade em caso de falha de um dos
discos. Porém possui as desvantagens de utilizar apenas metade da capacidade
total de discos, além de não trazer nenhum aumento de performance.
 RAID 5: Este nível de RAID também utiliza o conceito de data striping, mais
acrescenta uma forma de obter redundância dos dados, através do gerador de
paridade. Para cada escrita, é gerada uma paridade calculada pela operação de ou
exclusivo dos bits gravados. A paridade fica espalhada pelos 3 discos, ou seja, a
cada gravação ela é gravada em um disco diferente. São necessários, no mínimo,
3 discos para sua implementação, sendo o espaço "desperdiçado" do conjunto
devido ao armazenamento da paridade é equivalente ao espaço de um disco.
Pode-se, com este esquema, perder até um disco que, a partir dos outros e da
paridade, reconstitui-se os dados do disco perdido. Caso mais de um disco falhe
ao mesmo tempo, os dados não poderão ser recuperados. É um método muito
empregado nos storages atuais, porque alia aumento de performance à segurança
oferecida pela redundância com um ótimo aproveitamento de recursos.
 RAID 0 + 1 ou RAID 10: A combinação de níveis de RAID é uma prática
comum hoje em dia. A mais utilizada é a que combina os níveis 1 e 0, o que alia
a alta performance do RAID 0 com a segurança dos dados do RAID 1.
Software:
Um dos componentes indispensáveis para uma SAN são os softwares envolvidos.
Normalmente, as empresas fornecedoras de SAN são também produtoras de softwares
que gerenciam seus produtos de hardware. Embora não se tenham muitas pesquisas e
estatísticas que meçam o estado deste componente, a parte de software é um campo em
expansão, como pode ser visto em diversas empresas que vêm ampliando sua infra-
estrutura de dados. Estes softwares possuem diversas funções, entre elas:
 Organizar o acesso às diferentes áreas do storage por parte dos servidores:
muitos storages hoje em dia possuem diferentes áreas de discos, que possuem
controladoras diferentes, além, de outras características diferentes, como, por
exemplo, o esquema de RAID. O planejamento do local no storage para alocar
discos para os servidores, conforme suas necessidades e características é muito
importante, e os softwares atuais provém cada vez mais facilidades para este
trabalho.
 Prover diversos sistemas de contingência para o caso de falhas: como a maioria
dos dados em storage são críticos, há uma preocupação muito grande com um
esquema de contingência em caso de falhas. Um dos principais esquemas deste
tipo é o chamado failover. O failover é um termo genérico utilizado quando há
redundância entre caminhos de acesso e, caso haja falha em um deles, o outro é
automaticamente acionado e passa a ser utilizado, o que é controlado pelo
software.
 Aumentar a performance de acesso aos dados: há algumas ferramentas para
aumentar a performance de acesso aos dados em um software de um SAN,
dependendo da arquitetura utilizada. Uma muito utilizada é o balanceamento de
carga (load balance), que utiliza caminhos redundantes de acesso ao storage, e
controla por software a melhor maneira de acessa-lo, o que traz um grande
aumento de performance.
 Prover facilidades para o backup de servidores: quanto mais crítico um servidor,
mais complicado é o seu backup. Algumas aplicações não podem parar jamais e
possuem uma janela de backup muito pequena. Além disso, o backup não pode
interferir na performance do servidor, principalmente em casos de aplicações
com alto índice de acesso. Com ferramentas de software como o snapshot, é
possível gravar imagens da área de discos utilizadas pelo servidor, e fazer o
backup em outro horário qualquer, sem impactar em nada a produção. Isto é
feito, em geral, guardando-se ponteiros para os dados e utilizando-se áreas extras
do storage para guardar dados que sejam modificados após o snapshot, quando
os ponteiros que apontavam para a área original, passam a apontar para esta área
temporária.
Normalmente, estes softwares possuem duas interfaces, uma gráfica, ou web, e outra
por linha de comando, o que é extremamente útil para a confecção de scripts para
automatizar alguns processos. Infelizmente, hoje em dia, os softwares envolvidos em
uma SAN estão amarrados aos fabricantes de hardware e não há uma padronização
destes produtos. As diferenças entre eles são muito grandes, e o modo de operá-los
também, e, assim, as empresas que implantam SAN sempre perdem um grande tempo (e
dinheiro) com treinamentos para seus funcionários. Ainda: caso a solução seja migrada,
o modo de operação do novo produto, com certeza, será bem diferente do anterior.
Assim, na hora de escolher qual fabricante de storage adotar, é importante procurar
saber bem como será o seu gerenciamento, quais serão as facilidades que os softwares
proverão, suas compatibilidades e quão fácil será a operação de todo o conjunto.
Topologias:
As SANs atuais são todas construídas em uma topologia física de estrela. Um hub ou
switch é conectado ao storage e neles conectamos todos os outros servidores da rede. A
excessão fica com a ligação ponto-a-ponto, como veremos a seguir.
Assim, analisaremos as topologias existentes:
- Ligação ponto-a-ponto (point-to-point): Para alguns não é considerada uma
topologia de SAN, uma vez que não possui escalabilidade alguma. Neste tipo de
ligação, os servidores são ligados diretamente ao storage, sem nenhum equipamento
intermediário, como hub ou switch. O número máximo de servidores envolvidos é igual
ao número de portas que o storage possui. Comparado com a ligação SCSI, no entanto,
esta topologia, que utiliza Fibre Channel, apresenta uma performance muito melhor e
atinge distâncias maiores.
- Loops ou anéis: são chamados de Fibre Channel Arbitrated Loop (FC-AL): Nesta
topologia utiliza-se hub, cuja largura de banda de no máximo de 100 MB/s é
compartilhada por todos os seus membros. Teoricamente suporta loops com até 126
dispositivos, mas na prática este número é bem menor. Esta topologia está sendo muito
pouco utilizada nas SANs modernas. Algumas pessoas comparam esta topologia como
uma rede Token Ring, em que a largura de banda é dividida por todos os dispositivos do
loop. Esta topologia está sendo muito pouco utilizada nas SANs modernas. Entretanto
há equipamentos antigos que não suportam o modo fabric e, assim, é utilizado o modo
em loop.
- Malha (Switched fabric ou apenas fabric): nesta topologia, utiliza-se switches Fibre
Channel, o que permite um grande número de dispositivos interconectados. Dedica
largura de banda integral a cada uma das portas e permite transferências de dados
simultaneamente para um único nó. É a topologia que permite mais escalabilidade e
crescimento. Teoricamente, pode conter mais de 7,7 milhões de nós.
- Topologia mista: Na literatura, encontramos, ainda, a possibilidade de combinar as
duas topologias, o que não é comum de se fazer:
Zoneamento
Há algumas formas de se implementar uma SAN. Atualmente, como já falamos, a
topologia mais utilizada é em malha, e, com isto, a técnica do zoneamento (zonning)
tornou-se bastante popular. Esta técnica consiste em definir grupos de dispositivos que
se enxergam, o que chamamos de zona. Isto permite alocar o storage adequadamente
para cada hosts, pois as necessidades de espaço em disco, e mesmo de redundâncias, são
diferentes entre os membros de uma SAN. Entre as diversas formas de se definir uma
zona, a mais comum é utilizando-se os WWNs dos hosts.
O zoneamento é feito no switch. Atualmente, a maioria dos switches possui algum
utilitário gráfico que auxilie a fazer os zoneamentos e outras tarefas próprias de cada
um, mas pode-se fazer também se conectando no switch via telnet e utilizando o sistema
próprio dele.
Storage Área Network versus Network Attached Storage
Como este é um trabalho sobre redes de armazenamento de dados, vale à pena comentar
também uma outra tecnologia para compartilhamento de dados que ganhou
popularidade: a chamada NAS (Network Attached Storage). Trata-se, basicamente, de
um servidor de discos capaz de exportar áreas por protocolos como o NFS, CIFS ou até
mesmo o HTTP. Para isto, é utilizada a rede local, o que traz a vantagem de permitir
que qualquer host da rede tenha acesso a dados comuns, porém possui as desvantagens
de congestionar o tráfego da rede, bem como uma velocidade de acesso pequena, se
comparada à de uma SAN.
Uma outra grande vantagem da arquitetura NAS é que os dados podem ser
compartilhados entre diversos hosts, inclusive de sistemas operacionais diferentes,
enquanto em uma SAN os dados são dependentes do sistema operacional.
Bibliografia
Devido à dificuldade de se encontrar livros sobre este assunto no Brasil, a base para este
trabalho foi extraída toda da Internet. Segue abaixo, a lista dos principais links
utilizados por mim.
 http://www.dothill.com/tutorial/index.htm
 http://eval.veritas.com/webfiles/docs/san-whitepaper.pdf
 http://www.qlogic.com/documents/datasheets/knowledge_data/whitepapers/whit
epapers.zoning.pdf
 http://www.networkcomputing.com/1109/1109ws1.html
 http://www.fibrechannel.org/
 http://www.snia.org/
 http://www.networkmagazine.com/shared/article/showArticle.jhtml?articleId=17
601008&pgno=2
 http://access.globalknowledge.com/tutorials.asp?sort=cat&catID=12&perpage=2
0
 http://us-
support.external.hp.com/iv/data/documents/DE_SW_UX_swrec_EN_01_E/Fibr
eChannel.pdf
 http://forums1.itrc.hp.com/service/forums/questionanswer.do?admit=716493758
+1081305504552+28353475&threadId=19156
 http://www.sun.com/storage/white-papers/fc_comp.html
 http://www.javvin.com/protocolSAN.html
 http://www.nas-san.com
 http://www.chaparralnet.com/supp/support_documentation/JFS226UG.pdf
Além destes sites, foi retirada importantes informações sobre o padrão Fibre Channel do
seguinte livro:
 Manual de Administração do Sistema UNIX, 3a edição – Evi Nemeth, Garth
Snyder, Scott Seebass e Trent R. Hein
Questões:
1. Para que serve a bridge em uma SAN?
A bridge, em uma SAN, é um equipamento capaz de converter um meio físico para
outro. Tem sido muto utilizada para conectar dispositivos SCSI a SAN, que utiliza
meios de fibra ótica. É importante não confundir este equipamento com o que
conhecemos como bridge em uma LAN, pois suas funções são totalmente diferentes.
2. De que maneira o RAID 5 consegue recuperar a informação perdida em 1 dos
discos. Dê exemplos.
R: O RAID 5 calcula a paridade fazendo-se uma operação de ou-exclusivo com os bits
gravados nos discos. Suponha que um esquema de RAID 5 possua 6 discos (5 para
escrita e 1 para paridade). Se os bits gravados forem 1, 0, 0, 1, 1, então a paridade será
1. Cada um destes bits será gravado em um disco diferente. Se perdermos qualquer um
dos discos, recuperamos o bit perdido fazendo-se o ou-exclusivo dos outros bits,
contando com o de paridade, No exemplo, se perdermos o primeiro disco (bit 1),
faríamos para recuperar: 0 xor 0 xor 1 xor 1 xor 1, que dá exatamente 1, o bit perdido.
Se perdêssemos o segundo disco (bit 0), faríamos para recuperar: 1 xor 0 xor 1 xor 1 xor
1, que dá 0, novamente correto. Para todos os demais, o pensamento é análogo.
3. Explique porque o snapshot é uma boa ferramenta de software de SAN e como
ele funciona.
O snapshot é uma ferramenta de software que permite fazer e armazenar por um certo
tempo uma fotografia dos dados do servidor no storage. Possui a vantagem de quase não
consumir espaço em disco, uma vez que ele guarda um conjunto de ponteiros para os
dados, e não os dados propriamente. Esta imagem pode ser vista pelo servidor como
uma outra área, que pode ser montada como um drive (Windows) ou um filesystem
(Unix) para fins, principalmente, de backup. Em casos de atualização dos dados após o
snapshot, o software copia os dados anteriores à atualização para uma área temporária e
o ponteiro que apontava para os dados que foram atualizados passam a apontar para os
dados preservados nesta nova área, uma vez que a fotografia tirada deve ser mantida a
mesma. Isto limita o snapshot a momentos em que não aja muitas atualizações, ou em
casos em que não interessa guardar a imagem por um tempo muito grande.
4. Uma dada aplicação que utiliza um servidor UNIX de banco de dados deseja
utilizar uma SAN para, entre outras coisas, melhorar sua performance. O servidor
de banco de dados possui 3 áreas principais que podem ser distinguidas: tabelas,
índices e dados. Sabendo que as áreas não devem competir por recursos e que a
característica das áreas de tabelas e índice é mais de leitura, enquanto a área de
dados sofre um pouco mais de escrita, mas também muita leitura, diga como você
utilizaria os recursos de uma SAN para otimizar sua performance. Dica: estas
diferentes áreas correspondem a filesystems diferentes, que são montados no
servidor. Filesystem é como se fosse um pedaço de disco, ou seja, como um drive
para o Windows.
R: Neste caso, devemos fazer com que as diferentes áreas do servidor de banco de dados
acessem discos diferentes, que podem estar no mesmo storage, caso ele possua áreas
separadas (conhecidas como RAID groups), ou em storages diferentes. O importante é
perceber que o acesso aos dados deve ser feito por controladoras de disco diferentes,
uma vez que as 3 áreas não podem competir por recurso. Para melhorar ainda mais a
performance, podemos tentar adequar as características das áreas a um esquema de
RAID adequado, dentro do possível. No caso, uma boa solução seria, para as áreas de
tabelas e índices, seria um esquema de RAID 5 com 5 discos de dados e 1 de paridade,
enquanto para a área de dados, que sofre um pouco mais de escrita, poderíamos usar um
RAID 5 com 7 discos de dados e 1 (que é mais caro que o esquema 5 + 1) para
paridade, o que paralelizaria mais a escrita em disco, tornando mais rápido.
5. O administrador de um servidor de banco de dados de comércio eletrônico de
uma grande multinacional quer otimizar seu backup. Atualmente, para fazer um
backup íntegro dos seus dados ele precisa parar o banco de dados do servidor, o
que impossibilita as vendas neste período. Ele deseja que o banco de dados não
precise mais parar para o backup e, além disso, em caso de precisar de uma
restauração, ela deve ser feita o mais rápido possível. Supondo que este servidor
está conectado a uma SAN, diga qual o esquema de backup mais conveniente para
este caso e explique por que.
R: Neste caso, devemos utilizar discos BCV para o backup, pois atenderia tanto os
requisitos de backup quanto de restore. O sincronismo deve ser feito momentos antes de
iniciar o backup, para que os dados anteriores sejam preservados o maior tempo
possível, para o caso de precisar de uma recuperação. Logo após o término do
sincronismo, o quebramos e realizamos o backup do disco BCV, e não do servidor, que
continuará trabalhando e modificando sua base de dados. Para manter os dados por
ainda mais tempo no BCV, para o caso de precisar de uma restauração, pode-se usar
mais de um BCV em esquema de rodízio, conforme a disposição financeira.

Mais conteúdo relacionado

Mais procurados

Fluxograma contas a pagar (1)
Fluxograma contas a pagar (1)Fluxograma contas a pagar (1)
Fluxograma contas a pagar (1)sartori73
 
Conceitos bancários
Conceitos bancáriosConceitos bancários
Conceitos bancáriosValéria Lins
 
Lei 01 04 lei das sociedades comerciais
Lei 01 04 lei das sociedades comerciaisLei 01 04 lei das sociedades comerciais
Lei 01 04 lei das sociedades comerciaisJoão Manuel Juvandes
 
Hepatoesplenomegalia
Hepatoesplenomegalia Hepatoesplenomegalia
Hepatoesplenomegalia pauloalambert
 
Pancreatectomia - No Caminho da Enfermagem - Lucas Fontes
Pancreatectomia - No Caminho da Enfermagem - Lucas FontesPancreatectomia - No Caminho da Enfermagem - Lucas Fontes
Pancreatectomia - No Caminho da Enfermagem - Lucas FontesLucas Fontes
 
Formas jurídicas de empresa
Formas jurídicas de empresaFormas jurídicas de empresa
Formas jurídicas de empresaVasco Andorinha
 
Planejamento tributário empresa de turismo
Planejamento tributário   empresa de turismoPlanejamento tributário   empresa de turismo
Planejamento tributário empresa de turismoEduardo Tanaka
 
Anexos do relatorio inicial de simulacao empresarial
Anexos do relatorio inicial de simulacao empresarialAnexos do relatorio inicial de simulacao empresarial
Anexos do relatorio inicial de simulacao empresarialIsmael Miambo
 
52589565 plano-de-negocios-de-grafica-rapida-copiadora-lan-house-11
52589565 plano-de-negocios-de-grafica-rapida-copiadora-lan-house-1152589565 plano-de-negocios-de-grafica-rapida-copiadora-lan-house-11
52589565 plano-de-negocios-de-grafica-rapida-copiadora-lan-house-11Ronne Seles
 
Controle de contas a pagar
Controle de contas a pagarControle de contas a pagar
Controle de contas a pagarValéria Lins
 

Mais procurados (20)

Fluxograma contas a pagar (1)
Fluxograma contas a pagar (1)Fluxograma contas a pagar (1)
Fluxograma contas a pagar (1)
 
RECEITAS CREDITÍCIAS
RECEITAS CREDITÍCIASRECEITAS CREDITÍCIAS
RECEITAS CREDITÍCIAS
 
Aula 1 - Origem e evolução da Auditoria
Aula 1 - Origem e evolução da AuditoriaAula 1 - Origem e evolução da Auditoria
Aula 1 - Origem e evolução da Auditoria
 
Caderno de-exercicios-contab-ii
Caderno de-exercicios-contab-iiCaderno de-exercicios-contab-ii
Caderno de-exercicios-contab-ii
 
Conceitos bancários
Conceitos bancáriosConceitos bancários
Conceitos bancários
 
Lei 01 04 lei das sociedades comerciais
Lei 01 04 lei das sociedades comerciaisLei 01 04 lei das sociedades comerciais
Lei 01 04 lei das sociedades comerciais
 
Gastrite
GastriteGastrite
Gastrite
 
Documentos fiscais
Documentos fiscaisDocumentos fiscais
Documentos fiscais
 
Hepatoesplenomegalia
Hepatoesplenomegalia Hepatoesplenomegalia
Hepatoesplenomegalia
 
Pancreatectomia - No Caminho da Enfermagem - Lucas Fontes
Pancreatectomia - No Caminho da Enfermagem - Lucas FontesPancreatectomia - No Caminho da Enfermagem - Lucas Fontes
Pancreatectomia - No Caminho da Enfermagem - Lucas Fontes
 
Conceitos Bancários
Conceitos BancáriosConceitos Bancários
Conceitos Bancários
 
Formas jurídicas de empresa
Formas jurídicas de empresaFormas jurídicas de empresa
Formas jurídicas de empresa
 
Planejamento tributário empresa de turismo
Planejamento tributário   empresa de turismoPlanejamento tributário   empresa de turismo
Planejamento tributário empresa de turismo
 
Colelitíase
ColelitíaseColelitíase
Colelitíase
 
Anexos do relatorio inicial de simulacao empresarial
Anexos do relatorio inicial de simulacao empresarialAnexos do relatorio inicial de simulacao empresarial
Anexos do relatorio inicial de simulacao empresarial
 
52589565 plano-de-negocios-de-grafica-rapida-copiadora-lan-house-11
52589565 plano-de-negocios-de-grafica-rapida-copiadora-lan-house-1152589565 plano-de-negocios-de-grafica-rapida-copiadora-lan-house-11
52589565 plano-de-negocios-de-grafica-rapida-copiadora-lan-house-11
 
Aula IRPF e IRRF curso epd 28.03.12
Aula IRPF e IRRF curso epd 28.03.12Aula IRPF e IRRF curso epd 28.03.12
Aula IRPF e IRRF curso epd 28.03.12
 
Controle de contas a pagar
Controle de contas a pagarControle de contas a pagar
Controle de contas a pagar
 
Cheque
ChequeCheque
Cheque
 
Apendicite
ApendiciteApendicite
Apendicite
 

Destaque

Guia Salarial 2017 Robert Half Brasil
Guia Salarial 2017 Robert Half BrasilGuia Salarial 2017 Robert Half Brasil
Guia Salarial 2017 Robert Half BrasilFernando Palma
 
Gerenciamento na nuvem e System Center
Gerenciamento na nuvem e System CenterGerenciamento na nuvem e System Center
Gerenciamento na nuvem e System CenterFernando Palma
 
Cidades brasileiras inteligentes com iot
Cidades brasileiras inteligentes com iotCidades brasileiras inteligentes com iot
Cidades brasileiras inteligentes com iotFernando Palma
 
Internet Das Coisas Trabalho Acadêmico
Internet Das Coisas Trabalho AcadêmicoInternet Das Coisas Trabalho Acadêmico
Internet Das Coisas Trabalho AcadêmicoFernando Palma
 
Exemplo de Plano Estratégico de TI - MEC
Exemplo de Plano Estratégico de TI - MECExemplo de Plano Estratégico de TI - MEC
Exemplo de Plano Estratégico de TI - MECFernando Palma
 
Ebook ITIL Na Prática
Ebook ITIL Na PráticaEbook ITIL Na Prática
Ebook ITIL Na PráticaFernando Palma
 
Regulamento jornada PRINCE2
Regulamento jornada PRINCE2Regulamento jornada PRINCE2
Regulamento jornada PRINCE2Fernando Palma
 
Apostila Tutorial CakePHP
Apostila Tutorial CakePHPApostila Tutorial CakePHP
Apostila Tutorial CakePHPFernando Palma
 
Curso LINUX: Material
Curso LINUX: Material Curso LINUX: Material
Curso LINUX: Material Fernando Palma
 
Apostila LINUX Básico
Apostila LINUX BásicoApostila LINUX Básico
Apostila LINUX BásicoFernando Palma
 
Apostila de Banco dados
Apostila de Banco dadosApostila de Banco dados
Apostila de Banco dadosFernando Palma
 
Apostila sobre Big Data
Apostila sobre Big DataApostila sobre Big Data
Apostila sobre Big DataFernando Palma
 
Roadmap to Scrum Master ( CSM )
Roadmap to Scrum Master ( CSM ) Roadmap to Scrum Master ( CSM )
Roadmap to Scrum Master ( CSM ) Jaladhi Bhatt
 
TCC / Monografia em ITIL - 2
TCC / Monografia em ITIL - 2TCC / Monografia em ITIL - 2
TCC / Monografia em ITIL - 2Fernando Palma
 

Destaque (20)

Guia Salarial 2017 Robert Half Brasil
Guia Salarial 2017 Robert Half BrasilGuia Salarial 2017 Robert Half Brasil
Guia Salarial 2017 Robert Half Brasil
 
Tutorial memcached
Tutorial memcachedTutorial memcached
Tutorial memcached
 
Gerenciamento na nuvem e System Center
Gerenciamento na nuvem e System CenterGerenciamento na nuvem e System Center
Gerenciamento na nuvem e System Center
 
Cidades brasileiras inteligentes com iot
Cidades brasileiras inteligentes com iotCidades brasileiras inteligentes com iot
Cidades brasileiras inteligentes com iot
 
Internet Das Coisas Trabalho Acadêmico
Internet Das Coisas Trabalho AcadêmicoInternet Das Coisas Trabalho Acadêmico
Internet Das Coisas Trabalho Acadêmico
 
Exemplo de Plano Estratégico de TI - MEC
Exemplo de Plano Estratégico de TI - MECExemplo de Plano Estratégico de TI - MEC
Exemplo de Plano Estratégico de TI - MEC
 
Ebook ITIL Na Prática
Ebook ITIL Na PráticaEbook ITIL Na Prática
Ebook ITIL Na Prática
 
Regulamento jornada PRINCE2
Regulamento jornada PRINCE2Regulamento jornada PRINCE2
Regulamento jornada PRINCE2
 
Apostila Tutorial CakePHP
Apostila Tutorial CakePHPApostila Tutorial CakePHP
Apostila Tutorial CakePHP
 
Curso LINUX: Material
Curso LINUX: Material Curso LINUX: Material
Curso LINUX: Material
 
Linguagem ABAP
Linguagem ABAPLinguagem ABAP
Linguagem ABAP
 
Apostila LINUX Básico
Apostila LINUX BásicoApostila LINUX Básico
Apostila LINUX Básico
 
Vagas na BSI
Vagas na BSIVagas na BSI
Vagas na BSI
 
Apostila de Banco dados
Apostila de Banco dadosApostila de Banco dados
Apostila de Banco dados
 
Apostila sobre Big Data
Apostila sobre Big DataApostila sobre Big Data
Apostila sobre Big Data
 
Governança em TI
Governança em TIGovernança em TI
Governança em TI
 
Grupo 3 - Governança de TI
Grupo 3 - Governança de TIGrupo 3 - Governança de TI
Grupo 3 - Governança de TI
 
Simulado Scrum master
Simulado Scrum masterSimulado Scrum master
Simulado Scrum master
 
Roadmap to Scrum Master ( CSM )
Roadmap to Scrum Master ( CSM ) Roadmap to Scrum Master ( CSM )
Roadmap to Scrum Master ( CSM )
 
TCC / Monografia em ITIL - 2
TCC / Monografia em ITIL - 2TCC / Monografia em ITIL - 2
TCC / Monografia em ITIL - 2
 

Semelhante a SAN: O que é e principais benefícios

Aula 4 (tecnologias de armazenamento)
Aula 4 (tecnologias de armazenamento)Aula 4 (tecnologias de armazenamento)
Aula 4 (tecnologias de armazenamento)Evandro Júnior
 
Artigo sobre redes san e armazenamento em grande capacidade
Artigo sobre redes san e armazenamento em grande capacidadeArtigo sobre redes san e armazenamento em grande capacidade
Artigo sobre redes san e armazenamento em grande capacidadeAugusto Cezar Pinheiro
 
NoSQL x SQL: Bancos de Dados em Nuvens Computacionais
NoSQL x SQL: Bancos de Dados em Nuvens ComputacionaisNoSQL x SQL: Bancos de Dados em Nuvens Computacionais
NoSQL x SQL: Bancos de Dados em Nuvens ComputacionaisCarlo Pires
 
Introdução a computação 05
Introdução a computação 05Introdução a computação 05
Introdução a computação 05Felipe Pereira
 
fundamentos da informática
fundamentos da informáticafundamentos da informática
fundamentos da informáticaAngelio Nunes
 
Modernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data FabricModernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data FabricDenodo
 
Guia pratico-rede-e-servidores-linux-120904130641-phpapp01-140507215427-phpapp01
Guia pratico-rede-e-servidores-linux-120904130641-phpapp01-140507215427-phpapp01Guia pratico-rede-e-servidores-linux-120904130641-phpapp01-140507215427-phpapp01
Guia pratico-rede-e-servidores-linux-120904130641-phpapp01-140507215427-phpapp01Campannhas Valerio
 
Keynote nuvem estaleiro_ics
Keynote nuvem estaleiro_icsKeynote nuvem estaleiro_ics
Keynote nuvem estaleiro_icsHoracio Ibrahim
 
Alta Disponibilidade
Alta DisponibilidadeAlta Disponibilidade
Alta Disponibilidadeelliando dias
 
Sociedade da Informação e Cloud Forensics
Sociedade da Informação e Cloud ForensicsSociedade da Informação e Cloud Forensics
Sociedade da Informação e Cloud Forensicsederruschel
 
Sociedade da Informação e Cloud Forensics
Sociedade da Informação e Cloud ForensicsSociedade da Informação e Cloud Forensics
Sociedade da Informação e Cloud Forensicsederruschel
 
Sociedade da Informação e Cloud Forensics
Sociedade da Informação e Cloud ForensicsSociedade da Informação e Cloud Forensics
Sociedade da Informação e Cloud Forensicsederruschel
 
Data Mesh: O que é e quais tecnologias facilitam sua implementação?
Data Mesh: O que é e quais tecnologias facilitam sua implementação?Data Mesh: O que é e quais tecnologias facilitam sua implementação?
Data Mesh: O que é e quais tecnologias facilitam sua implementação?Denodo
 
Bancodedadosesgbds 140326151327-phpapp01
Bancodedadosesgbds 140326151327-phpapp01Bancodedadosesgbds 140326151327-phpapp01
Bancodedadosesgbds 140326151327-phpapp01Sugizo Akino
 

Semelhante a SAN: O que é e principais benefícios (20)

Aula 4 (tecnologias de armazenamento)
Aula 4 (tecnologias de armazenamento)Aula 4 (tecnologias de armazenamento)
Aula 4 (tecnologias de armazenamento)
 
Artigo sobre redes san e armazenamento em grande capacidade
Artigo sobre redes san e armazenamento em grande capacidadeArtigo sobre redes san e armazenamento em grande capacidade
Artigo sobre redes san e armazenamento em grande capacidade
 
Virtualização
VirtualizaçãoVirtualização
Virtualização
 
NoSQL x SQL: Bancos de Dados em Nuvens Computacionais
NoSQL x SQL: Bancos de Dados em Nuvens ComputacionaisNoSQL x SQL: Bancos de Dados em Nuvens Computacionais
NoSQL x SQL: Bancos de Dados em Nuvens Computacionais
 
Das nas-san
Das nas-sanDas nas-san
Das nas-san
 
Computação em Nuvem
Computação em NuvemComputação em Nuvem
Computação em Nuvem
 
Redes e Servidores
Redes e ServidoresRedes e Servidores
Redes e Servidores
 
Introdução a computação 05
Introdução a computação 05Introdução a computação 05
Introdução a computação 05
 
fundamentos da informática
fundamentos da informáticafundamentos da informática
fundamentos da informática
 
Modernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data FabricModernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data Fabric
 
Guia pratico-rede-e-servidores-linux-120904130641-phpapp01-140507215427-phpapp01
Guia pratico-rede-e-servidores-linux-120904130641-phpapp01-140507215427-phpapp01Guia pratico-rede-e-servidores-linux-120904130641-phpapp01-140507215427-phpapp01
Guia pratico-rede-e-servidores-linux-120904130641-phpapp01-140507215427-phpapp01
 
Keynote nuvem estaleiro_ics
Keynote nuvem estaleiro_icsKeynote nuvem estaleiro_ics
Keynote nuvem estaleiro_ics
 
Alta Disponibilidade
Alta DisponibilidadeAlta Disponibilidade
Alta Disponibilidade
 
Sociedade da Informação e Cloud Forensics
Sociedade da Informação e Cloud ForensicsSociedade da Informação e Cloud Forensics
Sociedade da Informação e Cloud Forensics
 
Sociedade da Informação e Cloud Forensics
Sociedade da Informação e Cloud ForensicsSociedade da Informação e Cloud Forensics
Sociedade da Informação e Cloud Forensics
 
Sociedade da Informação e Cloud Forensics
Sociedade da Informação e Cloud ForensicsSociedade da Informação e Cloud Forensics
Sociedade da Informação e Cloud Forensics
 
Data Mesh: O que é e quais tecnologias facilitam sua implementação?
Data Mesh: O que é e quais tecnologias facilitam sua implementação?Data Mesh: O que é e quais tecnologias facilitam sua implementação?
Data Mesh: O que é e quais tecnologias facilitam sua implementação?
 
Servidor
ServidorServidor
Servidor
 
2 cabeamento estruturado e ambiente de conexão
2 cabeamento estruturado e ambiente de conexão2 cabeamento estruturado e ambiente de conexão
2 cabeamento estruturado e ambiente de conexão
 
Bancodedadosesgbds 140326151327-phpapp01
Bancodedadosesgbds 140326151327-phpapp01Bancodedadosesgbds 140326151327-phpapp01
Bancodedadosesgbds 140326151327-phpapp01
 

Mais de Fernando Palma

CRM Gerenciamento Do Relacionamento Com Clientes | Prof. Francisco Alves | C...
CRM Gerenciamento Do Relacionamento Com Clientes | Prof. Francisco Alves |  C...CRM Gerenciamento Do Relacionamento Com Clientes | Prof. Francisco Alves |  C...
CRM Gerenciamento Do Relacionamento Com Clientes | Prof. Francisco Alves | C...Fernando Palma
 
Formação em ciência de dados
Formação em ciência de dadosFormação em ciência de dados
Formação em ciência de dadosFernando Palma
 
Apostila de Introdução ao Arduino
Apostila de Introdução ao ArduinoApostila de Introdução ao Arduino
Apostila de Introdução ao ArduinoFernando Palma
 
Apostila Arduino Basico
Apostila Arduino BasicoApostila Arduino Basico
Apostila Arduino BasicoFernando Palma
 
Cartilha Segurança na Internet - CERT.br
Cartilha Segurança na Internet - CERT.brCartilha Segurança na Internet - CERT.br
Cartilha Segurança na Internet - CERT.brFernando Palma
 
Ebook Apache Server: Guia Introdutório
Ebook Apache Server: Guia IntrodutórioEbook Apache Server: Guia Introdutório
Ebook Apache Server: Guia IntrodutórioFernando Palma
 
Apostila Zend Framework
Apostila Zend FrameworkApostila Zend Framework
Apostila Zend FrameworkFernando Palma
 
Ebook Governança de TI na Prática
Ebook Governança de TI na PráticaEbook Governança de TI na Prática
Ebook Governança de TI na PráticaFernando Palma
 
Simulado ITIL Foundation - Questões Comentadas
Simulado ITIL Foundation - Questões ComentadasSimulado ITIL Foundation - Questões Comentadas
Simulado ITIL Foundation - Questões ComentadasFernando Palma
 
Introdução à Aprendizagem de Máquina
Introdução à Aprendizagem de MáquinaIntrodução à Aprendizagem de Máquina
Introdução à Aprendizagem de MáquinaFernando Palma
 
PDTI - Plano Diretor de Tecnologia da Informação (modelo)
PDTI - Plano Diretor de Tecnologia da Informação (modelo)PDTI - Plano Diretor de Tecnologia da Informação (modelo)
PDTI - Plano Diretor de Tecnologia da Informação (modelo)Fernando Palma
 
Carreira em Governança de TI
Carreira em Governança de TICarreira em Governança de TI
Carreira em Governança de TIFernando Palma
 
Cobit 5 Parte 06: Modelo de Capacidade do Cobit 5
Cobit 5 Parte 06: Modelo de Capacidade do Cobit 5Cobit 5 Parte 06: Modelo de Capacidade do Cobit 5
Cobit 5 Parte 06: Modelo de Capacidade do Cobit 5Fernando Palma
 
Conceitos de hardware e software
Conceitos de hardware e softwareConceitos de hardware e software
Conceitos de hardware e softwareFernando Palma
 
Introdução a Informática Básica
Introdução a Informática BásicaIntrodução a Informática Básica
Introdução a Informática BásicaFernando Palma
 
Cobit 5 Parte 05: Guia de Implementação
Cobit 5 Parte 05: Guia de ImplementaçãoCobit 5 Parte 05: Guia de Implementação
Cobit 5 Parte 05: Guia de ImplementaçãoFernando Palma
 

Mais de Fernando Palma (17)

CRM Gerenciamento Do Relacionamento Com Clientes | Prof. Francisco Alves | C...
CRM Gerenciamento Do Relacionamento Com Clientes | Prof. Francisco Alves |  C...CRM Gerenciamento Do Relacionamento Com Clientes | Prof. Francisco Alves |  C...
CRM Gerenciamento Do Relacionamento Com Clientes | Prof. Francisco Alves | C...
 
Formação em ciência de dados
Formação em ciência de dadosFormação em ciência de dados
Formação em ciência de dados
 
Apostila de Introdução ao Arduino
Apostila de Introdução ao ArduinoApostila de Introdução ao Arduino
Apostila de Introdução ao Arduino
 
Apostila Arduino Basico
Apostila Arduino BasicoApostila Arduino Basico
Apostila Arduino Basico
 
Cartilha Segurança na Internet - CERT.br
Cartilha Segurança na Internet - CERT.brCartilha Segurança na Internet - CERT.br
Cartilha Segurança na Internet - CERT.br
 
Ebook Apache Server: Guia Introdutório
Ebook Apache Server: Guia IntrodutórioEbook Apache Server: Guia Introdutório
Ebook Apache Server: Guia Introdutório
 
Apostila Zend Framework
Apostila Zend FrameworkApostila Zend Framework
Apostila Zend Framework
 
Hacker Ético
Hacker ÉticoHacker Ético
Hacker Ético
 
Ebook Governança de TI na Prática
Ebook Governança de TI na PráticaEbook Governança de TI na Prática
Ebook Governança de TI na Prática
 
Simulado ITIL Foundation - Questões Comentadas
Simulado ITIL Foundation - Questões ComentadasSimulado ITIL Foundation - Questões Comentadas
Simulado ITIL Foundation - Questões Comentadas
 
Introdução à Aprendizagem de Máquina
Introdução à Aprendizagem de MáquinaIntrodução à Aprendizagem de Máquina
Introdução à Aprendizagem de Máquina
 
PDTI - Plano Diretor de Tecnologia da Informação (modelo)
PDTI - Plano Diretor de Tecnologia da Informação (modelo)PDTI - Plano Diretor de Tecnologia da Informação (modelo)
PDTI - Plano Diretor de Tecnologia da Informação (modelo)
 
Carreira em Governança de TI
Carreira em Governança de TICarreira em Governança de TI
Carreira em Governança de TI
 
Cobit 5 Parte 06: Modelo de Capacidade do Cobit 5
Cobit 5 Parte 06: Modelo de Capacidade do Cobit 5Cobit 5 Parte 06: Modelo de Capacidade do Cobit 5
Cobit 5 Parte 06: Modelo de Capacidade do Cobit 5
 
Conceitos de hardware e software
Conceitos de hardware e softwareConceitos de hardware e software
Conceitos de hardware e software
 
Introdução a Informática Básica
Introdução a Informática BásicaIntrodução a Informática Básica
Introdução a Informática Básica
 
Cobit 5 Parte 05: Guia de Implementação
Cobit 5 Parte 05: Guia de ImplementaçãoCobit 5 Parte 05: Guia de Implementação
Cobit 5 Parte 05: Guia de Implementação
 

SAN: O que é e principais benefícios

  • 1. Introdução Uma SAN é, de modo simplificado, uma rede dedicada ao armazenamento de dados, que conecta dispositivos armazenadores de discos conhecidos por storages aos servidores da rede. É uma tecnologia relativamente nova e que vem se popularizando bastante no meio corporativo nos últimos anos, trazendo cada vez mais benefícios para as empresas que a adotam. Em linhas gerais, podemos definir SAN como uma infraestrutura que permite que diversos servidores tenham acesso a discos externos de modo rápido e confiável. O conceito de discos externos já é, há algum tempo, uma tendência mundial, e vem sendo cada vez mais adotado. Os discos externos não são limitados em espaço como um disco interno, são mais fáceis de manusear quando necessário e trazem facilidades para o compartilhamento por vários servidores. A figura central de uma SAN, de fato, é o servidor de discos ou, como é popularmente conhecido, o storage. A centralização das operações de armazenamento de dados e seu gerenciamento são as razões principais pela popularização das SANs. Administrar todos os recursos de armazenamento em ambientes críticos e de crescimento elevado não é uma tarefa fácil e pode ser muito dispendioso. Imagine, por exemplo, uma empresa com centenas de servidores que possuem importante demanda por espaço em disco. Acompanhar máquina a máquina e gerenciar seus volumes, com certeza não será um tarefa fácil. Com a centralização oferecida pela SAN, tanto o tempo quanto o custo de gerenciamento destes ambientes é muito reduzido. Além disso, uma SAN provê uma série de outras vantagens para o acesso a áreas de discos, como sua alta escalabilidade e confiabilidade. Uma SAN é implementada utilizando-se componentes de hardware e também importantes softwares, sem os quais a SAN não traria tantos benefícios quanto conhecemos hoje. Como veremos no decorrer deste trabalho o conjunto de hardware e software certo é que vai definir a qualidade da SAN. Abaixo, vemos uma SAN, representada por uma nuvem e diversos de seus equipamentos, ao lado de outras redes. A figura nos dá uma idéia de como as tecnologias não são isoladas, mas se integram.
  • 2. Benefícios Podemos citar como principais benefícios proporcionados por uma arquitetura de SAN:  Alta performance no acesso aos dados: as taxas de transferência nas SAN mais modernas podem chegar a até 2 Gb/s. Além disso, dependendo do arranjo dos discos (RAID), pode haver grande ganho de performance na leitura e/ou escrita, como veremos adiante neste trabalho;  Alta disponibilidade e confiabilidade: uma SAN possui diversas formas de aumentar a disponibilidade dos dados de modo que, mesmo em caso de falha de alguns discos, a produção na seja interrompida. Opções como caminhos redundantes para acesso aos dados e espelhamento de dados em tempo real pode assegurar a disponibilidade dos dados e aplicações.  Escalabilidade: capacidade de adicionar mais capacidade de armazenamento e outros recursos à infraestrutura já existente. Isto é feito facilmente dentro de uma SAN, freqüentemente sem a necessidade de desligar o(s) servidore(s) ou seus clientes de rede;  Centralizar a administração dos recursos: nos ambientes atuais, cada vez mais complexos, isto pode ser a única solução para a administração dos recursos de discos, trazendo grandes economias para as empresas.  Descongestionamento da LAN: em muitos casos a rede local é lenta devido ao grande fluxo de informações que trafega por ela. Com uma SAN, este fluxo é bastante reduzido, o que alivia a rede local, beneficiando os usuários. Isto também é muito importante para o backup corporativo, que também pode ser feito sem utilizar a rede local. Além destes ganhos, há outros que variam um pouco dependendo da solução adotada e dos fornecedores escolhidos, tal como balanceamento de carga e facilidades para backup. Estas facilidades focam em alternativas para aplicações em que não há janela para backup disponível, já que elas exigem disponibilidade integral. Veremos algumas destas mais adiante. Enfim, as características das SAN podem trazer grandes economias, alta disponibilidade dos dados, fácil expansão do storage, poucas paradas da rede, e redução de seu tráfego. História A idéia da SAN nasceu em 1987, quando Patterson, Gibson e Katz, da Universidade da Califórnia, publicaram o artigo A Case for Redundant Arrays of Inexpensive Disks (RAID). As idéias apresentadas e explicadas no artigo sugeriam combinar vários pequenos discos, não muito caros, em uma matriz a fim de obter características que discos isolados não eram capazes de oferecer. Estas novas características tratavam-se, principalmente, de melhorar a performance de leitura e escrita e preservar automaticamente o conteúdo dos discos durante e depois da falha de componentes do disco. Com os discos em RAID, nasceram os servidores de discos, os storages, que são o centro de uma SAN.
  • 3. Um acontecimento que também foi muito importante para o surgimento desta arquitetura foi o desenvolvimento do padrão Fibre Channel (FC), utilizado nas SANs. Fibre Channel é um protocolo de transferência de dados, que faz uso do meio físico de fibra ótica. Acompanhando o processo de popularização das SANs, os diferentes fornecedores começaram a tentar definir seus próprios padrões FC, o que estava atrapalhando o desenvolvimento do padrão. Assim, foram criadas algumas organizações para definir as regras para o novo padrão. Entre elas, destacam-se a FCIA (Fibre Channel Industry Organization) e a SNIA (Storage Networking Industry Association). A FCIA foi criada em agosto de 1999, da fusão da Fibre Channel Association e Fibre Channel Community. É uma organização de benefício mútuo, sem fins lucrativos, formada por fabricantes, integradores de sistemas, desenvolvedores, vendedores, profissionais da indústria e usuários. O objetivo da FCIA é criar bases para a tecnologia de infra-estrutura FC, a fim de que várias aplicações dentro dos complicados mercados de Storage e TI possam ser suportadas. A SNIA foi criada em Dezembro de 1997 e também é uma associação sem fins lucrativos e dedica-se a garantir que as redes de armazenamento de dados tornem-se soluções completas e confiáveis dentro da comunidade de TI. Protocolos SANs podem ser implementadas utilizando interfaces de diferentes tipos. Os protocolos suportados por SAN são os seguintes:  FCP: Fibre Channel Protocol  FCIP: Fibre Channel sobre TCP/IP  IFCP: Internet Fibre Channel Protocol  SCSI: Small Computer System Interface  ISCSI: Internet Small Computer System Interface  ISNS: Internet Storage Name Service  SAS: Serial Attached SCSI Atualmente, Fibre Channel é o padrão utilizado na maioria das SANs. Fibre Channel é uma interface serial que possui uma alta largura de banda e permite que um grande número de dispositivos possam ser anexados a ela de uma vez. Os dispositivos Fibre Channel são conectados, principalmente, a um cabo de fibra ótica, mas pode ser utilizado também em cabos de cobre. As velocidades das SANs atuais vão até 2 Gb/s. A Fibre Channel pode se comunicar com vários protocolos diferentes, incluindo SCSI, e até mesmo IP. Os dispositivos do Fibre Channel são identificados por um número de ID fisicamente gravado denominado World Wide Name, análogo a um endereço de Ethernet MAC.
  • 4. Hardware Talvez a parte mais importante para a implantação de uma SAN seja referente ao hardware. É importante selecionar com cuidado os dispositivos de hardware para uma SAN pois há diferenças muito grandes entre os equipamentos fornecidos por diferentes empresas do ramo. Além disso, devido às SANs serem bastante dependentes de alguns softwares para funcionar corretamente, é muito importante garantir as atualizações de softwares, firmwares e outras questões ligadas a compatibilidade. Os fabricantes de equipamentos para SAN costumam divulgar matrizes de compatibilidade para seus produtos em seus sites. Nelas há uma qunatidade muito grande de informações, contendo diversas combinações de hardware e software, como storage, switch, HBA, servidor e sistema operacional, que foram homologados pelo fabricante. Entre as principais empresas do mercado especializadas em projeto de SAN destacam-se: EMC, Sun Microsystems, IBM, HP, Network Appliance e Brocade. Os principais componentes de hardware são:  Servidor de discos: Servidores de discos, também chamados de storages ou frames, são dispositivos que armazenam discos compartilhados pelos hosts da rede. Eles possuem, em geral, diversas áreas diferentes, com esquemas de RAID diferentes ou discos específicos para a realização de espelhamentos para backup, os chamados BCV (business continuance volumes). Os BCVs facilitam muito tanto o backup quanto a restauração dos dados. O seu conteúdo é sincronizado com o conteúdo do disco principal, até que se faça uma quebra do sincronismo, o chamado split. Neste momento, o BCV guarda uma imagem do disco antes do split, e pode ser usado para backup, enquanto o servidor continua trabalhando, sem impactos na produção. Este procedimento pode ser feito com a freqüência mais conveniente para o usuário e, em muitos casos, o BCV é utilizado também para restauração de dados perdidos, que é muito mais rápido do que acessar fitas de backup. Muitos storages, além de discos, possuem também uma espécie de processador e memórias nvram e/ou flash, onde é armazenado o firmware do equipamento.  Hubs: Assim como hubs de uma rede local, os hubs FC permite que todos os dispositivos conectados a ele se enxerguem e possam trocar informações entre si. Possuem as vantagens de possuir baixo preço e baixa complexidade. Permite ainda que dispositivos possam ser inseridos ou removidos sem interrupção alguma, o que torna o ambiente bastante dinâmico. Entretanto, os hubs dividem a largura de banda por todos os dispositivos conectados a ele, o que pode representar uma perda muito grande de velocidade. Os hubs podem ser cascateados, a fim de fornecer mais portas para aumentar ainda mais a conectividade. Teoricamente, o hub suporta até 127 dispositivos conectados a ele, mas na prática, deve-se restringir o total de dispositivos a 30, no máximo. Para pequenos grupos de trabalho os hubs são mais atrativos, pois fornecem um alto grau de interoperabilidade por um preço menor. Existem hubs fibre channel de 4 a 16 portas e possuem uma largura de banda de, no máximo, 100 MB por segundo, compartilhado entre os servidores conectados às suas portas.
  • 5.  Switches: Switches fibre channel são bem mais complexos que os hubs, tanto em seu projeto quanto em funcionalidade. Enquanto os hubs são apenas um concentrador de cabos para um segmento compartilhado, um switch é um dispositivo de rápido roteamento dos dados e possui uma taxa de transferência de dados exclusiva para cada porta. As taxas de transferência variam bastante dependendo do switch, que vêm evoluindo rapidamente. Atualmente, a velocidade máxima está em 400 MB/s para cada porta. Enquanto os hubs não participam de atividades no nível do protocolo Fibre Channel, os switches participam ativamente, tanto para fornecer serviços quanto para supervisionar o fluxo de frames entre a origem e o destino.  Bridges Fibre Channel-SCSI: As chamadas bridges em uma SAN são equipamentos que realizam a conversão entre dispositivos SCSI e Fibre Channel, interfaces de diferentes padrões elétricos e diferentes protocolos. Isto permite a manutenção dos dispositivos SCSI na SAN, como drives de fita de backup, integrando-o aos novos ambientes de tecnologia Fibre Channel.  HBA (Host Bus Adapter): Uma HBA é um dispositivo capaz de conectar dispositivos externos a um servidor. Por exemplo: para conectarmos um disco SCSI a um micro (barramento interno PCI), será necessário utilizar uma HBA SCSI-PCI. No caso da SAN, é necessário instalar em todos os servidores participantes dela uma HBA Fibre Channel, que se encarregará de fazer as conversões dos diferentes meios internos e externos ao servidor. As HBAs FC possuem, ainda, uma espécie de processador (um chip) capaz de fazer a conversão de protocolos para poupar a CPU do servidor deste trabalho. RAID A maior parte das SANs atuais utiliza sistemas de RAID em seus principais equipamentos de armazenamento de dados. Estes sistemas oferecem proteção dos dados, tolerância a falhas, no caso de um componente ou um caminho de I/O falhar, alta performance, capacidade de armazenamento e escalabilidade. Outras características para garantir a confiabilidade dos sistemas de RAID mais modernos incluem redundância de sistemas de refrigeração, fontes de alimentação, controladoras e até de circuitos de monitoramento. A idéia do RAID é combinar múltiplos discos em uma matriz a fim de obter características que discos isolados não poderiam fornecer, como alto desempenho e tolerância a falhas. Os computadores conectados a um servidor RAID enxergam suas áreas como um disco físico, que, para o servidor RAID é uma unidade lógica de armazenamento (Logical Storage Unit - LUN). Existem várias maneiras de obter as características de tolerância a falhas, redundância dos dados e alta performance, que constituem os chamados níveis de RAID. Existem 6 níveis de RAID, sendo que os principais são:
  • 6.  RAID 0: Os dados são distribuídos através dos discos, método conhecido por data striping, sem gerar paridade ou redundância. A gravação e a leitura dos dados é feita paralelamente, uma vez que cada disco possui a sua controladora. Com isto, há um grande ganho de performance, porém, por não haver redundância alguma, se um dos discos falhar, os dados são perdidos. RAID 0 é utilizado quando máxima performance é mais importante do que possíveis perdas de dados.  RAID 1: Os discos da matriz são divididos em 2 grupos. Na escrita, os dados são gravados igualmente nos 2 grupos. Na leitura, os dados podem ser lidos de qualquer um dos grupos. Normalmente, ela é feita alternando-se os discos, processo conhecido por round robin, mas pode haver um disco preferencial para leitura, no caso de haver um disco mais rápido que outro. Não há geração de paridade, mas sim uma redundância completa dos dados. Este método tem se tornado popular pela sua simplicidade e praticidade em caso de falha de um dos discos. Porém possui as desvantagens de utilizar apenas metade da capacidade total de discos, além de não trazer nenhum aumento de performance.  RAID 5: Este nível de RAID também utiliza o conceito de data striping, mais acrescenta uma forma de obter redundância dos dados, através do gerador de paridade. Para cada escrita, é gerada uma paridade calculada pela operação de ou exclusivo dos bits gravados. A paridade fica espalhada pelos 3 discos, ou seja, a cada gravação ela é gravada em um disco diferente. São necessários, no mínimo, 3 discos para sua implementação, sendo o espaço "desperdiçado" do conjunto devido ao armazenamento da paridade é equivalente ao espaço de um disco. Pode-se, com este esquema, perder até um disco que, a partir dos outros e da paridade, reconstitui-se os dados do disco perdido. Caso mais de um disco falhe ao mesmo tempo, os dados não poderão ser recuperados. É um método muito empregado nos storages atuais, porque alia aumento de performance à segurança oferecida pela redundância com um ótimo aproveitamento de recursos.
  • 7.  RAID 0 + 1 ou RAID 10: A combinação de níveis de RAID é uma prática comum hoje em dia. A mais utilizada é a que combina os níveis 1 e 0, o que alia a alta performance do RAID 0 com a segurança dos dados do RAID 1. Software: Um dos componentes indispensáveis para uma SAN são os softwares envolvidos. Normalmente, as empresas fornecedoras de SAN são também produtoras de softwares que gerenciam seus produtos de hardware. Embora não se tenham muitas pesquisas e estatísticas que meçam o estado deste componente, a parte de software é um campo em expansão, como pode ser visto em diversas empresas que vêm ampliando sua infra- estrutura de dados. Estes softwares possuem diversas funções, entre elas:  Organizar o acesso às diferentes áreas do storage por parte dos servidores: muitos storages hoje em dia possuem diferentes áreas de discos, que possuem controladoras diferentes, além, de outras características diferentes, como, por exemplo, o esquema de RAID. O planejamento do local no storage para alocar discos para os servidores, conforme suas necessidades e características é muito importante, e os softwares atuais provém cada vez mais facilidades para este trabalho.  Prover diversos sistemas de contingência para o caso de falhas: como a maioria dos dados em storage são críticos, há uma preocupação muito grande com um esquema de contingência em caso de falhas. Um dos principais esquemas deste tipo é o chamado failover. O failover é um termo genérico utilizado quando há redundância entre caminhos de acesso e, caso haja falha em um deles, o outro é automaticamente acionado e passa a ser utilizado, o que é controlado pelo software.  Aumentar a performance de acesso aos dados: há algumas ferramentas para aumentar a performance de acesso aos dados em um software de um SAN, dependendo da arquitetura utilizada. Uma muito utilizada é o balanceamento de carga (load balance), que utiliza caminhos redundantes de acesso ao storage, e controla por software a melhor maneira de acessa-lo, o que traz um grande aumento de performance.  Prover facilidades para o backup de servidores: quanto mais crítico um servidor, mais complicado é o seu backup. Algumas aplicações não podem parar jamais e possuem uma janela de backup muito pequena. Além disso, o backup não pode interferir na performance do servidor, principalmente em casos de aplicações com alto índice de acesso. Com ferramentas de software como o snapshot, é possível gravar imagens da área de discos utilizadas pelo servidor, e fazer o backup em outro horário qualquer, sem impactar em nada a produção. Isto é feito, em geral, guardando-se ponteiros para os dados e utilizando-se áreas extras do storage para guardar dados que sejam modificados após o snapshot, quando
  • 8. os ponteiros que apontavam para a área original, passam a apontar para esta área temporária. Normalmente, estes softwares possuem duas interfaces, uma gráfica, ou web, e outra por linha de comando, o que é extremamente útil para a confecção de scripts para automatizar alguns processos. Infelizmente, hoje em dia, os softwares envolvidos em uma SAN estão amarrados aos fabricantes de hardware e não há uma padronização destes produtos. As diferenças entre eles são muito grandes, e o modo de operá-los também, e, assim, as empresas que implantam SAN sempre perdem um grande tempo (e dinheiro) com treinamentos para seus funcionários. Ainda: caso a solução seja migrada, o modo de operação do novo produto, com certeza, será bem diferente do anterior. Assim, na hora de escolher qual fabricante de storage adotar, é importante procurar saber bem como será o seu gerenciamento, quais serão as facilidades que os softwares proverão, suas compatibilidades e quão fácil será a operação de todo o conjunto. Topologias: As SANs atuais são todas construídas em uma topologia física de estrela. Um hub ou switch é conectado ao storage e neles conectamos todos os outros servidores da rede. A excessão fica com a ligação ponto-a-ponto, como veremos a seguir. Assim, analisaremos as topologias existentes: - Ligação ponto-a-ponto (point-to-point): Para alguns não é considerada uma topologia de SAN, uma vez que não possui escalabilidade alguma. Neste tipo de ligação, os servidores são ligados diretamente ao storage, sem nenhum equipamento intermediário, como hub ou switch. O número máximo de servidores envolvidos é igual ao número de portas que o storage possui. Comparado com a ligação SCSI, no entanto, esta topologia, que utiliza Fibre Channel, apresenta uma performance muito melhor e atinge distâncias maiores. - Loops ou anéis: são chamados de Fibre Channel Arbitrated Loop (FC-AL): Nesta topologia utiliza-se hub, cuja largura de banda de no máximo de 100 MB/s é compartilhada por todos os seus membros. Teoricamente suporta loops com até 126 dispositivos, mas na prática este número é bem menor. Esta topologia está sendo muito pouco utilizada nas SANs modernas. Algumas pessoas comparam esta topologia como uma rede Token Ring, em que a largura de banda é dividida por todos os dispositivos do
  • 9. loop. Esta topologia está sendo muito pouco utilizada nas SANs modernas. Entretanto há equipamentos antigos que não suportam o modo fabric e, assim, é utilizado o modo em loop. - Malha (Switched fabric ou apenas fabric): nesta topologia, utiliza-se switches Fibre Channel, o que permite um grande número de dispositivos interconectados. Dedica largura de banda integral a cada uma das portas e permite transferências de dados simultaneamente para um único nó. É a topologia que permite mais escalabilidade e crescimento. Teoricamente, pode conter mais de 7,7 milhões de nós. - Topologia mista: Na literatura, encontramos, ainda, a possibilidade de combinar as duas topologias, o que não é comum de se fazer:
  • 10. Zoneamento Há algumas formas de se implementar uma SAN. Atualmente, como já falamos, a topologia mais utilizada é em malha, e, com isto, a técnica do zoneamento (zonning) tornou-se bastante popular. Esta técnica consiste em definir grupos de dispositivos que se enxergam, o que chamamos de zona. Isto permite alocar o storage adequadamente para cada hosts, pois as necessidades de espaço em disco, e mesmo de redundâncias, são diferentes entre os membros de uma SAN. Entre as diversas formas de se definir uma zona, a mais comum é utilizando-se os WWNs dos hosts. O zoneamento é feito no switch. Atualmente, a maioria dos switches possui algum utilitário gráfico que auxilie a fazer os zoneamentos e outras tarefas próprias de cada um, mas pode-se fazer também se conectando no switch via telnet e utilizando o sistema próprio dele. Storage Área Network versus Network Attached Storage Como este é um trabalho sobre redes de armazenamento de dados, vale à pena comentar também uma outra tecnologia para compartilhamento de dados que ganhou popularidade: a chamada NAS (Network Attached Storage). Trata-se, basicamente, de um servidor de discos capaz de exportar áreas por protocolos como o NFS, CIFS ou até mesmo o HTTP. Para isto, é utilizada a rede local, o que traz a vantagem de permitir que qualquer host da rede tenha acesso a dados comuns, porém possui as desvantagens de congestionar o tráfego da rede, bem como uma velocidade de acesso pequena, se comparada à de uma SAN.
  • 11. Uma outra grande vantagem da arquitetura NAS é que os dados podem ser compartilhados entre diversos hosts, inclusive de sistemas operacionais diferentes, enquanto em uma SAN os dados são dependentes do sistema operacional. Bibliografia Devido à dificuldade de se encontrar livros sobre este assunto no Brasil, a base para este trabalho foi extraída toda da Internet. Segue abaixo, a lista dos principais links utilizados por mim.  http://www.dothill.com/tutorial/index.htm  http://eval.veritas.com/webfiles/docs/san-whitepaper.pdf  http://www.qlogic.com/documents/datasheets/knowledge_data/whitepapers/whit epapers.zoning.pdf  http://www.networkcomputing.com/1109/1109ws1.html  http://www.fibrechannel.org/  http://www.snia.org/  http://www.networkmagazine.com/shared/article/showArticle.jhtml?articleId=17 601008&pgno=2  http://access.globalknowledge.com/tutorials.asp?sort=cat&catID=12&perpage=2 0  http://us- support.external.hp.com/iv/data/documents/DE_SW_UX_swrec_EN_01_E/Fibr eChannel.pdf  http://forums1.itrc.hp.com/service/forums/questionanswer.do?admit=716493758 +1081305504552+28353475&threadId=19156  http://www.sun.com/storage/white-papers/fc_comp.html  http://www.javvin.com/protocolSAN.html  http://www.nas-san.com  http://www.chaparralnet.com/supp/support_documentation/JFS226UG.pdf Além destes sites, foi retirada importantes informações sobre o padrão Fibre Channel do seguinte livro:  Manual de Administração do Sistema UNIX, 3a edição – Evi Nemeth, Garth Snyder, Scott Seebass e Trent R. Hein Questões: 1. Para que serve a bridge em uma SAN? A bridge, em uma SAN, é um equipamento capaz de converter um meio físico para outro. Tem sido muto utilizada para conectar dispositivos SCSI a SAN, que utiliza meios de fibra ótica. É importante não confundir este equipamento com o que conhecemos como bridge em uma LAN, pois suas funções são totalmente diferentes. 2. De que maneira o RAID 5 consegue recuperar a informação perdida em 1 dos discos. Dê exemplos.
  • 12. R: O RAID 5 calcula a paridade fazendo-se uma operação de ou-exclusivo com os bits gravados nos discos. Suponha que um esquema de RAID 5 possua 6 discos (5 para escrita e 1 para paridade). Se os bits gravados forem 1, 0, 0, 1, 1, então a paridade será 1. Cada um destes bits será gravado em um disco diferente. Se perdermos qualquer um dos discos, recuperamos o bit perdido fazendo-se o ou-exclusivo dos outros bits, contando com o de paridade, No exemplo, se perdermos o primeiro disco (bit 1), faríamos para recuperar: 0 xor 0 xor 1 xor 1 xor 1, que dá exatamente 1, o bit perdido. Se perdêssemos o segundo disco (bit 0), faríamos para recuperar: 1 xor 0 xor 1 xor 1 xor 1, que dá 0, novamente correto. Para todos os demais, o pensamento é análogo. 3. Explique porque o snapshot é uma boa ferramenta de software de SAN e como ele funciona. O snapshot é uma ferramenta de software que permite fazer e armazenar por um certo tempo uma fotografia dos dados do servidor no storage. Possui a vantagem de quase não consumir espaço em disco, uma vez que ele guarda um conjunto de ponteiros para os dados, e não os dados propriamente. Esta imagem pode ser vista pelo servidor como uma outra área, que pode ser montada como um drive (Windows) ou um filesystem (Unix) para fins, principalmente, de backup. Em casos de atualização dos dados após o snapshot, o software copia os dados anteriores à atualização para uma área temporária e o ponteiro que apontava para os dados que foram atualizados passam a apontar para os dados preservados nesta nova área, uma vez que a fotografia tirada deve ser mantida a mesma. Isto limita o snapshot a momentos em que não aja muitas atualizações, ou em casos em que não interessa guardar a imagem por um tempo muito grande. 4. Uma dada aplicação que utiliza um servidor UNIX de banco de dados deseja utilizar uma SAN para, entre outras coisas, melhorar sua performance. O servidor de banco de dados possui 3 áreas principais que podem ser distinguidas: tabelas, índices e dados. Sabendo que as áreas não devem competir por recursos e que a característica das áreas de tabelas e índice é mais de leitura, enquanto a área de dados sofre um pouco mais de escrita, mas também muita leitura, diga como você utilizaria os recursos de uma SAN para otimizar sua performance. Dica: estas diferentes áreas correspondem a filesystems diferentes, que são montados no servidor. Filesystem é como se fosse um pedaço de disco, ou seja, como um drive para o Windows. R: Neste caso, devemos fazer com que as diferentes áreas do servidor de banco de dados acessem discos diferentes, que podem estar no mesmo storage, caso ele possua áreas separadas (conhecidas como RAID groups), ou em storages diferentes. O importante é perceber que o acesso aos dados deve ser feito por controladoras de disco diferentes, uma vez que as 3 áreas não podem competir por recurso. Para melhorar ainda mais a performance, podemos tentar adequar as características das áreas a um esquema de RAID adequado, dentro do possível. No caso, uma boa solução seria, para as áreas de tabelas e índices, seria um esquema de RAID 5 com 5 discos de dados e 1 de paridade, enquanto para a área de dados, que sofre um pouco mais de escrita, poderíamos usar um RAID 5 com 7 discos de dados e 1 (que é mais caro que o esquema 5 + 1) para paridade, o que paralelizaria mais a escrita em disco, tornando mais rápido. 5. O administrador de um servidor de banco de dados de comércio eletrônico de uma grande multinacional quer otimizar seu backup. Atualmente, para fazer um
  • 13. backup íntegro dos seus dados ele precisa parar o banco de dados do servidor, o que impossibilita as vendas neste período. Ele deseja que o banco de dados não precise mais parar para o backup e, além disso, em caso de precisar de uma restauração, ela deve ser feita o mais rápido possível. Supondo que este servidor está conectado a uma SAN, diga qual o esquema de backup mais conveniente para este caso e explique por que. R: Neste caso, devemos utilizar discos BCV para o backup, pois atenderia tanto os requisitos de backup quanto de restore. O sincronismo deve ser feito momentos antes de iniciar o backup, para que os dados anteriores sejam preservados o maior tempo possível, para o caso de precisar de uma recuperação. Logo após o término do sincronismo, o quebramos e realizamos o backup do disco BCV, e não do servidor, que continuará trabalhando e modificando sua base de dados. Para manter os dados por ainda mais tempo no BCV, para o caso de precisar de uma restauração, pode-se usar mais de um BCV em esquema de rodízio, conforme a disposição financeira.