Backup 101: Planejamento e Ferramentas - Evidosol 2011
1. VIII EVIDOSOL/V CILTEC-online
Encontro Virtual de Documentação em Software Livre e
Congresso Internacional de Linguagem e Tecnologia online.
V. 1, N. 1, junho de 2011.
BACKUP 101: PLANEJAMENTOS E FERRAMENTAS
Jerônimo Medina Madruga (UFPel)
Resumo: Em um mundo onde quase todo serviço conta informações digitais, a garantia da segurança desses
dados muitas vezes é uma das maiores preocupações de usuários e administradores de sistemas. Essa palestra
visa falar sobre os perigos aos quais estão expostos essas informações, e mostrar ferramentas baseadas em
software livre que possam garantir a segurança de dados armazenados.
Abstract: In a world where almost all services uses digital information, the safety of these data is one of the
biggest concerns of users and system administrators. This talk aims to illustrate the dangers to which these
informations are exposed to, and to show open source based tools that can guarantee the safety of saved data.
Introdução
Ao pensarmos no valor de um sistema computacional, grande parte das pessoas irá
considerar os valores relativos a compra da máquina, peças e acessórios. Porém, na maioria dos
casos, o que há de mais importante em um computador são os dados. Informações muitas vezes
produzidas ao longo de anos, frutos de pesquisa, momentos de inspiração, coleta de informações e
outros esforços que nem sempre podem ser reproduzidos. Um processador, uma placa-mãe, um
cooler, tudo isso pode ser reposto simplesmente com um prejuízo financeiro. Mas e seus dados?
Quanto pode valer um trabalho de uma vida inteira? As fotos de sua família? Os arquivos da sua
empresa?
Pensando nisso, resolvi elaborar uma palestra focada na conscientização da importância do
backup, e como realizar o mesmo utilizando ferramentas livres. Backup é a atividade realizada para
garantir a cópia de dados com segurança. Muitos acreditam que a realização do backup seja
simplesmente copiar seus dados para outro equipamento, outra pasta e está resolvido. Porém, na
realidade o backup bem feito é muito mais do que isso. Não é somente um aplicativo ou uma cópia,
mas um conjunto de ações previamente planejadas focando garantir a segurança dos dados, e o que
fazer quando algo que ameace os dados acontecer.
Planejando a segurança de seus dados
http://gkosmos.com/evidosol/
2. VIII EVIDOSOL/V CILTEC-online
Encontro Virtual de Documentação em Software Livre e
Congresso Internacional de Linguagem e Tecnologia online.
V. 1, N. 1, junho de 2011.
O primeiro momento quando se pensa em backup é dedicado a pensar no planejamento.
Temos de considerar os perigos aos quais o sistema está exposto, como falha de equipamento, falha
do próprio sistema, falha do usuário, acesso não autorizado (invasão) e até mesmo desastres naturais
devem ser levados em conta. Um exemplo da importância da consideração dos fatores de risco pode
ser visto após os ataques de 11 de Setembro. Diversas empresas com sede nas torres gêmeas
acabaram perdendo informações que nunca foram recuperadas, e algumas até mesmo acabaram
falindo devido a isso.
Após a analise dos fatores de risco, é importante fazer um levantamento de certas
características do ambiente. Existem questões relativa a quantidade de armazenamento total
necessário, não só no momento atual, mas já planejando o aumento do armazenamento de acordo
com o aumento do sistema, para não implementar uma solução de backup que fique defasada
rapidamente. A velocidade é outro fator que deve ser levado em conta, não somente no momento em
que os dados são copiados, mas também o tempo necessário para recuperá-los caso os mesmos
sejam perdidos, incluído o tempo de transmissão em caso de sistemas que utilizem redes de
computadores. A utilização de compactação também deve ser considerada, porém é importante
destacar que a compactação pode ser uma faca de dois gumes: ela diminui o total de espaço
ocupado pelos dados armazenados, porém pode aumentar o tempo para realizar o backup e aumenta
a fragilidade dos dados (a corrupção de um arquivo compactado é bem mais danosa do que a
corrupção de um arquivo no seu formato original). A analise do custo total da propriedade (TCO) é
crucial também, foi o custo final de uma plataforma de backup não envolve somente o valor de
aquisição da mesma, mas sua manutenção, o treinamento associado ao uso da mesma, o tempo de
implementação, a escalabilidade da solução, entre outros fatores. Por fim, é interessante também
verificar a portabilidade da solução, para garantir que a mesma rode nos mais diversos sistemas
operacionais.
Tipos de backup
Relativo a forma como o backup arquiva os dados, podemos classificar as mais diversas
operações de backup em três tipos.
http://gkosmos.com/evidosol/
2
3. VIII EVIDOSOL/V CILTEC-online
Encontro Virtual de Documentação em Software Livre e
Congresso Internacional de Linguagem e Tecnologia online.
V. 1, N. 1, junho de 2011.
O backup completo é o tipo mais comum, e ele consiste em copiar todos os dados cada vez
que a rotina de backup é realizada. É o tipo de backup que consome maior espaço de
armazenamento e demanda maior tempo para sua realização, porém ele garante alta confiabilidade,
pois cada rotina de backup produzira uma saída completa.
O backup incremental copia somente as modificações realizadas após a última execução da
rotina de backup. Com isso, é o tipo de backup que ocupa menos espaço, porém é o mais frágil, pois
para realizar a recuperação dos dados salvos, é necessário que todos os arquivos estejam intactos.
O backup diferencial mescla as características do completo e do incremental, copiando todas
as modificações realizadas a partir de um tempo base. Com isso, a vulnerabilidade do sistema
diminui em relação ao incremental, ao mesmo tempo em que o consumo de armazenamento é
menor do que o completo.
Tipos de mídia
A escolha da mídia é extremamente importante para um sistema de backup. A relação de
gigabyte de capacidade por dólar é o fator monetário mais preciso, pois o custo total não reflete
diretamente isso. A confiabilidade deve levar em conta informações como o Mean Time Between
Failures (MTBF), que indica o tempo médio entre falhas. Riscos inerentes dos tipos específicos de
mídia tem de ser considerados, como interferência magnética e outros.
Ferramentas livres para backup
Começando a falar sobre ferramentas, temos a escolha do método para transmissão da
informação. O File Transfer Protocol (FTP) aparece como uma das opções mais populares.
Protocolo aberto suportado por diversas ferramentas, tem fácil implementação em diversos
sistemas, porém não garante criptografia dos dados transmitidos, deixando exposto a ataques
sistemas que sejam acessíveis por terceiros. Pensando em segurança, o uso do SSH e SCP é uma
ótima alternativa. O SSH garante a criptografia das informações, e o SCP pode ser utilizado para
copiar os dados criptografados, evitando vulnerabilidades durante a transmissão. Visando otimizar a
tranmissão, uma ferramenta com grande destaque é o rsync. O rsync é um algoritmo que compara
http://gkosmos.com/evidosol/
3
4. VIII EVIDOSOL/V CILTEC-online
Encontro Virtual de Documentação em Software Livre e
Congresso Internacional de Linguagem e Tecnologia online.
V. 1, N. 1, junho de 2011.
pequenos blocos do arquivo de destino com blobos do arquivo original, transmitindo somente os
blocos que tenham sido alterados. Além de diminuir o volume de dados transmitidos e
armazenados, o rsync também suporta transmissão utilizando SSH, o que acaba por garantir a
segurança durante a transferência.
Apesar de não ser uma ferramenta de backup, é importante citar o cron. Cron é a o serviço
de agendamento de tarefas utilizado no Linux e em grande partes dos sistemas operacionais abertos.
Com fácil configuração, ele pode ser utilizado para gerenciar a execução de aplicativos de backup,
ajudando a automatizar o processo.
Também muito associado a estratégias de backup, o RAID (Redundant Array of Inexpensive
Disks) é uma técnica que associa diversos discos comuns para serem vistos como uma única
unidade de armazenamento pelo sistema operacional. Ao utilizar essa técnica, pode se ganhar maior
velocidade com o acesso em paralelo de diversos discos ou redundância, pois também pode ser
configurado para que diversos discos tenham exatamente o mesmo conteúdo. É importante ressaltar
que o RAID garante somente que o sistema se torna tolerante a falhas, mas não é uma ferramenta
de backup, e não deve ser utilizado assim.
O sistema de arquivos também pode ajudar numa estratégia de backup. Sistemas avançados,
como o ZFS e o BTRFS trabalham com a possibilidade de snapshots, que são imagens do conteúdo
em um determinado momento. Também existem ferramentas auxiliares, como o Logical Volume
Management (LVM), que permite a associação de diversos discos físicos em um único disco lógico,
constituindo a técnica de RAID através do sistema operacional no Linux.
Conclusões
O estado das ferramentas de backup baseadas em software livre rivaliza qualquer opção
proprietária. Porém, para garantir sua efetividade, não somente devemos estudar as ferramentas,
mas devemos estudar o ambiente no qual será implementando a solução, visto que uma estratégia de
backup completa é muito mais do que somente aplicativos. Informações complementares sobre as
ferramentas disponíveis estão dispostas na palestra disponibilizada em conjunto com este texto.
http://gkosmos.com/evidosol/
4
5. VIII EVIDOSOL/V CILTEC-online
Encontro Virtual de Documentação em Software Livre e
Congresso Internacional de Linguagem e Tecnologia online.
V. 1, N. 1, junho de 2011.
REFERÊNCIAS
The Tao of Backup: http://www.taobackup.com
Página oficial do Rsync: http://rsync.samba.org
Página oficial do SSH: http://www.openssh.com
Informações sobre o LVM: http://tldp.org/HOWTO/LVM-HOWTO
Página oficial do BRTFS: https://btrfs.wiki.kernel.org
http://gkosmos.com/evidosol/
5