TechEd 2009: Planejamento e Operação de Ambientes SharePoint Multi-Terabyte
1. Planejamento e Operação de
Ambientes SharePoint Multi-
Terabyte
Aline Maia e Fabricio Catae
Premier Field Engineering
Microsoft
SUP302
2. Enquete sobre a audiência
SharePoint Ops, SQL DBA ou ambos?
Experiência com SharePoint 2007? (1-3 anos, +)
Bancos de dados acima de 200 GB/1 TB?
Problemas de perfomance e gerenciamento?
3. Agenda
Visão Geral SharePoint e SQL
Fatores de Performance
Melhores Práticas
Perguntas e Respostas
Considerações Finais
8. Configuração Padrão vs Recomendado
Revisar as configurações iniciais
1 arquivo DATA / 1 arquivo LOG
Arquivos no mesmo disco
Tamanhos default de arquivos
Autogrow = 10%
Recomendação:
Separar os arquivos de DATA e LOG
Pre-alocar o tamanho dos arquivos
Utilizar mais de um arquivo de DATA (apenas Content e Search)
Configurar “Autogrow” em 100MB-1GB
Definir o tamanho máximo dos bancos
9. Configuração do TempDB
TEMPDB é utilizado por rotinas internas do SQL Server
Algoritmos de Hash/Sort
Tabelas temporárias
Tipos de dados XML/varchar(max)/text
Versionamento de linhas
Recomendações:
Colocar os arquivos do TEMPDB em spindles dedicados
Utilizar múltiplos arquivos de dados (1 por CPU)
Pre-alocar o tamanho dos arquivos de DATA e LOG
Definir um tamanho de AutoGrow entre 100MB e 1GB
10. Fatores de Performance
Diversos fatores podem influenciar na performance do
ambiente:
Sizing / Topologia
Carga / SLAs
Forma de uso (ex. “Publishing”, “Collaboration”)
Hardware (CPU, memória, rede e disco)
Foco no SQL e ambientes multi-terabyte...
18. Cache
Cache de Leitura
Utilizado para leituras sequenciais
Não apresenta ganhos com leitura aleatória
Cache de Escrita
As escritas são efetivadas em cache,
posteriormente copiadas ao disco
Ganho significativo em escrita de log (<1ms)
Possível otimização do RAID-5 (escrita sequencial)
21. Performance de Disco
Fatores que influenciam o desempenho
Enterprise Class Disk (SCSI/FC/SAS)
Discos 10k/15k RPM
Write-Cache habilitado
Redundância RAID-10
Spindles compartilhados/dedicados
22. Workloads SQL Server
Nome do Banco Descrição
Master/Model/Msdb Base de Sistema (SQL)
Config/SSP Configuração MOSS
SearchDB Indexação e Busca no Site
Content Conteúdo
TempDB Rotinas Internas
23. SSP
Falando em Performance: Disk I/O
Search
Config
Content N
Temp
Master
MSDB
Tlogs
AUMENTO DA DEMANDA
Content B
Content A
...
24. Separação de Workload
Exemplo:
Rotinas de backup de conteúdo ocorrendo no mesmo
período que a indexação e a importação de profiles
Recomendação:
Separar os volumes de acordo com o workload
Usar spindles dedicados para garantir máxima performance
25. Exemplo
Nome do Banco Rotinas Acesso a Disco Volume (ex) RAID
Master/Model/Msdb Sistema Pouco acesso G: RAID1/RAID5
Config/SSP Gestão da Farm Pouco acesso G: RAID1/RAID5
SearchDB Index/Crawling
Query
Leitura+Escrita H: RAID1+0
Content Navegação e Conteúdo Leitura M,N,O,P RAID1+0/RAID5
TempDB Rotinas Internas Leitura+Escrita T: RAID1+0
Log – SearchDB Indexação Escrita I: RAID1
Log – TempDB Rotinas Internas Escrita J: RAID1
Log – ContentDB Inserir Conteúdo Escrita K: RAID1
27. Rotinas de Funcionamento e
Manutenção do SharePoint
Performance “Killers”
Indexing / Crawling
Backup (Central Admin, STSADM, SQL)
Profile Import
Timer Jobs
Consulta com múltiplos retornos (ex. listas com + 2000 itens)
28. Melhores Práticas: Content DBs
100 Content DBs por Web Application
100 GBs por Content DB
SLA: Tempo de Backup/ Restore
Lembrar: Dados de uma Site Collection estão sempre no mesmo
Content DB. Portanto, separe os Sites em múltiplos Site
Collections para uma mesma Web Application (trabalhe com
“Managed Paths”).
Estrutura de “My Sites” já baseada em múltiplos Site Collections
(mais simples de balancear entre Content DBs).
Referência: “Plan for Software Boundaries”
http://technet.microsoft.com/en-us/library/cc262787.aspx
29. Melhores Práticas: Objetos em DB
Objetos Sugestões para melhor performance Escopo impactado
Site Collection 50.000 por content database Farm
Site Collection 150.000 por Web application Farm
Sites 250.000 por Site Collection Site Collection
Subsite 2.000 por Site-Pai Site View
Document 5 milhões por biblioteca Library
Item 2.000 por view List View
Tamanho de Arquivos 50 MB (2 GB max) Library, Tempo de upload do
arquivo
Listas 2.000 por Site Site e Site Collection
30. Melhores Práticas: Múltiplos DATA
O uso de múltiplos arquivos Data é suportado apenas para
bancos de dados Content DB e Search
SQL Server partitioning NÃO é suportado para bancos
SharePoint. Use Data Files simples.
Use apenas PRIMARY filegroup
Crie Data Files de tamanhos iguais
Ao usar múltiplos Data Files, utilize uma solução de
backup/restore DIFERENTE de Central Admin/ stsadm.
(SharePoint backup e restore não é “filegroup-aware”)
31. Melhores Práticas: Backup / Restore
Ferramentas “Central Admin” e “STSADM” recomendadas
apenas para bancos com menos de 100 GB. Para Enterprise,
utilizar soluções corporativas (ex. Microsoft Data Protection
Manager)
Vale ressaltar: customizações que envolvam a distribuição de
DLLs, alterações de web.config, criação de features e conteúdos
no diretório “12” NÃO são ‘backupadas’ com o uso das
ferramentas SharePoint!
Leitura obrigatória “Data protection and recovery for Office
SharePoint Server”: http://technet.microsoft.com/en-
us/library/cc262129.aspx
32. Documentação Recomendada
“Physical storage recommendations for Office SharePoint Server” -
http://technet.microsoft.com/en-us/library/cc298801.aspx
“Case Study: Using Microsoft Office SharePoint Server to implement a large-
scale content storage scenario with rapid search availability” -
http://technet.microsoft.com/en-us/library/cc262067.aspx
“White paper: Working with large lists in Office SharePoint Server 2007” -
http://technet.microsoft.com/en-us/library/cc262813.aspx
“Additional performance and capacity planning factors”
http://technet.microsoft.com/en-us/library/cc263061.aspx
“Configure High Availability”
http://technet.microsoft.com/en-us/library/dd207313.aspx
33. Estudo de Caso: MSW (Intranet MS)
Veja também:
http://download.microsoft.com/downl
oad/1/f/7/1f79634e-f46d-43f1-b06d-
9688a5855d32/CreatingEffectiveEnte
rprisePortalsTWP.doc
“How Microsoft IT Increases
Availability and Decreases
Rendering Time of
SharePoint Sites” – Technical
Whitepaper
http://download.microsoft.com/do
wnload/0/E/B/0EBA7263-A555-
4279-B9DD-
1720F0139A2E/SharePointOpti
mizationTWP.doc
34. Considerações Finais
O planejamento da distribuição das Site Collections em
múltiplos Content DBs é importante fator de performance e
manutenibilidade do ambiente.
Tenha um ambiente Multi-Terabyte (com múltiplos databases)
ao invés de bancos Multi-Terabyte.
Esteja atento para as configurações padrão de criação dos
bancos de dados. Separe os arquivos de DATA e LOG, pre-
aloque o tamanho dos arquivos, configurando “Autogrow” para
valor entre 100MB e 1GB.
35.
36. Recursos
www.microsoft.com/teched
Tech·Talks Tech·Ed Bloggers
Live Simulcasts Virtual Labs
http://www.technetbrasil.com.br
Avaliação de produtos finais e betas,
conteúdo técnico em português e
MUITO MAIS!
http://www.msdnbrasil.com.br
Developer’s Kit, conteúdo técnico
em português,
e MUITO MAIS!
37. Sessões Relacionadas
DBP401 - Tudo sobre Alta Disponibilidade no SQL Server (26/08, 13:15 - 14:30)
Apresentado por Andre Hass
OFC304 - Implementado Governança com Microsoft Office SharePoint Server 2007
(26/08 15:00 - 16:15) – Apresentado por Roberval Ranches
OFD304 - Sites Internet com SharePoint e Silverlight (26/08 16:45 - 18:00) – Por Thiago
Soares
OFC305 - Planejamento de testes e capacidades para Microsoft Office SharePoint Server
2007 (27/08 08:45 - 10:00) – Por Rodolfo Roim e Fabio Camara
41. SQL Server 2008 e SharePoint (inglês)
“Hardware and software requirements”
http://msdn.microsoft.com/en-us/library/ms143506.aspx
“To support SQL 2008, Windows SharePoint Services 3.0 Service
Pack 1 must be installed”
http://www.microsoft.com/downloads/details.aspx?FamilyI
D=875da47e-89d5-4621-a319-
a1f5bfedf497&DisplayLang=en
“Matrix of features available within each edition of SQL Server
2008”
http://msdn.microsoft.com/en-us/library/cc645993.aspx
42. SQL Server 2008 e SharePoint (inglês)
“Manageability Enhancements”
Policy-based administration
Back-up compression
http://technet.microsoft.com/en-us/library/cc645579.aspx
“High Availability Enhancements”
Data mirroring enhancements
http://technet.microsoft.com/en-us/library/cc645581.aspx
Notas do Editor
Aline pergunta 2 primeiros bullets e retoma no último bullet.
4/22/2016 3:10 PM
Aline: Apresentação das bases criadas no SQL (continuação)
Aline – As bases são criadas, por padrão, durante a execução dos wizards de configuração. O banco de dados de conteúdo associado a uma Web Application é criado com as configurações padrão.
4/22/2016 3:10 PM
Fabrício:
As configurações “default” não são apropriadas para uma instalação grande de Sharepoint. Recomendamos fazer todas alterações no início ao invés de “on the fly”.
O objetivo da palestra é detalhar as configurações recomendadas em um servidor SQL.
Fabricio
Aline
Fabricio
Fabricio:
Os dados são armazenados em uma estrutura magnética em formato de disco, denominada de Plate.
De que forma os dados são localizados?
Imaginem vários círculos concêntricos no plate – cada círculo corresponde a um track. Essa é uma das coordenadas para encontrar a informação. Cada track é dividido em pedaços menores, com 512 bytes, que correspondem aos setores.
Fabricio
Discos 15k RPM sao os mais rapidos
Existem diferentes classes de disco: Desktop e Enterprise