Monitoramento contínuo em dia de pico de consumo ajuda a determinar o número ideal de processadores LOGICOS definidos numa partição ZOS mainframe

Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
15/05/2018
Isabel Soutello – migdsbel@gmail.com
Monitoramento contínuo em dia de pico
como auxílio no ajuste fino de
capacidade de LPAR mainframe

Cenário ou contexto
O Planejamento de Capacidade com base em análise de
longo prazo nos dá condições de definir CECs com diversas
partições e estimar o tamanho necessário (processadores e pesos)
de cada uma para atender o processamento na maior parte do
tempo.
Recomenda-se ter num mesmo CEC partições com cargas
diferentes sejam ou não de um mesmo Sysplex e cujos picos de
carga ocorram em períodos diferentes (horas ou dias).
Ambiente Mainframe, CECs com mais de uma LPAR zOS,
cargas diversas em cada LPAR

Por que monitorar o dia de pico?
Geralmente é o dia que o processamento transacional pode
apresentar problema de tempo de resposta devido a taxa de
volume de transações muito alta pontual.
Evitar incidente de capacidade, mesmo sabendo que a
partição está bem dimensionada para a maior parte do tempo.
Custo da monitoração se torna beneficio maior.

Método / ferramenta
Ações necessárias: instalação da parte cliente na estação
(micro com Windows), ativação do processo servidor de rede
GMPSERVE nas partições zOS, além dos processos básicos do
RMF e RMFGAT já utilizados.
Definições no membro do RMF da PARMLIB, geralmente
já utilizadas com a instalação do RMF
Salva dos dados, coletados durante intervalo escolhido,
em arquivo .CSV e posteriormente importados em planilha por ex.
Excel.
Monitoração continua (minuto) com RMF-PM versão
client-server

Somente utilização % de CPU (MVS %) é uma medida fraca
embora seja geralmente a mais usada por equipes de Operação.
Já vimos partição com utilização a 95% sem nenhuma contenção
de processadores em compensação outra com 75% sofrendo
contenção.
Por que?
Depende muito do comportamento da carga da partição.
Quais medidas monitorar?

Medidas adequadas e tipos de carga
Número de CPs necessários vs. CPs disponiveis fica mais preciso.
Costumamos chamar de fila o número de processos que excedem
o de processadores.
Por observação durante a monitoração e cruzamento dos dados
em análise posterior (já que os dados de cada série podem
facilmente ser salvos) notamos que uma LPAR com carga
majoritariamente online esta relação deve ser no máximo 2:1 (ou
fila de 1:1)
LOAD AVERAGE – NÚMERO DE PROCESSOS EM
EXECUÇÃO NOS PROCESSADORES OU
AGUARDANDO PROCESSADOR (READY QUEUE)
# PROCESSORS ONLINE – NÚMERO DE
PROCESSADORES ATIVOS NA PARTIÇÃO

Medidas adequadas e tipos de carga
Já em partições com muita carga batch esta relação pode chegar a
3:1 ou até 4:1 sem grandes prejuízos para tempo de resposta e
para as janelas de execução, desde que “goals” estejam bem
definidos no WLM.
Ação de aumento correto de # CPs online na LPAR minimiza o
“prejuízo” das transações mal atendidas por falta de
processadores. Geralmente o CEC todo não está a 100% e
portanto a partição com maior demanda pode ser beneficiada sem
prejudicar o conjunto.
LOAD AVERAGE – NÚMERO DE PROCESSOS EM
EXECUÇÃO NOS PROCESSADORES OU
AGUARDANDO PROCESSADOR (READY QUEUE)
# PROCESSORS ONLINE – NÚMERO DE
PROCESSADORES ATIVOS NA PARTIÇÃO

Aumento de # CPs online para atender “fila” temporária

Medidas adicionais com “Hyperdispatch”
Classificação de processadores em:
Esta distribuição é feita quando se usa Hyperdispatch (distribuição
vertical em vez de horizontal) e o cálculo é feito em função do peso
e processadores atribuídos a LPAR. Não é preciso conhecer
fórmula, o monitor mostra a cada mudança de # processadores ou
peso.
Os processadores “High” são os “dedicados” a esta partição, os
“Médium” podem atender outra partição mas dão preferencia a
esta e os “Low” são os processadores “excedentes” ou totalmente
compartilhados entre as LPARs do CEC.
# PROCESSORS WITH HIGH SHARE
# PROCESSORS WITH MEDIUM SHARE
# PROCESSORS WITH LOW SHARE

Medidas adicionais com Hyperdispatch
Processadores “Low” ficam estacionados ou inativos na LPAR
Por não serem necessários na maior parte do tempo, ficando
inativos evitam “overhead” de troca de processadores
desnecessária.
Quando demandados por um excesso temporário de carga, podem
diminuir ou até cair a zero, entrando em ação para atender esta
LPAR que está com alta demanda.
Se notamos que os processadores “parked” se tornam zero por
muito tempo ou com muita frequência, é o caso de rever também o
peso da LPAR, de modo a atender a carga com melhor
performance.
Obs. : vale também para processadores zIIP.
# PROCESSORS PARKED – PROCESSADORES QUE
NÃO ESTÃO EM USO NA PARTIÇÃO

Uso dos processadores “parked” indica necessidade aumento de peso

Com pesos alterados, além do aumento de CPs
pesos CP online High Medium Low
LPAR XXXX (carga predominate online) 68 30 24 1 6
LPAR YYYY (carga predominate batch) 32 15 11 2 2
total CPs logicos 45 35 3 8
total CPs fisicos 100 35
Configuração CEC alterada para pico

Conclusões – ganho de performance
É bom monitorar todas as partições de um Sysplex e do CEC.
Se bem ajustadas todas essas medidas nos dão a
possibilidade de obter a melhor performance das partições sendo
monitoradas, pois teremos menos “dança de processadores” de
uma partição para outra que leva a perda de performance pelo não
aproveitamento dos “cache” de processadores, principalmente se
as partições que os compartilham estão em diferentes “drawers”.
O número total de processadores atende o “load average” do
momento e com os processadores parked, somente os
processadores necessários atendem a partição, evitando
“overhead”.

Medidas complementares para análise
Uma relação entre % utilização do MVS e fila (load
average) x número de processadores, pode ser deduzida, pela
repetição mensal da monitoração/análise pois perfil geralmente se
repete em situação de pico de demanda de acordo com
característica da carga, mas ainda assim há situações especificas.
Fazer uma boa definição de “report class” agrupando
processos e/ou transações de mesmo objetivo, ajuda para
identificação imediata dos principais causadores de alta demanda
de consumo no pico .
Medidas que ajudam a entender o ambiente e carga da
partição.

“Transaction ended rate” (by workload e by report class).
Com isso, na monitoração é possível identificar a curva de
transações/segundo das report class e compara-las com do
workload completo. Por ex. entre 10:00 e 10:10 (pico horário do dia
de pico) as transações por segundo da report class RINFO
representam 35% das transações por segundo do WORKLOAD
CICS.
As medidas “% using by report class” e/ou “% delay by report
class” ajudam a descobrir o conjunto de processos que responde
por um maior consumo no período de pico.
Workload e report class

Transações por Report x WKLD

“Processor - % using by job” representa o % de tempo
entre 2 medidas que o processo esteve usando CPU.
Ajuda a verificar se não temos processos que já são
“CPU bound” por natureza executando em “service class” com
prioridade alta.
Se este valor maior que 100, significa processo
extrapolando mais de 1 processador.
Processos

Links e Referências
https://www-03.ibm.com/
systems/z/os/zos/features/rmf/tools/rmftools.html
The IBM RMF PM Java ™ Technology
version 2.4.87 – General Help
Planning Considerations for HiperDispatch Mode Version 2 -
Steve Grabarits Gary King Bernie Pierce
Version Date: May 11, 2011 - Techdocs

Muito Obrigada!
Colaboração:
Fernando Ferreira (IBM)
Alvaro Salla (MAFFEI)

Monitoramento contínuo em dia de pico de consumo ajuda a determinar o número ideal de processadores LOGICOS definidos numa partição ZOS mainframe

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a Monitoramento contínuo em dia de pico de consumo ajuda a determinar o número ideal de processadores LOGICOS definidos numa partição ZOS mainframe

Semelhante a Monitoramento contínuo em dia de pico de consumo ajuda a determinar o número ideal de processadores LOGICOS definidos numa partição ZOS mainframe (20)

Mais de Joao Galdino Mello de Souza

Mais de Joao Galdino Mello de Souza (20)

Monitoramento contínuo em dia de pico de consumo ajuda a determinar o número ideal de processadores LOGICOS definidos numa partição ZOS mainframe

Notas do Editor