SlideShare uma empresa Scribd logo
1 de 15
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
17 de Maio de 2.017
LUIZ CARLOS ORSONI
Cache Associativity:
Qual a Importância deste Conceito?
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
Abstract + Agenda
Na z13, o Cache L1I é 6-way Set Associative, os Caches L1D, L2I
e L2D são 8-way Set Associative, já o L3 é 16-way Set Associative.
O cache L4 é 30-way Set Associative mais um diretório NIC que é
14-way Set Associative, totalizando 44-way Set Associative.
O nível de Associatividade tem sido sempre crescente:
Qual o significado disso, suas vantagens e desvantagens?
#1 = Fundamentos:
Fatos, Conceitos e Consequências
#2 = Diagramas Conceituais: DM = Direct Mapped,
FA = Fully Associative e SA = Set Associative
#3 = Comparações: zEC12 x z13
#4 = Funcionamento na z13:
L1I, L1D + L2I + L2D, L3, L4 + NIC
#5 = Comentários
#6 = Conclusões
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
#1 = Fundamentos
Consequências:
MISSes são demorados para serem ‘resolvidos’ [MF=List e Execute]
MISSes provocam ‘replacement’, segundo uma Política (LRU, . . .)
Lines podem ser Shared para Leitura, ou Exclusive para Alteração
Alterações implicam em invalidações em outros Caches . . . (Coerência)
Conceitos: Relacionados a RNI=Relative Nest Intensity
HIT Foi encontrado no Cache o que o Processador necessita
MISS Não encontrado, tem que vir de outros níveis de Cache
Não encontrando nos Caches, tem que vir da Memória
[Há vários tipos de MISS, que não serão detalhados...]
Caches de nível mais alto podem ser divididos em I=Instrução e D=Dados
Teoricamente, Instruções não são modificadas, alguns Dados sim!
Fatos:
O Ciclo dos circuitos do Processador é muito menor que o da Memória
Os Ciclos dos circuitos de Caches são menores do que o da Memória
É possível e desejável que hajam Caches em vários Níveis
Processadores necessitam de Caches para não ter que esperar
L1
L2
L3
L4
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
#2 = Diagramas Conceituais: DM
000.... 01010110011110001001 0010 10111100
!
Compare Bits Select Bits Line Offset
Toda a Memória e
todos os Caches
são tratados em
‘fatias’ de 256 bytes,
chamadas Lines,
as unidades de
transporte entre eles.
Os últimos 8 bits
dos Endereços
determinam qual o
Byte dentro da Line.
?
Diretório+Lines
HIT
MISS
Bits:
Invalid
“Dirty”
PKeys
LRU
. . .
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
#2 = Diagramas Conceituais: FA
?
0000000.... 010101100111100010010010 10111100
? ?? ? ? ? ?
Compare Bits Line Offset
!
Os circuitos de
Comparação operam
em paralelo e
terminam no
mesmo Ciclo.
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
#2 = Diagramas Conceituais: SA
000.... 01010110011110001001 0010 10111100
? !? ? ? ? ??
Compare Bits Select Bits Line Offset
Nível de Associatividade = 8: # Mágico!
?
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
#3 = Comparações: zEC12 x z13
6
IBM J. RES. & DEV. VOL. 59 # 4/5
Paper 3 JULY/SEPTEMBER 2.015
IBM z13 Technical Guide
SG24-8251-00 January 2015
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
Inclusive x Non Inclusive
IBM J. RES. & DEV. VOL. 59 # 4/5
Paper 1 JULY/SEPTEMBER 2.015
IBM z13 Technical Guide
SG24-8251-00 January 2015
L3
L1D
L2D
L1I
L2I
L1D
L2D
L1I
L2I
L1D
L2D
L1I
L2I
L1D
L2D
L1I
L2I
L1D
L2D
L1I
L2I
L1D
L2D
L1I
L2I
L1D
L2D
L1I
L2I
L1D
L2D
L1I
L2I
Store Through
Store In
L3L3 X
Bus
X
Bus
L4 Até 1.536L4
L3 L3L3
S Bus
X
Bus
X
Bus
Memórias DIMM
até 2,5TB por Drawer
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
#4 = Funcionamento na z13: L1I = 6 way
000.... 01010110011110001001 0010 10111100
Compare Bits Select Bits Line Offset
?
As Lines de Instrução não podem ser alteradas!
Podem haver Lines de Page, Segment e Region Tables
Podem haver Lines de Dicionários da CMPSC
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
#4= Funcionamento na z13: L1D, L2I, L2D = 8 way
000.... 01010110011110001001 0010 10111100
Compare Bits Select Bits Line Offset
?
L2I: Todas as Lines deste Cache não podem ser alteradas!
L1D+L2D: Todas Lines de Dados: podem ser alteradas.
[os Caches de Dados possuem um Store Buffer]
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
#4 = Funcionamento na z13: L3 = 16 way
000.... 01010110011110001001 0010 10111100
Compare Bits Select Bits Line Offset
?
Algumas Lines de Instrução, outras de Dados
estes Caches também são chamados Unificados
L3s são 16way porque atendem até 16 L2s!
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
#4 = Funcionamento na z13: L4 = 30+14 = 44 way
000.... 01010110011110001001 0010 10111100
Compare Bits Select Bits Line Offset
NIC
L3L3L3
Diretórios NIC apontam
para Lines dos L3 do Node
?
Diretório+Lines
Algumas Lines de Instrução,
outras de Dados e muitas de Canais!
L4s atendem 3 L3s mais Canais!
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
#5 = Comentários
#1 = Statement FREQUENCY do FORTRAN em 15/10/1.956!
#2 = Separar o que é mais usado do opcional eventual
#3 = Não misturar Instruções com Dados
#4 = Agrupar os Dados que podem sofrer Alteração
#5 = CPUMF + HIS podem indicar ‘como andam’ . . .
#6 = Ficar “de olho” nas Opções de Compiladores!
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
#6 = Conclusões
#1 = Foram implementados nas decisões de Design
#2 = Evoluem, à medida que a Tecnologia permite
#3 = É bom saber como funcionam
#4 = Site LSPR: RNI determina a Performance!
#5 = Algumas ações podem melhorar a Performance
#6 = Acompanham a “Tecnologia de Ponta”!
Qual a Importância deste Conceito?
Proibida cópia ou divulgação sem
permissão escrita do CMG Brasil.
Cache Associativity:
Manuais e RedBooks: © IBM
Cursos MFTSxx: © MAFFEI
Perguntas ? ? ?
Obrigado !
orsoni@maffei.com.br
Boas Otimizações!

Mais conteúdo relacionado

Semelhante a Cache Associativity Importância

Semelhante a Cache Associativity Importância (20)

8085 2
8085 28085 2
8085 2
 
Quantas Instruções por Ciclo?
Quantas Instruções por Ciclo?Quantas Instruções por Ciclo?
Quantas Instruções por Ciclo?
 
Tradutor de Pig Latin
Tradutor de Pig LatinTradutor de Pig Latin
Tradutor de Pig Latin
 
Z13 x zEC12: O que esperar? - por Luiz Carlos Orsoni
Z13 x zEC12: O que esperar? - por Luiz Carlos OrsoniZ13 x zEC12: O que esperar? - por Luiz Carlos Orsoni
Z13 x zEC12: O que esperar? - por Luiz Carlos Orsoni
 
Tendências Tecnológicas em processadores, por Luiz Carlos Orsoni
Tendências Tecnológicas em processadores, por Luiz Carlos OrsoniTendências Tecnológicas em processadores, por Luiz Carlos Orsoni
Tendências Tecnológicas em processadores, por Luiz Carlos Orsoni
 
Programação básica de microcontroladores
Programação básica de microcontroladoresProgramação básica de microcontroladores
Programação básica de microcontroladores
 
Quantas Instruções por Ciclo?
Quantas Instruções por Ciclo?Quantas Instruções por Ciclo?
Quantas Instruções por Ciclo?
 
Principios da microprogramacao
Principios da microprogramacaoPrincipios da microprogramacao
Principios da microprogramacao
 
Microprogramacao
MicroprogramacaoMicroprogramacao
Microprogramacao
 
Microprogramacao
MicroprogramacaoMicroprogramacao
Microprogramacao
 
Roteiro IOC 03_2
Roteiro IOC 03_2Roteiro IOC 03_2
Roteiro IOC 03_2
 
Arquitetura de Computadores: Sistemas de numeração
Arquitetura de Computadores: Sistemas de numeraçãoArquitetura de Computadores: Sistemas de numeração
Arquitetura de Computadores: Sistemas de numeração
 
Utilizando um Display de LCD
Utilizando um Display de LCDUtilizando um Display de LCD
Utilizando um Display de LCD
 
Arq orgcom (1)
Arq orgcom (1)Arq orgcom (1)
Arq orgcom (1)
 
ArqOrgCom.ppt
ArqOrgCom.pptArqOrgCom.ppt
ArqOrgCom.ppt
 
-Aula 4 - Programacao do 8085.ppt
-Aula 4 - Programacao do 8085.ppt-Aula 4 - Programacao do 8085.ppt
-Aula 4 - Programacao do 8085.ppt
 
Pic18xx
Pic18xxPic18xx
Pic18xx
 
Lista2009 2
Lista2009 2Lista2009 2
Lista2009 2
 
Redes - IPv6 Pratica
Redes - IPv6 PraticaRedes - IPv6 Pratica
Redes - IPv6 Pratica
 
Codificando e-magazine11
Codificando e-magazine11Codificando e-magazine11
Codificando e-magazine11
 

Mais de Joao Galdino Mello de Souza

Enterprise computing for modern business workloads por Lívio Sousa (IBM)
Enterprise computing for modern business workloads por Lívio Sousa (IBM)Enterprise computing for modern business workloads por Lívio Sousa (IBM)
Enterprise computing for modern business workloads por Lívio Sousa (IBM)Joao Galdino Mello de Souza
 
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)Joao Galdino Mello de Souza
 
Scaling Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
Scaling  Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...Scaling  Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
Scaling Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...Joao Galdino Mello de Souza
 
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)Joao Galdino Mello de Souza
 
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...Joao Galdino Mello de Souza
 
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)Joao Galdino Mello de Souza
 
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)Joao Galdino Mello de Souza
 
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...Joao Galdino Mello de Souza
 
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)Joao Galdino Mello de Souza
 
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)Joao Galdino Mello de Souza
 
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)Joao Galdino Mello de Souza
 
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)Joao Galdino Mello de Souza
 
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...Joao Galdino Mello de Souza
 
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)Joao Galdino Mello de Souza
 
Pervasive Encryption por Eugênio Fernandes (IBM)
Pervasive Encryption por Eugênio Fernandes (IBM)Pervasive Encryption por Eugênio Fernandes (IBM)
Pervasive Encryption por Eugênio Fernandes (IBM)Joao Galdino Mello de Souza
 
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)Joao Galdino Mello de Souza
 
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...Joao Galdino Mello de Souza
 
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)Joao Galdino Mello de Souza
 
Lei geral de proteção de dados por Kleber Silva e Ricardo Navarro (Pise4)
Lei geral de proteção de dados por Kleber Silva  e Ricardo Navarro (Pise4)Lei geral de proteção de dados por Kleber Silva  e Ricardo Navarro (Pise4)
Lei geral de proteção de dados por Kleber Silva e Ricardo Navarro (Pise4)Joao Galdino Mello de Souza
 

Mais de Joao Galdino Mello de Souza (20)

Explorando a API Rest Jira Cloud
Explorando a API Rest Jira CloudExplorando a API Rest Jira Cloud
Explorando a API Rest Jira Cloud
 
Enterprise computing for modern business workloads por Lívio Sousa (IBM)
Enterprise computing for modern business workloads por Lívio Sousa (IBM)Enterprise computing for modern business workloads por Lívio Sousa (IBM)
Enterprise computing for modern business workloads por Lívio Sousa (IBM)
 
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
 
Scaling Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
Scaling  Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...Scaling  Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
Scaling Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
 
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
 
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
 
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
 
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
 
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
 
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
 
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
 
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
 
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
 
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
 
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
 
Pervasive Encryption por Eugênio Fernandes (IBM)
Pervasive Encryption por Eugênio Fernandes (IBM)Pervasive Encryption por Eugênio Fernandes (IBM)
Pervasive Encryption por Eugênio Fernandes (IBM)
 
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
 
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
 
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
 
Lei geral de proteção de dados por Kleber Silva e Ricardo Navarro (Pise4)
Lei geral de proteção de dados por Kleber Silva  e Ricardo Navarro (Pise4)Lei geral de proteção de dados por Kleber Silva  e Ricardo Navarro (Pise4)
Lei geral de proteção de dados por Kleber Silva e Ricardo Navarro (Pise4)
 

Cache Associativity Importância

  • 1. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. 17 de Maio de 2.017 LUIZ CARLOS ORSONI Cache Associativity: Qual a Importância deste Conceito?
  • 2. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Abstract + Agenda Na z13, o Cache L1I é 6-way Set Associative, os Caches L1D, L2I e L2D são 8-way Set Associative, já o L3 é 16-way Set Associative. O cache L4 é 30-way Set Associative mais um diretório NIC que é 14-way Set Associative, totalizando 44-way Set Associative. O nível de Associatividade tem sido sempre crescente: Qual o significado disso, suas vantagens e desvantagens? #1 = Fundamentos: Fatos, Conceitos e Consequências #2 = Diagramas Conceituais: DM = Direct Mapped, FA = Fully Associative e SA = Set Associative #3 = Comparações: zEC12 x z13 #4 = Funcionamento na z13: L1I, L1D + L2I + L2D, L3, L4 + NIC #5 = Comentários #6 = Conclusões
  • 3. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. #1 = Fundamentos Consequências: MISSes são demorados para serem ‘resolvidos’ [MF=List e Execute] MISSes provocam ‘replacement’, segundo uma Política (LRU, . . .) Lines podem ser Shared para Leitura, ou Exclusive para Alteração Alterações implicam em invalidações em outros Caches . . . (Coerência) Conceitos: Relacionados a RNI=Relative Nest Intensity HIT Foi encontrado no Cache o que o Processador necessita MISS Não encontrado, tem que vir de outros níveis de Cache Não encontrando nos Caches, tem que vir da Memória [Há vários tipos de MISS, que não serão detalhados...] Caches de nível mais alto podem ser divididos em I=Instrução e D=Dados Teoricamente, Instruções não são modificadas, alguns Dados sim! Fatos: O Ciclo dos circuitos do Processador é muito menor que o da Memória Os Ciclos dos circuitos de Caches são menores do que o da Memória É possível e desejável que hajam Caches em vários Níveis Processadores necessitam de Caches para não ter que esperar L1 L2 L3 L4
  • 4. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. #2 = Diagramas Conceituais: DM 000.... 01010110011110001001 0010 10111100 ! Compare Bits Select Bits Line Offset Toda a Memória e todos os Caches são tratados em ‘fatias’ de 256 bytes, chamadas Lines, as unidades de transporte entre eles. Os últimos 8 bits dos Endereços determinam qual o Byte dentro da Line. ? Diretório+Lines HIT MISS Bits: Invalid “Dirty” PKeys LRU . . .
  • 5. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. #2 = Diagramas Conceituais: FA ? 0000000.... 010101100111100010010010 10111100 ? ?? ? ? ? ? Compare Bits Line Offset ! Os circuitos de Comparação operam em paralelo e terminam no mesmo Ciclo.
  • 6. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. #2 = Diagramas Conceituais: SA 000.... 01010110011110001001 0010 10111100 ? !? ? ? ? ?? Compare Bits Select Bits Line Offset Nível de Associatividade = 8: # Mágico! ?
  • 7. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. #3 = Comparações: zEC12 x z13 6 IBM J. RES. & DEV. VOL. 59 # 4/5 Paper 3 JULY/SEPTEMBER 2.015 IBM z13 Technical Guide SG24-8251-00 January 2015
  • 8. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Inclusive x Non Inclusive IBM J. RES. & DEV. VOL. 59 # 4/5 Paper 1 JULY/SEPTEMBER 2.015 IBM z13 Technical Guide SG24-8251-00 January 2015 L3 L1D L2D L1I L2I L1D L2D L1I L2I L1D L2D L1I L2I L1D L2D L1I L2I L1D L2D L1I L2I L1D L2D L1I L2I L1D L2D L1I L2I L1D L2D L1I L2I Store Through Store In L3L3 X Bus X Bus L4 Até 1.536L4 L3 L3L3 S Bus X Bus X Bus Memórias DIMM até 2,5TB por Drawer
  • 9. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. #4 = Funcionamento na z13: L1I = 6 way 000.... 01010110011110001001 0010 10111100 Compare Bits Select Bits Line Offset ? As Lines de Instrução não podem ser alteradas! Podem haver Lines de Page, Segment e Region Tables Podem haver Lines de Dicionários da CMPSC
  • 10. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. #4= Funcionamento na z13: L1D, L2I, L2D = 8 way 000.... 01010110011110001001 0010 10111100 Compare Bits Select Bits Line Offset ? L2I: Todas as Lines deste Cache não podem ser alteradas! L1D+L2D: Todas Lines de Dados: podem ser alteradas. [os Caches de Dados possuem um Store Buffer]
  • 11. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. #4 = Funcionamento na z13: L3 = 16 way 000.... 01010110011110001001 0010 10111100 Compare Bits Select Bits Line Offset ? Algumas Lines de Instrução, outras de Dados estes Caches também são chamados Unificados L3s são 16way porque atendem até 16 L2s!
  • 12. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. #4 = Funcionamento na z13: L4 = 30+14 = 44 way 000.... 01010110011110001001 0010 10111100 Compare Bits Select Bits Line Offset NIC L3L3L3 Diretórios NIC apontam para Lines dos L3 do Node ? Diretório+Lines Algumas Lines de Instrução, outras de Dados e muitas de Canais! L4s atendem 3 L3s mais Canais!
  • 13. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. #5 = Comentários #1 = Statement FREQUENCY do FORTRAN em 15/10/1.956! #2 = Separar o que é mais usado do opcional eventual #3 = Não misturar Instruções com Dados #4 = Agrupar os Dados que podem sofrer Alteração #5 = CPUMF + HIS podem indicar ‘como andam’ . . . #6 = Ficar “de olho” nas Opções de Compiladores!
  • 14. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. #6 = Conclusões #1 = Foram implementados nas decisões de Design #2 = Evoluem, à medida que a Tecnologia permite #3 = É bom saber como funcionam #4 = Site LSPR: RNI determina a Performance! #5 = Algumas ações podem melhorar a Performance #6 = Acompanham a “Tecnologia de Ponta”! Qual a Importância deste Conceito?
  • 15. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Cache Associativity: Manuais e RedBooks: © IBM Cursos MFTSxx: © MAFFEI Perguntas ? ? ? Obrigado ! orsoni@maffei.com.br Boas Otimizações!