O documento compara o desempenho de várias arquiteturas de memória DRAM contemporâneas, incluindo Fast Page Mode, Extended Data Out, Synchronous DRAM, Enhanced SDRAM, Synchronous Link DRAM, Rambus DRAM e Direct Rambus DRAM. Ele descreve a metodologia de simulação usada para testar cada arquitetura e apresenta resultados preliminares sobre o tratamento de refresh e resultados finais sobre tempo de execução total, distribuição do tempo e largura de banda do barramento. A conclusão é que as melhorias na DRAM ajudaram, mas
16. Metodologia: Básico
• SimpleScalar tool
• Duas simulações extras:
•Transmissão pelo barramento instantânea
•Operação da memória instantânea
•Tl = Tu – Tp
•Tb = T – Tu
•To = Tp – (T-Tm)
Tp = time processing, Tl = memory latency stalls, To = overlapped mem. access
Tu = exec. time with instantaneous bandwidth, Tm = total mem. access time
Tb = memory bandwidth stalls, T = total real execution time
17. Metodologia: Arquitetura simulada
•L2 cache com 100ns, 10ns e 1ns de velocidade, escalando a velocidade da
CPU para equilibrar com a memória cache L2(Velocidade da CPU = 10x
Velocidade da L2).
• Simulated architecture:
Processor: eight-way superscalar, out of order
Caches: L1: Lockup-free split (64K/64K), 2-way set
associative with 64-byte linesizes
L2: unified 1MB, 4-way set associative with a 128-byte
linesize and write back, lockup-free, but only allows one
outstanding request at a time
• Isso representava as workstations da época(1999).
18. Metodologia: Balanceando as arquiteturas
•Número de bancos FPM e EDO = 1
•FPM1 = Pessismista
•FPM2 = Otimista
•FPM3 = Interleaved
•EDO1 = Original
•EDO2 = Interleaved
23. Conclusão
1. Efeitos das melhorias na DRAM
2. Onde o tempo é gasto?
• Bandwidth é um problema, porém contornável. A latência DRAM é o maior
problema.
• A caixa de truques está ficando vazia.
• Precisamos encontrar um jeito de melhorar a latência:
• Outra tecnologia?
• Melhor exploração da localidade (Previsão de endereço) ?
• Mais divisões internas?
• Cache interno multilevel?
• Um tipo diferente de matrix de armazenamento?