A performance Comparison of contemporary DRAM Architectures

A Performance Comparison of
Contemporary DRAM Architectures

Agenda
• Abstract
• DRAM Convencional
• Arquiteturas
• Metodologia
• Resultados Preliminares
• Resultados
• Conclusão

Abstract
• Motivação
• Objetivo
•Extended Data Out
• Synchronous
• Enhanced Synchronous
• Synchronous Link
• Rambus
• Direct Rambus
Arquiteturas testadas:
• Fast Page Mode

Arquiteturas : Extended Data Out

Arquiteturas : Synchronous DRAM

Arquiteturas : Enhanced SDRAM e
Synchronous Link DRAM
• ESDRAM
• SLDRAM

Arquiteturas: Direct Rambus DRAM
• Núcleo e transmissão mais rápida
• Channel
• Não intercala o barramento

Metodologia: Básico
• SimpleScalar tool
• Duas simulações extras:
•Transmissão pelo barramento instantânea
•Operação da memória instantânea
•Tl = Tu – Tp
•Tb = T – Tu
•To = Tp – (T-Tm)
Tp = time processing, Tl = memory latency stalls, To = overlapped mem. access
Tu = exec. time with instantaneous bandwidth, Tm = total mem. access time
Tb = memory bandwidth stalls, T = total real execution time

Metodologia: Arquitetura simulada
•L2 cache com 100ns, 10ns e 1ns de velocidade, escalando a velocidade da
CPU para equilibrar com a memória cache L2(Velocidade da CPU = 10x
Velocidade da L2).
• Simulated architecture:
Processor: eight-way superscalar, out of order
Caches: L1: Lockup-free split (64K/64K), 2-way set
associative with 64-byte linesizes
L2: unified 1MB, 4-way set associative with a 128-byte
linesize and write back, lockup-free, but only allows one
outstanding request at a time
• Isso representava as workstations da época(1999).

Metodologia: Balanceando as arquiteturas
•Número de bancos FPM e EDO = 1
•FPM1 = Pessismista
•FPM2 = Otimista
•FPM3 = Interleaved
•EDO1 = Original
•EDO2 = Interleaved

Resultados preliminares: Refresh Handling

Resultados: Tempo de execução total

Resultado: Performance breakdown
• FPM é o mais lento
• EDO e FPM
• SDRAM / ESDRAM
• SLDRAM e Rambus X SDRAM e
ESDRAM

Resultado: Canal paralelo DRAM e Bandwidth

Conclusão
1. Efeitos das melhorias na DRAM
2. Onde o tempo é gasto?
• Bandwidth é um problema, porém contornável. A latência DRAM é o maior
problema.
• A caixa de truques está ficando vazia.
• Precisamos encontrar um jeito de melhorar a latência:
• Outra tecnologia?
• Melhor exploração da localidade (Previsão de endereço) ?
• Mais divisões internas?
• Cache interno multilevel?
• Um tipo diferente de matrix de armazenamento?

A performance Comparison of contemporary DRAM Architectures

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (19)

Destaque

Destaque (9)

Semelhante a A performance Comparison of contemporary DRAM Architectures

Semelhante a A performance Comparison of contemporary DRAM Architectures (20)

A performance Comparison of contemporary DRAM Architectures