EACH
Evolução das CPUs:
 Dual e Quad Core

     Cesar Sposito
     Mário J. Filho
    Rodrigo Ferrassa




      ... os computadores sequenciais estão se
      aproximando do limite físico fundamental em
      sua energia potencial computacional. Tal
      limite é a velocidade da luz...
                             Angel L. DeCegama
EACH
     Introdução – Limite: Pentium IV

    Desafio: Aumento frequência de clock.

    Corrida por clock (Intel X AMD).

    Athlon Thunderbird X Pentium III.

    Intel: Movimento arriscado.

    Investimento em um processador com um
    longo pipeline.

    Pentium IV.
EACH
         Pentium IV: longo pipeline

    Pipeline é uma técnica de hardware que
    permite que a CPU realize a busca de uma
    ou mais instruções além da próxima a ser
    executada.

    Pentium III: 10 estágios.

    Pentium IV: 20 estágios a 31 estágios.

    Dobrar o número de estágios no
    processador é como dobrar o número de
    funcionários de uma empresa.
EACH
     Longo pipeline: Consequencias

    Com mais estágios, o processador seria
    capaz de atingir freqüências mais altas.

    Adicionar    mais   estágios   tornou  o
    processador menos eficiente, pois as
    instruções precisavam do dobro do número
    de ciclos do processador para serem
    processadas.

    Possuir o dobro de estágios significa
    também possuir aproximadamente o dobro
    de transistores e consumir o dobro da
    eletricidade.
EACH
    Mais consumo – Maior aquecimento

    Maior consumo gera maiores desperdícios.

    Maior desperdicio gera maiores
    aquecimentos.

    A dissipação térmica (W/cm^2) de um
    Pentium 4, é próximo do núcleo de um
    reator nuclear.

    Se    a    produção     de     processadores
    continuasse da mesma forma, num futuro
    não    muito    distante,     teríamos    um
    processador    com     dissipação     térmica
    próxima a da superfície solar.
EACH
Aquecimento




Fonte: http://blogs.intel.com
EACH
          A barreira dos 3.4 GHZ

    Desde 1983 até 2002, as taxas de
    frequência de clock aumentaram de 5 MHz
    para 3 GHz.

    Aumento do clock 600 X em 19 anos.

    Na época, a Intel previa alcançar 5.2 GHz no
    final de 2004 e planos para 10 GHz no final
    de 2005.

    Porém, nada disso aconteceu. Os 3.4 GHz
    se tornaram uma barreira difícil de transpor.

    Fim da Lei de Moore?
EACH
         Hyper Treading: Inicio do
          processamento paralelo

    Hyper Treading: simula em um único
    processador físico dois processadores
    lógicos.

    Pode melhorar desempenho de até 30%

    Utiliza as partes ociosas dos recursos para
    simular dois núcleos.
EACH
                   Evolução

    Elevando, por exemplo, em 20% a
    freqüência do processador, aumentamos
    apenas em 13% o seu desempenho e como
    efeito colateral, também passa a consumir
    73% mais energia.

    Recíproca verdadeira.
EACH
                 Estratégia

    Reduzindo a freqüência em 20%, perdemos
    apenas 13% de desempenho e reduzimos
    em 49% o consumo de energia.

    Se reduzíssemos em 20% o clock e
    colocássemos dentro da mesma pastilha
    dois processadores?
EACH
       Estratégia: Multiplos Núcleos

    Teríamos um processador de dois núcleos
    com 73% mais desempenho e consumindo
    praticamente a mesma coisa (~2% mais
    energia).

    Processadores      multicore       podem
    simultaneamente executar múltiplas tarefas
    computacionais.
EACH
Single-Core X Dual-Core




     Fonte: http://blogs.intel.com
EACH
              Nova Arquitetura

    “Caminhou bastante, porém para o lado e
    não para a frente” (National Instruments).
              NetBurst                 Core


                         Pentium D
                                              Quad Core




                                              Core 2 Duo
                         Pentium IV




                         Pentium III
EACH
              Arquitetura Core

    Somando-se a estratégia de lançar
    processadores de múltiplos núcleos, a nova
    arquitetura interna do processador também
    foi importante.

    Maior eficiência de execução de instruções
    por ciclo de CPU.

    Maior desempenho e menor consumo.

    A arquitetura Core consegue desempenho
    superior aos da microarquitetura Netburst
    (anterior) com o clock muito inferior.
EACH
               Arquitetura Core

    Derivada do Pentium III – Pentium M.

    Pipeline de 14 estágios.

    Cache de memória L2 é compartilhado.

    Pré-buscas são compartilhadas, se o
    controlador de cache carregar um bloco de
    dados para ser usado pelo primeiro núcleo,
    o segundo núcleo também pode usar o dado
    já carregado.

    Aprimoramento da unidade de pré-busca do
    processador (“Melhor Chute”).
EACH
               Arquitetura Core

    Quanto menor o número de instruções a
    serem    executadas,   mais   rápido    o
    computador realizará a execução da tarefa
    além de consumir menos.

    O decodificador de instruções do Pentium IV
    pode decodificar três instruções por pulso de
    clock, já o do Core 2 Duo (Arquitetura Core)
    4.
EACH
                   Arquitetura Core

    Novo conceito: Fusão de instruções
      load eax, [mem1]
      cmp eax, [mem2]
      jne target


      load eax, [mem1]
      cmp eax, [mem2] + jne target

    Graças ao conceito de fusão de instruções o
    decodificador de instruções da arquitetura
    Core consegue fundir 2 instruçoes enviar 5
    por pulso de clock.
EACH
              Arquitetura Core

    E mais!

    Unidade de ponto flutuante (FPU) e uma
    unidade lógica e aritmética (ALU) extras.

    Caminho de dados real de 128 bits.

    Desambiguação de memória.

    Chaveamento Elétrico Avançado.

    Etc.
EACH
Quad Core
EACH
             Quad Core
- É uma das versões de processadores da
  Intel mais recente apresentada com
  núcleos Kentsfield(65nm) e
  Yorkfield(45nm).
- O clock pode alcançar até 3.33Ghz. Em
  overclocking, com cooler de ar, até
  4.0Ghz, e na água até 5Ghz.
- Exemplos: Core 2 Quad, Core 2
  Extreme: quad-core, Quad-Core Xeon.
EACH
                       Quad Core
- Multi-Chip: Duas pastilhas de silício (1 núcleo em cada)
encapsuladas junto: Comunicação externa .
- Monolítica: Uma pastilha de silício integra 2 núcleos
encapsulados: Comunicação interna.
- Monolítica Multi-Chip: Duas pastilhas de silício (2 núcleos
em cada) encapsuladas: Comunicação interna e externa.
EACH
Quad Core
EACH
Quad Core – Jogos
EACH
Quad Core – Jogos
EACH

Quad Core - Exemplos
EACH
Aquecimento: Netburst X Core
              Pentium D




         Pentium Extreme Edition
EACH
Aquecimento: Netburst X Core
           Core 2 Duo




         Core 2 Extreme




          Core 2 Quad
EACH
Arquitetura Core – Processadores

         Dual/Quad/Six Core Xeon
EACH
Arquitetura Core – Núcleos
EACH
             AMD: Athlon 64 X2
• Primeiro processador com dois núcleos da AMD.
• Deriva do Athlon 64.
EACH
AMD: Athlon 64 X2
EACH
AMD: Athlon 64 X2
EACH
       AMD: Phenom X3/X4

• Três ou Quatro núcleos independentes.
• Os núcleos se comunicam internamente
  dentro da pastilha.
• Controlador de memória integrado.
• Tecnologia HT.
EACH
AMD: Phenom X3/X4
EACH
           Considerações Finais

    Por 10 anos os aumentos de desempenho
    vieram à custa do uso cada vez mais
    ineficiente do uso de energia.

    A partir de 2001, a taxa de crescimento de
    desempenho pareceu ter reduzido. Se essa
    diminuição será ou não temporária ainda é
    uma questão obscura.

    Arquitetos estão usando técnicas cada vez
    mais complexas para tentar explorar mais
    paralelismo a nível de instrução.
                            J L Hennessy e D A Patterson
EACH
           Considerações Finais

    Com essa estratégia em mente, os
    fabricantes de processadores tem o desafio
    de continuar entregando a melhor relação
    desempenho/Watts.

    A Intel propõem melhorar sempre, em um
    ano a microarquitetura, no ano seguinte a
    miniaturização, e assim por diante.
EACH
Considerações Finais




   Fonte: http://blogs.intel.com
EACH
           Considerações Finais

    2007    a   Intel   lança os   primeiros
    processadores para servidores fabricados
    com a tecnologia de 45nm.

    2008 foi o ano do Nehalem, que foi o nome
    código da nova microarquitetura, que
    permitirá um outro passo importante, para
    manter viva a Lei de Moore.
EACH
                          Considerações Finais

                                         Processadores Futuros (Roadmaps)

Arquitetura Processador      Clock            Núcleos    Processo     Cache        TDP         Previsão
                                                     Intel
  Nehalem       Core i7      2,6 - 3,2 Ghz 4 por padrão     45nm        1 a 8mb    130W – 150W Novembro-08
 Westmere          -                -      6 por padrão     32nm        1 a 12mb        -       2009/2010
Sandy Bridge       -                -          4–8          32nm        8 a 24mb        -       2010/2011
  Haswell          -                -      8 por padrão     22nm            -           -         2012

                                                        AMD
Barcelona   Opteron                  -              4         65nm          2mb          -        2008
Shanguai    Opteron/Phenom           -              4         45nm          6mb          -      2008/2009
Istambu     Phenom                   -              6         45nm          6mb          -        2009
Magny-Cours         -                -             12         45nm          12mb         -        2010
São Paulo           -                -              6         45nm          6mb          -        2010
EACH
                    Bibliografia

    J L Hennessy e D A Patterson

    HENSON Valerie -          The Kernel Hacker's
    Bookshelf: Ultimate        Physical Limits of
    Computation

    INTEL - http://www.intel.com/portugues/
    products/ processor/index.htm

    BLOGS INTEL - http://blogs.intel.com

    FAPESP - http://www.agencia.fapesp.br

    NATIONAL INSTRUMENTS -
    http://digital.ni.com/worldwide/brazil
EACH
                   Bibliografia


    CLUBE DO HARDWARE -
    http://www.clubedohardware.com.br/

    PC FÓRUM - http://www.pcforum.com.br/

    FÓRUM PC - http://forumpcs.ig.com.br/home

    Vasconcelos, Laércio – Introdução aos
    processadores dual core e quad core

Evolução das CPUs

  • 1.
    EACH Evolução das CPUs: Dual e Quad Core Cesar Sposito Mário J. Filho Rodrigo Ferrassa ... os computadores sequenciais estão se aproximando do limite físico fundamental em sua energia potencial computacional. Tal limite é a velocidade da luz... Angel L. DeCegama
  • 2.
    EACH Introdução – Limite: Pentium IV  Desafio: Aumento frequência de clock.  Corrida por clock (Intel X AMD).  Athlon Thunderbird X Pentium III.  Intel: Movimento arriscado.  Investimento em um processador com um longo pipeline.  Pentium IV.
  • 3.
    EACH Pentium IV: longo pipeline  Pipeline é uma técnica de hardware que permite que a CPU realize a busca de uma ou mais instruções além da próxima a ser executada.  Pentium III: 10 estágios.  Pentium IV: 20 estágios a 31 estágios.  Dobrar o número de estágios no processador é como dobrar o número de funcionários de uma empresa.
  • 4.
    EACH Longo pipeline: Consequencias  Com mais estágios, o processador seria capaz de atingir freqüências mais altas.  Adicionar mais estágios tornou o processador menos eficiente, pois as instruções precisavam do dobro do número de ciclos do processador para serem processadas.  Possuir o dobro de estágios significa também possuir aproximadamente o dobro de transistores e consumir o dobro da eletricidade.
  • 5.
    EACH Mais consumo – Maior aquecimento  Maior consumo gera maiores desperdícios.  Maior desperdicio gera maiores aquecimentos.  A dissipação térmica (W/cm^2) de um Pentium 4, é próximo do núcleo de um reator nuclear.  Se a produção de processadores continuasse da mesma forma, num futuro não muito distante, teríamos um processador com dissipação térmica próxima a da superfície solar.
  • 6.
  • 7.
    EACH A barreira dos 3.4 GHZ  Desde 1983 até 2002, as taxas de frequência de clock aumentaram de 5 MHz para 3 GHz.  Aumento do clock 600 X em 19 anos.  Na época, a Intel previa alcançar 5.2 GHz no final de 2004 e planos para 10 GHz no final de 2005.  Porém, nada disso aconteceu. Os 3.4 GHz se tornaram uma barreira difícil de transpor.  Fim da Lei de Moore?
  • 8.
    EACH Hyper Treading: Inicio do processamento paralelo  Hyper Treading: simula em um único processador físico dois processadores lógicos.  Pode melhorar desempenho de até 30%  Utiliza as partes ociosas dos recursos para simular dois núcleos.
  • 9.
    EACH Evolução  Elevando, por exemplo, em 20% a freqüência do processador, aumentamos apenas em 13% o seu desempenho e como efeito colateral, também passa a consumir 73% mais energia.  Recíproca verdadeira.
  • 10.
    EACH Estratégia  Reduzindo a freqüência em 20%, perdemos apenas 13% de desempenho e reduzimos em 49% o consumo de energia.  Se reduzíssemos em 20% o clock e colocássemos dentro da mesma pastilha dois processadores?
  • 11.
    EACH Estratégia: Multiplos Núcleos  Teríamos um processador de dois núcleos com 73% mais desempenho e consumindo praticamente a mesma coisa (~2% mais energia).  Processadores multicore podem simultaneamente executar múltiplas tarefas computacionais.
  • 12.
    EACH Single-Core X Dual-Core Fonte: http://blogs.intel.com
  • 13.
    EACH Nova Arquitetura  “Caminhou bastante, porém para o lado e não para a frente” (National Instruments). NetBurst Core Pentium D Quad Core Core 2 Duo Pentium IV Pentium III
  • 14.
    EACH Arquitetura Core  Somando-se a estratégia de lançar processadores de múltiplos núcleos, a nova arquitetura interna do processador também foi importante.  Maior eficiência de execução de instruções por ciclo de CPU.  Maior desempenho e menor consumo.  A arquitetura Core consegue desempenho superior aos da microarquitetura Netburst (anterior) com o clock muito inferior.
  • 15.
    EACH Arquitetura Core  Derivada do Pentium III – Pentium M.  Pipeline de 14 estágios.  Cache de memória L2 é compartilhado.  Pré-buscas são compartilhadas, se o controlador de cache carregar um bloco de dados para ser usado pelo primeiro núcleo, o segundo núcleo também pode usar o dado já carregado.  Aprimoramento da unidade de pré-busca do processador (“Melhor Chute”).
  • 16.
    EACH Arquitetura Core  Quanto menor o número de instruções a serem executadas, mais rápido o computador realizará a execução da tarefa além de consumir menos.  O decodificador de instruções do Pentium IV pode decodificar três instruções por pulso de clock, já o do Core 2 Duo (Arquitetura Core) 4.
  • 17.
    EACH Arquitetura Core  Novo conceito: Fusão de instruções load eax, [mem1] cmp eax, [mem2] jne target load eax, [mem1] cmp eax, [mem2] + jne target  Graças ao conceito de fusão de instruções o decodificador de instruções da arquitetura Core consegue fundir 2 instruçoes enviar 5 por pulso de clock.
  • 18.
    EACH Arquitetura Core  E mais!  Unidade de ponto flutuante (FPU) e uma unidade lógica e aritmética (ALU) extras.  Caminho de dados real de 128 bits.  Desambiguação de memória.  Chaveamento Elétrico Avançado.  Etc.
  • 19.
  • 20.
    EACH Quad Core - É uma das versões de processadores da Intel mais recente apresentada com núcleos Kentsfield(65nm) e Yorkfield(45nm). - O clock pode alcançar até 3.33Ghz. Em overclocking, com cooler de ar, até 4.0Ghz, e na água até 5Ghz. - Exemplos: Core 2 Quad, Core 2 Extreme: quad-core, Quad-Core Xeon.
  • 21.
    EACH Quad Core - Multi-Chip: Duas pastilhas de silício (1 núcleo em cada) encapsuladas junto: Comunicação externa . - Monolítica: Uma pastilha de silício integra 2 núcleos encapsulados: Comunicação interna. - Monolítica Multi-Chip: Duas pastilhas de silício (2 núcleos em cada) encapsuladas: Comunicação interna e externa.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
    EACH Aquecimento: Netburst XCore Pentium D Pentium Extreme Edition
  • 27.
    EACH Aquecimento: Netburst XCore Core 2 Duo Core 2 Extreme Core 2 Quad
  • 28.
    EACH Arquitetura Core –Processadores Dual/Quad/Six Core Xeon
  • 29.
  • 30.
    EACH AMD: Athlon 64 X2 • Primeiro processador com dois núcleos da AMD. • Deriva do Athlon 64.
  • 31.
  • 32.
  • 33.
    EACH AMD: Phenom X3/X4 • Três ou Quatro núcleos independentes. • Os núcleos se comunicam internamente dentro da pastilha. • Controlador de memória integrado. • Tecnologia HT.
  • 34.
  • 35.
    EACH Considerações Finais  Por 10 anos os aumentos de desempenho vieram à custa do uso cada vez mais ineficiente do uso de energia.  A partir de 2001, a taxa de crescimento de desempenho pareceu ter reduzido. Se essa diminuição será ou não temporária ainda é uma questão obscura.  Arquitetos estão usando técnicas cada vez mais complexas para tentar explorar mais paralelismo a nível de instrução. J L Hennessy e D A Patterson
  • 36.
    EACH Considerações Finais  Com essa estratégia em mente, os fabricantes de processadores tem o desafio de continuar entregando a melhor relação desempenho/Watts.  A Intel propõem melhorar sempre, em um ano a microarquitetura, no ano seguinte a miniaturização, e assim por diante.
  • 37.
    EACH Considerações Finais Fonte: http://blogs.intel.com
  • 38.
    EACH Considerações Finais  2007 a Intel lança os primeiros processadores para servidores fabricados com a tecnologia de 45nm.  2008 foi o ano do Nehalem, que foi o nome código da nova microarquitetura, que permitirá um outro passo importante, para manter viva a Lei de Moore.
  • 39.
    EACH Considerações Finais Processadores Futuros (Roadmaps) Arquitetura Processador Clock Núcleos Processo Cache TDP Previsão Intel Nehalem Core i7 2,6 - 3,2 Ghz 4 por padrão 45nm 1 a 8mb 130W – 150W Novembro-08 Westmere - - 6 por padrão 32nm 1 a 12mb - 2009/2010 Sandy Bridge - - 4–8 32nm 8 a 24mb - 2010/2011 Haswell - - 8 por padrão 22nm - - 2012 AMD Barcelona Opteron - 4 65nm 2mb - 2008 Shanguai Opteron/Phenom - 4 45nm 6mb - 2008/2009 Istambu Phenom - 6 45nm 6mb - 2009 Magny-Cours - - 12 45nm 12mb - 2010 São Paulo - - 6 45nm 6mb - 2010
  • 40.
    EACH Bibliografia  J L Hennessy e D A Patterson  HENSON Valerie - The Kernel Hacker's Bookshelf: Ultimate Physical Limits of Computation  INTEL - http://www.intel.com/portugues/ products/ processor/index.htm  BLOGS INTEL - http://blogs.intel.com  FAPESP - http://www.agencia.fapesp.br  NATIONAL INSTRUMENTS - http://digital.ni.com/worldwide/brazil
  • 41.
    EACH Bibliografia  CLUBE DO HARDWARE - http://www.clubedohardware.com.br/  PC FÓRUM - http://www.pcforum.com.br/  FÓRUM PC - http://forumpcs.ig.com.br/home  Vasconcelos, Laércio – Introdução aos processadores dual core e quad core