SlideShare uma empresa Scribd logo
1 de 32
Abstract   e  Agenda Devido à aproximação dos  limites físicos , os Processadores  evoluem  em 2 “ frentes”: Mais e maiores  Caches  e  Pipelines  mais “profundas”   Esta Palestra procurará identificar estes  componentes  nos  MainFrames, comentando como têm evoluído e qual a sua tendência [Claro está, a evolução Tecnológica  reduz  o  Cycle Time , mas não é nosso foco] 1 -  5min – Máquinas  Super  Escalares    Caches  e  Pipelines  aumentam o “throughput” 2 -  5min – Mais e Maiores Caches  John Liptay & alii Evolução desde o /360- 85 3 -  5min – Pipelines mais Profundas  Robert Tomasulo & alii Evolução desde o /360- 91 4 - 10min – CMOS e sua evolução  JLiptay & alii  e  CWebb & alii De “A Mainframe on a Chip” até o  z196 5 - 15min – Representação atual  nos equipamentos  z196   CWebb & alii 6min Caches em múltiplos níveis  e  Chip Area Size 6min Pipeline mais ‘profunda’  e  Execução Fora de Ordem (OOO) 3min CPUMF  e  HIS 6 -  5min – Conclusões, Perguntas e Agradecimento
Tendências Tecnológicas #1 =  Máquinas  Super  Escalares #2 = Mais e Maiores  Caches #3 =  Pipelines   mais Profundas #4 =  CMOS   e  sua  evolução #5 = ‘State of Art’  nos equipamentos  z196 #6 =  Conclusões Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Execução em Paralelo? Execução Fora de Ordem? O que será que tem em  80%  da Área nos Chips de  Processadores ?
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Memória de Núcleos do /360- 67 64 KB  em  NewCastle
Máquinas Não   Escalares Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Instr. Fetch  EXEC ....... MEM C P U I ALU
Máquinas Não   Escalares Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. CACHE L2 Instr. Fetch  EXEC ....... i MEM C P U I ALU INSTR L1 DADOS L1
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Máquinas Escalares ? ? ? Dezsõ Sima Kandó Polytechnik Budapest
#1 =  Máquinas Super  Escalares Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. CACHE L2 Instr. Fetch  EXEC . ...... EXEC ....... EXEC ....... INSTR L1 DADOS L1 MEM C P U I I I ALU ALU ALU BHT ....... TLB1 ....... TLB2 ....... ALB ....... DA T i i i i i
Caches: Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Efeito de Caches ( 85 ) e PipeLines ( 91 )
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. z9 L1  I   256KB L1 D  256KB L2  40MB z10   e  z196 L1  I   64KB L1 D  128KB z10 L1.5  3MB L2  48MB #2 = Mais e Maiores  Caches
Pipelines: Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Comparação  entre  z9   e  z10 #3 =  Pipelines   mais Profundas
CACHE L1.5 Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. CACHE L2 Instr. Fetch  EXEC . ...... i EXEC ....... EXEC ....... INSTR L1 DADOS L1 i i MEM C P U*4 I I I BHT ....... TLB1 ....... TLB2 ....... ALB ....... DA T Diagrama  Simplificado  dos  z10 Chip *5 ALU ALU ALU Book Book Book
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. PipeLine   dos  z10
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. “ A Mainframe on a Chip”
#4 =  CMOS   e sua  evolução CycleTime  GHz z900 1,3ns  0,769 z900 1,09  0,917 z990 0,83  1,2 z9 0,58  1,7 z10 0,227  4,404 z196 0,192  5,208 Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. PU
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Chip  dos  z900
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
#5 = ‘State of Art’  nos equipamentos  z196 Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. CACHE L3 Instr. Fetch  EXEC ....... EXEC ....... EXEC ....... I NSTR L1 D ADOS L1 MEM C P U CACHE L2 TLB1 I BHT PHT BTB DAT ??? EXEC ....... EXEC ....... TLB1 D CACHE L4 Chip *6 ALU ALU ALU TLB2 ALB . NonQuiesce SSKE? Partial Purge? Ex.Fora de Ordem? Virtual Registers? ALU ALU CPU CPU CPU I I I I I Book Book Book
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Chip  dos  Storage  Controllers  dos  z196
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Chip  das  4  PUs  dos  z196
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Chip  das  8  PUs  dos  Power7 L1I   32KB L1D   32KB L2 256KB L3   32MB
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. MicroFotografia  de  cada  PU  dos  z10
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. DUPLA DUPLA IFB Instruction Fetch & Branch prediction ICM Instruction Cache & Merge IDU Instruction Decode Unit ISU Instruction Sequence Unit FXU FiXed-point Unit BFU Binary & Hex Floating-point Unit DU Decimal Unit LSU Load-Store Unit for Operands XU Translation Unit  (DAT) RU Recovery Unit CACHE I + TLB1I CACHE D + TLB1D BHT PHT BTB DAT + TLB2 MicroFotografia  de  cada  PU  dos  z196
DUPLA DUPLA IFB ISU XU RU ICM  IDU IFB Instruction Fetch & Branch prediction ICM Instruction Cache & Merge IDU Instruction Decode Unit ISU Instruction Sequence Unit FXU FiXed-point Unit BFU Binary & Hex Floating-point Unit DU Decimal Unit LSU Load-Store Unit for Operands XU Translation Unit  (DAT) RU Recovery Unit Diagrama das Unidades Funcionais dos  z196 <=CPUMF
#6 - Conclusões : Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. ,[object Object],[object Object],[object Object],[object Object],[object Object]
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Uma constatação, antes das Perguntas: “ A Realidade sempre é um pouquinho diferente dos Comerciais” SpinTrônica?
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Perguntas  ?  ?  ? Obrigado  ! [email_address] Boas  Otimizações ! Todos os Manuais e RedBooks :      IBM Cursos  MFTS00  e  MFTS30  :     MAFFEI
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Mais conteúdo relacionado

Mais procurados

[5/9] Sistemas embarcados de alto desempenho para tratamento e processamento ...
[5/9] Sistemas embarcados de alto desempenho para tratamento e processamento ...[5/9] Sistemas embarcados de alto desempenho para tratamento e processamento ...
[5/9] Sistemas embarcados de alto desempenho para tratamento e processamento ...Marcelo Barros de Almeida
 
Arquitetura pentium
Arquitetura pentiumArquitetura pentium
Arquitetura pentiumEMSNEWS
 
Acelerando suas aplicações com o novíssimo Vector Packed Decimal Facility do ...
Acelerando suas aplicações com o novíssimo Vector Packed Decimal Facility do ...Acelerando suas aplicações com o novíssimo Vector Packed Decimal Facility do ...
Acelerando suas aplicações com o novíssimo Vector Packed Decimal Facility do ...Joao Galdino Mello de Souza
 
TDC2016SP - Trilha Linux Embarcado
TDC2016SP - Trilha Linux EmbarcadoTDC2016SP - Trilha Linux Embarcado
TDC2016SP - Trilha Linux Embarcadotdc-globalcode
 
8085 Introducao
8085 Introducao8085 Introducao
8085 Introducaoedgluc2001
 
CMG Brasil 2012 - Uso de Lines nos z196
CMG Brasil 2012 - Uso de Lines nos z196CMG Brasil 2012 - Uso de Lines nos z196
CMG Brasil 2012 - Uso de Lines nos z196Rodrigo Campos
 
Boas práticas e sobrevivência com vcr no rspec
Boas práticas e sobrevivência com vcr no rspecBoas práticas e sobrevivência com vcr no rspec
Boas práticas e sobrevivência com vcr no rspecfabio perrella
 
TDC2016POA | Trilha IoT - Controlando AR Drone com PHP
TDC2016POA | Trilha IoT -  Controlando AR Drone com PHPTDC2016POA | Trilha IoT -  Controlando AR Drone com PHP
TDC2016POA | Trilha IoT - Controlando AR Drone com PHPtdc-globalcode
 

Mais procurados (14)

[5/9] Sistemas embarcados de alto desempenho para tratamento e processamento ...
[5/9] Sistemas embarcados de alto desempenho para tratamento e processamento ...[5/9] Sistemas embarcados de alto desempenho para tratamento e processamento ...
[5/9] Sistemas embarcados de alto desempenho para tratamento e processamento ...
 
Arquitetura pentium
Arquitetura pentiumArquitetura pentium
Arquitetura pentium
 
Acelerando suas aplicações com o novíssimo Vector Packed Decimal Facility do ...
Acelerando suas aplicações com o novíssimo Vector Packed Decimal Facility do ...Acelerando suas aplicações com o novíssimo Vector Packed Decimal Facility do ...
Acelerando suas aplicações com o novíssimo Vector Packed Decimal Facility do ...
 
Introdução ao pipeline
Introdução  ao  pipelineIntrodução  ao  pipeline
Introdução ao pipeline
 
TDC2016SP - Trilha Linux Embarcado
TDC2016SP - Trilha Linux EmbarcadoTDC2016SP - Trilha Linux Embarcado
TDC2016SP - Trilha Linux Embarcado
 
ARM
ARMARM
ARM
 
8085 Introducao
8085 Introducao8085 Introducao
8085 Introducao
 
MIPS Pipeline
MIPS Pipeline MIPS Pipeline
MIPS Pipeline
 
CMG Brasil 2012 - Uso de Lines nos z196
CMG Brasil 2012 - Uso de Lines nos z196CMG Brasil 2012 - Uso de Lines nos z196
CMG Brasil 2012 - Uso de Lines nos z196
 
Boas práticas e sobrevivência com vcr no rspec
Boas práticas e sobrevivência com vcr no rspecBoas práticas e sobrevivência com vcr no rspec
Boas práticas e sobrevivência com vcr no rspec
 
Seminario pic
Seminario picSeminario pic
Seminario pic
 
8085 3
8085 38085 3
8085 3
 
TDC2016POA | Trilha IoT - Controlando AR Drone com PHP
TDC2016POA | Trilha IoT -  Controlando AR Drone com PHPTDC2016POA | Trilha IoT -  Controlando AR Drone com PHP
TDC2016POA | Trilha IoT - Controlando AR Drone com PHP
 
8085 2
8085 28085 2
8085 2
 

Destaque

RestauraAltarDeusnaVida
RestauraAltarDeusnaVidaRestauraAltarDeusnaVida
RestauraAltarDeusnaVidaPrgalba Freire
 
Social Media 101- Webinar 5 Portuguese
Social Media 101- Webinar 5 PortugueseSocial Media 101- Webinar 5 Portuguese
Social Media 101- Webinar 5 PortugueseOptime Consulting
 
Dossier de Pré-Produção "Chip Humano"
Dossier de Pré-Produção "Chip Humano"Dossier de Pré-Produção "Chip Humano"
Dossier de Pré-Produção "Chip Humano"Rui Cardoso
 
[EBD Maranata] Revista Atos dos Apóstolos | Lição 08 - Quando a Igreja de Cri...
[EBD Maranata] Revista Atos dos Apóstolos | Lição 08 - Quando a Igreja de Cri...[EBD Maranata] Revista Atos dos Apóstolos | Lição 08 - Quando a Igreja de Cri...
[EBD Maranata] Revista Atos dos Apóstolos | Lição 08 - Quando a Igreja de Cri...José Carlos Polozi
 
Lição 12 conservando a pureza do movimento pentecostal
Lição 12   conservando a pureza do movimento pentecostalLição 12   conservando a pureza do movimento pentecostal
Lição 12 conservando a pureza do movimento pentecostalJose Ventura
 
Fofoca e formação de panelinha
Fofoca e formação de panelinhaFofoca e formação de panelinha
Fofoca e formação de panelinhaMariane03
 
3º trimestre 2015 lição 10 Adultos
3º trimestre 2015 lição 10 Adultos3º trimestre 2015 lição 10 Adultos
3º trimestre 2015 lição 10 AdultosJoel Silva
 
06 Apocalipse Diz Que Jesus Voltará
06   Apocalipse Diz Que Jesus Voltará06   Apocalipse Diz Que Jesus Voltará
06 Apocalipse Diz Que Jesus Voltaráarlete.becker
 
O centro da vontade de deus
O centro da vontade de deusO centro da vontade de deus
O centro da vontade de deusRogerioMP
 
“ESCATOLOGIA: BREVE TRATADO TEOLÓGICO - PASTORAL” Fr. Clodovis M. Boff, OSM
“ESCATOLOGIA: BREVE TRATADO TEOLÓGICO - PASTORAL” Fr. Clodovis M. Boff, OSM“ESCATOLOGIA: BREVE TRATADO TEOLÓGICO - PASTORAL” Fr. Clodovis M. Boff, OSM
“ESCATOLOGIA: BREVE TRATADO TEOLÓGICO - PASTORAL” Fr. Clodovis M. Boff, OSMBernadetecebs .
 
Descobrindo a igreja de deus na bíblia
Descobrindo a igreja de deus na bíbliaDescobrindo a igreja de deus na bíblia
Descobrindo a igreja de deus na bíbliaO ÚLTIMO CHAMADO
 
Qual é a igreja verdadeira de deus na terra
Qual é a igreja verdadeira de deus na terraQual é a igreja verdadeira de deus na terra
Qual é a igreja verdadeira de deus na terraO ÚLTIMO CHAMADO
 
EBD CPAD LIÇÕES BÍBLICAS Lição 12 Novos céus e nova Terra.
EBD CPAD LIÇÕES BÍBLICAS Lição 12 Novos céus e nova Terra.EBD CPAD LIÇÕES BÍBLICAS Lição 12 Novos céus e nova Terra.
EBD CPAD LIÇÕES BÍBLICAS Lição 12 Novos céus e nova Terra.GIDEONE Moura Santos Ferreira
 
Metas da nova ordem mundial
Metas da nova ordem mundialMetas da nova ordem mundial
Metas da nova ordem mundialSérgio Ventura
 
Lição 9 Mornidão Espiritual
Lição 9   Mornidão EspiritualLição 9   Mornidão Espiritual
Lição 9 Mornidão EspiritualWander Sousa
 
O Milênio - Ouvindo a Voz de Deus, Estudo Bíblico, Igreja Adventista
O Milênio - Ouvindo a Voz de Deus, Estudo Bíblico, Igreja AdventistaO Milênio - Ouvindo a Voz de Deus, Estudo Bíblico, Igreja Adventista
O Milênio - Ouvindo a Voz de Deus, Estudo Bíblico, Igreja AdventistaIgreja Adventista do Sétimo Dia
 

Destaque (20)

RestauraAltarDeusnaVida
RestauraAltarDeusnaVidaRestauraAltarDeusnaVida
RestauraAltarDeusnaVida
 
Social Media 101- Webinar 5 Portuguese
Social Media 101- Webinar 5 PortugueseSocial Media 101- Webinar 5 Portuguese
Social Media 101- Webinar 5 Portuguese
 
intervention2_vicki_becky
intervention2_vicki_beckyintervention2_vicki_becky
intervention2_vicki_becky
 
Dossier de Pré-Produção "Chip Humano"
Dossier de Pré-Produção "Chip Humano"Dossier de Pré-Produção "Chip Humano"
Dossier de Pré-Produção "Chip Humano"
 
[EBD Maranata] Revista Atos dos Apóstolos | Lição 08 - Quando a Igreja de Cri...
[EBD Maranata] Revista Atos dos Apóstolos | Lição 08 - Quando a Igreja de Cri...[EBD Maranata] Revista Atos dos Apóstolos | Lição 08 - Quando a Igreja de Cri...
[EBD Maranata] Revista Atos dos Apóstolos | Lição 08 - Quando a Igreja de Cri...
 
Lição 12 conservando a pureza do movimento pentecostal
Lição 12   conservando a pureza do movimento pentecostalLição 12   conservando a pureza do movimento pentecostal
Lição 12 conservando a pureza do movimento pentecostal
 
Fofoca e formação de panelinha
Fofoca e formação de panelinhaFofoca e formação de panelinha
Fofoca e formação de panelinha
 
3º trimestre 2015 lição 10 Adultos
3º trimestre 2015 lição 10 Adultos3º trimestre 2015 lição 10 Adultos
3º trimestre 2015 lição 10 Adultos
 
06 Apocalipse Diz Que Jesus Voltará
06   Apocalipse Diz Que Jesus Voltará06   Apocalipse Diz Que Jesus Voltará
06 Apocalipse Diz Que Jesus Voltará
 
O centro da vontade de deus
O centro da vontade de deusO centro da vontade de deus
O centro da vontade de deus
 
“ESCATOLOGIA: BREVE TRATADO TEOLÓGICO - PASTORAL” Fr. Clodovis M. Boff, OSM
“ESCATOLOGIA: BREVE TRATADO TEOLÓGICO - PASTORAL” Fr. Clodovis M. Boff, OSM“ESCATOLOGIA: BREVE TRATADO TEOLÓGICO - PASTORAL” Fr. Clodovis M. Boff, OSM
“ESCATOLOGIA: BREVE TRATADO TEOLÓGICO - PASTORAL” Fr. Clodovis M. Boff, OSM
 
Descobrindo a igreja de deus na bíblia
Descobrindo a igreja de deus na bíbliaDescobrindo a igreja de deus na bíblia
Descobrindo a igreja de deus na bíblia
 
O sangue de Jesus
O sangue de JesusO sangue de Jesus
O sangue de Jesus
 
Qual é a igreja verdadeira de deus na terra
Qual é a igreja verdadeira de deus na terraQual é a igreja verdadeira de deus na terra
Qual é a igreja verdadeira de deus na terra
 
EBD CPAD LIÇÕES BÍBLICAS Lição 12 Novos céus e nova Terra.
EBD CPAD LIÇÕES BÍBLICAS Lição 12 Novos céus e nova Terra.EBD CPAD LIÇÕES BÍBLICAS Lição 12 Novos céus e nova Terra.
EBD CPAD LIÇÕES BÍBLICAS Lição 12 Novos céus e nova Terra.
 
Metas da nova ordem mundial
Metas da nova ordem mundialMetas da nova ordem mundial
Metas da nova ordem mundial
 
Lição 9 Mornidão Espiritual
Lição 9   Mornidão EspiritualLição 9   Mornidão Espiritual
Lição 9 Mornidão Espiritual
 
O Milênio - Ouvindo a Voz de Deus, Estudo Bíblico, Igreja Adventista
O Milênio - Ouvindo a Voz de Deus, Estudo Bíblico, Igreja AdventistaO Milênio - Ouvindo a Voz de Deus, Estudo Bíblico, Igreja Adventista
O Milênio - Ouvindo a Voz de Deus, Estudo Bíblico, Igreja Adventista
 
As 7 igrejas da asia
As 7 igrejas da asiaAs 7 igrejas da asia
As 7 igrejas da asia
 
O sacrificio mais agradável a Deus
O sacrificio mais agradável a DeusO sacrificio mais agradável a Deus
O sacrificio mais agradável a Deus
 

Semelhante a Evolução de processadores mainframe

Mistério ou tecnologia? Paralelismo!
Mistério ou tecnologia? Paralelismo!Mistério ou tecnologia? Paralelismo!
Mistério ou tecnologia? Paralelismo!Rodrigo Campos
 
Z13 x zEC12: O que esperar? - por Luiz Carlos Orsoni
Z13 x zEC12: O que esperar? - por Luiz Carlos OrsoniZ13 x zEC12: O que esperar? - por Luiz Carlos Orsoni
Z13 x zEC12: O que esperar? - por Luiz Carlos OrsoniJoao Galdino Mello de Souza
 
Detalhes internos da z14/Otimização de códigos - por Luiz Carlos Orsoni (MAFFEI)
Detalhes internos da z14/Otimização de códigos - por Luiz Carlos Orsoni (MAFFEI)Detalhes internos da z14/Otimização de códigos - por Luiz Carlos Orsoni (MAFFEI)
Detalhes internos da z14/Otimização de códigos - por Luiz Carlos Orsoni (MAFFEI)Joao Galdino Mello de Souza
 
CPUMF: O que é, como implementar, o que inferir por Luiz Carlos Orsoni
CPUMF: O que é, como implementar, o que inferir por Luiz Carlos OrsoniCPUMF: O que é, como implementar, o que inferir por Luiz Carlos Orsoni
CPUMF: O que é, como implementar, o que inferir por Luiz Carlos OrsoniJoao Galdino Mello de Souza
 
Behind the Scenes: z Systems CACHE por Carolina de Souza Joaquim - IBM Brasil
Behind the Scenes: z Systems CACHE por Carolina de Souza Joaquim - IBM BrasilBehind the Scenes: z Systems CACHE por Carolina de Souza Joaquim - IBM Brasil
Behind the Scenes: z Systems CACHE por Carolina de Souza Joaquim - IBM BrasilJoao Galdino Mello de Souza
 
Tendências Tecnológicas em Processadores, por Luiz Carlos Orsoni
Tendências Tecnológicas em Processadores, por Luiz Carlos OrsoniTendências Tecnológicas em Processadores, por Luiz Carlos Orsoni
Tendências Tecnológicas em Processadores, por Luiz Carlos OrsoniJoao Galdino Mello de Souza
 
Programação básica de microcontroladores
Programação básica de microcontroladoresProgramação básica de microcontroladores
Programação básica de microcontroladoresDanilo Morais Pagano
 
Pic apostila
Pic apostilaPic apostila
Pic apostilamoschen
 
Pcs2031 projeto01 introducao_pic_v4
Pcs2031 projeto01 introducao_pic_v4Pcs2031 projeto01 introducao_pic_v4
Pcs2031 projeto01 introducao_pic_v4Flávia Martins
 
Como montar um pc
Como montar um pcComo montar um pc
Como montar um pcTiago
 
11 montagem
11 montagem11 montagem
11 montagemTiago
 
Microcontroladores pic lingc unicamp-150206140414-conversion-gate02
Microcontroladores pic lingc unicamp-150206140414-conversion-gate02Microcontroladores pic lingc unicamp-150206140414-conversion-gate02
Microcontroladores pic lingc unicamp-150206140414-conversion-gate02Cláudio Alves
 
Microcontroladores pic ling c unicamp
Microcontroladores pic ling c unicampMicrocontroladores pic ling c unicamp
Microcontroladores pic ling c unicampFrancisco Fambrini
 
Lua em transmissões ao vivo
Lua em transmissões ao vivoLua em transmissões ao vivo
Lua em transmissões ao vivoLeandro Moreira
 
Microcontroladores pic
Microcontroladores picMicrocontroladores pic
Microcontroladores picCesar Prim
 

Semelhante a Evolução de processadores mainframe (20)

Quantas Instruções por Ciclo?
Quantas Instruções por Ciclo?Quantas Instruções por Ciclo?
Quantas Instruções por Ciclo?
 
Mistério ou tecnologia? Paralelismo!
Mistério ou tecnologia? Paralelismo!Mistério ou tecnologia? Paralelismo!
Mistério ou tecnologia? Paralelismo!
 
Z13 x zEC12: O que esperar? - por Luiz Carlos Orsoni
Z13 x zEC12: O que esperar? - por Luiz Carlos OrsoniZ13 x zEC12: O que esperar? - por Luiz Carlos Orsoni
Z13 x zEC12: O que esperar? - por Luiz Carlos Orsoni
 
Detalhes internos da z14/Otimização de códigos - por Luiz Carlos Orsoni (MAFFEI)
Detalhes internos da z14/Otimização de códigos - por Luiz Carlos Orsoni (MAFFEI)Detalhes internos da z14/Otimização de códigos - por Luiz Carlos Orsoni (MAFFEI)
Detalhes internos da z14/Otimização de códigos - por Luiz Carlos Orsoni (MAFFEI)
 
Por dentro da z14
Por dentro da z14Por dentro da z14
Por dentro da z14
 
CPUMF: O que é, como implementar, o que inferir por Luiz Carlos Orsoni
CPUMF: O que é, como implementar, o que inferir por Luiz Carlos OrsoniCPUMF: O que é, como implementar, o que inferir por Luiz Carlos Orsoni
CPUMF: O que é, como implementar, o que inferir por Luiz Carlos Orsoni
 
Behind the Scenes: z Systems CACHE por Carolina de Souza Joaquim - IBM Brasil
Behind the Scenes: z Systems CACHE por Carolina de Souza Joaquim - IBM BrasilBehind the Scenes: z Systems CACHE por Carolina de Souza Joaquim - IBM Brasil
Behind the Scenes: z Systems CACHE por Carolina de Souza Joaquim - IBM Brasil
 
Tendências Tecnológicas em Processadores, por Luiz Carlos Orsoni
Tendências Tecnológicas em Processadores, por Luiz Carlos OrsoniTendências Tecnológicas em Processadores, por Luiz Carlos Orsoni
Tendências Tecnológicas em Processadores, por Luiz Carlos Orsoni
 
Programação básica de microcontroladores
Programação básica de microcontroladoresProgramação básica de microcontroladores
Programação básica de microcontroladores
 
Pic apostila
Pic apostilaPic apostila
Pic apostila
 
Pcs2031 projeto01 introducao_pic_v4
Pcs2031 projeto01 introducao_pic_v4Pcs2031 projeto01 introducao_pic_v4
Pcs2031 projeto01 introducao_pic_v4
 
Pic18xx
Pic18xxPic18xx
Pic18xx
 
Como montar um pc
Como montar um pcComo montar um pc
Como montar um pc
 
11 montagem
11 montagem11 montagem
11 montagem
 
LEON3 e KIT ALTERA.
LEON3 e KIT ALTERA.LEON3 e KIT ALTERA.
LEON3 e KIT ALTERA.
 
Microcontroladores pic lingc unicamp-150206140414-conversion-gate02
Microcontroladores pic lingc unicamp-150206140414-conversion-gate02Microcontroladores pic lingc unicamp-150206140414-conversion-gate02
Microcontroladores pic lingc unicamp-150206140414-conversion-gate02
 
Microcontroladores pic ling c unicamp
Microcontroladores pic ling c unicampMicrocontroladores pic ling c unicamp
Microcontroladores pic ling c unicamp
 
Lua em transmissões ao vivo
Lua em transmissões ao vivoLua em transmissões ao vivo
Lua em transmissões ao vivo
 
Microcontroladores pic
Microcontroladores picMicrocontroladores pic
Microcontroladores pic
 
Aula 15 processadores
Aula 15 processadoresAula 15 processadores
Aula 15 processadores
 

Mais de Joao Galdino Mello de Souza

Enterprise computing for modern business workloads por Lívio Sousa (IBM)
Enterprise computing for modern business workloads por Lívio Sousa (IBM)Enterprise computing for modern business workloads por Lívio Sousa (IBM)
Enterprise computing for modern business workloads por Lívio Sousa (IBM)Joao Galdino Mello de Souza
 
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)Joao Galdino Mello de Souza
 
Scaling Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
Scaling  Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...Scaling  Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
Scaling Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...Joao Galdino Mello de Souza
 
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)Joao Galdino Mello de Souza
 
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...Joao Galdino Mello de Souza
 
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)Joao Galdino Mello de Souza
 
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)Joao Galdino Mello de Souza
 
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...Joao Galdino Mello de Souza
 
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)Joao Galdino Mello de Souza
 
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)Joao Galdino Mello de Souza
 
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)Joao Galdino Mello de Souza
 
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)Joao Galdino Mello de Souza
 
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...Joao Galdino Mello de Souza
 
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)Joao Galdino Mello de Souza
 
Pervasive Encryption por Eugênio Fernandes (IBM)
Pervasive Encryption por Eugênio Fernandes (IBM)Pervasive Encryption por Eugênio Fernandes (IBM)
Pervasive Encryption por Eugênio Fernandes (IBM)Joao Galdino Mello de Souza
 
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)Joao Galdino Mello de Souza
 
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...Joao Galdino Mello de Souza
 
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)Joao Galdino Mello de Souza
 
Lei geral de proteção de dados por Kleber Silva e Ricardo Navarro (Pise4)
Lei geral de proteção de dados por Kleber Silva  e Ricardo Navarro (Pise4)Lei geral de proteção de dados por Kleber Silva  e Ricardo Navarro (Pise4)
Lei geral de proteção de dados por Kleber Silva e Ricardo Navarro (Pise4)Joao Galdino Mello de Souza
 

Mais de Joao Galdino Mello de Souza (20)

Explorando a API Rest Jira Cloud
Explorando a API Rest Jira CloudExplorando a API Rest Jira Cloud
Explorando a API Rest Jira Cloud
 
Enterprise computing for modern business workloads por Lívio Sousa (IBM)
Enterprise computing for modern business workloads por Lívio Sousa (IBM)Enterprise computing for modern business workloads por Lívio Sousa (IBM)
Enterprise computing for modern business workloads por Lívio Sousa (IBM)
 
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI) e Fernando Ferreira (IBM)
 
Scaling Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
Scaling  Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...Scaling  Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
Scaling Multi-cloud with Infrastructure as Code por André Rocha Agostinho (S...
 
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
Alta Disponibilidade SQL Server por Marcus Vinicius Bittencourt (O Boticário)
 
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
Cloud no Banco Votorantim por Marcus Vinícius de Aguiar Magalhaes (Banco Voto...
 
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
Descomplicando a Ciência de Dados por Adelson Lovatto (IBM)
 
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
Pré-Anúncio z/OS 2.4 por Alvaro Salla (MAFFEI)
 
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
Consumo de CPU, Distorções e Redução de custo de SW por Maria Isabel Soutello...
 
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
Qualidade no desenvolvimento de Sistemas por Anderson Augustinho (Celepar)
 
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
Assets Tokenization: Novas Linhas de negócio por Lívio Sousa (IBM)
 
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
Intelligent Edge e Intelligent Cloud por Vivian Heinrichs (Softline)
 
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
Evolução da eficiência operacional no mainframe por Emerson Castelano (Eccox)
 
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
Gestão de Capacidade, desempenho e custos no ambiente mainframe zOS: Um caso ...
 
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
Eletricidade e Eletrônica 1.01 por Luiz Carlos Orsoni (MAFFEI)
 
Pervasive Encryption por Eugênio Fernandes (IBM)
Pervasive Encryption por Eugênio Fernandes (IBM)Pervasive Encryption por Eugênio Fernandes (IBM)
Pervasive Encryption por Eugênio Fernandes (IBM)
 
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
Minimizar RNI ambiente CICS por Milton Ferraraccio (Eccox Technology)
 
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
Scaling Multi-Cloud with Infrastructure as a Code por André Rocha Agostinho (...
 
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
Como obter o melhor do Z por Gustavo Fernandes Araujo (Itau Unibanco)
 
Lei geral de proteção de dados por Kleber Silva e Ricardo Navarro (Pise4)
Lei geral de proteção de dados por Kleber Silva  e Ricardo Navarro (Pise4)Lei geral de proteção de dados por Kleber Silva  e Ricardo Navarro (Pise4)
Lei geral de proteção de dados por Kleber Silva e Ricardo Navarro (Pise4)
 

Evolução de processadores mainframe

  • 1. Abstract e Agenda Devido à aproximação dos limites físicos , os Processadores evoluem em 2 “ frentes”: Mais e maiores Caches e Pipelines mais “profundas” Esta Palestra procurará identificar estes componentes nos MainFrames, comentando como têm evoluído e qual a sua tendência [Claro está, a evolução Tecnológica reduz o Cycle Time , mas não é nosso foco] 1 - 5min – Máquinas Super Escalares Caches e Pipelines aumentam o “throughput” 2 - 5min – Mais e Maiores Caches John Liptay & alii Evolução desde o /360- 85 3 - 5min – Pipelines mais Profundas Robert Tomasulo & alii Evolução desde o /360- 91 4 - 10min – CMOS e sua evolução JLiptay & alii e CWebb & alii De “A Mainframe on a Chip” até o z196 5 - 15min – Representação atual nos equipamentos z196 CWebb & alii 6min Caches em múltiplos níveis e Chip Area Size 6min Pipeline mais ‘profunda’ e Execução Fora de Ordem (OOO) 3min CPUMF e HIS 6 - 5min – Conclusões, Perguntas e Agradecimento
  • 2. Tendências Tecnológicas #1 = Máquinas Super Escalares #2 = Mais e Maiores Caches #3 = Pipelines mais Profundas #4 = CMOS e sua evolução #5 = ‘State of Art’ nos equipamentos z196 #6 = Conclusões Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Execução em Paralelo? Execução Fora de Ordem? O que será que tem em 80% da Área nos Chips de Processadores ?
  • 3. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Memória de Núcleos do /360- 67 64 KB em NewCastle
  • 4. Máquinas Não Escalares Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Instr. Fetch EXEC ....... MEM C P U I ALU
  • 5. Máquinas Não Escalares Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. CACHE L2 Instr. Fetch EXEC ....... i MEM C P U I ALU INSTR L1 DADOS L1
  • 6. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Máquinas Escalares ? ? ? Dezsõ Sima Kandó Polytechnik Budapest
  • 7. #1 = Máquinas Super Escalares Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. CACHE L2 Instr. Fetch EXEC . ...... EXEC ....... EXEC ....... INSTR L1 DADOS L1 MEM C P U I I I ALU ALU ALU BHT ....... TLB1 ....... TLB2 ....... ALB ....... DA T i i i i i
  • 8. Caches: Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
  • 9. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Efeito de Caches ( 85 ) e PipeLines ( 91 )
  • 10. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. z9 L1 I 256KB L1 D 256KB L2 40MB z10 e z196 L1 I 64KB L1 D 128KB z10 L1.5 3MB L2 48MB #2 = Mais e Maiores Caches
  • 11. Pipelines: Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
  • 12. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Comparação entre z9 e z10 #3 = Pipelines mais Profundas
  • 13. CACHE L1.5 Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. CACHE L2 Instr. Fetch EXEC . ...... i EXEC ....... EXEC ....... INSTR L1 DADOS L1 i i MEM C P U*4 I I I BHT ....... TLB1 ....... TLB2 ....... ALB ....... DA T Diagrama Simplificado dos z10 Chip *5 ALU ALU ALU Book Book Book
  • 14. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. PipeLine dos z10
  • 15. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. “ A Mainframe on a Chip”
  • 16. #4 = CMOS e sua evolução CycleTime GHz z900 1,3ns 0,769 z900 1,09 0,917 z990 0,83 1,2 z9 0,58 1,7 z10 0,227 4,404 z196 0,192 5,208 Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. PU
  • 17. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Chip dos z900
  • 18. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
  • 19. #5 = ‘State of Art’ nos equipamentos z196 Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. CACHE L3 Instr. Fetch EXEC ....... EXEC ....... EXEC ....... I NSTR L1 D ADOS L1 MEM C P U CACHE L2 TLB1 I BHT PHT BTB DAT ??? EXEC ....... EXEC ....... TLB1 D CACHE L4 Chip *6 ALU ALU ALU TLB2 ALB . NonQuiesce SSKE? Partial Purge? Ex.Fora de Ordem? Virtual Registers? ALU ALU CPU CPU CPU I I I I I Book Book Book
  • 20. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Chip dos Storage Controllers dos z196
  • 21. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Chip das 4 PUs dos z196
  • 22. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Chip das 8 PUs dos Power7 L1I 32KB L1D 32KB L2 256KB L3 32MB
  • 23. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. MicroFotografia de cada PU dos z10
  • 24. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. DUPLA DUPLA IFB Instruction Fetch & Branch prediction ICM Instruction Cache & Merge IDU Instruction Decode Unit ISU Instruction Sequence Unit FXU FiXed-point Unit BFU Binary & Hex Floating-point Unit DU Decimal Unit LSU Load-Store Unit for Operands XU Translation Unit (DAT) RU Recovery Unit CACHE I + TLB1I CACHE D + TLB1D BHT PHT BTB DAT + TLB2 MicroFotografia de cada PU dos z196
  • 25. DUPLA DUPLA IFB ISU XU RU ICM IDU IFB Instruction Fetch & Branch prediction ICM Instruction Cache & Merge IDU Instruction Decode Unit ISU Instruction Sequence Unit FXU FiXed-point Unit BFU Binary & Hex Floating-point Unit DU Decimal Unit LSU Load-Store Unit for Operands XU Translation Unit (DAT) RU Recovery Unit Diagrama das Unidades Funcionais dos z196 <=CPUMF
  • 26.
  • 27. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Uma constatação, antes das Perguntas: “ A Realidade sempre é um pouquinho diferente dos Comerciais” SpinTrônica?
  • 28. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
  • 29. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. Perguntas ? ? ? Obrigado ! [email_address] Boas Otimizações ! Todos os Manuais e RedBooks :  IBM Cursos MFTS00 e MFTS30 :  MAFFEI
  • 30. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
  • 31. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
  • 32. Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Notas do Editor

  1. Abstract e Agenda para a Apresentação no CMG Brasil – São Paulo, 18 de Agosto de 2.011
  2. Focaremos os principais componentes dos modernos Hardwares: Caches e PipeLines, como apareceram nos Mainframes, e qual seu estado atual até as máquinas zEnterprise, ou z196. Fundamentaremos os conceitos com Figuras e Textos presentes em Manuais, RedBooks e Palestras da IBM.
  3. O propósito desta Figura acima é dar idéia do quão longe ficava a Memória dos System/360. Trata-se do Modelo 67 de NewCastle, com 64KB.
  4. Nos System/360, a Memória de Núcleos Magnéticos era lenta e longínqua , alimentando os Circuitos do Instruction Fetch, e da Execution Unit, única portadora de ALU, capaz de produzir os resultados, uma Instrução por vez. Este fato caracterizava-os como Máquinas Não Escalares. Pelo fato de trabalharem em série , ou seja, todos os circuitos aguardavam enquanto um dos componentes estava ativo, era baixo o througput. Para reduzir os tempos necessários para se obter Instruções e Operandos, ou guardá-los, na Memória, foi introduzido o conceito de Cache.
  5. Embora os Caches cumprissem sua função, baixando os tempos em que se esperava trazer e levar Operandos para a Memória, enquanto houvesse apenas uma ALU, as máquinas continuariam sendo Não Escalares.
  6. Este artigo do Professor Sima, Diretor do Instituto de Informática Kandó, veicula como: From the companion CD-ROM to the IEEE CS Press book, &amp;quot;The Anatomy of a Microprocessor: A Systems Perspective,&amp;quot; by Shriver &amp; Smith. Esclarece que a qualificação Escalar se aplica a máquinas que executem mais de uma Instrução em Paralelo, mas decodifiquem seqüencialmente. Por outro lado, quando ambas são feitas em paralelo, a máquina é dita Super Escalar. Consideramos que todo Mainframe IBM da zSeries seja Super Escalar.
  7. Acima tipificamos uma Máquina Super Escalar, como por exemplo uma z10 , que execute até 3 Instruções por ciclo (sem dependências e nem Delays devido aos Caches e/ou TLBs) . Notar: 1 – A Adição de Caches de nível 1, separados para Instruções (Read) e Dados (Read&amp;Write) 2 – A existência de várias Instruções e seus Operandos, aguardando Execução em Filas 3 – Circuitos de Tradução de Endereços e suas respectivas Memórias Associativas TLBs e ALB 4 – Tabelas para acelerar Branches, como a BHT – Branch History Table
  8. Anunciado em Jan/68 e entregue em Dez/69, o /360 Modelo 85 trouxe a novidade do Cache podendo ser solicitado em 16KB ou 32KB. Testes iniciais mostraram que, com uma Line Size de 64 bytes, um Cache de apenas 16KB permitiria encontrar nele mais de 80% dos bytes requisitados, e com 32KB, quase 90% , obtendo um grande ganho em “vazão” (de 3,2 até 4,8 vezes mais rápido). Prevalecendo a idéia de Cache, implementou-se novo nível dentro da própria CPU, reduzindo o tempo de busca, bem como dividindo o Cache L1 em Instruções e Dados, com o IF solicitando os Dados antes , para serem usados a seguir, na Execution Unit.
  9. Este BenchMark mostra o efeito dos Caches na Performance do Modelo 85 , comparado ao 65 (sem Cache), para os dois tamanhos possíveis: 16 ou 32 KB. Observar na primeira coluna, o ganho obtido pelo Modelo 75 , também sem Cache, apenas aplicando mais recente e melhor Tecnologia, com menor Cycle Time. Na última coluna aparecem os resultados do Modelo 91 , assunto que trataremos a seguir.
  10. Quantidade de Bytes atualmente colocadas à disposição das PUs: z9: 256KB para cada L1 (IeD), vindos de 40MB z10: 192KB de Caches IeD, mais L1.5 privado de 3MB , vindos de Cache Externo de 48MB z196: 192KB de Caches IeD, mais L2 privado de 1,5MB , mais L3 de 24MB compartilhado com as outras 3 PUs do chip, vindos de Cache Externo de 192MB Conclusão : da z10 a z196, o Cache é 4 vezes maior! Mais de 6 mil vezes, desde o /360- 85 .
  11. Anunciado em Nov/64 e entregue em Out/67, o /360 Modelo 91 trouxe a novidade do Pipeline , permitindo execução simultânea de mais do que uma Instrução. A inclusão de várias Execution Unit, com suas ALUs, tornou possível executar mais do que uma Instrução por vez (processamento Super Escalar), colocando maior demanda na Performance dos Caches. Notar: 8 DoubleWords de PreFetch, mais duas para Execução Alternada, devido a Branches. V er a descrição de “ Imprecise Interrupts” e da Instrução BCR 15,0 no Manual “Functional Characteristics” do System /360 Modelo 91 .
  12. Aqui temos uma comparação das PipeLines do modelo z9 com o z10 (internamente era chamado de z6 , nesta apresentação de Charles Webb, em 2007). Observar que, embora com Ciclo mais rápido, e fazendo mais coisas em Paralelo, o z10 tem mais “Penalty Cycles”. Ver no IBM Systems Journal do z10 , o conceito de FanOut.
  13. Completamos a Figura anterior, que representou o z10 , adicionando: 1 – Cada Cache L 2 alimenta os 4 Books 2 – Todos os Canais também se servem do L 2 3 – O Cache privado L 1.5 4 – Cada chip de PU é quádruplo 5 – Existem 5 chips de PU por MCM, ou Book A Figura já ilustra as adições, ocorridas no System/370 e seguintes , como DAT, TLB em 2 níveis, ALB (AASF) e a B ranch H istory T able, que permitem acelerar decisões.
  14. Comparado à z9 , a Pipeline da z10 é mais “profunda”, o que também pode ser detalhado no Volume do IBM Journal of Research and Development, Vol. 53 No. 1 de 2009 , do qual se recomenda a leitura.
  15. Por volta de Março de 1.997, Charles Webb e John Liptay publicam artigos relatando terem conseguido implementar um Mainframe da Arquitetura ESA/390 em um único chip CMOS, eliminando a necessidade de refrigeração a água. Acima, as aparições destes artigos no IEEE Journal of Solid State Circuits Volume 32 Número 11 e no IBM Journal of Research and Development, Volume 41 Número 4/5.
  16. Apenas para comparação, ilustramos acima o tamanho dos MCM – Multi Chip Modules das primeiras máquinas da Série z, como a z900, com 5 polegadas de lado (13 cm) e 20 PUs. Para ser mais rápido, o MCM da z990 tinha que ser menor, apresentando apenas 3,5 polegadas de lado (96mm), tendo chips de PUs duplos . Não houve muita diferença (95mm) para o MCM das z9, com chips de PU duplos. Nas z10 o chip de PU passa a ser quádruplo , com 5 chips por MCM, podemos ter até 20 PUs. Nas z196, o MCM reduz para apenas 83mm, com 6 chips de PUs quádruplos, 24 PUs por Book.
  17. Apenas por curiosidade, esta Micro Fotografia retrata o chip com uma PU da z900, contendo Caches de Nível 1 de 256KB, tanto para Dados quanto para Instruções. Estas máquinas, até a z990, tinham circuitos duplicados para Decodificação e Execução das Instruções, sendo seu resultado comparado pela R-Unit, por questões de integridade (RAS). Notar circuitos separados para Execução em Ponto Fixo e Ponto Flutuante, permitindo paralelismo.
  18. A Figura acima ilustra as conquistas deste milênio: M ulti C hip M odules do tamanho de um diskette de 3,5 polegadas (95mm), como da z9 sobreposto ao diskette e o da z10 , logo abaixo. Na Micro Fotografia das z10 ao lado, vê-se que dentro do mesmo chip estão abrigadas 4 PUs, mais 2 Co-Processadores: Crypto e Compressão de Dados, mais os Interfaces com Canais (GX) e Cache L2 e Memória Central (MC). Vê-se também a região dedicada ao Instruction Fetch e Branch Prediction, Decodificação, Execução separada para Ponto Fixo, Flutuante (Hexa e Binário) e Decimal, Load &amp; Store Unit, Conversão de Endereços e RAS.
  19. As novas máquinas z196 acrescentaram um Cache L 2 de 1.5MB , intermediário entre os L 1 (Instrução e Dados) e os L 3 , permitindo à PU trabalhar mais tempo in dependente dos circuitos externos e dos L 3 e L 4 . Além da implementação de Execução de até 5 Instruções, incluindo Fora de Ordem (OOO), e mais umas 100 novas Instruções, os equipamentos z196 contam com outras “maravilhas” [como Non Quiesce SSKE e Partial Purge, mais os indicadas com ? na Figura acima] cujo tempo desta Palestra não permite discorrer, mas que aconselhamos seja pesquisado nos Manuais correspondentes.
  20. Esta Micro Fotografia dá conta do existente dentro de cada um dos 2 chips que completam a composição do MCM, tendo 96MB cada um. Lines de 256 bytes destes Caches de nível 4 são também disputadas por todos os Canais, durante as Operações de I/O, via conexão InfiniBand. Além de servirem os 6 chips de PUs do próprio Book, também se comunicam, em estrela, com os demais L4 dos outros 3 Books, caso existam. Notar circuitos para ETR e TOD.
  21. Detalhamento da composição do chip das máquinas z196: Cada PU conta com 64 KB de Cache L1 para Instruções e sua respectiva TLB1I, mais 128 KB de Cache L1 para Dados e sua respectiva TLB1D, mais um Cache L 2 de 1,5 MB. Cada 4 PUs em cada chip, compartilham um Cache L3 de 24 MB. Cada Book possui um Cache L4 de 192 MB, compartilhado por todos os Chips e pelos Canais. Cada CoProcessador tem 2 Caches de 16 KB. Observar a área ocupada pelos Caches! 80%!
  22. Esta Micro Fotografia do RedBook do Power7 , foi colocada aqui apenas a título de comparação e para completar a idéia de Tendência desta Evolução Tecnológica. São 8 PUs no Chip, mais seus respectivos Caches: L1I (32KB), L1D (32KB), L2 (256KB) e L3 (32MB).
  23. Esta Micro Fotografia, da apresentação de Charles Webb, agrupa e identifica os diversos circuitos na PU da z10. Compare-se com a próxima Micro Fotografia, dos circuitos equivalentes da z196, que ganha a ISU – Instruction Sequencing Unit, que habilita a z196 a executar até 5 Instruções por ciclo e também fora de ordem . Notas: Máquinas como a ES-9000 já executavam Instruções fora de ordem, aumentando o throughput, mas este esquema não havia nas máquinas da Série z, reaparecendo agora na z196. Quanto aos Operandos, todas os processam fora de ordem.
  24. Esta bonita Micro Fotografia mostra que: Instruções vêm do Cache L2 para a ICM , no L1I e TLB1I, sob comando da IFB , que também faz Branch Prediction: BHT+PHT+BTB. Daí são decodificadas pela IDU e seqüenciadas pela ISU , sendo então distribuídas para a LSU , que é dupla, para a FXU , também dupla, para a BFU (se Ponto Flutuante Hexadecimal ou Binário) ou para a DU (se Ponto Flutuante Decimal ou Decimal Compactado). Todo Operando necessário é movimentado pela LSU e toda Tradução de Virtual para Real é tratada pela XU , onde estão os circuitos do DAT e a TLB2. A RU garante o RAS.
  25. Observar que a parte de cima é feita “ In Order”, enquanto que a parte de baixo, após a ISU , é feita “ Out Of Order”, se possível. Decidido pela IFB o que “fetchar”, as Instruções migram do Cache L1I para a IDU via buffers, de onde são Decodificadas e entregues à ISU , que detecta dependências e, sendo possível, as entrega a uma das duas LSU , ou uma das duas FXU , ou à BFU ou à DU (além de Ponto Flutuante, estas duas Unidades também se encarregam de Multiplicação e Divisão). Todo Operando é manipulado pela LSU , onde se encontra o Cache L1D, e Traduzido pela XU .
  26. Como o limite desta Tecnologia se aproxima rapidamente , é aconselhável que alguns analistas iniciem uma “Caça ao Desperdício”, para eliminar , ou pelo menos reduzir , todo consumo in desejável (e des necessário!). Alguns Compiladores já oferecem a possibilidade de gerar Código específico para a Arquitetura de uma dada máquina, otimizando a execução deste mesmo Código. Continuam as pesquisas com a SpinTrônica, provavelmente a “nova” Tecnologia a substituir a atual Metodologia para fabricar circuitos.
  27. Acima uma pequena Bibliografia do assunto SpinTrônica. Um dos objetivos desta Palestra foi tentar mostrar que, desde a introdução de PipeLines no final dos anos 60, e a conseqüente proliferação de máquinas Super Escalares, devemos nos abster de imaginar os Mainframes executando apenas uma Instrução por vez (ou por Ciclo, para aquelas que necessitam de apenas um Ciclo), mas o que ocorre é mais parecido com a foto do próximo slide . . . [Quando os vagões do Metrô param, os passageiros que conseguirem embarcar, vão. Não é bem uma fila!]
  28. Encontro das Linhas Azul e Vermelha, na estação de Metrô da Sé, em São Paulo.
  29. Agradecemos a oportunidade, oferecida pelo CMG Brasil, de trazer este assunto e seus Conceitos à consideração dos Profissionais responsáveis pelas disciplinas de Análise de Performance e Planejamento de Capacidade. À disposição para Perguntas e eventuais esclarecimentos adicionais, obrigado. Se desejar maiores detalhes e/ou quiser trocar informações, favor contatar : [email_address]
  30. Violenta redução no número de Instruções geradas pelo Compilador FORTRAN, quando comparadas as Versões G, com H Extended e H Enhanced. Observar que o percentual de ganho obtido depende da Máquina e mais especificamente, do próprio Código gerado, não sendo uniforme.
  31. Observar as grandes diferenças, devidas a diferentes opções e diferentes Bibliotecas de Suporte, bem como aos diversos Parâmetros de Otimzação para o Compilador.
  32. Novamente um comparativo entre 4 Versões do Compilador FORTRAN, observando-se o percentual de redução na quantidade de Instruções geradas. A Mensagem destes números, que não são recentes, é a de que Otimizações são possíveis e na grande maioria das vezes, os resultados são compensadores.