TCC Apresentacao Final

1.340 visualizações

Publicada em

Apresentação final do meu TCC

Complete work and more information here: http://arthurgregorio.eti.br/blog/78-programacao/87-faculdade-tcc-e-o-cuda

Publicada em: Tecnologia
0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
1.340
No SlideShare
0
A partir de incorporações
0
Número de incorporações
2
Ações
Compartilhamentos
0
Downloads
27
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

TCC Apresentacao Final

  1. 1. GPU COMPUTING VS. CPU MULTINUCLEAR: ANÁLISE DE DESEMPENHO PARA PROCESSAMENTO DE ILUMINAÇÃO POR RAY TRACING EM MODELOS TRIDIMENSIONAIS Arthur Pereira Gregório Rodigo Zanatta Rodriguez Centro de Ensino Superior de Foz do Iguaçu Ciência da Computação - Trabalho de Curso II
  2. 2. ROTEIRO <ul><li>Objetivo Geral </li></ul><ul><li>Descrição do Ambiente Experimental </li></ul><ul><li>Implementação </li></ul><ul><li>Análise dos Resultados </li></ul><ul><li>Considerações Finais </li></ul><ul><li>Trabalhos Futuros </li></ul><ul><li>Principais Bibliografias </li></ul>
  3. 3. OBJETIVO GERAL <ul><li>Apresentar um comparativo de desempenho que possa indicar a viabilidade do uso de sistemas GPGPU em relação ao um sistema composto apenas por uma CPU multinuclear para renderização de objetos tridimensionais iluminados por Ray Tracing . </li></ul>
  4. 4. AMBIENTE EXPERIMENTAL <ul><li>Estrutura de Hardware: </li></ul><ul><ul><li>Processador Intel Core i5 2500K </li></ul></ul><ul><ul><ul><li>3.3Ghz, 6MB Cache L3, 4 cores e 4 threads </li></ul></ul></ul><ul><ul><li>Placa mãe AsRock P67 Extreme6 </li></ul></ul><ul><ul><li>Memórias Corsair Vengeance </li></ul></ul><ul><ul><ul><li>DDR-3, 2 x 4GB, 1866Mhz </li></ul></ul></ul><ul><ul><li>Placa de vídeo Zotac GeForce GTX 580 </li></ul></ul><ul><ul><ul><li>772Mhz, 512 CUDA Cores, 1536GB GDDR-5 </li></ul></ul></ul>VS.
  5. 5. AMBIENTE EXPERIMENTAL <ul><li>Estrutura de Software: </li></ul><ul><ul><li>Ubuntu 10.04.3 LTS x64 </li></ul></ul><ul><ul><li>CUDA Toolkit 3.2 x64 </li></ul></ul><ul><ul><li>Intel® Threading Building Blocks 4.0 </li></ul></ul><ul><ul><li>Renderer C++ versão 2.2s </li></ul></ul><ul><ul><li>Renderer Cuda versão 2.2h </li></ul></ul><ul><ul><li>Compilador GNU GCC/G++ versão 4.4.3 </li></ul></ul>
  6. 6. IMPLEMENTAÇÃO <ul><li>Os testes foram baseados em dois modos de renderização presentes na renderer : </li></ul><ul><ul><li>Modo 0 : renderização do modelo tridimensional, iluminação por ray tracing e suavização das bordas da imagem com o uso de anti-aliasing morfológico (MLAA) </li></ul></ul><ul><ul><li>Modo 9 : renderização do modelo tridimensional, iluminação por ray tracing sem suavização de bordas na imagem </li></ul></ul><ul><li>Em ambos os casos foram utilizados 60 quadros para a medição do desempenho </li></ul>
  7. 7. IMPLEMENTAÇÃO <ul><li>Os modelos utilizados possuem três níveis de complexidade: </li></ul>
  8. 8. IMPLEMENTAÇÃO <ul><li>Baixa Complexidade: Chessboard, 46658 triângulos e 32488 vértices </li></ul>
  9. 9. IMPLEMENTAÇÃO <ul><li>Média Complexidade: Dodge Challenger 2007, 1067082 triângulos e 355694 vértices </li></ul>
  10. 10. IMPLEMENTAÇÃO <ul><li>Alta Complexidade: Happy, 543652 triângulos e 1087716 vértices </li></ul>
  11. 11. RESULTADOS <ul><li>Modelo de baixa complexidade, tempo de renderização: </li></ul>
  12. 12. RESULTADOS <ul><li>Modelo de baixa complexidade, quadros pro segundo: </li></ul>
  13. 13. RESULTADOS <ul><li>Modelo de média complexidade, tempo de renderização: </li></ul>
  14. 14. RESULTADOS <ul><li>Modelo de média complexidade, quantidade de quadros pro segundo: </li></ul>
  15. 15. RESULTADOS <ul><li>Modelo de alta complexidade, tempo de renderização: </li></ul>
  16. 16. RESULTADOS <ul><li>Modelo de alta complexidade, quantidade de quadros pro segundo: </li></ul>
  17. 17. CONSIDERAÇÕES FINAIS <ul><li>Durante os testes com os modelos de baixa e média complexidade o CUDA foi em média 1800% mais rápido que a CPU multinuclear; </li></ul><ul><li>O teste com o modelo de alta complexidade não pode ser completado na plataforma GPGPU devido a uma limitação do tempo de execução para o CUDA em GPU’s compartilhadas com o ambiente gráfico do sistema; </li></ul><ul><li>Em ambientes de produção o uso de uma placa dedicada para aplicativos escritos utilizando a API CUDA é essencial para evitar problemas e obter o máximo de desempenho. </li></ul>
  18. 18. TRABALHOS FUTUROS <ul><li>Criar um novo estudo de caso utilizando uma placa específica para execução de aplicativos que utilizem a API CUDA para paralelismo possivelmente obtendo melhores resultados. </li></ul>
  19. 19. PRINCIPAIS BIBLIOGRAFIAS <ul><li>CORPORATION nVidia. NVIDIA CUDA C Program-ming Guide v3.2. nVidia Corporation, 2010. Disponível em: < http:// developer.download.nvidia.com/compute/cuda/3_2/toolkit/docs/CUDA_C_Programming_Guide.pdf > Acesso em: 20/10/2011. </li></ul><ul><li>DAVID B. KIRK, W.-M. W. H. Programando para Processadores Paralelos, Uma Abordagem Prática à Programação de GPU. Rio de Janeiro: Campus / Elsevier, 2010. </li></ul><ul><li>IKEDA, P. A. Um Estudo do uso Eficiente de Programas em Placas Gráficas. 2011. Disponível em: < http :// gpubrasil.files.wordpress.com/2011/09/dissertacao-versao-entregue.pdf >. Acesso em: 18/10/2011. </li></ul>
  20. 20. PRINCIPAIS BIBLIOGRAFIAS <ul><li>TSIODRAS, D.-I. T. A realtime 3D renderer in OpenMP/TBB. 2010. Disponível em: < http:// users.softlab.ece.ntua.gr/ttsiod/renderer.html >. Acesso em: 07/10/2011. </li></ul><ul><li>TSIODRAS, D.-I. T. A realtime raytracer of triangle meshes in CUDA. 2011. Disponível em: < http:// users.softlab.ece.ntua.gr/ttsiod/cudarendererBVH.html >. Acesso em: 07/10/2011. </li></ul><ul><li>TANENBAUM, A. S. Organizacão Estruturada de Computadores. [S.l.]: Prentice-Hall, 2006. </li></ul>

×