Este artigo apresenta uma introdução à programação em CUDA, uma plataforma que permite utilizar as GPUs da NVIDIA para computação paralela e científica. Explica como o CUDA aproveita os milhares de núcleos das GPUs para executar aplicações de forma massivamente paralela através da utilização de threads. Descreve um exemplo simples de soma de vetores para ilustrar como o CUDA consegue calcular operações em paralelo de forma muito mais rápida do que nas CPUs.