Este documento descreve uma implementação híbrida e paralela da Transformada Rápida de Fourier (FFT) no supercomputador Cray XD1, que combina processamento em CPU e FPGA. A abordagem é dividida entre software em C e hardware em VHDL, com diferentes tamanhos de entrada sendo processados em cada componente. Os resultados mostram um ganho de desempenho para certos tamanhos de entrada. Trabalhos futuros incluem melhorias no pipeline e uso de radix-4.