1. АЛ-31 для СУ-27 Двигатель для «Сухой
«Суперджет»
15 лет 6 лет
50 опытных образцов 8 тестовых образцов
3.5 млрд долларов 600 млн евро
2. Лишь 5% продукции
производится без моделирования
"Суперкомпьютерные технологии в современном мире
стали стратегической областью, без которой
невозможно дальнейшее развитие.
Мощность национальных суперкомпьютеров сейчас так
же важна, как мощность электростанций или
количество боеголовок."
5. 1978 г. - Intel 8086 4.77 Мгц
2004 г. - Intel Pentium 4 3.46 GHz
2005 г. - Intel Pentium 4 3.8 GHz
2005 г. - 2 вычислительных ядра: AMD
Athlon 64 X2, IBM PowerPC 970 и Intel
Pentium D
Центральные процессоры (CPU)
6. 2005 г. - 2 вычислительных ядра
2007 г. - 4 ядра CPU
2010 г. - 6 ядер (12 ядер для серверов)
2011 г. - 8 ядер (16 ядер)
"Мультиядерная эволюция"
7. 1994 г. - MPI 1 (Интерфейс передачи
сообщений)
1997 г. – OpenMP
2010г. – DirectCompute (DirectX 10)
2011 г. - C++11 AMP (MS VS 2012)
C#, Java. 2 вида многозадачности.
Как использовать многоядерность?
8. N - кол-во процессоров (ядер)
"Если мы можем распараллелить 3/4
всей программы, то максимальный
выигрыш составит 4 раза."
Закон Амдала ( Amdahl Law)
1
(1+P) +
N
P
S =
11. NVIDIA Compute Unified Device
Architecture
ноябрь 2006 г. - первый GPU с DirectX 10,
GeForce 8800 GTX с архитектурой CUDA
• Учѐт требований IEEE к арифметическим
операциям
• Набор команд, ориентированный на
вычисления
• Произвольный доступ к памяти для чтения и
записи
• CUDA Toolkit и CUDA SDK
13. Cray Titan
29 октября 2012
18 688 AMD Opteron (16 ядер в каждом)
18688 Tesla K20X
9 МВт, 404 кв. м
20 петафлопс (1015) – 1 место
14. NVIDIA Compute Unified Device
Architecture
Язык программирования C с расширениями
Распространѐнность GPU
GeForce 8, 9, 100, 200, 300, 400, 500, 600
15. NVIDIA CUDA. Применение
Прирост производительности CPU CPU
2 операций MD5:
100 Tesla = 10000 CPU - 2 дня
SHA-1:
Phenom II X4 3.4 GHz vs GF GTX 560 Ti (49152
потока) - 10 раз
Core2 Duo 2.26 GHz vs GF 9300M (8192 потока) -
3 раза
50
16. NVIDIA CUDA. Применение
Медицицина. TechniScan Svara - УЗИ
35 Гб данных за 15 минут
2 Tesla C1060 - 20 минут
Гидродинамика. Кэмбридж
Моделирование ПАВ. P&G
2 Tesla = Cray XT3 (128 CPU) или IBM BlueGene/L
(1024 CPU)
Геология, финансы, криптография...
17. NVIDIA CUDA. Применение
Наличие оптимизированных версий библиотек
FFT и BLAS, SPARSE, RAND, NPP...
Поддержка готовым ПО (MAGMA, Video
Encoder, Adobe Photoshop, Folding@Home,
Seti@Home, CoreAVC, Cyberlink Power Director,
...
18. Open Compute Language
Khronos Group: AMD, Intel, Motorola, Apple,
NVIDIA, IBM, ARM
2008 г. - OpenCL 1.0
1 декабря 2012 г. - OpenCL 1.2
C99 с новыми ключевыми словами
Открытый стандарт
Широкая поддержка оборудования
Прирост в WinZip 16.5 на AMD APU - 45%
20. Intel
Larrabee -> Xeon Phi
Архитектура x86
Много ядер Pentium в одном чипе с общей памятью
21. Взаимодействие NVIDIA с ВУЗами
269 университетов мира
СПбГПУ, СПбГУ, "Дубна", ОИЯИ,
МИЭТ, МГТУ им. Баумана, МАИ,
"Курчатовский институт",
МГУ им. Ломоносова, ...
декабрь 2009 - научно-образовательный центр
"Параллельные вычисления", Дубна
22. Список источников
1. Сайты HSA Foundation, NVIDIA, AMD,
Khronos Group
2. thg.ru - подробный обзор Intel Xeon Phi
3. Wikipedia
4. Статьи с habrahabr.ru
5. Сайт научно-образовательного центра
"Параллельные вычисления"
http://www.parallel-compute.ru/
6. opencl.org
7. gpgpu.org
8. Результаты НИР на 3-4 курсах. Научный
руководитель - Семьянов П. В.