Hpc 1.24.02.2013.

АЛ-31 для СУ-27 Двигатель для «Сухой
«Суперджет»
15 лет 6 лет
50 опытных образцов 8 тестовых образцов
3.5 млрд долларов 600 млн евро

Лишь 5% продукции
производится без моделирования
"Суперкомпьютерные технологии в современном мире
стали стратегической областью, без которой
невозможно дальнейшее развитие.
Мощность национальных суперкомпьютеров сейчас так
же важна, как мощность электростанций или
количество боеголовок."

Современное состояние
отрасли высокопроизводительных
вычислений
Кизько Б. А.,
5085/2, ИИТ, ФГБОУ ВПО СПбГПУ
2013

High-performance computing (HPC)
top500.org

1978 г. - Intel 8086 4.77 Мгц
2004 г. - Intel Pentium 4 3.46 GHz
2005 г. - Intel Pentium 4 3.8 GHz
2005 г. - 2 вычислительных ядра: AMD
Athlon 64 X2, IBM PowerPC 970 и Intel
Pentium D
Центральные процессоры (CPU)

2005 г. - 2 вычислительных ядра
2007 г. - 4 ядра CPU
2010 г. - 6 ядер (12 ядер для серверов)
2011 г. - 8 ядер (16 ядер)
"Мультиядерная эволюция"

1994 г. - MPI 1 (Интерфейс передачи
сообщений)
1997 г. – OpenMP
2010г. – DirectCompute (DirectX 10)
2011 г. - C++11 AMP (MS VS 2012)
C#, Java. 2 вида многозадачности.
Как использовать многоядерность?

N - кол-во процессоров (ядер)
"Если мы можем распараллелить 3/4
всей программы, то максимальный
выигрыш составит 4 раза."
Закон Амдала ( Amdahl Law)
1
(1+P) +
N
P
S =

GPU
General-Purpose Computing
on Graphics Processing Unit

NVIDIA Compute Unified Device
Architecture
ноябрь 2006 г. - первый GPU с DirectX 10,
GeForce 8800 GTX с архитектурой CUDA
• Учѐт требований IEEE к арифметическим
операциям
• Набор команд, ориентированный на
вычисления
• Произвольный доступ к памяти для чтения и
записи
• CUDA Toolkit и CUDA SDK

Architecture
NVIDIA Tesla
Intel Core i5 – 110 Гфлопс – 100 Вт
Core 2 Duo – 19 Гфлопс - 90 Вт
Tesla K20X – 3,95 Тфлопс – 225 Вт

Cray Titan
29 октября 2012
18 688 AMD Opteron (16 ядер в каждом)
18688 Tesla K20X
9 МВт, 404 кв. м
20 петафлопс (1015) – 1 место

Architecture
Язык программирования C с расширениями
Распространѐнность GPU
GeForce 8, 9, 100, 200, 300, 400, 500, 600

NVIDIA CUDA. Применение
Прирост производительности CPU CPU
2 операций MD5:
100 Tesla = 10000 CPU - 2 дня
SHA-1:
Phenom II X4 3.4 GHz vs GF GTX 560 Ti (49152
потока) - 10 раз
Core2 Duo 2.26 GHz vs GF 9300M (8192 потока) -
3 раза
50

Медицицина. TechniScan Svara - УЗИ
35 Гб данных за 15 минут
2 Tesla C1060 - 20 минут
Гидродинамика. Кэмбридж
Моделирование ПАВ. P&G
2 Tesla = Cray XT3 (128 CPU) или IBM BlueGene/L
(1024 CPU)
Геология, финансы, криптография...

Наличие оптимизированных версий библиотек
FFT и BLAS, SPARSE, RAND, NPP...
Поддержка готовым ПО (MAGMA, Video
Encoder, Adobe Photoshop, Folding@Home,
Seti@Home, CoreAVC, Cyberlink Power Director,
...

Open Compute Language
Khronos Group: AMD, Intel, Motorola, Apple,
NVIDIA, IBM, ARM
2008 г. - OpenCL 1.0
1 декабря 2012 г. - OpenCL 1.2
C99 с новыми ключевыми словами
Открытый стандарт
Широкая поддержка оборудования
Прирост в WinZip 16.5 на AMD APU - 45%

HSA Foundation
AMD, ARM, Samsung, Texas
Instruments, Qualcomm, MediaTek, Imagination
Technologies

Intel
Larrabee -> Xeon Phi
Архитектура x86
Много ядер Pentium в одном чипе с общей памятью

Взаимодействие NVIDIA с ВУЗами
269 университетов мира
СПбГПУ, СПбГУ, "Дубна", ОИЯИ,
МИЭТ, МГТУ им. Баумана, МАИ,
"Курчатовский институт",
МГУ им. Ломоносова, ...
декабрь 2009 - научно-образовательный центр
"Параллельные вычисления", Дубна

Список источников
1. Сайты HSA Foundation, NVIDIA, AMD,
Khronos Group
2. thg.ru - подробный обзор Intel Xeon Phi
3. Wikipedia
4. Статьи с habrahabr.ru
5. Сайт научно-образовательного центра
"Параллельные вычисления"
http://www.parallel-compute.ru/
6. opencl.org
7. gpgpu.org
8. Результаты НИР на 3-4 курсах. Научный
руководитель - Семьянов П. В.

Благодарю за
внимание!

Hpc 1.24.02.2013.

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (19)

Destaque

Destaque (12)

Semelhante a Hpc 1.24.02.2013.

Semelhante a Hpc 1.24.02.2013. (20)

Mais de Boris Kizko

Mais de Boris Kizko (8)

Hpc 1.24.02.2013.