NAS Parallel benchmark Нижегородский государственный университет им. Н.И.Лобачевского Факультет Вычислительной математики и кибернетики 2011.

Презентация:



Advertisements
Похожие презентации
Нижегородский государственный университет им. Н.И.Лобачевского Факультет Вычислительной математики и кибернетики Применение технологии Cilk для решения.
Advertisements

Интернет Университет Суперкомпьютерных технологий Якобовский Михаил Владимирович проф., д.ф.-м.н. Институт прикладной математики им. М.В.Келдыша РАН, Москва.
Интернет Университет Суперкомпьютерных технологий Якобовский Михаил Владимирович проф., д.ф.-м.н. Институт прикладной математики им. М.В.Келдыша РАН, Москва.
Интернет Университет Суперкомпьютерных технологий Лекция 3 Методы построения параллельных программ (продолжение) Учебный курс Введение в параллельные алгоритмы.
Fortan OpenMP/DVM - язык параллельного программирования для кластеров В.А. Бахтин, Н.А. Коновалов, В.А. Крюков, Н.В. Поддерюгина Институт прикладной математики.
Сравнение различных способов декомпозиции сеточной области при численном решении уравнения переноса Е.А. Данилкин, А.В. Старченко Томский государственный.
Интернет Университет Суперкомпьютерных технологий Учебный курс Основы параллельных вычислений Гергель В.П., профессор, д.т.н. Нижегородский университет.
1 МФТИ Потери производительности Параллельные алгоритмы Якобовский Михаил Владимирович д.ф.-м.н. Институт математического моделирования РАН, Москва.
Численные методы линейной алгебры. Методы решений нелинейных уравнений и систем. Лекция 3:
Интернет Университет Суперкомпьютерных технологий Лекция 4 Методы построения параллельных программ (продолжение) Учебный курс Введение в параллельные алгоритмы.
Интернет Университет Суперкомпьютерных технологий Анализ сложности вычислений и оценка возможности распараллеливания Учебный курс Основы параллельных вычислений.
Интернет Университет Суперкомпьютерных технологий Лекция 3 Методы построения параллельных программ Учебный курс Введение в параллельные алгоритмы Якобовский.
Учебный курс Основы вычислительной математики Лекция 1 доктор физико-математических наук, профессор Лобанов Алексей Иванович.
Интернет Университет Суперкомпьютерных технологий Лекция 3 Методы построения параллельных программ (продолжение) Учебный курс Введение в параллельные алгоритмы.
1 Параллельное программирование Минакова Е.О. Студентка 6 курса ОНУ им.И.И.Мечникова.
1 Исследование алгоритмов решения задачи k коммивояжеров Научный руководитель, проф., д.т.н. Исполнитель, аспирант Ю.Л. Костюк М.С. Пожидаев Томский государственный.
Распараллеливание построения среднеквадратических приближений сплайнами восьмого порядка аппроксимации Полуянов С.В.
Мультипроцессорные компьютеры с производительностью до 100х10 9 операций с плавающей точкой в секунду Научно-исследовательский центр электронной вычислительной.
Принципы разработки параллельных алгоритмов. Введение Для определения эффективных способов организации параллельных вычислений необходимо: Выполнить анализ.
Качество знаний, успеваемость и СОУ за I полугодие учебный год.
Транксрипт:

NAS Parallel benchmark Нижегородский государственный университет им. Н.И.Лобачевского Факультет Вычислительной математики и кибернетики 2011

NBP – это… NAS Parellel Benchmark(NBP) – набор тестов производительности нацеленных на проверку возможностей высокопараллельных суперкомпьютеров.

Немного истории Сравнительно молодой бенчмарк Разрабатывался в центре NASA Является «paper and pencil» тестом Также имеет готовая реализация Реализация использует технологии OpenMP/MPI Актуальная версия 3.3

Состав NBP Ядра Embarrassing Parallel (EP) MultiGrid (MG) Integer Sort (IS) Conjugate Gradient (CG) Fast Fourier Transform (FT) Псевдо-приложения Block Tridiagonal (BT) Scalar Pentadiagonal (SP) Lower-Upper разложение (LU)

ТестКласс AКласс BКласс CКласс D EP MG CG x x10 6 FT256 2 x x x2048 IS LU SP BT Решаемые задачи разделены на 6 классов

Тест EP Embarrassingly Parallel Чрезвычайно параллельный Генерация независимых нормально распределенных случайных величин Основывается на методе Марсальи-Брея Оценивает максимальную производительность кластера при операциях с плавающей точкой Минимальные межпроцессорные взаимодействия

Тест EP - результаты Intel Core i5 4Gb ABCD 2 процессора N/A 4 процессора N/A 200 кластер

Тест IS Integer Sort – сортировка малых целых чисел Основан на блочной сортировке Играет сильное значение начальное распределение в памяти Оценивает работу с общей памятью

Тест FT Решение 3-хмерного уравнения в частных производных при помощи БПФ Используется прямое и обратное БПФ Включает большое количество действий, оказывающих большую нагрузку на сеть Оценивает скорость перемещения массивов данных

Тест FT - результаты Intel Core i5 4Gb ABCD 4 процессора N/A 128 кластер

Тест CG Решение неупорядоченной, разряженной СЛАУ методом сопряженных градиентов Метод сопряженных градиентов используется для нахождения приближенного значения наименьшего собственного числа матрицы Тест применяется для оценки скорости передачи данных при отсутствии какой-либо регулярности

Тест CG - результаты Intel Core i5 4Gb ABCDE 2 процессора N/A 4 процессора N/A 128 кластер

Тест MG Приближенное решение уравнения Пуассона Размер сетки N определяется классом теста Оценивает скорость передачи, как длинных, так и коротких данных

Тест MG - результаты Intel Core i5 4Gb ABCD 2 процессора N/A 4 процессора N/A 128 кластер

Псевдо-приложения Решение системы нелинейных дифференциальных уравнений в частных производных Lower-Upper symmetric Gauss-Seidel (LU) Block Triagonal (BT) Scalar Pentadiagonal (SP)

Тест BT Решение серии независимых систем уравнений (блочные трехдиагональные матрицы 5х5 с преобладанием недиагональных элементов) Эффективность с точки зрения общего потребления простых арифметических операций Работает с плотными матрицами Есть подтип данного теста с большой интенсивностью ввода-вывода

Тест BT - результаты Intel Core i5 4Gb ABCD 4 процессора N/A 64 кластер

Тест SP Решение нескольких независимых систем скалярных уравнений (пентадиагональные матрицы с преобладанием недиагональных членов) Работает с плотными матрицами Мильтираcпределение данных для полного параллелизма Метод хорошо распараллеливается и обеспечивает оптимальную загрузку сети

Тест SP - результаты Intel Core i5 4Gb ABCD 4 процессора N/A 64 кластер

Тест LU Решает систему уравнений с равномерной разряженной блочной структурой методом симметричной последовательной верхней сверхрелаксации Используются трехмерные уравнения Навье-Стокса Тест критичен ко времени передачи очень маленьких объемов данных между узлами

Тест LU - результаты Intel Core i5 4Gb ABCD 4 процессора N/A 64 кластер

Заключение Проведенные тесты показали, что кластер полностью использует свой потенциал Время выполнения тестов масштабируется как и ожидается, неожиданных скачков или падений времени выполнения тестов в какой-то определенной области не наблюдается Это говорит о том что кластер хорошо настроен и вычисления хорошо распределены

Список литературы Курс на Intuit.ru: Статья на Wikipedia: Официальный сайт NASA:

Спасибо за внимание