Параллельные вычисления на ЦИВК ОИЯИ Э.Б. Душанов, Х.Т. Холмуродов, В.В. Кореньков Лаборатория информационных технологий ОИЯИ Лаборатория радиационной.

Презентация:



Advertisements
Похожие презентации
Решения компании «Т-Платформы» для высокопроизводительных вычислений: взаимовыгодное сотрудничество отечественной науки и бизнеса.
Advertisements

Влияние межпроцессорных связей на эффективность параллельных вычислений Г.Адам 1,2, С.Адам 1,2, А.Айриян 1, Э.Айрян 1, Э.Душанов 1, В.Кореньков 1, А.Луценко.
Суперкомпьютер «УРАН» Андрей Созыкин Заведующий сектором суперкомпьютерных технологии ИММ УрО РАН Заведующий кафедрой высокопроизводительных.
М.Л. Цымблер, Л.Б. Соколинский Южно-Уральский государственный университет (Челябинск) Организация систем хранения данных на базе вычислительных кластеров.
Параллельные вычисления Лекция 6. y = 3x + 7x – 8x при x = 4 y1 = 3x(1 действие) y2 = 7x(2 действие) y3 = 8x(3 действие) y = y1 + y2 – y3(4 действие)
Санкт-Петербургский Государственный Политехнический Университет Развитие высокопроизводительных вычислительных ресурсов вуза 21 ноября 2011 В.С. Синепол.
Схема экспериментальной сети T-Grid Института программных систем РАН Cуперкомпьютер Первенец-М (пиковая производительность 98 GFlops) - 16 узлов ( 2 x.
Московский государственный университет им.М.В.Ломоносова Институт вычислительной математики РАН Воеводин В.В., Воеводин Вл.В. СУПЕРВЫЧИСЛЕНИЯ:
Исследование эффективности параллельного алгоритма Монте-Карло моделирования внутренних свободномолекулярных течений Хохлов И.А. 4-й курс Московский физико-технический.
Основы параллельного программирования Посыпкин Михаил Анатольевич.
Компания «Т-Платформы» Является ведущим российским разработчиком кластерных решений Поставляет высокопроизводительные решения для любых отраслей народного.
Программная система для изучения и исследования параллельных методов решения сложных вычислительных задач Нижегородский государственный университет им.
Об организации подготовки по параллельному программированию в Уфимском государственном авиационном техническом университете Р.К. Газизов УГАТУ, кафедра.
? Биатлон для СКИФов: быстро и точно С.М. Абрамов, А.И. Адамович, М.Р. Коваленко, В.А. Роганов Институт программных систем Российской академии наук
Перспективные информационно-сетевые технологии в космических исследованиях Институт космических исследований РАН, Телекоммуникационные сети и системы Москва,
ОБЩИЕ ПРИНЦИПЫ ДЕЯТЕЛЬНОСТИ НИЖЕГОРОДСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА ПО РАЗВИТИЮ РАБОТ В ОБЛАСТИ ПАРАЛЛЕЛЬНЫХ ВЫЧИСЛЕНИЙ Высокопроизводительные вычислительные.
Суперкомпьютеры и их применение. Суперкомпьютер Суперкомпьютер (с англ. «Supercomputer», СверхЭВМ, СуперЭВМ, сверхвычислитель) специализированная вычислительная.
Компьютерные кластеры. Автор: Капля Алексей Владимирович alex
Суперкомпьютерное образование ВЫСОКОПРОИЗВОДИТЕЛЬНЫЕ ВЫЧИСЛЕНИЯ В НАУКЕ И ОБРАЗОВАНИИ Вл.В.Воеводин, А.В.Тихонравов 25 марта 2009 г.
Суперкомпьютерный комплекс НИВЦ МГУ и перспективы его развития 12 ноября 2008 г. А.В.Тихонравов, Вл.В.Воеводин.
Транксрипт:

Параллельные вычисления на ЦИВК ОИЯИ Э.Б. Душанов, Х.Т. Холмуродов, В.В. Кореньков Лаборатория информационных технологий ОИЯИ Лаборатория радиационной биологии ОИЯИ

Суперкомпьютер ЦИВК ОИЯИ В Лаборатории Информационных технологий Объединённого института ядерных исследований был создан и быстро развивается Центральный информационно-вычислительный комплекс (ЦИВК) ОИЯИ, являющийся частью создаваемой российской GRID- инфраструктуры. В 2007 году ОИЯИ приобрёл новый суперкомпьютерный кластер, который был установлен и запущен в ЦИВК и используется, в основном, для задач моделирования и анализа данных в области физики частиц, ядерной физики и физики конденсированных сред экспериментов LHC (CERN), а также других экспериментов с участием ОИЯИ 1. 1 Выч. & инф. ресурсы, ЦИВК,

Суперкомпьютер ЦИВК ОИЯИ Суперкомпьютер ЦИВК представляет собой кластер из 3 стоек, в каждой стойке 20 узлов («компьютеров»), состоящих из двух двуядерных процессоров. Производители: одна стойка от HP ( ), две от «Т-платформы» ( ) блок с 20 прцессорами от SuperMicro ( Кластер IIКластер I

Данные кластеров Процессор Тактовая частота процессора Кэш-память второго уровня (на каждом процессоре) Ядер в процессоре Процессоров на узле Объем памяти на узле Узлов в кластере Общее количество процессоров Общее количество ядер Суммарный объем ОП Операционная система Теоретическая производительность Сеть MPI Intel 2xXeon MHz 4 MB 2 8 GB GB Scientific Linux GFlops Gigabit Ethernet Version Intel Xeon MHz 4 MB GB GB Scientific Linux GFlops GE, InfiniBand OpenMPI Кластер IКластер II

High-Performance Linpack benchmark представляет собой решение системы линейных уравнений методом LU-разложения с известным количеством арифметических операций и вычисление времени выполнения этой задачи. Производительность вычисляется по формуле: где N OP – количество арифметических операций, а T - время решения СЛАУ. Количество операций при этом: где N – порядок решаемой СЛАУ 1. HPL на сегодняшний день является самым популярным и признанным тестом производительности параллельных систем, по результатам которого составляются престижные TOP500 – список пятисот наиболее производительных систем в мире и TOP50 – пятьдесят наиболее производительных систем в пределах стран СНГ. High-Performance Linpack benchmark 1 Воеводин В.В., Воеводин Вл.В., Паралельные вычисления.- СПб.: БХВ-Петербург, 2002

Результаты тестирования (кл. I) Достигнутая нами максимальная производительность на тесте HPL составила 1124 GFlops, что примерно в два раза меньше (~50%) пиковой производительности GFlops

Результаты тестирования (кл.II) Достигнутая нами максимальная производительность на тесте HPL составила 687 GFlops, что примерно в 1,4 раза меньше (~ 70%) пиковой производительности 960 GFlops

МД моделирования с помощью ЦИВК Современное состояние компьютерных молекулярных исследований представляет собой методы молекулярного моделирования и квантовой химии или гибрида этих двух методов, открывающих новые возможности. Методы молекулярного моделирования больших систем (обычная или гибридная молекулярная динамика (МД), Монте-Карло, ab initio и т.д, получили интенсивное развитие в течение последних 5-10 лет. С созданием новых параллельно/векторных суперкомпьютеров и специализированных вычислительных кластеров методы молекулярного моделирования становятся реальным инструментом изучения в биоинженерии, нанотехнологии и материаловедении. Они позволяют исследовать детальную картину процессов на атомно-молекулярном масштабе и выявлять технологически интересные явления с большой долей вероятности, производя вычисления над системами от сотен тысяч до миллиарда частиц. Молекулярное моделирование служит практическим инструментом в разработке новых материалов и в дизайне новых лекарств.

Исследование производительности DL_POLY Проведен сравнительный анализ производительности пакета многоцелевого использования для молекулярно-динамических моделирований DL_POLY 1 на вычислительном кластере ЦИВК ЛИТ ОИЯИ для различных сетевых систем. Сравнения кодов DL_POLY проводились для двух видов кластерных архитектур, на основе Gigabit Ethernet и InfiniBand технологий. Код DL_POLY представляет собой программный пакет многоцелевого назначения для МД расчетов; его авторами являются У. Смит, Т.Р. Форестор и И.Т. Тодоров из Лаборатории Даресбари, Англия. Оригинальный пакет DL_POLY разработан группой молекулярного моделирования в Лаборатории Даресбари при поддержке Исследовательского совета инженерных и физических наук для моделирования конденсированных фаз (проект CCP5). При расчетах мы использовали версии 2.17 и 3.07 кода DL_POLY. Тесты на производительность DL_POLY включают в себя типичные системы (benchmarks), которые широко используются при МД моделировании на DL_POLY. 1 Todorov, I.T. et al. DL_POLY_3: new dimensions in molecular dynamics simulations via massive parallelism, J. Mater. Chem., 2006, V.16, p.1911.

DL_POLY Benchmarks Указанными системами для DL_POLY_2.17 были: Benchmark 3: Моделирование Валиномицина (valinomycin) в среде с 1223 молекулами воды (общее число атомов , 100 шагов по времени); Benchmark 5: Динамическая оболочечная модель - структуры MgCl2 (768 атомов, 1280 сайтов, число шагов по времени -1000); Benchmark 9: Моделирование мембраны с двумя цепочками, 202 и 2746 молекул раствора и растворителя, соответственно (число атомов атомов, число шагов ). Для DL_POLY_3.07: Benchmark 1: Моделирование системы NaCl с суммированием по Эвальду (27000 ионов); Benchmark 2: Моделирование NaCl с суммированием по Эвальду ( ионов); Benchmark 4: DMPC молекулы в водном окружении ( атомов).

Исследование производительности Кластер I Кластер II Работа с сетью Gigabit Ethernet. На рис. приведены результаты вычисления для DL_POLY_3.07 кода на кластерах I и II, соответственно. Показано, что эффективность DL_POLY_3.07 в кластере II становится линейным с ростом количества процессоров. Кластер I Кластер II

Исследование производительности Кластер I Кластер II Работа с сетью InfiniBand. На рис. представлены результаты вычислений для DL_POLY_2.17 и DL_POLY_3.07 кодов на кластере II с сетью типа InfiniBand. Показано, что эффективность кодов становится линейным для 32 процессоров. DL_POLY_2.17 DL_POLY_3.07

Заключение Достигнутая, по результатам тестирования, максимальная производительность позволила суперкомпьютерному кластеру ЦИВК ОИЯИ занять 12 место в TOP50 – в рейтинге самых производительных суперкомпьютеров СНГ. Эксперимент показал эффективность кластера для параллельных вычислений и хорошую производительность работы библиотеки линейной алгебры. Коммуникационная сеть типа InfiniBand представляет собой наиболее оптимальное решение для проведения эффективных МД расчетов. Данная оценка поддерживается на базе вычислений с обеими версиями кода DL_POLY. Время вычисления МД с Gigabit Ethernet в зависимости от числа процессоров варьируется: линейная зависимость не обнаруживается.

Спасибо за внимание!!!