Д. Н. Микушин В. М. Степаненко Параллельные Вычислительные Технологии ПАВТ-2009 МГУ им. М.В. Ломоносова Научно- исследовательский Вычислительный Центр.

Презентация:



Advertisements
Похожие презентации
МГУ им. М.В. Ломоносова Научно-исследовательский Вычислительный Центр ©NASA Earth Observatory.
Advertisements

Реализация мезомасштабной атмосферной модели на вычислительных системах с распределенной памятью В. М. Степаненко Всероссийская научная конференция «Научный.

Типовые расчёты Растворы
Тема 11 Медицинская помощь и лечение (схема 1). Тема 11 Медицинская помощь и лечение (схема 2)

Тренировочное тестирование-2008 Ответы к заданиям КИМ Часть I.
Интернет Университет Суперкомпьютерных технологий Якобовский Михаил Владимирович проф., д.ф.-м.н. Институт прикладной математики им. М.В.Келдыша РАН, Москва.
Маршрутный лист «Числа до 100» ? ? ?
Интернет Университет Суперкомпьютерных технологий Лекция 1 Основные понятия Учебный курс Введение в параллельные алгоритмы Якобовский М.В., д.ф.-м.н. Институт.
Интернет Университет Суперкомпьютерных технологий Якобовский Михаил Владимирович проф., д.ф.-м.н. Институт прикладной математики им. М.В.Келдыша РАН, Москва.
ЗРИТЕЛЬНЫЕ ИЛЛЮЗИИ ОПТИЧЕСКИЕ ОБМАНЫ 1. Зрительная иллюзия – не соответствующее действительности представление видимого явления или предмета из-за особенностей.
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ УПРАВЛЕНИЯ Обработка и хранение информации.
О СИТУАЦИИ НА РЫНКЕ ТРУДА И РЕАЛИЗАЦИИ РЕГИОНАЛЬНЫХ ПРОГРАММ ПО СНИЖЕНИЮ НАПРЯЖЕННОСТИ НА РЫНКЕ ТРУДА СУБЪЕКТОВ СЕВЕРО-КАВКАЗСКОГО ФЕДЕРАЛЬНОГО ОКРУГА.
Департамент экономического развития Ханты-Мансийского автономного округа - Югры 1.
Автор: учитель информатики МКОУ Плесской средней общеобразовательной школы Юдин Андрей Борисович Часть 1.
ИД «Первое сентября». Журнал «Физика» 2/ Роза ветров 9 ИД «Первое сентября». Журнал «Физика» 2/2014.
Тема: ФОРМУЛЫ КОРНЕЙ КВАДРАТНЫХ УРАВНЕНИЙ Цели: повторить алгоритм решения полных квадратных уравнений, понятие и смысл дискриминанта; показать правила.
Каратанова Марина Николаевна МОУ СОШ 256 г.Фокино.
Школьная форма Презентация для родительского собрания.
Транксрипт:

Д. Н. Микушин В. М. Степаненко Параллельные Вычислительные Технологии ПАВТ-2009 МГУ им. М.В. Ломоносова Научно- исследовательский Вычислительный Центр

Параллельные Вычислительные Технологии ПАВТ Региональная атмосферная модель и её приложения 2. Компоненты модели, профилирование 3.MPI-реализация 1. Явные схемы уравнений динамики, термодинамики и радиации: локальность вычислений 2. Решение эллиптического уравнения: транспонирование расчётной области 4.Cell-реализация 1. Одномерные циклы, шаблоны памяти 2. Вычисление правой части для эллиптического уравнения 3. Явная схема для уравнения переноса 5. Перспективы развития

Параллельные Вычислительные Технологии ПАВТ-2009 Обтекание воздушным потоком горного рельефа (Miranda and James, 1992)

Параллельные Вычислительные Технологии ПАВТ-2009 Виды бризовых циркуляций: морской бриз городской бриз ледовый бриз и др. (Langland et al., 1989) Рост концентрации вредных примесей в приземном слое атмосферы (Eastman et al., 1995)

Параллельные Вычислительные Технологии ПАВТ-2009 Height, m Черноморское побережье Кавказа Взаимодействие морского бриза с горно-долинными циркуляциями Временной ход температуры в приземном слое по результатам модели и данным измерений

Параллельные Вычислительные Технологии ПАВТ-2009 Атмосферная динамика Вертикальное перемешивание Микрофизика облачности и осадков Модель подстилающей поверхности Атмосферная термодинамика Радиационное излучение Модель внутренних водоёмов

Двумерная декомпозиция расчетной области Высокая связанность задачи – большое количество обменов Информационная зависимость алгоритмов по вертикальной координате: прогонки радиационный блок Параллельные Вычислительные Технологии ПАВТ-2009

Подобласть процесса Обмены граничными элементами массивов X Y Пример шаблона: явная схема + фильтрация Параллельные Вычислительные Технологии ПАВТ-2009

Сверхлинейное ускорение за счёт кэширования Параллельные Вычислительные Технологии ПАВТ-2009

Ускорение близко к линейному Параллельные Вычислительные Технологии ПАВТ-2009

TRANS_XY_YZ БПФ по оси X 1) 2) 3) TRANS_YZ_XZ TRANS_XZ_XY БПФ по оси Y X Y σ Параллельные Вычислительные Технологии ПАВТ-2009

Параллельные Вычислительные Технологии ПАВТ-2009 Насыщение на 100 процессорах

Параллельные Вычислительные Технологии ПАВТ ) Repeat for each piece of N Data 1) Transpose: N pieces per SPU 2) Fetch some pieces to SPUs 3) Compute partial results 4) Transfer results into main memory Results 6) Repeat for each iteration

Параллельные Вычислительные Технологии ПАВТ-2009 Обмен данными только между SPU и PPU (между SPU нет обменов) Декартово разбиение (как в случае MPI) не нужно X Y σ 0 nv = nx ny ns

Параллельные Вычислительные Технологии ПАВТ-2009 // 32 FLOPS const double ppdx = (*_P(_R(pp3)) - *_P(_L(pp3))) / (dx2 * *_P(_C(pp3))), ppdy = (*_P(_U(pp3)) - *_P(_D(pp3))) / (dy2 * *_P(_C(pp3))), ppgra2 = ppdx * ppdx + ppdy * ppdy, pplap = ((*_P(_R(pp3)) + *_P(_L(pp3)) - 2. * *_P(_C(pp3))) / dxx + (*_P(_U(pp3)) + *_P(_D(pp3)) - 2. * *_P(_C(pp3))) / dyy) / *_P(_C(pp3)), p = ptop + sigma0[is] * *_P(_C(pp3)), dtsdsi = (*_F(tems) - *_B(tems)) / (ds02a[is] * *_C(tems)), alfa = ptop / p + sigma0[is] * dtsdsi, beta = -ptop * *_P(_C(pp3)) / (p * p) + dtsdsi * (1. + sigma0[is] * dtsdsi) + sigma0[is] * ((*_F(tems) - *_C(tems)) / ds0[is+1] - (*_C(tems) - *_B(tems)) / ds0[is]) / (ds1[is] * *_C(tems)), betas = beta * sigma0[is], upduds = 0.5 * (*_C(u3) + *_L(u3)) * s0ds2a[is] * (*_F(u3) + *_LF(u3) - *_B(u3) - *_LB(u3)), vpdvds = 0.5 * (*_C(v3) + *_D(v3)) * s0ds2a[is] * (*_F(v3) + *_DF(v3) - *_B(v3) - *_DB(v3)); // 12 FLOPS const double val1 = ((*_P(_C(pp3)) - *_P(_C(pp1))) / dtl * (*_C(u2) * (*_P(_C(pp2)) + *_P(_R(pp2))) – *_L(u2) * (*_P(_L(pp2)) + *_P(_C(pp2)))) / dx * (*_C(v2) * (*_P(_C(pp3)) + *_P(_U(pp3))) – *_D(v2) * (*_P(_D(pp3)) + *_P(_C(pp3)))) / dy + *_P(_C(pp2)) * (*_F(wsig2) - *_C(wsig2)) / ds1[is]) / dt2; // 12 FLOPS const double val2 = -(*_C(uflux) - *_L(uflux)) / dx - (*_C(vflux) - *_D(vflux)) / dy +...

Параллельные Вычислительные Технологии ПАВТ-2009 // 32 FLOPS const double ppdx = (*_P(_R(pp3)) - *_P(_L(pp3))) / (dx2 * *_P(_C(pp3))), ppdy = (*_P(_U(pp3)) - *_P(_D(pp3))) / (dy2 * *_P(_C(pp3))), ppgra2 = ppdx * ppdx + ppdy * ppdy, pplap = ((*_P(_R(pp3)) + *_P(_L(pp3)) - 2. * *_P(_C(pp3))) / dxx + (*_P(_U(pp3)) + *_P(_D(pp3)) - 2. * *_P(_C(pp3))) / dyy) / *_P(_C(pp3)), p = ptop + sigma0[is] * *_P(_C(pp3)), dtsdsi = (*_F(tems) - *_B(tems)) / (ds02a[is] * *_C(tems)), alfa = ptop / p + sigma0[is] * dtsdsi, beta = -ptop * *_P(_C(pp3)) / (p * p) + dtsdsi * (1. + sigma0[is] * dtsdsi) + sigma0[is] * ((*_F(tems) - *_C(tems)) / ds0[is+1] - (*_C(tems) - *_B(tems)) / ds0[is]) / (ds1[is] * *_C(tems)), betas = beta * sigma0[is], upduds = 0.5 * (*_C(u3) + *_L(u3)) * s0ds2a[is] * (*_F(u3) + *_LF(u3) - *_B(u3) - *_LB(u3)), vpdvds = 0.5 * (*_C(v3) + *_D(v3)) * s0ds2a[is] * (*_F(v3) + *_DF(v3) - *_B(v3) - *_DB(v3)); // 12 FLOPS const double val1 = ((*_P(_C(pp3)) - *_P(_C(pp1))) / dtl * (*_C(u2) * (*_P(_C(pp2)) + *_P(_R(pp2))) – *_L(u2) * (*_P(_L(pp2)) + *_P(_C(pp2)))) / dx * (*_C(v2) * (*_P(_C(pp3)) + *_P(_U(pp3))) – *_D(v2) * (*_P(_D(pp3)) + *_P(_C(pp3)))) / dy + *_P(_C(pp2)) * (*_F(wsig2) - *_C(wsig2)) / ds1[is]) / dt2; // 12 FLOPS const double val2 = -(*_C(uflux) - *_L(uflux)) / dx - (*_C(vflux) - *_D(vflux)) / dy pp pp pp3 4.+nx pp3 5.-nx pp pp pp pp pp3 10.+nx pp3 11.-nx pp pp pp pp3 15.+np tems 16.-np tems tems pp3 19.+np tems tems tems 22.-np tems tems u u3 26.+np u3 27.+np-1 u3 28.-np u3 29.-np-1 u v3 … pp pp pp3 4.+nx pp3 5.-nx pp pp pp pp pp3 10.+nx pp3 11.-nx pp pp pp pp3 15.+np tems 16.-np tems tems pp3 19.+np tems tems tems 22.-np tems tems u u3 26.+np u3 27.+np-1 u3 28.-np u3 29.-np-1 u v3 …

Параллельные Вычислительные Технологии ПАВТ Пробный проход итерации цикла: последовательность эффективных адресов используемых данных исключение дубликатов 2. Использование полученной последовательности как базовых адресов в итерациях цикла с прибавлением соотв. смещения

Параллельные Вычислительные Технологии ПАВТ массивов, на одну итерацию: 83 входных значения 2 выходных значения 119 FLOP Процессорные элементы Время, сек

Параллельные Вычислительные Технологии ПАВТ массивов, на одну итерацию: 22 входных значения 1 выходное значение 17 FLOP Процессорные элементы Время, сек

Параллельные Вычислительные Технологии ПАВТ-2009 Возможность одновременного расчёта двух итераций (double precision) при использовании векторных операций ПРОБЛЕМА согласования выравниваний

Параллельные Вычислительные Технологии ПАВТ-2009

Параллельные Вычислительные Технологии ПАВТ-2009 сопряжение региональной атмосферной модели и вихре разрешающей модели пограничного слоя ИВМ РАН (Глазунов А.В.) развитие блока переноса активной атмосферной примеси включение параметризации кристаллической фазы в блок микрофизики облаков моделирование эмиссии и переноса метана в атмосферном бассейне Сибири

Параллельные Вычислительные Технологии ПАВТ Работа выполнена при поддержке гранта РФФИ программы Скиф-грид компании Т-Платформы