Визуализация в распределенных системах Институт математического моделирования Российской академии наук mail: lira@imamod.rulira@imamod.ru web:

Презентация:



Advertisements
Похожие презентации
Визуализация сеточных данных М.В.Якобовский Институт математического моделирования Российской академии наук mail: web:
Advertisements

Интернет Университет Суперкомпьютерных технологий Лекция 4 Методы построения параллельных программ (продолжение) Учебный курс Введение в параллельные алгоритмы.
Интернет Университет Суперкомпьютерных технологий Лекция 3 Сортировка данных с точки зрения МВС (начало) Учебный курс Введение в параллельные алгоритмы.
Интернет Университет Суперкомпьютерных технологий Лекция 3 Методы построения параллельных программ (продолжение) Учебный курс Введение в параллельные алгоритмы.
Интернет Университет Суперкомпьютерных технологий Лекция 3 Методы построения параллельных программ (продолжение) Учебный курс Введение в параллельные алгоритмы.
Интернет Университет Суперкомпьютерных технологий Якобовский Михаил Владимирович проф., д.ф.-м.н. Институт прикладной математики им. М.В.Келдыша РАН, Москва.
Интернет Университет Суперкомпьютерных технологий Лекция 3 Методы построения параллельных программ Учебный курс Введение в параллельные алгоритмы Якобовский.
Интернет Университет Суперкомпьютерных технологий Якобовский Михаил Владимирович проф., д.ф.-м.н. Институт прикладной математики им. М.В.Келдыша РАН, Москва.
Интернет Университет Суперкомпьютерных технологий Лекция 1 Основные понятия Учебный курс Введение в параллельные алгоритмы Якобовский М.В., д.ф.-м.н. Институт.
1 МФТИ Потери производительности Параллельные алгоритмы Якобовский Михаил Владимирович д.ф.-м.н. Институт математического моделирования РАН, Москва.
Методы построения параллельных программ
Урок повторения по теме: «Сила». Задание 1 Задание 2.
Рисуем параллелепипед Известно, что параллельная проекция тетраэдра, без учета пунктирных линий, однозначно определяется заданием проекций его вершин (рис.
Школьная форма Презентация для родительского собрания.
Типовые расчёты Растворы
1. Определить последовательность проезда перекрестка
Интернет Университет Суперкомпьютерных технологий Лекция 2 Основные понятия Учебный курс Введение в параллельные алгоритмы Якобовский М.В., проф., д.ф.-м.н.
1 Знаток математики Тренажер Таблица умножения 2 класс Школа 21 века ®м®м.
Применение генетических алгоритмов для генерации числовых последовательностей, описывающих движение, на примере шага вперед человекоподобного робота Ю.К.
1 ПРЕЗЕНТАЦИЯ ПАКЕТА ПРОГРАММ «STEP+» Численное исследование автономных систем обыкновенных дифференциальных уравнений и нелинейных уравнений общего вида.
Транксрипт:

Визуализация в распределенных системах Институт математического моделирования Российской академии наук mail: web: Нижний Новгород 2009 М.В.Якобовский

Особенности момента Потребность в суперкомпьютерах высока Эффективность использования суперкомпьютеров низка: – Использование каждого ядра последовательной программой составляет проценты и доли процентов – Обмены, синхронизация и другие дополнительные операции ещё снижают эффективность параллельной программы Есть минимальный объем вычислений на процессорное ядро, определяющий максимальное ч исло используемых ядер За счет многопроцессорности проблематично сокращать время моделирования физического процесса, но можно повышать сложность решаемой задачи, например за счет увеличения размеров и детальности представления изучаемых объектов

TOP T МВС- 1000М JSCC г г T 1 T 100 G 10 G 1 G 1 Pflops 2301 Tf #1 281 Tf 500 #500 1,65 Tf 0,42 Gf 1,12 Tf 60 Gf flops Workstation: 1/ JSCCMSU o Оперативная память o Кеш o Операционные устройства o Множественный доступ o Бета-тестер

4 Вычислительная среда Выбор математической модели и солверов. Сопоставление атрибутам начальных и граничных условий, физических параметров. Выбор сервера вычислений Выбор сервера визуализации Проект Построение геометрической модели, поверхностной и объемной сетки. Задание атрибутов. Формирование варианта задания Расчет варианта задания Файлы результатов Визуализация результатов

Визуализация Скалярные Векторные Стационарные Зависящие от времени Решетки Треугольные и тетраэдральные сетки сетки Б о л ь ш и е

Этапы визуализации Запись Сетка Сеточная функция Чтение Формирование объектов виртуальной сцены Отображение

Клиент-серверная технология Аппроксимация и потоковая обработка VISIT ParaView EnSightOpenDX Отображение Расчет Запись результатов Копирование всех данных Чтение Формирование сцены Чтение Формирование сцены TecPlot Origin

Методы Распределенное иерархическое хранение Декомпозиция Огрубление с контролируемой точностью Клиент-серверная технология Потоковая обработка Хранение образов

Обтекание самолета Сетка Изоповерхности

Расчетная сетка

Огрубление поверхностей Ошибка Количество точек Количество треугольников Коэффициент сжатия 0% ,1% ,9 0,2% ,9 0,5% ,0

Огрубление поверхностей

Двухуровневое разбиение Сетка предварительно разбивается на большое число микродоменов, образующих макрограф Вершины макрографа распределяются по процессорам III

Потоковая обработка Кол-во исходных точек Время чтения файлов данных, мин:сек Общее время работы, мин:сек Кол-во полученных точек 100 млн.0:080: млн.4:3836: млн.32:07Не хватило памяти млн.56:54Не хватило памяти- Кол-во исходных точек регулярной сетки Число фрагментов, на которые разбивался каждый файл Общее время работы, мин:сек Кол-во полученных точек изоповерхности 252 млн.124: млн.84: млн.640: млн.841: млн.270: млн.640: млн :5483: млн.270: млн.82: процессоров, полное чтение файла 40 процессоров, чтение фрагментов файла

Изоповерхности Ошибка аппроксимации 5%

Огрубление 3D-данных Точность Кол-во точек Кол-во тетр-в Коэфф. сжатия Время сжатия, с 0% ,1% , ,2% , ,5% , % , %2% ,07170

Огрубление 3D-данных Точность Кол-во точек Кол-во тетр-в Коэфф. сжатия Время сжатия, с 0% % , % , % ,8235 1% ,1223

27 Сечение регулярной 3D сетки плоскостью В результате сечения регулярной кубической решетки получается фрагмент неструктурированной сетки

28 Аппроксимация триангулированных поверхностей Алгоритмы синтеза Алгоритмы редуцирования

Начальная аппроксимация кривой

Аппроксимация кривой этап 2 1 вектор

Аппроксимация кривой этап 3 3 вектора

Аппроксимация кривой этап 4 7 векторов

Аппроксимация кривой этап 5 15 векторов

34 Методы редуцирования Удаление ребра Удаление точки Уточнение топологии

35 Аппроксимация изоповерхностей

36 Плоскость, пересекающая цилиндр Ошибка аппроксимации 5%

Многоуровневое огрубление больших сеток

Распределенная визуализация

39 Моделирование течения вокруг летательного аппарата

40 Изоповерхности поля плотности R emote V iewer T ecplot

Тетраэдральные сетки 10 8 узлов

42

43 Заполнение пространства пирамидами На каждую из 2n точек в среднем опирается 2n пирамид Число пирамид ~ n 2

Зависимость объема хранимых данных от числа микродоменов Число микродоменов Размер описания (МБ) > узлов * 8 2 -> тетраэдров На 35% больше чем 124

Нерегулярная тетраэдральная сетка узлов тетраэдров поверхностных треугольников Время выполнения программы на 100 процессорах МВС-15000ВМ составляет 270 секунд (с учетом записи данных на диск). Время равномерного измельчения – 30 секунд. Дисковое пространство Гб

Библиотека ввода-вывода Ввод-вывод тетраэдральных сеток – Хранение микродоменов – Хранение макрографа Ввод-вывод регулярных решеток – Хранение фрагментов сеток – Хранение сеточных функций

Записи двух сеточных 2d функций Функция F1 Функция F2 Рисунок 2.

Групповое сжатие вещественных чисел Перегруппировка байт Сжатие байт стандартной библиотекой zlib Обнуление младших бит мантиссы

Отсечение младших бит мантиссы f=x 2 +y 2 +z байт 10^9 узлов байт – 0.1% битa на узел 10^9 узлов: 1000 блоков по 10^6 узлов 3.54 бинарный без компрессии без огрубления компрессия без огрубления

Огрубление данных 50

Моделирование процессов охлаждения CPU

CPU Процессор, охлаждаемый медным радиатором Мощность 65Вт 10мм ~1.4мм Толщина 0.3мм 7мм …… 97.5мм, 78 медных пластин 100мм …… Поток воздуха: T=20C, м 3 /с Cu 30x30 мм 35мм до границы

Зависимость эффективности от числа ядер Конфигурация: 78 тонких ребер (0.3 мм) на радиаторе Сетка: 1000 х 3500 х 150 = 525 млн. Параллельная реализация: MPI + нити (8 нитей на узле)

Изоповерхности температуры: Т=20.5, 21, 22.5 С сетка 800*700*120=67,2 млн. узлов

Зависимость коэффициента сжатия от числа усеченных бит w101_reduced 12.bjn w101_reduced 13.bjn w101_reduced 14.bjn w101_reduced 15.bjn w101_reduced 16.bjn w101_reduced 17.bjn w101_reduced 18.bjn w101_reduced 19.bjn w101grid.bjn Сетка: 1000 х 3500 х 150 = 525 млн узлов

Параллельные библиотеки SDLB - динамическая балансировка (0D) MCoarse - огрубление сеток (2D, 3D) BjnIOlib - ввод-вывод регулярных сеток TMLlib - ввод-вывод неструктурированных сеток LRND - генерация псевдослучайных чисел PSORT - параллельная сортировка

Якобовский М.В. д.ф.-м.н., зав. сектором «Программного обеспечения многопроцессорных систем и вычислительных сетей» Института математического моделирования Российской академии наук mail: