Эффективность распараллеливания Оценки качества вычислительного алгоритма, системного ПО и аппаратуры Цель – оптимизация счета Критерии качества: Производительность.

Презентация:



Advertisements
Похожие презентации
Оценка эффективности параллельных вычислений Комышев Е. Г. гр
Advertisements

Колмаков Алексей Аспирант ИПМ им. М.В. Келдыша. Для многопроцессорных расчетов математической модели область делится на подобласти (возможно с перекрытиями)
Выполнил студент группы А Буренков Сергей Александрович. Научный руководитель к.т.н., доцент Шамаева Ольга Юрьевна. ОРГАНИЗАЦИЯ И ИССЛЕДОВАНИЕ ПАРАЛЛЕЛЬНО-ПОСЛЕДОВАТЕЛЬНЫХ.
Расчеты развития неустойчивости на границе раздела газов по методике МЕДУЗА с выделением контактной линии в смешанных ячейках Барабанов Роман Анатольевич,
1 Исследование алгоритмов решения задачи k коммивояжеров Научный руководитель, проф., д.т.н. Исполнитель, аспирант Ю.Л. Костюк М.С. Пожидаев Томский государственный.
Интернет Университет Суперкомпьютерных технологий Лекция 1 Основные понятия Учебный курс Введение в параллельные алгоритмы Якобовский М.В., д.ф.-м.н. Институт.
Технические средства компьютерной графики. Схема системы вывода изображения на экран.
Белорусский государственный университет Механико-математический факультет Кафедра уравнений математической физики Горбач Александр Николаевич ОПТИМИЗАЦИЯ.
ТЕМА ЛЕКЦИИ : « МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ ». ПЛАН ЛЕКЦИИ 1. Определение матрицы, элементы матриц 2. Виды матриц 3. Линейные операции над матрицами.
–Формула – математическое выражение, записанное по правилам, установленным в среде табличного процессора. –Формула может включать в себя: константы (значения,
Кафедра ЮНЕСКО по НИТ1 Эффективность и ускорение параллельных программ параллельное программирование.
Планирование выполнения инструкций для векторных процессоров с переменной длиной векторов Пантелеев Алексей Юрьевич Национальный исследовательский ядерный.
ТЕМА ЛЕКЦИИ: «МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ». ПЛАН ЛЕКЦИИ 1. ПОНЯТИЕ И ВИДЫ МАТРИЦ 2. СТРОКИ, СТОЛБЦЫ, ЭЛЕМЕНТЫ И РАЗМЕР МАТРИЦ 3. ОПЕРАЦИИ НАД МАТРИЦАМИ.
Поиск максимальной длины рекуррентности в графе зависимостей Научный руководитель: Гимпельсон В.Д. Работу выполнила Филиппова В.Н. Московский физико-технический.
Электронные таблицы. Адресация в электронных таблицах.
МОСКВА, 2009 ООО "РЕЗОЛЬВЕНТА" НАШ ПРИНЦИП – КАЧЕСТВО! МАТЕМАТИКА.
ПАРАЛЛЕЛЬНАЯ ФИЛЬТРАЦИЯ ИЗОБРАЖЕНИЙ Фурсов В.А., Попов С.Б. Самарский научный центр РАН, Самарский государственный аэрокосмический университет, Институт.
МОСКВА, 2009 ООО "РЕЗОЛЬВЕНТА" НАШ ПРИНЦИП – КАЧЕСТВО! МАТЕМАТИКА.
МОСКВА, 2009 ООО "РЕЗОЛЬВЕНТА" НАШ ПРИНЦИП – КАЧЕСТВО! МАТЕМАТИКА.
Основная микросхема компьютера, в которой и производятся все вычисления. На процессоре установлен большой медный ребристый радиатор, охлаждаемый вентилятором.
Транксрипт:

Эффективность распараллеливания Оценки качества вычислительного алгоритма, системного ПО и аппаратуры Цель – оптимизация счета Критерии качества: Производительность / стоимость. Предельные случаи: Минимизация астрономического времени счета задачи - ТА Минимизация стоимости – суммарное платное процессорное время – ТР ТР = ТА * P где Р – число процессоров ТА не равно ТА1 / Р

Коэффициент ускорения при распараллеливании KP = (TA1 / TAP) / P или ТАР = ТА1 / (KP * P) Где: ТА1 – астрономическое время счета на одном процессоре ТАР - астрономическое время счета на Р процессорах Р - число процессоров Пример. 10 процессоров вместо одного при КР = 1 время счета уменьшится в 10 раз, при КР = 0.5 только в 5 раз. КР(Р) – зависит от Р КР = (ТАР1 / TAР2) / (P2 / P1) – случай сравнения счета для Р1 и Р2 процессоров

Результаты счета, оценка эффективности

Факторы, влияющие на КР Предполагается, что КР не зависит от номера шага. ТАШ = ТП + ТО где ТАШ – астрономическое время одного шага ТП – чисто процессорное время без учета простоев ЦП ТО – время простоя ЦП из-за обменов, не совмещенных со счетом. Совмещение? Тогда КР = ТА1 / (ТАР * Р) = (ТП * Р) / ((ТП + ТО) * Р) = 1 / (1 + ТО/ТП) Если использовать отношение времени обменов к времени процессорного счета: КО = ТО / ТП то КР = 1/(1+КО)

Вычисление зависимости КР от числа процессоров Подсчет ТП и ТО. Необходимо знать: Количество обрабатываемых чисел (размер сетки, размер матриц, …) Количество операций над одним числом в одном шаге. Эмпирические данные для типичной разностной схемы: 8-10 опер/шаг, не зависит от размера сетки Умножения матриц. Предлагается самим посчитать для случая разбиения полностью заполненной матрицы на полосы и столбцы. Зависит от размера матрицы. Попытайтесь найти физическое объяснение разницы в числе операций и виде матриц для этих двух случаев. Скорость процессора. Скорость среды обмена (латентность, максимальную длину блока). При фиксированном размере сетки уменьшая число процессоров, мы уменьшаем КО (влияние обменов), увеличиваем КР (эффективность использования процессоров – снижаем стоимость), увеличиваем общее астрономическое время счета (уменьшаем производительность). И наоборот.

Задача на дом Параллельное умножение матриц (полосы строк и столбцов) Вывести зависимость КР(Р) для: Матрица - 10**4 на 10**4 Скорость процессор+программа – 10**9 опер/сек Скорость обмена – 10**6 чисел/сек плюс задержка на запуск обмена 10**-3 сек. Счет и обмены не совмещены. Р в диапазоне от 1 до 10**5