ИНСТИТУТ ПРОБЛЕМ ПРОЕКТИРОВАНИЯ В МИКРОЭЛЕКТРОНИКЕ РАН (ИППМ) Способы регулирования вычислений в параллельной потоковой вычислительной системе Д.Н. Змеев,

Презентация:



Advertisements
Похожие презентации
ИНСТИТУТ ПРОБЛЕМ ПРОЕКТИРОВАНИЯ В МИКРОЭЛЕКТРОНИКЕ РАН (ИППМ) Архитектура планировщика процессора сопоставления ППВС «Буран» Д.Н. Змеев, Н.Н. Левченко,
Advertisements

ИНСТИТУТ ПРОБЛЕМ ПРОЕКТИРОВАНИЯ В МИКРОЭЛЕКТРОНИКЕ РАН (ИППМ) Исследование принципов работы блока ввода данных для параллельной потоковой вычислительной.
Выполнили: Мартышкин А. И. Кутузов В. В., Трояшкин П. В., Руководитель проекта – Мартышкин А. И., аспирант, ассистент кафедры ВМиС ПГТА.
Работу выполнили ученики 21 гимназии 10 А класса.
Разработка аппаратного модулярного фильтра с конечной импульсной характеристикой на базе теоретико- числового быстрого преобразования Фурье В.М. Амербаев.
Терминология Микропроцессор (МП) - программно-управляемое устройство, осуществляющее процесс цифровой обработки информации и управления и построенное на.
Fortan OpenMP/DVM - язык параллельного программирования для кластеров В.А. Бахтин, Н.А. Коновалов, В.А. Крюков, Н.В. Поддерюгина Институт прикладной математики.
Система фрагментированного программирования Перепелкин В.А. Всероссийская молодежная школа по параллельному программированию МО ВВС ИВМиМГ 2009 г.
Распределение регистров при планировании инструкций для архитектуры Эльбрус Дипломная работа Иванова Д. С. Научный руководитель Шлыков С. Л. Москва 2008.
БАЗЫ ДАННЫХ часть II Распределенные и параллельные системы управления базами данных.
Операционная система. Базовые понятия Операционная система – это комплекс программ, обеспечивающий контроль за существованием, распределением и использованием.
Операционные системы Введение (часть 4) 4.Основы архитектуры операционных систем 4.1.Базовые понятия 4.2.Свойства ОС 4.3.Структура ОС 4.4.Логические функции.
Программное обеспечение персонального компьютера.
« МАТИ » - РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ ИМЕНИ К. Э. ЦИОЛКОВСКОГО КАФЕДРА « ПРОЕКТИРОВАНИЕ ВЫЧИСЛИТЕЛЬНЫХ КОМПЛЕКСОВ » « Моделирование.
Пользователь (User) Приложение (Software) Операционная система (ОС, Operating System, OS) Оборудование (Hardware)
МультиТредовые архитектуры.
Методика распараллеливания программ в модели DVM Институт прикладной математики им. М.В.Келдыша РАН
Лекция 6. Способы адресации в микропроцессорных системах.
Смешанная модель параллельной программы Приятное с полезным Сергей Петрович Нечаев, Сибирский Суперкомпьютерный центр.
ПРОГРАМНОЕ УПРАВЛЕНИЕ КОМПЬЮТЕРОМ. КОМПЬЮТЕР (computer)- автоматическое устройство или система, способная выполнять заданную, четко определенную последовательность.
Транксрипт:

ИНСТИТУТ ПРОБЛЕМ ПРОЕКТИРОВАНИЯ В МИКРОЭЛЕКТРОНИКЕ РАН (ИППМ) Способы регулирования вычислений в параллельной потоковой вычислительной системе Д.Н. Змеев, А.В. Климов, Н.Н. Левченко, А.С. Окунев

2 x4–> M1.b{9,4}x2–> M1.b{7,6} x3–>M2.c{8,6} x1–>M1.a{7,6} M1(x1,x2){7,6} Программа на DFL = набор узлов … node M1(a,b) {i,j} begin … a*b –> M2.c{i+1,j}; … end … i j пакет токены входы узла заголовок узла программа узла Ассоциативная память Сопоставление токенов (при одинаковом контексте) Сопоставление токенов (при одинаковом контексте) формирование пакета ожидание «парного» токена ожидание «парного» токена формирование и посылка токена формирование и посылка токена поступает на вход узла node M1(a,b){i,j} контекст узла имя узла M1(x1,x2){7,6} пакет

3 Память Получатель Парадигма «СБОРА» (C, Fortran, и др.) Парадигма «РАЗДАЧИ» (DFL) Источник Получатель значение, адрес получателя Источник значение, адрес в памяти адрес в памяти, адрес получателя адрес получателя, значение Источник сохраняет свой результат в памяти по некоторому адресу, откуда его запрашивает потребитель по мере надобности. В DFL узел-источник сам знает (вычисляет) адреса всех потребителей, на которые и рассылает свой результат. Это облегчает работу аппаратуры при распределенном выполнении.

4... коммутатор токенов пакет токен... ПС k-1 ИУ r-1 ИУ 0 внутренний коммутатор пакетов ПС 0 токен пакет токен пакет ЯДРО ВЫЧИСЛИТЕЛЬНЫЙ МОДУЛЬ внутренний коммутатор токенов... пакет токен пакет токен пакет ЯДРО ВЫЧИСЛИТЕЛЬНЫЙ МОДУЛЬ ИУ m-r ПС n-k ПС n-1 ИУ m-1 внутренний коммутатор пакетов внутренний коммутатор токенов

Аппаратная поддержка мелкозернистого параллелизма Аппаратная поддержка мелкозернистого параллелизма Аппаратная синхронизация вычислительных процессов по данным Аппаратная синхронизация вычислительных процессов по данным Способность аппаратного (автоматического) выявления неявного параллелизма задачи Способность аппаратного (автоматического) выявления неявного параллелизма задачи Высокий показатель реальной производительности Высокий показатель реальной производительности Архитектура суперкомпьютерной системы Архитектура суперкомпьютерной системы 5 Аппаратная ассоциативная память Аппаратное распределение ресурсов Выполнение программы вычислительного узла не прерывается на подкачку данных Начинать работу можно до полного формирования данных (массива)

Классические dataflow системы Языки высокого уровня Sisal, Id, VAL и др. «работают» в парадигме «сбора». Заранее (статически) создается граф выполнения программы. Процессора сопоставления не было (примитивные команды). Не были решены проблемы управления локализацией и планирования вычислений. Были трудности с реализацией ассоциативной памяти ключей и токенов большого объема. Не была реализована поддержка динамического формирования контекста. Целевые узлы определялись в основном статически (были только элементы динамики). Модель вычислений ППВС Новая парадигма программирования – парадигма «раздачи», выраженная в языке DFL. Граф выполнения программы создается (разворачивается) в процессе вычислений. Имеется процессор сопоставления с развитой системой команд. Развитые (удобные) средства управления локализацией и планированием вычислений. Благодаря реализации функций управления локализацией и планированием вычислений удалось избежать построения физической памяти большого объема (иерархия памяти). Реализована аппаратная поддержка динамического формирования контекста и функций взаимодействия (формирование токенов и пакетов). Динамический выбор целевых узлов в узлах-источниках. 6

7 распределение вычислений по пространству (локализация по вычислительным ядрам); распределение вычислений во времени (локализация по этапам); изменение алгоритма работы буферов токенов и пакетов; управление с помощью различных методов ввода данных в систему; ограничение числа активных временных этапов (активаций) итераций или функций.

ИНСТИТУТ ПРОБЛЕМ ПРОЕКТИРОВАНИЯ В МИКРОЭЛЕКТРОНИКЕ РАН (ИППМ) Спасибо за внимание!