Технология распределенных вычислений X-Com: возможности, задачи, направления развития Вл.В. Воеводин, С.И. Соболев НИВЦ МГУ имени М.В. Ломоносова Перспективные.

Презентация:



Advertisements
Похожие презентации
ПАРАЛЛЕЛЬНАЯ ФИЛЬТРАЦИЯ ИЗОБРАЖЕНИЙ Фурсов В.А., Попов С.Б. Самарский научный центр РАН, Самарский государственный аэрокосмический университет, Институт.
Advertisements

Студент группы МТ Уросов Александр Павлович Научный руководитель Авербух Владимир Лазаревич Доцент КИПУ Кандидат технических наук.
Решения компании «Т-Платформы» для высокопроизводительных вычислений: взаимовыгодное сотрудничество отечественной науки и бизнеса.
Разработка методологии переноса вычислительно сложных SPMD задач на GPE Grid Власов Всеволод, 544 группа Научный руководитель: Краснощеков В.Е. Рецензент:
1 Интеллектуальные суперкомпьютерные технологии e-Science А.В. Бухановский С.В. Иванов С.В. Ковальчук Москва, 31 октября 2013.
Базы данных Лекция 01 Информационные технологии баз данных.
ДИНАМИЧЕСКИ ФОРМИРУЕМЫЕ ПАРАЛЛЕЛЬНЫЕ СРЕДЫ В УСЛОВИЯХ ГРИД-ПОЛИГОНОВ, ПРОБЛЕМЫ И РЕШЕНИЯ Варламов Дмитрий Волохов В.М., Пивушков А.В., Сурков Н.Ф., Волохов.
Учня 11-А класса Алчевської інформаційно-технологічної гімназії м. Алчевськ Луганської обл. Малишева Андрія Едуардовича
Краткая информация о системе. Назначение системы Система применяется на всех уровнях образовательного учреждения (ректорат, деканаты, кафедры) для решения.
«Разработка методов сбора и анализа статистики по потоку прохождения задач в распределенных и многопроцессорных системах» Дипломная работа Выполнена Булочниковой.
Программная система для изучения и исследования параллельных методов решения сложных вычислительных задач Нижегородский государственный университет им.
Направление «Информатика и вычислительная техника» Бакалавр по направлению подготовки Информатика и вычислительная техника науки должен решать следующие.
Разработка высокопроизводительного программного комплекса для моделирования перспективных лазерных сред на основе органических соединений в твердотельных.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Факультет прикладной математики и информатики Кафедра информатики.
М.Л. Цымблер, Л.Б. Соколинский Южно-Уральский государственный университет (Челябинск) Организация систем хранения данных на базе вычислительных кластеров.
« МАТИ » - РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ ИМЕНИ К. Э. ЦИОЛКОВСКОГО КАФЕДРА « ПРОЕКТИРОВАНИЕ ВЫЧИСЛИТЕЛЬНЫХ КОМПЛЕКСОВ » « Моделирование.
Выполнили: Мартышкин А. И. Кутузов В. В., Трояшкин П. В., Руководитель проекта – Мартышкин А. И., аспирант, ассистент кафедры ВМиС ПГТА.
Программное обеспечение компьютера. Операционная система.
Об использовании инфраструктуры высокопроизводительных вычислений для нужд сферы образования и науки Директор Департамента развития информационно-коммуникационных.
Учебный курс Объектно-ориентированный анализ и программирование Лекция 4 Трансформация логической модели в программный код Лекции читает кандидат технических.
Транксрипт:

Технология распределенных вычислений X-Com: возможности, задачи, направления развития Вл.В. Воеводин, С.И. Соболев НИВЦ МГУ имени М.В. Ломоносова Перспективные компьютерные системы: устройства, методы и концепции Россия, Таруса, 2-4 марта 2011 г.

Распределенные вычисления Распределенные вычисления - применение доступных разнородных компьютерных ресурсов, соединенных между собой каналами связи общего назначения, для решения вычислительно сложных задач Типичные случаи использования: задаче не хватает имеющихся суперкомпьютеров нужно решить задачу подручными средствами выбор в качестве технологии программирования

Распределенные среды и задачи Свойства распределенных сред: масштабность географическая распределенность неоднородность динамичность различные политики администрирования Свойства задач: высокий ресурс параллелизма минимизация коммуникаций Организация вычислений: клиент-серверная схема

Примеры программных платформ Condor (1988, University of Wisconsin- Madison) –использование простаивающих ресурсов компьютеров в организациях BOINC (2002, UC Berkeley) –volunteer computing Hadoop (2005, Apache) –обработка больших массивов данных + распределенная ФС X-Com (2001, НИВЦ МГУ)

X-Com: основные факты Инструментарий для организации и проведения распределенных расчетов Легкая переносимая система Основные принципы: –клиент-серверная архитектура –возможность построения иерархических распределенных сред

X-Com: программирование и запуск задач Разбиение задачи на клиентскую и серверную части –серверная часть (разбиение и склейка порций): 6-7 функций на Perl: –инициализация, номера первой и последней порций, генерация порции, обработка готовой порции, условия завершения, завершение список файлов –клиентская часть (вычисления): 2 функции на Perl: –инициализаций и запуск команды описание запуска команды Компоновка файлов задачи, настройка конфигурационных файлов

X-Com: пример серверной части задачи package Power;# Имя пакета = имя задачи use vars Определение списка экспортируемых функций, use Exporter;# не зависит от задачи, должно = qw (Exporter);# = qw (initialize getFirstPortionNumber getLastPortionNumber isFinished getPortion addPortion finalize); sub initialize { my $taskArg = $_[0];# считываем аргументы задачи print STDERR "Power: initialization argument is $taskArg\n"; } sub getFirstPortionNumber { return 1; # номер первой порции = 1 } sub getLastPortionNumber { return 50; # номер первой порции = 50 } sub isFinished { return 0;# число порций задано, поэтому возвращаем 0 } sub getPortion { my $N = $_[0];# получаем номер порции в $N my $prt = $N*2;# формируем содержимое порции ($N*2) print STDERR "Power: portion $N created, value is '$prt'\n"; return $prt;# отдаем порцию } sub addPortion { my ($N, $data) = ($_[0], $_[1]);# получаем номер порции и результат print STDERR "Power: portion $N processed, result is '$data'\n"; } sub finalize { print STDERR "Power is finished.\n";# завершение расчета } 1;# эта единица в конце файла должна быть обязательно

X-Com: пример клиентской части задачи sub gcprepare { return 1;# подготовка завершена – возвращаем 1 } sub gctask { my ($task, $taskarg, $portion, $din, $dout) входные параметры open IN, "< $din";# открываем файл $din с входной порцией my $n = ;# читаем число в переменную $n close IN;# закрываем файл my $res = $n ** $taskarg;# возводим в степень open OUT, "> $dout";# открываем файл для записи вых. данных print OUT $res;# пишем результат close OUT;# закрываем файл return 1;# успешно – возвращаем 1 } 1;# эта единица должна быть обязательно

X-Com: особенности Режимы работы на вычислительных узлах: –монопольно –по занятости –через системы управления заданиями: Cleo, Torque, LoadLeveler, Unicore, … Подсистема управления заданиями –последовательный и параллельный запуск задач –требования задач к ресурсам узлов Визуализация хода расчета: –встроенная «техническая» –внешние модули, читающие данные из XML

X-Com: реальные среды и задачи 1.Определение скрытой периодичности в генетических последовательностях –совместно с Центром «Биоинженерия» РАН 400 компьютеров, 10 организаций, 6 часовых поясов 2.Виртуальный докинг и скрининг –НИВЦ совместно с подразделениями РАМН монопольно на СКИФ Cyberia и СКИФ МГУ «Чебышев» 5-6 суперкомпьютерных центров поиск ингибиторов тромбина дал запатентованный результат –совместно с факультетом биоинженерии и биоинформатики МГУ и компанией «Молекулярные технологии» поиск ингибиторов для белков-мишеней онкологических заболеваний на СКИФ МГУ «Чебышев» через систему очередей в новогодние каникулы THROMBIN

X-Com: визуализация хода расчета

X-Com: реальные среды и задачи 4.Вычисление коэффициентов матрицы для задачи дифракции электромагнитной волны на однородных диэлектрических телах –совместно с Пензенским государственным университетом –несколько этапов задачи в различных режимах 5.Анализ лог-файлов маршрутизаторов –сетевой центр Южно-уральского государственного университета 6.Расшифровка паролей UNIX –экспериментальная задача –МГУ, ТГУ, ЮУрГУ, УГАТУ, СКИФ-ГРИД/Unicore

X-Com как средство управления задачами Распределение вычислений на несколько суперкомпьютеров –решение оптимизационных гидродинамических задач на суперкомпьютерах МГУ –совместный проект НИВЦ МГУ, компаний Тесис и Сигма Технология Сервис группировки однопроцессорных задач на суперкомпьютере СКИФ МГУ «Чебышев» Исследование свойств прикладных задач на процессорном полигоне НИВЦ МГУ

Как описать вычислительную систему? Пиковая производительность Пропускная способность и латентность коммуникационной среды Реальная производительность (Linpack) –рейтинг Top500 Эффективность Энергоэффективность –рейтинг Green500 Другие бенчмарки (Graph500)

Как описать распределенную вычислительную среду? Пиковая производительность –среда динамична… Пропускная способность и латентность коммуникационной среды –разные сегменты – разные характеристики –влияние других потоков данных Реальная производительность на тесте –разные показатели от запуска к запуску Эффективность –выбор принципа –конкретная задача в конкретной среде

Характеристики среды и расчета в X-Com Суммарная пиковая производительность среды Серверная эффективность – отношение суммарного клиентского процессорного времени к условному суммарному серверному времени –характеризует накладные расходы на организацию распределенного расчета Клиентская эффективность – отношение числа отправленных к числу принятых порций –характеризует динамичность среды

Характеристики среды и расчета в X-Com – проблемы Суммарная пиковая производительность среды –дает представление о масштабе среды, но не реальную картину участия в расчетах Серверная эффективность –не учитывает накладные расходы при работе через системы очередей Клиентская эффективность –не учитывает эффекты распределения последних порций и буферизации

«Распределенный Linpack» - цели и задачи нового направления Разработка комплекса характеристик распределенных вычислительных сред Разработка комплекса характеристик распределенных расчетов Создание методики и инструментария для определения свойств распределенной среды и оценки поведения приложений в такой среде Выдача рекомендаций по оптимизации распределенного приложения для среды с определенными свойствами

Спасибо за внимание! Перспективные компьютерные системы: устройства, методы и концепции Россия, Таруса, 2-4 марта 2011 г.

Суперкомпьютерные конференции Параллельные вычислительные технологии (ПаВТ2011) –Москва, МГУ, 28 марта – 1 апреля – Научный сервис в сети Интернет: экзафлопсное будущее –Абрау-Дюрсо, сентября –прием докладов до 1 июня –