Кластерные системы. Задача производительности Существует класс задач требующих высокой производительности Моделирование Математические вычисления Доступ.

Презентация:



Advertisements
Похожие презентации
Системы с общей оперативной памятью UMA, SMP, NUMA.
Advertisements

Понятие вычислительной системы Под вычислительной системой (ВС) понимают совокупность взаимосвязанных и взаимодейст- вующих процессоров или ЭВМ, периферийного.
Компьютерные кластеры. Автор: Капля Алексей Владимирович alex
Общая характеристика многопроцессорных вычислительных систем.
Параллельные вычисления Лекция 6. y = 3x + 7x – 8x при x = 4 y1 = 3x(1 действие) y2 = 7x(2 действие) y3 = 8x(3 действие) y = y1 + y2 – y3(4 действие)
Компьютеры с виртуальной общей памятью (NUMA) Главная особенность – неоднородный доступ к памяти. Технически – это MPP компьютеры, узлами которых являются.
Учебный курс Технологии и средства разработки корпоративных систем Лекция 1 Открытые системы. Клиент и сервер Лекции читает кандидат технических наук,
Все процессоры выполняют одну и ту же программу ВС класса SIMD.
Архитектура компьютера. Функциональные характеристики ПК Лекция 2 часть г.
Архитектуры высокопроизводительной системы является достаточно широким, поскольку под архитектурой можно понимать и способ параллельной обработки данных,
СУПЕРКОМПЬЮТЕРЫ Что это? Зачем это нужно? Кто этим пользуется?
Супер ЭВМ Понятие Супер ЭВМ Цели Супер ЭВМ Характеристики производительности Супер ЭВМ Программное обеспечение Супер ЭВМ Архитектура совеременных Супер.
Выполнил(а):Студент(ка)1 курса 21 группы Очной формы обучения Красичкова Алина Максимовна.
Вычислительная система (ВС) - это взаимосвязанная совокупность аппаратных средств вычислительной техники и программного обеспечения, предназначенная для.
Компьютерные сети Компьютерная сеть – это система обмена информацией между компьютерами. Локальная сеть (ЛС) - небольшая по масштабам компьютерная сеть,
Высокопроизводительные вычислительные системы: применения в биологии и практические аспекты решения некоторых задач.
ИНФОРМАЦИОННЫЕ СИСТЕМЫ СОДЕРЖАНИЕ Понятие информационной системы Информационное обеспечение Технологические платформы ИС Централизованная платформа Децентрализованная.
Локальная сеть Типы локальных сетей Топология сетей.
Классификация архитектур ЭВМ по Флинну. Одиночный поток команд (Single Instruction) Множество потоков команд (Multiple Instruction) Одиночный поток данных.
По производительности и быстродействию По назначению По уровню специализации По типу используемого процессора По особенностям архитектуры По размерам.
Транксрипт:

Кластерные системы

Задача производительности Существует класс задач требующих высокой производительности Моделирование Математические вычисления Доступ к информации и ее обработка Задачи искусственного интеллекта

Три способа повышения производительности Work Harder (работать лучше) Work Smarter (работать умнее) Ask Help (попросить помощи)

Для компьютеров Повышение скорости работы Улучшения архитектуры Объединение устройств

Архитектура Способ соединения компьютеров между собой, с памятью и внешними устройствами

Типы архитектур Single Instruction Single Data Multiple Instruction Single Data Single Instruction Multiple Data Multiple Instruction Multiple Data

SISD Один поток команд, один поток данных, один процессор Обычные рабочие станции

MISD Множественный поток команд, одиночный поток данных Реальных устройств не существует Пример – работа СУБД

SIMD Одиночный поток команд, множественный поток данных. Большое число процессоров от 1024 Единственная инструкция выполняется над многими элементами данных Векторные компьютеры

MIMD (SMP, MPP) Множественный поток команд, множественный поток данных Команды и данные связаны и являются частью одной задачи Конвейерные и многопроцессорные системы

SMP архитектура Symmetric multiprocessing Наличие общей памяти Простота программирования Плохая масштабируемость. Одна шина – одна инструкция

MPP архитектура Massive parallel processing Память физически разделена Хорошая масштабируемость Ниже скорость. Дороже софт

Гибридная архитектура (NUMA) Nonuniform memory access Память физически разделена, но логически разделяема Неоднородный доступ к памяти. Быстрее MPP Проблема когерентности кешей.

Кластерная архитектура Кластер – это группа вычислительных машин, которые связаны между собою и функционируют как один узел обработки информации (c) Digital Equipment Corporation (DEC).

Типы узлов Серверы Рабочие станции Персональные компьютеры

Ключевые особенности Неограниченная масштабируемость Дешевизна Отказ узла не влияет на работоспособность системы Стандартные сетевые технологии связи узлов Ethernet MyriNet SCI (Scalable Coherent Interface Кластеризация может быть осуществлена на разных уровнях. Программном, системном, аппаратном

Типы кластеров Класс I Система строится на базе стандартных элементов (низкая цена, простое обслуживание) Класс II Эксклюзивные элементы (более высокая производительность, выше цена и сложность решения)

Типы кластеров по задачам Системы высокой надежности Системы высокой производительности Многопоточные системы

Системы высокой надежности Повышение надежности за счет распределения задачи между различными физическими устройствами. Выход узла из строя только уменьшает производительность Критически важные сервера

Высокопроизводительные системы Для выскопроизводительных вычислений Большое число однотипных узлов Сложное ПО Стандартная для всех узлов ОС

Многопоточные системы Обеспечение множественного доступа к ресурсам Например, веб-сервера, билинговые системы, банковские и корпоративные системы

Первый кластер 1994 год. Первый кластер из 16 узлов Intel DX4. Сеть 10mb/Ethernet Один из узлов – серверный Стандартное ПО ОС - Linux

Современный кластер

Производительность кластеров Производительность – есть функция зависящая от типа задачи, размерности задачи, архитектуры кластера, числа узлов, производительности узлов и межузловых соединений

Выкопать яму: 1рабочий = 8дн

Выкопать яму: 2рабочих = 4дн

Выкопать яму: 4рабочих = 2дн

Выкопать яму: 16рабочих = ?

Выкопать яму: 1экск=1день

Зависимость скорости решения задачи от числа узлов

Зависимость от размера задачи

Производительность узла

Сравнение SCI и Fast Ethernet

Требования к пропускной способности интерфейсов Скорость обмена между узлами в мб/сек должна быть не ниже 1/10 пиковой производительности процессора измеренной в Mflops Процессор узлаСкорость сети PIII мгц 50 мб/сек PIV – 2 ГГц 200 мб/сек AMD Opteron 250 мб/сек

Сравнение высокоскоростных коммуникационных интерфейсов Технология Пропускная способность MByte/s Задержка мксек/паке т Стоимость карточки/свич а на 8 портов Поддержка платформ Комментарий Fast Ethertnet /200 Linux, UNIX, Windows Низкие цены, популярная Gigabit Ethernet /3500 Linux, UNIX, Windows Удобство модернизации Myrinet /5000 Linux, UNIX, Windows Открытый стандарт, популярная VI (сLAN от Giganet) /6500Linux, Windows Первая аппаратная промышленная реализация VI SCI /5000 * Linux, UNIX, Windows Стандартизиро вана, широко используется QsNet 3402 N/A ** True64 UNIX AlphaServer SC и системы Quadrics Memory Channel 1003 N/ATrue64 UNIX Используется в Compaq AlphaServer

Характеристики интерфейсов GigabitGiganetMyrinetQsnetSCIServernet Скорость Мб/сек Латентность мкс Мах. Узлов K ОСNT/Linux Over GMNone Hardware

Скорость интерфейсов

Время передачи мин пакета

Архитектура кластеров Существует закономерность – производительность кластера в большей степени зависит от способа организации связи узлов чем от производительности узлов

Типы связей Плоская решетка Максимальное расстояние = 6. Если более 4 - неэффективно

Типы связей Кубы. Максимальный объем – минимальная площадь. Вторая по эффективности.

Типы связей Кольцо с полной связью по хордам

Типы связей Толстое дерево. Наиболее эффективная

Типы связей Толстое дерево. Вид сверху

Еще архитектуры

Кластерные решения Стоимость коммуникационного оборудования падает, а производительность растет Производительность современных ПК сравнима с производительностью суперкомпьютеров прошлого десятилетия. Удваивается каждые 18 месяцев Кластер можно апгрейдить Кластер проще программировать

Решения от IBM Вычислительный узел IBMxSeries 335 на одном или двух Pentium4 Xeon Соединение Ethernet/MyriNet ОС – RedHat Linux Специализированное ПО

Решения от IBM Пример конфигурации кластера 1350 Класс Число узлов кластера Скорость процессора, ГГц Память системы, Гбайт Внутренняя память, Гбайт Соединение кластера, Мбит/с Начальный 82,00, /100 Ethernet Средний 322, /100 Ethernet Профессио нальный 1282,8136 Gigabit Ethernet Высоко- производит ельный 642,8136Myrinet-2000

Самые быстрые кластеры МестоИмяТехнологияЦельGFlops Barcelona Supercomputer Center Spain/2004 MareNostrum eServer BladeCenter JS20 (PowerPC GHz), Myrinet / 3564 IBM eServer BladeCenter JS20 (PowerPC GHz), Myrinet IBM Cluster JS20 CLuster, Myrinet Academic Lawrence Livermore National Laboratory United States/2004 Thunder Intel Itanium2 Tiger4 1.4GHz - Quadrics / 4096 California Digital Corporation Intel Itanium2 Tiger4 1.4GHz - Quadrics NOW - Intel Itanium Itanium2 Tiger4 Cluster - Quadrics Research Los Alamos National Laboratory UnitedStates/20 02 ASCI Q ASCI Q - AlphaServer SC45, 1.25 GHz / 8192 HP ASCI Q - AlphaServer SC45, 1.25 GHz HP AlphaServer SC Alpha- Server-Cluster Research Virginia Tech UnitedStates/20 04 System X 1100 Dual 2.3 GHz GigE / 2200 Self-made 1100 Dual 2.3 GHz GigE NOW - PowerPC XServe Cluster Academic

Будущее кластерных систем Удешевление межузловых интерфейсов Повышение скорости их работы Создание GRID систем

GRID системы Глобальные вычислительные сети Узлы – обычные PC Размер – десятки тысяч узлов Участники – пользователи глобальных сетей Производительность - петафлоп

Выводы Кластеры это хорошо Но есть проблемы Проблемы технические Проблемы распараллеливания задач Что дальше?

Цитата Google runs on a unique combination of advanced hardware and software. The speed you experience can be attributed in part to the efficiency of our search algorithm and partly to the thousands of low cost PC's we've networked together to create a superfast search engine

Вопросы?

Спасибо за внимание