Прогнозные оценки развития высокопроизводительной вычислительной техники. Эйсымонт Л.К. ОАО «НИЦЭВТ» (Концерн радиостроения Вега)

Презентация:



Advertisements
Похожие презентации
Суперкомпьютеры и их применение. Суперкомпьютер Суперкомпьютер (с англ. «Supercomputer», СверхЭВМ, СуперЭВМ, сверхвычислитель) специализированная вычислительная.
Advertisements

1 Микропроцессорная система. 2 Особенности микропроцессорных систем Гибкая логика работы меняется в зависимости от задачи; Универсальность может решать.
История предмета год.- Чарьлз Бебидж механическо- вычислительную машину, использовав.
Компьютер – универсальная техническая система обработки информации Информатика. 10 класс.
Центр дистанционных автоматизированных учебных лабораторий Казанский государственный технический университет им. А.Н.Туполева Институт радиоэлектроники.
Работу выполнили ученики 21 гимназии 10 А класса.
ПАРАЛЛЕЛЬНАЯ ФИЛЬТРАЦИЯ ИЗОБРАЖЕНИЙ Фурсов В.А., Попов С.Б. Самарский научный центр РАН, Самарский государственный аэрокосмический университет, Институт.
Выполнили: Мартышкин А. И. Кутузов В. В., Трояшкин П. В., Руководитель проекта – Мартышкин А. И., аспирант, ассистент кафедры ВМиС ПГТА.
Терминология Микропроцессор (МП) - программно-управляемое устройство, осуществляющее процесс цифровой обработки информации и управления и построенное на.
Компьютер как средство обработки информации. Компьютер – это универсальная электронная машина, которая состоит из согласованно работающих аппаратных и.
Нижегородский государственный университет им. Н.И. Лобачевского Факультет вычислительной математики и кибернетики Учебно-исследовательская лаборатория.
ВЯТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ «Роль ВятГУ в развитии биотехнологии Кировской области» Пименов Евгений Васильевич II Международная конференция биотехнологов.
Поколения ЭВМ. В конце XIX века американец Герман Холлерит изобрёл счётно - перфорационную машину. Она осуществляла перфорацию, сортировку, суммирование,
Направление «Информатика и вычислительная техника» Бакалавр по направлению подготовки Информатика и вычислительная техника науки должен решать следующие.
Устройства компьютера. Компьютер – это универсальная электронная машина, которая состоит из согласованно работающих аппаратных и программных средств Аппаратное.
Задача BT (класс А) на UCB NOW и Origin
Архитектура ЭВМ, комплексов и систем Структура дисциплины, Понятие вычислительной машины, принципы ф.Неймана.
Третье поколение ЭВМ ( гг.) В 70-х годах возникают и развиваются ЭВМ третьего поколения. В нашей стране это ЕС ЭВМ, АСВТ, СМ ЭВМ. Данный этап.
1 Микропроцессорные системы. 2 Основные термины Процессор обработчик и вычислитель, выполняющий все операции над кодами и сигналами; Программа набор управляющих.
КЛАССИФИКАЦИЯ КОМПЬЮТЕРОВ Работу выполнил : Смирнов Александр.
Транксрипт:

Прогнозные оценки развития высокопроизводительной вычислительной техники. Эйсымонт Л.К. ОАО «НИЦЭВТ» (Концерн радиостроения Вега)

Четыре сегмента рынка суперкомпьютеров Таблица 1. Зафиксированные в 2002 году объемы четырех сегментов рынка суперкомпьютеров. Таблица 2. Предсказанные в 2002 году объемы сегментов рынка суперкомпьютеров. На самом деле оказалось, что общий объем рынка составил: 2008 ~ $9.000 Дальнейший рост ожидается: 2010 ~ $ ~ $ Это 30% рынка серверных платформ Нас интересует Technical Capability – суперкомпьютеры для решения задач, требующих предельных возможностей (стратегические задачи)

Разные сегменты суперкомпьютерного рынка – разные технологии, разные прогнозы (видение IBM). Наиболее чувствительный к новым технологиям сегмент - CКСН

Специфика формирования прогнозных оценок -- Прогнозные оценки даются с точки зрения архитектора заказных суперкомпьютеров высшего диапазона производительности, предназначенных для решения уникальных стратегически важных для государства задач, далее - суперкомпьютеров стратегического назначения (СКСН) -- Выделяются два связанных друг с другом процесса будущего развития (на примере США, Япония и Китай – по такому же образцу): - революционное развитие, определяемое необходимостью решения стратегических задач государства: 1) работы по программе DARPA HPCS создания заказных СКСН с перспективной архитектурой и глобально адресуемой памятью, далее – перспективных СКСН; 2) работы по Федеральному плану США разработок и исследований в области СКСН, которые являются усилением и обобщением программы DARPA HPCS. - эволюционное развитие, определяемое рынком и появлением массовой и коммерчески доступной элементной базы новой волны, основа которой - многоядерно-мультитредовые микропроцессоры и многосокетные платы на их основе, являющиеся мощными SMP-узлами с разделяемой между сокетами платы общей памятью.

Проекты создания суперкомпьютеров стратегического назначения (СКСН) с перспективной архитектурой США – программа DARPA HPCS (2002) - проект Cascade (Cray) - системы Baker, Granite, Marble. 250 млн $ на федеральный проект - проект PERCS (IBM) млн $ на , федеральный проект Япония – программа Next Generation Supercomputer Министерства Образования, Культуры, Спорта, Науки и Технологий (2006) - проект 3K (Институт физических и химических исследований (RIKEN) и Fujitsu),1.2 млрд.$, федеральный проект. Китай – программа 863 Министерства науки и технологий (2006) - проект HPP (Институт вычислительных технологий (ICT), фирма Dawning, Национальный университет оборонных технологий (NUDT)), федеральный проект Россия – в рамках ФЦП Минпромторговли РФ, Минобрнауки РФ (2005) - проект Ангара (ОАОНИЦЭВТ)

Главная решаемая проблема в проектах создания перспективных СКСН – стена памяти Что это за проблема ?

Интегральные оценки реальной производительности – пакет HPC Challenge и метод APEX-поверхности Cхема организации APEX-теста

Пример профиля работы с памятью задачи CF-класса (DGEMM)

Пример профиля работы с памятью для задачи DIS-класса (SpMV) Рис. Профиль обращений к памяти для теста SpMV (A*p=q)

Пример профиля работы с памятью для задачи DIS-класса (FFT-одномерное быстрое преобразование Фурье)

Пример профиля работы с памятью для задачи DIS-класса (BFS)

Пример профиля работы с памятью для задачи DIS-класса (RandomAccess)

Коммуникационные профили разных задач. Большой объем передаваемой информации, нерегулярный и коллективный характер взаимодействий приводят к деградации реальной производительности и плохой масштабируемости.

Требования к перспективным CКСН программы DARPA HPCS.

Общий взгляд на задачи для СКСН и влияние базовых характеристик СКСН на эффективность решения этих задач. 1.Контроль боеготовности ядерных арсеналов и разработка новых боезапасов. 2. Радиоэлектронная разведка и другие задачи разведывательных сообществ. 3. Решение задач военного характера. 4.Предсказание климата. 5.Физика плазмы – решение задач создания термоядерных реакторов. 6.Решение инженерных задач в области машиностроения. 7. Биоинформатика и вычислительная биология, задачи влияния окружающей среды. 8.Предсказание землетрясений. 9.Геофизические расчеты. 10.Астрофизика (+ поиск новых источников энергии). 11.Материаловедение и нанотехнологии. 12. Исследования социальных систем – макроэкономика и социальная динамика.

Подробный комментарий к задачам, для которых в первую очередь создаются перспективные СКСН программы DARPA HPCS (или в решении каких задач мы рискуем отстать)

Мирные приложения – значимость перспективных СКСН для развития общества V технологический уклад - Компьютеры - Малотоннажная химия - Телекоммуникации - Электроника - Интернет VI технологический уклад - Биотехнологии - Нанотехнологии - Проектирование живого - Вложения в человека - Новое природопользование - Роботехника - Новая медицина - Высокие гуманитарные технологии - Проектирование будущего и управление им - Технологии сборки и уничтожения социальных субъектов

Организация работ в области перспективных СКСН в США, контроль качества разработок с использованием новых подходов объективного оценочного тестирования реальной производительности Одновременно ведется программа DARPA PCA разработки перспективных встроенных суперкомпьютеров (ВСК), во многом похожая по решаемым принципиальным проблемам на DARPA HPCS и контролируемая той же организацией – Линкольновской лабораторией Массачусетского технологического института. В данном докладе это не рассматривается, требует отдельного детального рассмотрения.

Об организации работ в области суперкомпьютерных технологий в США DARPA Cray – проект CASCADE IBM - проект PERCS MIT – проект RAW Stanford Unv. – проект Smart Memory Unv.of South.Calif. (+Raytheon) – проект MONARCH Unv.of Texas at Austin (+IBM) – проект TRIPS

Cистема тестов оценки производительности CКСН программы DARPA HPCS

Сравнение NEC SX-9 с другими системами (современный подход - kiviat-диаграмма, на лучах – наименования тестов пакета HPC Challenge)

Примеры планов и основных решений проектов создания перспективных СКСН США, Японии и Китая Базовые стратегии решения проблемы стены памяти - обеспечение толерантности процессора к задержкам за счет работы со скоростью, определяемой темпом выполнения операций, а не задержками их выполнения (мультитредовые и векторные архитектуры); - обеспечение управляемой локализации как данных при вычислениях, так и вычислений при данных (кэши, удаленные вызовы процедур, DAE-архитектуры и модели вычислений); - применение статических и динамических потоковых моделей вычислений с управлением вычислениями потоком данных (streambased-архитектуры, dataflow-архитектуры, одновременно решает проблему ограниченного ILP, т.е. ограниченного параллелизма выполнения машинных команд)

Планы создания новых суперкомпьютеров фирмы Cray (+ унификация !)

Планы создания новых суперкомпьютеров фирмы IBM (+ унификация!)

Новая политика Японии в области стратегических вычислений

Фирма Сray, проект Cascade программы DARPA HPCS – базовая концепция проекта

Cтруктура CКСН Сray Cascade Baker и Granite Глобально адресуемая память с унифицированной для всех типов узлов архитектурой Конфигурируемые сеть, память, процессоры и ввод-вывод Гетерогенная обработка на множестве узлов разного типа и внутри тредово-векторных (MVP) узлов Возможность адаптации при конфигурировании, компиляции в процессе выполнения

Многоядерно-мультитредовый микропроцессор Power7 – базовый микропроцессор CКСН IBM PERCS - 8 ядер, в каждом ядре 4 треда, SMT-мультитредовость, запуск в одном ядре 6 команд за такт; - в одном мультитредовом ядре 12 функциональных устройств: FXU -2, FPU – 4, LSU -2, VSX – 1, BRU – 1, СRU-1, DFU -1; - объем кэш-памяти L3 – 32 Мбайт, 2 контроллера внешней DRAM - памяти; - 32 сокета на плате, т.е треда над общей памятью - кристалл – 567 мм 2, 1.2 млрд.транзисторов, 4 Ггц. Кристалл Power 7Одно многоядерное ядро (Core)

Модифицированная сеть Клоса – коммуникационная сеть СКСН IBM PERCS Обычная свернутая сеть Клоса, при передачах проходят несколько линков, но это лучше, чем для сетей N-тор Сеть IBM PERCS, при большинстве передач проходят только один линк, лучше, чем для сети Клоса

Многоядерный мультитредово-потоковый микропроцессор СКСН Ангара (вариант J10)

Какие характеристики можно ожидать от перспективных СКСН ? Результаты оценочных тестовых экспериментов на имитационной архитектурной модели российской перспективной СКСН Ангара (данные по зарубежным перспективным СКСН пока недоступны, ожидаются в 2010 году)

APEX-поверхности для микропроцессоров разного типа и узла СКСН Ангара

APEX-поверхности для мультипроцессорных систем разного типа (256 узлов) и СКСН Ангара

Эффективность СКСН Ангара на тесте умножения разреженной матрицы на вектор J7-2 J10-4

Эффективность СКСН Ангара на тесте BFS работы с графами

Какие изменения происходят в области коммерчески доступной элементной базыновой волныи вычислительных средств?Вынужденные решения проблемы стены памяти из-за появления многоядерных микропроцессоров. Требуемого стратегическими приложениями решения проблемы стены памяти пока нет, хотя стало полегче…

Ослабление закона Мура, многоядерные микропроцессоры

Прогнозируемые общие изменения микроархитектуры процессоров применение малой и существенной мультитредовости применение гомогенных и гетерогенных реконфигурируемых полей ядер увеличение пропускной способности интерфейса с памятью и сетью обеспечение эффективной работы с глобально адресуемой памятью

Многосокетная плата нового поколения с микропроцессорами AMD (HyperTransport-!)

Многосокетные платы нового поколения с микропроцессорами Intel (QuickPath - !)

Реальная производительность одной многосокетной платы на задаче UA расчета на структурированной динамически изменяемой сетке.

Динамика изменений среднего времени обращения к памяти для разной пространственно-временной локализации и разной мультитредовости.

Динамика изменений среднего времени обращения к памяти для лучшей и худшей точки APEX-поверхности

Сравнение современных многоядерных микропроцессоров и многосокетных плат с массово-мультитредовыми микропроцессорами перспективных СКСН. Задача CG, класс C.

Что будет после достижения целей DARPA HPCS и похожих других программ создания стратегических СКСН? Прогнозы и планы дальнейшего развития в соответствии с Федеральным планом США 2004 года по возрождению работ в области стратегических информационных технологий

Экзафлопсная перспектива 2020 года ( усиление тредового и потокового параллелизма) Додекатрон

Оценки предельных возможностей использования кремниевой элементной базы при построении высокопроизводительных систем (ноябрь 2004, Sandia Lab). Peta – 10 15, Exa – 10 18, Zetta – 10 21, Yotta – – обычная кремеиевая технология, программируемые микропроцессоры 2 – бычная кремниемая технология, но прямая аппаратная реализация решателей задач 3 – новая технология с транзисторами на квантовых точках и реверсивной логике, программируемые средства - зеленая линия, прямая аппаратная реализация - красная

Развитие аппаратных средств-1.

Развитие аппаратных средств-2.

Развитие аппаратных средств-3.

Развитие программного обеспечения-1.

Развитие программного обеспечения-3.

Развитие СКСН - 1.

Развитие СКСН - 2.

Развитие СКСН - 3.

ОАО « Научно - исследовательский центр электронной вычислительной техники »