Особенности архитектуры «Эльбрус» Александр Ким, Владимир Волконский ЗАО «МЦСТ» & ОАО «ИНЭУМ им. И.С.Брука» Научная конференция «Высокопроизводительные.

Презентация:



Advertisements
Похожие презентации
Обзор операционных систем ВОУНБ им. М. Горького «Операционная система - это совокупность программ, обеспечивающих управление процессом обработки информации.
Advertisements

Лекция 6 Понятие операционных систем Учебные вопросы: 1. Характеристики ОС 2. Свободные и проприетарные ОС.
Домашнее задание (от ) § 2.2 1, 5. ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ КОМПЬЮТЕРА КОМПЬЮТЕР КАК УНИВЕСАЛЬНОЕ УСТРОЙСТВО ДЛЯ РАБОТЫ С ИНФОРМАЦИЕЙ Информатика.
Архитектура операционных систем Семестр 2, Лекция 1.
Архитектура операционных систем. Архитектура ОС Состав модулей (компонент) ОС Структура связей между отдельными модулями ОС Принципы взаимодействия модулей.
1 Работа под управлением ОС Windows. 2 Темы для обсуждения 1. Что такое операционная система Что такое операционная система Понятие ОС Виды ОС 2. Операционная.
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ КОМПЬЮТЕРА КОМПЬЮТЕР КАК УНИВЕСАЛЬНОЕ УСТРОЙСТВО ДЛЯ РАБОТЫ С ИНФОРМАЦИЕЙ Информатика и ИКТ.
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ КОМПЬЮТЕРА КОМПЬЮТЕР КАК УНИВЕСАЛЬНОЕ УСТРОЙСТВО ДЛЯ РАБОТЫ С ИНФОРМАЦИЕЙ Информатика и ИКТ.
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ КОМПЬЮТЕРА Ключевые слова программа программное обеспечение (ПО) системное ПО прикладное ПО система программирования.
Архитектура операционной системы. Ядро и вспомогательные модули операционной системы При функциональной декомпозиции ОС модули разделяются на две группы:
ОПЕРАИОННАЯ СИСТЕМА. Операционная система комплекс программ, обеспечивающий управление аппаратными средствами компьютера, организующий работу с файлами.
Оглавление Программное обеспечение Операционная система Загрузка ОС Установка ОС Домашнее задание.
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ КОМПЬЮТЕРА КОМПЬЮТЕР КАК УНИВЕСАЛЬНОЕ УСТРОЙСТВО ДЛЯ РАБОТЫ С ИНФОРМАЦИЕЙ Информатика и ИКТ.
1 Программное обеспечение (ПО) или «софт» (software) По назначению Системное Прикладное Инструментальное По способу распространения Проприетарное Открытое.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РЕСПУБЛИКА ТАДЖИКИСТАН ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ ТАДЖИКИСТАНА ФАКУЛЬТЕТ: «С Т Р Ф» МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ.
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ КОМПЬЮТЕРА КОМПЬЮТЕР КАК УНИВЕСАЛЬНОЕ УСТРОЙСТВО ДЛЯ РАБОТЫ С ИНФОРМАЦИЕЙ Информатика и ИКТ Скачать конспект к данной презентации.
Теория компиляторов-2. Л.31 Теория компиляторов Часть II Лекция 2.
Архитектура ЭВМ (лекция 7) проф. Петрова И.Ю. Курс Информатики.
Выберите процессор, соответствующий Вашим потребностям.
Учитель информатики Трашков О.Л.. Обработка информации в компьютере и управление всеми его устройствами осуществляется с помощью программ. Компьютер представляет.
Транксрипт:

Особенности архитектуры «Эльбрус» Александр Ким, Владимир Волконский ЗАО «МЦСТ» & ОАО «ИНЭУМ им. И.С.Брука» Научная конференция «Высокопроизводительные вычисления в науке и образовании» 25 марта 2009 г.

ЗАО «МЦСТ» и его разработки ЗАО «МЦСТ» –создана в 1992 г. на базе отделений ИТМ и ВТ им. С.А.Лебедева –с 2007 г. интегрируется с ОАО «ИНЭУМ им. И.С.Брука» Микропроцессоры (МП) –семейство МП «Эльбрус» для высокопроизводительных вычислений –семейство МП «МЦСТ-R» для встраиваемых систем Вычислительные комплексы –«Эльбрус-3М» на базе МП «Эльбрус» –Семейство «Эльбрус-90микро» на базе МП «МЦСТ-R» Системное программное обеспечение –операционные системы (Linux, ОС МСВС, Solaris) –оптимизирующие компиляторы с языков С, С++, Фортран –система оптимизирующей двоичной трансляции для обеспечения совместимости с Интел x86

Микропроцессор «Эльбрус» Российский универсальный микропроцессор «Эльбрус» Не имеющая аналогов в мире высокопроизводительная архитектура Прошел успешные Государственные испытания в 2007 г.

Вычислительные комплексы «Эльбрус-3М» на базе микропроцессора «Эльбрус» Исполнение CompactPCI Серверное исполнение Выдержал успешные Государственные испытания в 2007 г.

Важнейшие особенности архитектуры «Эльбрус» Высокая производительность за счет параллелизма –явный параллелизм операций – широкая команда –векторный параллелизм – использование ширины регистров –параллелизм потоков управления Полная и эффективная (за счет параллелизма) двоичная совместимость с Intel x86 на базе скрытой динамической двоичной трансляции Аппаратная поддержка защищенных вычислений (модульного программирования) –защита от вирусов –эффективный параллельный контроль при выполнении операций над объектами

Параллелизм операций в архитектуре «Эльбрус» Архитектура микропроцессораЧисло операций, выполняемых за такт в одном ядре Intel Pentium 44 Intel Core 26 IBM Power 66 Intel Itanium Эльбрус23 По результатам ГИ производительность «Эльбруса» 300 МГгц в среднем равна 2 ГГц Pentium 4, логическая скорость превышает более 6 раз

Программная поддержка параллельной аппаратуры –Операционная система обеспечивает многопроцессорный и многомашинный режим вычислительного процесса –Оптимизирующий компилятор выполняет автоматическое оптимальное распараллеливание транслируемых программ –Система двоичной трансляции Обеспечивает полную совместимость с Intel x86 Характеристики ПО –разработано 5,4 млн. строк –перенесено с доработками под платформу 95,8 млн. строк Программное обеспечение ВК «Эльбрус-3М»

Микропроцессор «Эльбрус»

Характеристики МП «Эльбрус» Эльбрус Intel Core2 Технология мкм 0,13 0,045 Частота МГц Количество транзисторов млн. 75,8 > 400 Количество слоев металла Темп обмена с ОП ГБ/с 4,8 10,8 Темп обмена с КЭШ памятью ГБ/с 16,8 21,4 Мощность Вт Размер кристалла кв. мм Количество выводов BGA 900(470) > 1000 Пиковая производ-сть Гипс/Гфлпс - 32-разрядные числа 9,5/4,8 27,6/18, разрядные числа 6,9/2,4 13,8/9,2

Одновременно исполняемые операции скал. выч.цикл Int (8) / FP (9) / St (2) / Ld (4) Обработка предикатов Передача управления Загрузка литерала 32/64- 4/2 + Считывание элемента массива- 4 + Адресная арифметика- 4 + Обработка счетчика цикла Всего: 18/16 23

Оптимизирующий компилятор

Производительность ВК «Эльбрус-3М» На 21 задаче производительность в среднем равна 2 ГГц Pentium 4 Наиболее заметное преимущество на задачах с большим параллелизмом

Пиковая производительность (32-/64-разрядные операции) –33/23 операций за такт –16/8 вещественных операций за такт На реальных задачах демонстрируется производительность близкая к пиковой - умножение матриц (DGEMM) 32/64 разряда 4,5/2,3 Гфлпс (пик – 4,8/2,4) - сложение матриц (STREAM – темп памяти) 4,6 ГБ/с (пик – 4,8) - быстрое преобразование Фурье (FFT) 32/64 разряда 2,8/1,5 Гфлпс (пик – 3,0/1,5) - Госкрипт – 97% загрузка арифметических устройств; в 3,6 раза быстрее Pentium 4 1,5 ГГц Производительность ВК «Эльбрус-3М»

Двоичная трансляция

Эффективность двоичной совместимости с Intel x86 Функциональность –Полная совместимость с архитектурой Intel x86 –Прямое исполнение 20+ операционных систем, в том числе: MSDOS, Windows XP, Linux, QNX –Прямое исполнение самых популярных приложений ПроизводительностьПроизводительность –Логическая скорость в 1,5-2 раза выше Pentium 4 –Достигается за счет скрытой системы двоичной трансляции, использующей параллелизм Лицензионная независимость от Intel

Производительность при полной совместимости с Intel x86 На плавающих задачах Spec Lintel на платформе E3M 300Mгц превосходит x86 машину с процессором PIII 450Mгц При этом на некоторых задачах Spec2000fp Lintel всего в два раза отстаёт от P4 1.7 Ггц.

Обеспечение эффективности энергопотребления –Архитектура предоставляет параллельные ресурсы –Компиляторы автоматически распараллеливают программу, эффективно загружая аппаратуру –Достигается для универсальных одноядерных микропроцессоров соотношение производительности к мощности – более 0,4 Гфлпс на 1 Вт Малое энергопотребление

Основаны на контекстной защите памяти на базе тегированной архитектуры Служат основой защиты от компьютерных вирусов Многократно ускоряется отладка программ Эффективность реализации базируется на параллельном выполнении контроля –Не замедляет выполнение операций Защищенные вычисления

Задачи Всего задач Задач с найденными ошибками Задачи пользователей 74 Пакет SPECint95 87 Пакет негативных тестов samate на защищенность Типы ошибок: нарушение границ объекта (переполнение буфера) использование неинициализированных данных использование опасных конструкций языка или опасных отклонений от стандарта языка Эффективный инструмент отладки программ

Развитие линии «Эльбрус» Увеличение производительности микропроцессоров –Повышение тактовой частоты – свыше 3 ГГц –Увеличение числа ядер на кристалле до 16 –Включение специализированных ядер Увеличение производительности комплексов –Создание мощного 64-процессорного сервера (узла), работающего на общей памяти –Создание вычислительных систем, связывающих узлы мощными каналами обмена данными Распараллеливание вычислений на уровне операций, ядер, процессоров и узлов с использованием компиляторов

Система на кристалле Эльбрус-1С

Развитие линии микропроцессоров 500 МГц, 12 Вт 600 МГц, 20 Вт 4000 МГц 2000 МГц 1000 МГц, 31 Вт

4-х процессорные конфигурации на базе МП «Эльбрус» cpu Mem I/O 4-х процессорный сервер (модуль) 1тфлпс 4-х процессорный кластер (модуль) 1тфлпс Switch 4-х процессорный сервер – когерентная система с распределенной общей памятью 4-х процессорный кластер – базовый элемент для 16-ти и 64-х процессорных серверов. Switch содержит справочник и фильтр для построения когерентных систем CPU – 8 -ядерный процессор

Развитие серверов и комплексов

Двоичная компиляция –Реализовать многопроцессорность –Обеспечить совместимость с х86-64 –Реализовать бинарный компилятор приложений –Повысить эффективность за счет компилятора в 1,5-2 раза Повысить производительность за счет оптимизирующего компилятора с языков С, С++, Фортран в 1,5-2 раза Высокопроизводительные библиотеки –Линейная алгебра, обработка сигналов, 3D графика Поддержка в ОС несимметричного доступа в память Направления разработки компиляторов и ОС

Полностью российская архитектура Простота перехода –За счет полной совместимости с Intel x86 –Наличие OS Linux, ОС МСВС –Наличие развитых средств разработки программ Высокая логическая скорость при экономном потреблении энергии Полный диапазон применения –настольные компьютеры, серверы, суперкомпьютеры Платформа для создание безопасных систем Низкая стоимость при массовом производстве Преимущества использования линии «Эльбрус»

СПАСИБО! Контакты авторов:

Состав ОПО «Эльбрус» Операционные системы –Linux, ОС МСВС –Ядро поддерживает работу в реальном времени –Оболочка обеспечивает стандартное пользовательское окружение, включая графические библиотеки и базы данных Система программирования –Компиляторы, отладчики, анализаторы производительности –Высокопроизводительные библиотеки –Средства защищенного исполнения программ Оптимизирующий двоичный транслятор

Производительность на выделяемую мощность 1C4C4C2C 4C 8C Превосходит зарубежные микропроцессоры

Разновидности параллелизма в архитектуре «Эльбрус» Параллелизм операций –Явный параллелизм, планируется при компиляции Векторный параллелизм –Векторные операции на ширину аппаратных регистров Параллелизм потоков управления –Когерентный доступ в память –Обеспечивается многопроцессорностью и многоядерностью в составе мощного сервера Параллелизм слабо взаимодействующих задач –Обеспечивается объединением в сеть серверных узлов с сохранением когерентного доступа в память

Параллелизм операций (1) u = (a – c) – (b + c) – (c + d); x = (e – f); y = (a + b) + e; z = (a + b) + (a – c) + (e – (b – d)); Пример: исходный текст Всего 36 операций a, b, c, d, e, f – операции считывания данных из памяти u, x, y, z – операции записи данных в память

Параллелизм операций (2) u = (a – c) – (b + c) – (c + d); x = (e – f); y = (a + b) + e; z = (a + b) + (a – c) + (e – (b – d)); Пример: исходный текстПредставление в виде графа зависимостей Зависимости между операциями Критический путь Число операций в графе уменьшилось за счет оптимизирующего компилятора 36 операций 22 операции acbdef + – –– –++ –– + x––+ + y u – z

Параллелизм операций (3) Представление в виде графа зависимостейПараллельный код Эльбруса Критический путь – 5 тактов Совпадает с критическим путем! 5 тактов Каждая строка соответствует одной широкой команде, запускающей все операции в ней параллельно acbdef + – –– –++ –– + x––+ + y u – z

Параллелизм операций (4) Аппаратный Планировщик Intel x86 Последовательный код Параллельный код IntelПараллельный код Эльбруса В 2 раза быстрее Intel 22 такта 10 тактов 5 тактов Код планируется компилятором по графу acbdef + – ++ –– +x ––+ + y u – z

Параллелизм операций (5) Аппаратный Планировщик Intel x86 Последовательный код Параллельный код IntelПараллельный код Эльбруса 22 такта 10 тактов 5 тактов Параллельный код Эльбруса 6 тактов В 2 раза быстрее Intel Скрытый двоичный транслятор Выполняется быстрее Intel в 1,66

Список исполненных программ Приложения (1000+) Игры для DOS (600+) Программы для DOS (100+) - файловые менеджеры (nc, vc), архиваторы (rar, arj, zip), компиляторы (borland pascal, c, djgpp), антивирусы (dr.web, aidstest), базы данных, справочники, словари, переводчики, Мультимедиа просмотрщики (видео/картинки) Программы для Windows (200+) - Игры (Unreal, Diablo, Civilization, Quake, ), компиляторы (MS Visual Studio, Intel C++,...), браузеры (IE, Mazilla, Opera,...), графические редакторы (Paint, Photoshop, CorelDraw,...), текстовые редакторы (10+), пакет MS- Office, мультимедиа просмотрщики (Аудио/Видео/Картинки 10+), программы работы с БД (Переводчики, Справочники, Энциклопедии 15+), тесты надежности и производительности (Sandra, Dr.Hard, CPU-Z,SpeedDisk 30+)- программы с высокой нагрузкой на вычислительные ресурс(MathCad, MathLab 15+) Программы для работы в linux (50+) - компиляторы и интерпретаторы языков программирования (gcc, ixx, ifort,perl, awk, pythiton, bash,...), мультимедиа просмотрщики/редакторы (mplayer, qiv,...), текстовые редакторы (vim, nedit, less,...), Архиваторы (zip,...), тестовые пакеты задач (x11.perf, spec92/95/2000/2006), файловые менеджеры (mc,...) Программы для школы (18 позиций из 31 списка требуемых) - звуковой редактор (CoolEdit), редакторы векторной и растровой графики (Photoshop, CorelDraw), программа для проведения видеомонтажа и сжатия видео файлов (Dr.DivX), редактор Web- страниц (AceHTML), клавиатурный тренажер (BabyType) и др. Операционные системы (20+) Windows - 95, 98, ME, 2000, NT, NT RUS, XP MS DOS, FreeDOS32 ОС МСВС Rev.11, Rev.13 Linux - Debian, Ubuntu 7.10 (Gutsy Gibbon), Ubuntu 8.04 LTS (Hardy Heron), ALT Linux Master 2.4 (LiveCD Installer), Gentoo (LiveCD Installer), Gentoo Linux (LiveCD Installer), Paragon Partition Manager (LiveCD), Knoppix 3.78 (CD), Knoppix MythTV (LiveCD), slax- popcorn (LiveCD), geexbox (LiveCD), womp-0.6beta, linVDR 0.5, PragmaLinux UNIX - FreeBSD 5.3 (LiveCD Installer), OpenBSD3.5-firewall, NetBSD, ИНТРОС 5.3 LynxOS QNX eCOS, eCOS/Scivoli, ZOG (eCOS+Forth) Menuet OS MIR OS RTEMS FortOS (4IM)

Схемы переноса и исполнения программ на ВК «Эльбрус-3М» Коды C/C++ под Linux Перенос с адаптацией и отладкой Оптимизирующий компилятор и сборка Дополнительные трудозатраты Любые кодыIntel x86 Любые операционные системы ВК Эльбрус-3М OS Linux Предельно быстрое исполнение Двоичный транслятор Коды «Эльбрус» Исполнение быстрее, чем на Intel с той же тактовой частотой Затраты на перенос не нужны

Защита данных