С у п е р к о м п ь ю т е р ы – и перспективы развития С у п е р к о м п ь ю т е р ы – состояние и перспективы развития 1 0. 2 0 0 9 В. К. Л е в и н, академик.

Презентация:



Advertisements
Похожие презентации
КЛАССИФИКАЦИЯ КОМПЬЮТЕРОВ ПО ФУНКЦИОНАЛЬНЫМ ВОЗМОЖНОСТЯМ.
Advertisements

МАССОВЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ: СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ БЕТЕЛИН В.Б.
Санкт-Петербургский Государственный Политехнический Университет Развитие высокопроизводительных вычислительных ресурсов вуза 21 ноября 2011 В.С. Синепол.
Институт программных систем Российской академии наук 1 Суперкомпьютерная программа «СКИФ-ГРИД» Союзного государства Третий Форум проектов союзных программ.
Параллельные вычисления Лекция 6. y = 3x + 7x – 8x при x = 4 y1 = 3x(1 действие) y2 = 7x(2 действие) y3 = 8x(3 действие) y = y1 + y2 – y3(4 действие)
Компания «Т-Платформы» Является ведущим российским разработчиком кластерных решений Поставляет высокопроизводительные решения для любых отраслей народного.
The AMD Athlon (K7). Шина AMD Athlon AMD Opteron.
Суперкомпьютерный комплекс НИВЦ МГУ и перспективы его развития 12 ноября 2008 г. А.В.Тихонравов, Вл.В.Воеводин.
История предмета год.- Чарьлз Бебидж механическо- вычислительную машину, использовав.
Решения компании «Т-Платформы» для высокопроизводительных вычислений: взаимовыгодное сотрудничество отечественной науки и бизнеса.
Основы параллельного программирования Посыпкин Михаил Анатольевич.
Супер-ЭВМ это достаточно гибкий и очень широкий термин. В общем понимании супер-ЭВМ это компьютер значительно мощнее всех имеющихся доступных на рынке.
Архитектура микропроцессоров И ее эволюция. Процессор и память: Команды и данные.
Поколения ЭВМ © Ягодкина Ю.В., ГОУ СОШ 1028, 2010.
Организация ЭВМ и систем Кафедра Параллельных вычислений (ИВМиМГ) Маркова Валентина Петровна, Киреев Сергей Евгеньевич,
Система в сборе 1. Кластер 2. ИБП 3. Стойка 14 U 4. Поставщик оборудования - компания Bevalex.
Микропроцессор Назначение и основные характеристики памяти Внутренняя память.
Процессор – это центральное устройство компьютера. Он выполняет команды находящейся в оперативной памяти программы и взаимодействует.
© 2010 IBM Corporation IBM Power Systems Уникальные технологии IBM для центров обработки данных Алексей Перевозчиков POWER Product Manager
Демидов А.В г.1 Операционные системы Лекция 1 Определение, история, классификация ОС, Архитектура ЭВМ.
Транксрипт:

С у п е р к о м п ь ю т е р ы – и перспективы развития С у п е р к о м п ь ю т е р ы – состояние и перспективы развития В. К. Л е в и н, академик РАН, научный руководитель ФГУП НИИ «Квант»

Цель – создание высокопроизводительных систем для решения актуальных сложных прикладных задач, требующих большого объема вычислений и обработки данных – обеспечение потребностей текущего и ближайшего периода Создание и применение суперкомпьютеров относится к факторам стратегического значения и входит в число научно-технических приоритетов развитых стран СУПЕРКОМПЬЮТЕРЫ В РОССИИ

Диапазон производительн. (0,1–1) Max – это 20 –30 вычислительн. установок, фактически уникальных; 500 наиболее мощных установок ( охватывают 100-кратн. диапазон; суммарно 20 Max. С у п е р к о м п ь ю т е р ы : – наиболее мощные вычислит. установки, – сложны и нетрадиционны в применениях, – ограничены по условиям приобретения. Концепция высокопроизводительных вычислений: м а с с о в о - п а р а л л е л ь н а я с т р у к т у р а на прогрессирующей микропроцессорной базе. Реализация : массивы процессоров, объединенные с хост-компьютерами, внешней памятью, серверами и рабочими станциями пользователей в сетевой среде. Свойства: масштабируемость, преемственность ПО. Max 1 квдрлн операций / сек. На сегодня: Max 1 квдрлн операций / сек.

ENIAC Р а з в и т и е с у п е р к о м п ь ю т е р о в 1 Tf/s 1 Gf/s 1 Pf/s 1 Ef/s 1 Mf/s оп./с гг Cray 1 IBM 701 Транзисторы CDC ЭСЛ-база КМОП-база 1946

Годы Прогноз [Petaflops] В е р х н и й у р о в е н ь производительности суперкомпьютеров экстраполяция данных списков Top 500 Факторы повышения производительности: физическое быстродействие компонентов; структурный параллелизм – внутрипроцессорный и многопроцессорный; проблемная ориентация – специализация.

С у п е р к о м п ь ю т е р ы в с п и с к е Т о р 5 0 0

2005 г. B l u e G e n e / L 367 Tflops; 32 TB 230 м тыс. процессоров 2 МВт В 2007 г. основная аппаратура увеличена с 64- до 104 стоек, производит. повышена до 0,6 Pf / s; в новых стойках удвоена память, т.е. объем операт. памяти 72 ТВ 5 место Тор 500

C r a y Jaguar 45 тыс. чипов, 4-яд. AMD Opteron; память 8 Гбайт / чип; 8,5 MВт; 600 м 2 XT5; 1,4 Pf/s; 150 тыс. ядер; 200 стоек XT4; 0,26 Pf/s; 31 тыс. ядер; 84 стойки 2005 – 9 1,6 Plops peak 12 место Тор место Тор 500

I B M R o a d r u n n e r Процессоры: 7 тыс. 2 Opteron, 13 тыс. Cell, eDP Модуль 0,4 Tf/s Память TB Сеть Infiniband 500 м 2 2,4 MВт 230 т 1,1 Pflops (Linpack) ; 2008 г.

Similar to processor used in Playstation 3 with 64 bit float. point. PPU Power PC, Linux, 4gb RAM, 512kb L2 cache. 8 SPUs: - 256kb RAM; - memory (DMA) controller with access to local and PowerPC memory. 128 registers, 128 bits wide. Short vector operations: - 4 single precision operations at once, - 2 double precision operations. Each SPU has an independent memory (DMA) controller, memory access can be overlapped with computation. Fast and simple, and there are 8 of them. IBM Road Runner Cell Processor the Accelerator

IBM RoadRunner Programming Model Параллелизм: SIMD MIMD Multi SIMD How many programs do I have to write? 3 ! – Opteron / MPI, Power Processor, SPE. C e l l MPI CellCell CellCell CellCell

Фирма, система, процессор Тест Linpack: T f l o p s / … Место в Тор 500 / ядро/ кВт/ стойка / млн долл. IBM p6 0,015 0,096, IBM Cell 0,009 0, яд. Xeon 0,009 0,27 6, яд. Opteron 0,007 0,23 5,5311 IBM BG/P 0,0028 0, IBM BG/L 0,0022 0,24,755 SiCortex ,001 0,36 6 Tf/s MDGRAPE-3 0, Pf/s Сопоставление суперкомпьютеров

Суперкомпьютеры в списке Тор 500 (июнь 2009 г.) Обновляемость: отсечено 230 позиций списка Тор 500 от ноября 2008 г. Суммарная производительность установок списка: 22,6 Pflops (год назад было 11,7Pf/s); доли фирм США: IBM - 39%, HP - 25%, Cray -14%, SGI - 7%, Dell - 2%; доля японских фирм – 3%. Поставщики 476 установок списка – фирмы США: IBM – 188 уст. / в т.ч кластеры, HP – 212 кл., SGI – 20, Cray – 20, Dell – 14 кл. В 497 уст. использ. микропроцессоры фирм США: Intel (89% - 4-яд.), IBM - 55 (Cell - 4), AMD - 43 уст. Кластеры: 410 установок, 59% суммарной производ. Межпроцессорные сети: Gigabit Ethernet 282, Infiniband 151, Myrinet 10 установок..

Дислокация Колич. [Tf/s] Верх. места 1.США Великобрит Германия Франция Китай Япония Швеция Канада Индия Италия Испания Н. Зеландия Австрия Швейцария Россия Польша Прочие 15 стран В с е г о22608 Распределение количества суперкомпьют-в, их суммарной производит. и верхних уровней производительн. по странам мира данные списка Тор 500 от 06.09, 1,1 Pf/s 17 Tf/s В России 42 устан. в диапазоне 17 1 Tf/s (supercomputers.ru)

С у п е р к о м п ь ю т е р ы в Р о с с и и

A NEW VISION of high end computing, high p r o d u c t i v i t y computing systems (HPCS) Design attributes in the latter part of this decade: Performance: Improve the computational efficiency and performance of critical national security applications. Programmability: Reduce cost and time of developing HPCS application solutions. Portability: Insulate research and operational HPCS application software from system specifics. Robustness: Deliver improved reliability to HPCS users and reduce risk of malicious activities.

Р А З В И Т И Е С У П Е Р К О М П Ь Ю Т И Н Г А О г р а н и ч е н и я :О г р а н и ч е н и я : Ограничения по стоимости, срокам работ, площади, энергопотреблению, теплоотводу Дефицит кадров Трудности разработки, изготовления, эксплуатации Сложность, новизна, трудоемкость использования Неясность результатов и потребностей применений С ф е р ы в з а и м о д е й с т в и я gif

Виртуальная общая оперативная память Конкретизация потребностей применений. Интерпретация программными средствами. Совершенствование организации кэш-памяти. Наращивание количества процессорных ядер в SMP-модуле. Применение быстродействующих интерфейсов и внешних шин в процессорах. Ускорение межпроцессорного обмена; 2–3 -уровневая структура и специализация сетей. Многопотоковая обработка (m u l t i t h r e a d i n g). Новые компоненты системного ПО.

Обработка 64-битных чисел Время выполнения в потоке данных Латентность - время доступа к массиву данных Арифметические операции 0,1 н с0, 5 2 н с Кэш-памяти; многопотоковая и многоядерная структура Обращение к основной памяти 2 н с н с Межмодульный обмен 5 н с1 3 м к с Обращение к дисковой памяти 2 0 н с1 0 м с Оценки продолжительности операций К о н с т р у и р о в а н и е - снижение латентности П р и м е н е н и я - локализация данных в памяти Н е о б х о д и м а в з а и м о с в я з ь :

Взаимодействие человек машина Д Р У Г И Е П А Р А Д И Г М Ы АВТОМАТИКИ З а д а ч и : математика, физика, химия, биология, геология, метеорология, инженерия, … РАЗВИТИЕIСПЕЦИАЛИЗАЦИЯРАЗВИТИЕIСПЕЦИАЛИЗАЦИЯ Баланс ресурсов совмещение разнородных задач П А Р А Д И Г М А ОБРАБОТКИ ДАННЫХ Использование к о м п ь ю т е р о в : методы и алгоритмы; программирование К о м п ь ю т е р : обработка - АЛУ, хранение - память, передача данных, программн. обесп.

У Р О В Н И ПАРАЛЛЕЛЬНОЙ ОБРАБОТКИ З а д а ч иЗ а д а ч иРезультаты Операционная система Прикладные программы Масштабируемая с е т ь процессорных модулей (MPP) Многопроцессорный модуль с о б щ е й памятью (SMP) СБИС с нескольк. процессорными ядрами (m u l t i - c o r e c h i p) С о п р о ц е с с о р ы – векторные и др. Многопотоковая обработка данных (m u l t i t h r e a d i n g) Множество АЛУ с общим программным управлением (SIMD) Параллелизм в схемотехнике обрабатывающих элементов Оптимизация программ Свойства аппаратуры, в т.ч. памяти и связей

П р о б л е м н а я о р и е н т а ц и я функциональная специализация в ы ч и с л и т е л н ы х с и с т е м СПЕЦИАЛИЗАЦИЯСПЕЦИАЛИЗАЦИЯ М Я Г К А ЯМ Я Г К А Я ЖЕСТКАЯ Реконфигурируемые структуры компонентов (ПЛИС) и систем В ы ч и с лители с жесткой структурой управления С о п р о ц е с с о р ы - у с к о р и т е л и ( г и б р и д н ы е с и с т е м ы ) С о с т а в и п а р а м е т р ы а п п а р а т у р ы и п р о г р а м м

узел 0 узел 1 узел 5 у з е лу з е л Гибридная система – макет «МВС-экспресс», совместная разработка ИПМ им. М.В.Келдыша РАН и «НИИ «Квант». Пиковая производит. – 2Тфлопс.

Реконфигурируемый м о д у л ь (РМ) на базе П Л И С Вычислителный м а к р о м о д у л ь на базе «программируемой» логики больших интегральных с х е м – П Л И С - FPGA В Н Е Ш Н Я Я С Е Т Ь К оммуникационная среда РМ Реконфигурируемый модуль ( Р М ) СубмодульСубмодуль СубмодульСубмодуль ПЛИС СубмодулиСубмодули СубмодулиСубмодули Х о с т – к о м п ь ю т е р Проблемно-ориентированная обработка данных

Развитие памяти, П Л И С, коммутаций, внешних устр. функциональная полнота – универсальность, высокое б ы с т р о д е й с т в и е, массовость, надежность, относит. дешевизна, малые габариты и энергопотребление. Современное поколение микропроцессоров: ~ 1 млрд. транзисторов в чипе, тактовая частота 1– 4 ГГц, тепловыделение 30 –100 Вт. Векторная, мультитредовая, мультипроцессорная обработка МИКРОПРОЦЕССОРНАЯ БАЗА КОМПЬЮТЕРОВ Крупносерийная п р о д у к ц и я ш и р о к о г о пр именения Крупносерийная п р о д у к ц и я ш и р о к о г о п р и м е н е н и я Технология 40 – 80 нм Близкая перспектива: технология 30 нм; 5 8 ГГц Близкая перспектива: технология 30 нм; 5 – 8 ГГц

30 nm длина 65 nm Node nm прототип 45 nm Node nm длина 90 nm Node nm Node nm прототип 2013 – nm Node nm 11 nm Node nm 2003 – 2012 Новое поколение технологий Intel каждые 2 года; Intel R&D обеспечит это в течение следующего десятилетия 3 nm 8 nm Node 2017 Intel продвигает закон Мура в будущее ИсследованияВ планах выпуска 15 nm прототип 32 nm Node nm 15nm Возможности производства позволяют реализовать новые технологии Производительность: более быстрые транзисторы

Увеличение количества ядер в мп-чипе. Многопотоковая обработка m u l t i t h r e a d i n g. Расширение векторной обработки и формата обрабатываемых данных (до 256 бит). Встраивание в мп-чип графической обработки. Наращивание в чипе блоков системной логики: - расширение доступа к памяти и многоканальные контроллеры памяти; - контроллеры высокоскоростных межкристальных линий связи (Hyper Transport, шины PCI-Express…). Сочетание микропроцессоров и ПЛИС. С т р у к т у р н о - ф у н к ц и о н а л ь н о е р а з в и т и е м и к р о п р о ц е с с о р о в

Развитие микропроцессоров IBM Cell PowerXCell 8i, 3.2 GHz

П р о г н о з н а г. – 10 flops, 50 – 100 тыс. чипов, 100 стоек, 2 МВт, 4 – 8 млн. процессоров СК 2015 г. – flops, 50 – 100 тыс. чипов, 100 стоек, 2 МВт, 4 – 8 млн. процессоров : 80-процессорный чип, 32 нм, мм 2, 3 ГГц, 1 Tflops ( 2 ) I n t e l 2010 г. : 80-процессорный чип, 32 нм, мм 2, 3 ГГц, 1 Tflops ( 2 ) T 10 T T 100 T T 1 T P 10 P Pflops 100 Pflops P 1 P #1#1 ПРОИЗВОДИТЕЛЬНОСТЬПРОИЗВОДИТЕЛЬНОСТЬ МВС #500 МСЦ IBM Roadrunner Cray XT5 Jaguar IBM BG / L 0,5 Pf/s 104 стойки 106 тыс. 2-проц. чипов СКИФ МГУ МВС-1000M г.м Тор Pf/s

М и к р о э л е к т р о н и к а : - быстродействие и уровень интеграции; - надежность; - стоимость; - энергопотребление, теплоотвод. Системная интеграция – кластеры; программное обеспечение; сферы и методы применений. Проблемно-ориентированные системы. G r i d - т е х н о л о г и и : - сети массовых компьютеров; - взаимодействие крупных ВЦ. Защита информации: модели угроз; нормы; средства защиты; организация эксплуатации. Инфраструктура; координация и обмен опытом. Поисковые исследования, «нетрадиционные» напр. м а с с о в о с т ь п р о и з в о д т в а Факторы развития суперкомпьютинга повышение мощности и эффективности