Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 10 лет назад пользователемАлла Тронина
1 Обеспечение оперативного контроля и эффективной автономной работы суперкомпьютерных комплексов А.С. Антонов, Вад.В. Воеводин, Вл.В. Воеводин, С.А. Жуматий, Д.А. Никитенко, С.И. Соболев, К.С. Стефанов, П.А. Швец Лаборатория параллельных информационных технологий НИВЦ МГУ Ломоносовские чтения, 24 апреля 2014 г.
2 Проблема Современный суперкомпьютерный комплекс – крайне сложная и энергонасыщенная система: –вычислительное оборудование: узлы, сети, … –инфраструктура: питание, климатика, безопасность, … –ПО: ОС, компиляторы, прикладные пакеты, … –… В любой момент времени любой компонент может выйти из строя –последствия могут быть различными –принципиально проблема не решается
3 Основные задачи проекта OctoTron Разработка программного комплекса для обеспечения: максимальной сохранности оборудования максимально полного использования оборудования
4 Требования к системе OctoTron Обнаружение всех потенциальных источников отказов комплекса Наличие средств реагирования на аварийные ситуации Гибкость и независимость от целевой архитектуры Масштабируемость Наличие средств самодиагностики Обеспечение преемственности в сопровождении суперкомпьютерных комплексов
5 Основная идея проекта Модель функционирования суперкомпьютерного комплекса, представленная в виде расширенного мультиграфа: –вершины – компоненты суперкомпьютера –ребра – связи между компонентами –атрибуты – свойства компонентов –правила и реакции – функции для определения аварийных ситуаций и реагирования на них Стойка 1 Узел 1 Узел 2 Узел N содержит ИБП 1 питает Горячий коридор 1 Стойка 2 охлаждает содержит
6 Новизна подхода Системы обеспечения безопасного функционирования существуют и активно используются В суперкомпьютерных комплексах применяется либо «традиционный подход», либо решения от производителей оборудования Аналогичных систем, основанных на моделях, в открытом доступе не нашлось
7 Текущие результаты Реализован прототип системы OctoTron Созданы средства описания моделей Прототип проходит апробацию на суперкомпьютере «Чебышев» Прототип готовится к внедрению на суперкомпьютере «Ломоносов» Грант РФФИ мол_а_вед ( ) 1 публикация в трудах конференции –статья в журнале «Вестник УГАТУ»
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.