Е. Новодворский (ПИЯФ, Гатчина) Что такое Grid? GRID - некоторая аналогией с электрическими сетями (power grid), предоставляющими всеобщий доступ к электрической.

Презентация:



Advertisements
Похожие презентации
Grid для новых пользователей GRID - некоторая аналогия с электрическими сетями (power grid), предоставляющими всеобщий доступ к электрической мощности.
Advertisements

Е. Новодворский (ПИЯФ, Гатчина) GRID - некоторая аналогия с электрическими сетями (power grid), предоставляющими всеобщий доступ к электрической мощности.
Распределенная обработка информации Разработано: Е.Г. Лаврушиной.
Выполнила студентка II курса ГБОУ СПО Баймакский сельскохозяйственный техникум Вахитова Гульназ.
Администрирование информационных систем Лекция 4. Система управления базами данных.
Локальная сеть Типы локальных сетей Топология сетей.
Рис Еталонная модель OSI Абонентская станция 1 Абонентская станция 2 Прикладной процесс АПрикладной процесс В Уровни Протоколы 1 Прикладной 2 Представительский.
Структура компьютерных сетей. Компьютерная сеть Компьютерная сеть – соединение компьютеров для обмена информацией и совместного использования ресурсов.
Компьютерные сети и Компьютерные сети и Интернет.
Организация распределенных прикладных систем. Попытаемся ответить на вопросы Как устроены распределенные прикладные системы? Каковы наиболее важные их.
Архитектура защиты ГРИД-систем для обработки конфиденциальной информации И.А.Трифаленков Директор по технологиям и решениям.
Сетевые службы Для конечного пользователя сеть это не компьютеры, кабели и концентраторы и даже не информационные потоки, для него сеть это, прежде всего,
«СЕТИ КОМПЬЮТЕРОВ. ОСНОВНЫЕ ПОНЯТИЯ» Методическое пособие по дисциплине «Программное обеспечение компьютерных сетей и информационных систем»
Назначение и классификация компьютерных сетей Современное производство требует высоких скоростей обработки информации, удобных форм её хранения и передачи.
Autodesk ФОРУМ ТЕХНОЛОГИИ ПРОЕКТИРОВАНИЯ Москва, 22 и 23 сентября 2010 Повышение производительности расчетных задач в Autodesk Algor при использовании.
Базы данных Лекция 01 Информационные технологии баз данных.
Компьютерные сети и Интернет Локальные сети. Локальные сети. Для связи с внешним (периферийными)устройствами компьютер имеет порты, через которые он способен.
Перспективные информационно-сетевые технологии в космических исследованиях Институт космических исследований РАН, Телекоммуникационные сети и системы Москва,
Принципы согласования гетерогенных сетей. Маршрутизация пакетов. Борисов В.А. КАСК – филиал ФГБОУ ВПО РАНХ и ГС Красноармейск 2011 г.
Дисциплина: Организация, принципы построения и функционирования компьютерных сетей Лекция 4 Многоуровневые коммуникации в сетях.
Транксрипт:

Е. Новодворский (ПИЯФ, Гатчина) Что такое Grid? GRID - некоторая аналогией с электрическими сетями (power grid), предоставляющими всеобщий доступ к электрической мощности. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Предпосылки Экстенсивное развитие - простое увеличение мощности процессоров, емкости накопителей, пропускной способности каналов практически исчерпало свои ресурсы Необходим качественный, концептуальный скачок в вычислениях (мощности по требованию). Разработки в этом направлении ведут как академические учреждения, так и компании … IBM вычисления по требованию (on-demand computing) реализуют идеи распределения ресурсов по потребности. автономные вычисления (autonomic computing) должна повысить надежность и управляемость вычислительных систем, снизив при этом сложность их эксплуатации. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Одна из первых по важности разработок такого рода технология Grid NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

История Грид Начало 90-х - идея создать из многочисленных суперкомпьютерных центров США очень большой Метакомпьютер, так чтобы пользователи могли получать практически неограниченные ресурсы для вычислений и хранения данных. Первоначально необходимость в новой системе компьютерной связи возникла у физиков. Когда в ЦЕРНе началось строительство гигантского ускорителя, выяснилось - для обработки результатов экспериментов понадобятся суперкомпьютеры с такими вычислительными мощностями, каких в природе пока и не существует. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

ЦЕРН инициатор создаения системы распределенных компьютерных вычислений GRID. Первая фаза проекта GRID для ускорителя LHC (Большой адронный коллайдер - Large Hadron Collider) была одобрена на Совете ЦЕРН. Сегодня важно не только иметь доступ к информации, но и распределенным образом обрабатывать ее. Четыре гигантских детектора этого ускорителя будут накапливать больше чем 10 миллионов гигабайт данных в течение каждого года о событиях, происходящих при столкновении частиц. Это эквивалентно содержанию, примерно, 20 миллионов компьютерных компакт-дисков. Почти 10 тысяч ученых из сотен университетов мира группируются в виртуальные сообщества, чтобы анализировать данные с ускорителя LHC. За одну секунду на экспериментальных установках этого ускорителя будет происходить более одного миллиарда соударений. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Концепция GRID создание компьютерной инфраструктуры нового типа, обеспечивающей глобальную интеграцию информационных и вычислительных ресурсов на основе управляющего и оптимизирующего программного обеспечения (middleware) нового поколения. создание набора стандартизированных служб для обеспечения надежного, совместимого, дешевого и всепроникающего доступа к географически распределенным высокотехнологичным информационным и вычислительным ресурсам - отдельным компьютерам, кластерам и суперкомпьютерным центрам, хранилищам информации, сетям, научному инструментарию и т.д. междисциплинарный характер GRID. Имеется довольно много общего в вычислительных потребностях различных областей научных исследований - развиваемые технологии применяются в физике высоких энергий, космофизике, микробиологии, экологии, метеорологии, различных инженерных приложениях. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Объединенные сетью центры обработки данных и соответствующее программное обеспечение middleware как элемент, связывающий ресурсы Пользователи используют ресурсы, общаются с коллегами, имеют доступ к данным независимо от своего местоположения. Научные инструменты и эксперименты поставляют огромные массивы данных Взгляд на GRID NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Технология Grid виртуализация ресурсов концепция разделения и совместного использования логических и физических устройств в сети. среда, в которой объединены находящиеся в разных местах глобальной телекомунникационной сети вычислительные установки и которая предназначена для выполнения распределенных приложений, использующих ресурсы этих установок. технология распределенных вычислений в Интернете опирается и развивает традиционные технологии Интернет впервые серьезно ставится вопрос о гарантированном качестве обслуживания. третье поколение Интернета. Второе поколение - взаимодействие между двумя компьютерами: с одного мы можем присоединиться к другому и осуществить некую транзакцию. Третье поколение - со своего компьютера вы сможете заставить работать на себя сеть компьютеров. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

GRID GRID новое направление, позволяющее использовать вычислительную мощность и системы хранения данных в гетерогенных системах. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Вначале считалось, что Grid будет использоваться в основном для задействования простаивающих вычислительных компьютерных ресурсов с учетом нужд существующего ПО. Сейчас стало ясно, что 80–90% ПО составляют совершенно новые приложения,которые вообще не были бы возможны без Grid.. Пример У одного немецкого банка процедура расчета инвестиционных рисков занимала 13 часов. Теперь, с использованием технологии Grid на Unix кластере, они рассчитывают риски каждые 15 минут. Банк никогда бы не купил компьютер достаточной для таких расчетов мощности и смог позволить себе такую услугу только благодаря технологии Grid. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Итак Grid позволяет вдохнуть новую жизнь в уже существующие технологии. Grid является основой для новых приложений, ранее не реализуемых. Важный момент для заказчика он не покупает Grid, он строит Grid, решая бизнес-задачи. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Сегодня Grid широко применяется Ускоритель CERN UK Science Grid Национальный маммографический проект в Великобритании Молекулярная биологии для моделирования структуры белка, анализа последовательностей ДНК …. Бизнес нефтяная отрасль, геологоразведка В банковском деле В автомобильной промышленности Grid позволяет ускорить и удешевить расчет виртуальных крэш-тестов Airbus и Boeing используют технологию для постоянного контроля состояния двигателей и других агрегатов и узлов самолета - показания датчиков, непрерывно собирающих информацию, через спутник передаются на землю, где анализируются в сетях Grid В телекоммуникационной отрасли потенциальной областью использования Grid являются онлайновые игровые системы, такие, как Butterfly.net IBM активно использует технологию Grid для внутренних нужд (моделирование при создании микропроцессоров следующих поколений, таких, как Power5 и Power6 NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Некоторые GRID-проекты Distributed.net - решение крупных переборных задач. GIMPS - поиск простых чисел Мерсенна (т.е. простых чисел вида 2 P -1). С начала проекта было найдено 4 таких простых числа. SETI - поиск внеземных цивилизаций с помощью распределенной обработки данных, поступающих с радиотелескопа. Для участия в проекте зарегистрировались около 920 тыс. человек. TERRA ONE - объединение персональных компьютеров, подключенных к Интернет, для решения задач анализа информации, предоставляемой различными заказчиками. Legion - разработка объектно-ориентированного программного обеспечения для построения виртуальных мета-компьютеров, включающих до нескольких миллионов хостов, объединенных высокоскоростными сетями. Condor - распределяет независимые подзадачи по существующей в организации сети рабочих станций, заставляя компьютеры работать в свободное время Globus - построение инфраструктуры для "computational grids", включающей в себя вычислительные системы, системы визуализации, экспериментальные установки. В рамках проекта проводятся исследовании по построению распределенных алгоритмов, обеспечению безопасности и отказоустойчивости мета-компьютеров. EU Data GRID (EDG) - для физики высоких энергий, биоинформатики и системы наблюдений за Землей. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Российские участники Grid Телекоммуникационный центр "Наука и общество" Биологи: Институт молекулярной биологии РАН Институт биологии гена РАН Институт биомедицинской химии РАМН Физики: Институт теоретической и экспериментальной физики НИИ ядерной физики МГУ Институт Космических исследований РАН Объединённый институт ядерных исследований (Дубна) Институт физики высоких энергий (Протвино) Петербургский Институт Ядерной Физики (Гатчина) Химики: Институт химической физики РАН Институт органической химии РАН Медики: Институт иммунологии МЗ Институт вирусологии РАМН Институт биохимии РАМН Институт вакцин и сывороток РАМН Научный центр хирургии РАМН Международный институт теории прогнозов NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Краткий обзор структуры GRID GRID Распределенная программно-аппаратная компьютерная среда, с принципиально новой организацией вычислений и управления потоками заданий и данных. Такая компьютерная инфраструктура предназначена для объединения вычислительных мощностей различных организаций. На основе технологии GRID Предполагается формирование региональных и даже национальных вычислительных компьютерных инфраструктур для создания объединенных интернациональных ресурсов, предназначенных для решения крупных научно-технических задач. В идеальном случае пользователя не будет интересовать где находятся используемые им ресурсы. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Цели создания инфраструктуры GRID Среди основных направлений использования GRID на данный момент можно выделить : организация эффективного использования ресурсов для небольших задач, с утилизацией временно простаивающих компьютерных ресурсов; распределенные супервычисления, решение очень крупных задач, требующих огромных процессорных ресурсов, памяти и т.д.; вычисления с привлечением больших объемов географически распределенных данных, например, в метеорологии, астрономии, физике высоких энергий; коллективные вычисления, в которых одновременно принимают участие пользователи из различных организаций. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Задачи инфраструктуры GRID Cвязь Взаимодействие в GRID-среде может происходить в самых разных режимах: от передачи сообщений точка-точка до широкого вещания, причем, такие приложения как, например, управление инструментами могут одновременно использовать несколько режимов. Информационное обслуживание Безопасность Безопасность в GRID-среде включает вопросы аутентификации, авторизации, разграничения прав и пр. Пользователь аутентифицирует себя всего один раз за сессию, создавая мандат, по которому процессы получают ресурсы от имени пользователя без какого-либо его дополнительного вмешательства. Управление ресурсами – обнаружение и выделение ресурсов аутентификация авторизация создание процессов другие действия по подготовке ресурсов к использованию в сетевом приложении. Локальное управление ресурсами и заданиями. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Информационное обслуживание Предоставление информации : –Самой Grid Главным образом для пакетов middleware Пользователь может запросить её, чтобы понять состояние Grid –Приложению Grid Для пользователей Гибкая инфраструктура –Возможность справиться с узлами в распределенной среде с ненадежной сетью –Динамическое дополнение и удаление информационных источников –Система безопасности способна адресовать доступ к информации на высоком уровне степени детализации –Возможность определить новые типы данных –Масштабируемость –Хорошая производительность –Стандартизация

Безопасность важна для Grid: –В частности в коммерции Вопрос безопасности должен быть решен с самого начала Безопасность Grid основывается на PKI - Public Key Infrastructure (или асимметричная криптография) –Требования: аутентификация и авторизация Базовые точки: –Пользователи – CA (Certificate Authorities) – провайдер ресурсов Мы должны решить вопросы безопасности с самого начала, но решим что с ней делать позже Безопасность NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Сертификат - подробнее – в докладе Кирьянова А.К NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г. Безопасность

Терминология Компьютер конечного пользователя (User Interface, UI) установлено программные средства пользовательского интерфейса позволяет конечному пользователю взаимодействовать с GRID- средой ( запускать задания и получать результаты). Вычислительный элемент (Computing Element, CE) представляет собой GRID-интерфейс к локальной СУПО. Рабочие узлы (Woker Nodes, WN) выполняют фактические вычисления, на них установлено программное обеспечение для выполнения заданий конечных пользователей. Накопитель данных (Storage Element, SE) обеспечивает единообразный доступ к любым накопителям данных. В общем случае, накопитель может управлять дисковыми массивами, массовой памятью и т.п. Этот элемент скрывает детали конкретной накопительной системы и обеспечивает пользователям единообразный доступ к данным. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Терминология Узлы, ответственные за сервисы общего пользования: Брокер ресурсов (Resource Broker) принимает задание от пользователя согласует требования к ресурсам, содержащиеся в описании задания, с имеющимися в наличии свободными ресурсами и направляет задание на подходящий сайт. Каталог реплик (Replica Catalog) Поддерживает базу данных о местах хранения оригинальных файлов и всех их копий. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Терминология GRID и распределенные вычисления однотипные ресурсы, локальные или специализированные компьютерные сети, разнородные ресурсы, динамическое подключение и удаление ресурсов, большие коллективы Виртуальная Организация (VO) много организаций, объединённых для решения проблем в режиме скоординированного распределения своих ресурсов GRID и WWW www - организуется доступ к распределенным информационным ресурсам (незначительные вычисления) GRID - инфраструктура для доступа к значительным распределенным вычислительным ресурсам и данным NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Виртуальные организации Пользователь должен выть членом VO VO –Контролирует доступ к описанным CE, SE –Обычно включает географически распределенных пользователей –Должна знать, кто что делает, и кому не будет позволено делать это снова… Безопасность. Существующие VO: –HEP сообщество, биологи, астрономы,… VOMS: максимальная гибкость управления VO NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Терминология Applications (Приложения) Прикладной уровень для каждого класса задач имеет свои особенности и предполагает взаимодействие с другими уровнями модели с использованием либо стандартных либо собственных средств и сервисов (например, на основе наборов SDKs и интерфейсов APIs ) Collective (Координация глобальных ресурсов) Большое разнообразие протоколов необходимо для: Обслуживания директорий (определение участниками доступных ресурсов VO и/или их свойств) Службы приписки, планирования и выделения ресурсов Службы мониторинга и диагностики ресурсов Службы репликации данных (обеспечение наивысшей производительности при доступе к данным – время реакции, надежность, стоимость) Средств контроля и корректировки загрузки ресурсов Службы определения и выбора оптимальных версий Software для различных вычислительных платформ Серверов авторизации (проведение политики выделения ресурсов и политики безопасности) Службы подсчета потребленных ресурсов (в т.ч. для оплаты) Службы поддержки больших коллабораций NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Терминология Resource (Распределение одиночных ресурсов) Этот уровень обслуживает только локальные ресурсы. Глобальными ресурсами занят другой уровень. информационные протоколы определения состояния ресурсов (конфигурация, текущая загрузка, политика – например, стоимость) управляющие протоколы, определяющие условия доступа к ресурсам, включая качество обслуживания, резервирование, формы оплаты и т.д. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Терминология Connectivity (Быстрое и безопасное соединение) Коммуникационные протоколы для обмена данными между ресурсами (транспортировка, маршрутизация, работа с именами). Средства аутентификации пользователей и ресурсов должны поддерживать: делегирование прав (условных и безусловных) взаимодействие с локальными средствами безопасности (в т.ч. Unix, Kerberos и т.п.) доверительные отношения пользователей (А+Б=АБ) одноразовая проверка подлинности; Гибкость политики безопасности (контроль за защитными механизмами с возможностью в критических случаях снимать или ограничивать делегированные права). NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Терминология Fabric (Ресурсы) Вычислительные ресурсы: функции определения типа Hardware и Software; механизмы запуска программ, мониторинга, управления завершением программ; состояния загрузки процессоров, очередей и т.п. Ресурсы файловой памяти: механизмы приема/передачи файлов (включая возможности компрессии); средства резервирования и освобождения файлового пространства; функции определения типа Hardware и Software; мониторинг доступного пространства и скоростей обмена. Сетевые ресурсы: механизмы определения и назначения ресурсов (включая запросы на приоритеты и резервацию). Хранилище кодов: Специализированный ресурс для работы с различными версиями исходных и объектных кодов. Каталоги: Специализированный ресурс для работы с порядком доступа и обновлением каталогов (например, реляционные базы данных). Снятие или ограничение делегированных прав). NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Middleware Обеспечивает общие услуги Grid Информация Управление Заданиями Управление Данными Безопасность Регистрация Мониторинг NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Что характеризует Grid систему? Огромные ресурсы Собственность организаций и индивидуумов Потенциальная недоступность ресурсов Различные требования безопасности Гетерогенные ресурсы Географическая распределенность Различные политики управления ресурсами Соединение гетерогенных многоуровневых сетей

Суть идеи Если нельзя считать в миллион раз быстрее, то можно считать медленно, но на миллионе компьютеров одновременно. Вести расчеты сразу на многих компьютерах можно и через Интернет, но для этого вы должны сначала договориться с владельцами компьютеров. Включаясь в Grid, вы изначально отдаете все свои свободные вычислительные мощности в общее пользование. Grid в качестве Интернета-2 будет намного удобнее и эффективнее. Обыкновенный потребитель, которому вроде бы и не нужно заниматься сложными вычислениями, на самом деле постоянно занимается ими - его компьютер только и делает, что рассчитывает сложную графику. Подключившись к Grid, человек превращает свой самый обычный, дешевый компьютер в супермашину с астрономическими возможностями. Grid - дорогое удовольствие, но платить необязательно живыми деньгами. Подключаясь к Grid, вы отдаете в его распоряжение ресурсы своего компьютера, а это тоже плата. Та страна, которая подключит к Grid больше информационных и вычислительных ресурсов, будет в конечном итоге платить за него меньше всех. Больше всех придется раскошеливаться тем, у кого этих ресурсов мало. Другими словами, за Grid главным образом будут платить опоздавшие. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Что будет … Физики узнают, наконец, из чего состоит следующая неделимая элементарная частица. Биологи расскажут врачам, как с помощью генной инженерии вырастить новые зубы взамен выпавших. Химики изобретут пластиковые пакеты, которые будут растворяться и утекать в водостоки. Астрономы найдут, наконец, сигналы от братьев по разуму … И каждый пользователь нового Интернета сможет узнать много нового и интересного обо всём на свете. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Когда? Уже началось! Значительная часть аппаратной инфраструктуры, образующая ядро российского сегмента Grid уже построена. Работа идёт над согласованием протоколов взаимодействия элементов Grid - компьютеров и … людей, использующих Grid. Для взаимопонимания компьютеров создаются программы, которые обеспечат их взаимодействие. Для взаимопонимания людей создаётся Ассоциация пользователей российского сегмента Grid, в рамках которой будет организовано взаимодействие участников. NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Полезные ссылки European DataGrid (EDG) LHC Computing GRID (LCG)cern.ch/lcg CrossGRID DataTAG GridLab EUROGRID EGEE public.eu-egee.org RDIG NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.

Спасибо за внимание! NA3 Induction Courses, ПИЯФ, 10 сентября, 2004 г.