Сервисно ориентированная наука: SOS или СОН. Общество стало другим.

Презентация:



Advertisements
Похожие презентации
WEB- ТЕХНОЛОГИИ Лекция 6. Понятие Web- сервисов 1 Интерфейс в глобальную сеть для некоторого абстрактного программного обеспечения, этот интерфейс позволяет.
Advertisements

Современные направления интеллектуализации глобальной сети Интернет Сорокин Арсений Николаевич Вологда, 2008.
Реинжениринг данных общего архива наблюдений САО РАН Желенкова О. П., Витковский В. В., Пляскина Т. А. 1 САО РАН, июля, 2009.
Специальная астрофизическая обсерватория РАН В.В. Витковский, О.П. Желенкова, Е.И. Кайсина, Н.А. Калинина, Г.А. Малькова, В.Н. Черненков,
Web - сервисы. Веб-служба, веб-сервис (англ. web service) идентифицируемая веб-адресом программная система со стандартизированными интерфейсами.англ.веб-адресоминтерфейсами.
1 Современные системы программирования. Часть 2. Системное и прикладное программное обеспечение Малышенко Владислав Викторович.
10 фактов об астрономии Сергей Попов. Факт 1 Астрономия – наблюдательная наука В астрономии невозможны прямые эксперименты с изучаемыми объектами. Это.
Решение задач 1. Скорость модема бит / с. Сколько времени потребуется для передачи 1 страницы текста, состоящей из 40 строк по 60 символов? 2. Скорость.
Тест Тема: Компьютерные сети. Вопрос 1 Вариант 1 Какой из способов подключения к Интернет обеспечивает наибольшие возможности для доступа к информационным.
ГСНТИ задание 2.2«Разработать сервер доступа к библиотечным информационным ресурсам по протоколу z39.50 и систему обслуживания по принципу «Одно.
Раздел 3 Сетевые модели. Тема 3.1 Понятие сетевой модели. Архитектура сети определяет основные элементы сети, характеризует ее общую логическую организацию,
Сервисы Интернет. РЕЗОЛЮЦИЯ: Федеральный сетевой совет признает, что следующие словосочетания отражают наше определение термина "Интернет". Интернет это.
Интеграция «1С:Предприятие 8» с другими системами ЗАО "МиСофт НВП" , г.Минск, ул.Шафарнянская, 11, офис 31. тел. (017)
Сервис On-Line доступ ПП Парус 8 Применение для разработки WEB- интерфейса.
Всеми́рная паути́на (англ. World Wide Web) это система (сеть), обеспечивающая доступ к информационным объектам, связанным между собой гиперссылками и.
Наиболее популярные ресурсы Интернета это Всемирная паутина Электронная почта Файловые архивы Общение в Интернете Мобильный Интернет.
РЕАЛИЗАЦИЯ GRID-СЕРВИСОВ В ОКЕАНОГРАФИЧЕСКОЙ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЙ СИСТЕМЕ ДВО РАН Антушев С. Г., Голик А. В
С Е Р В И С Ы ИНТЕРНЕТ. Глобальная сеть Интернет привлекает пользователей своими информационными ресурсами и услугами Глобальная сеть Интернет привлекает.
Автоматизированная библиотечная система и электронный архив открытого доступа Разделение задач, функций и технологических решений Негуляев Е. А. Пятая.
«СЕТИ КОМПЬЮТЕРОВ. ОСНОВНЫЕ ПОНЯТИЯ» Методическое пособие по дисциплине «Программное обеспечение компьютерных сетей и информационных систем»
Транксрипт:

Сервисно ориентированная наука: SOS или СОН

Общество стало другим

Информационное общество –главные продукты производства это информация и знание –Основа капитализация компании это знание. Основной вопрос как накопить знание и обмениваться знанием –CEO, СTO, CIO senior information officer –NSF-Knowledge management –Цифровое поколение –NSF- CDI, изучение базовых элементов инфраструктуры киберобщества.

Наука стала другой

eScience составная часть информационного общества - синтез науки и информатики –роль информации и ее обработка становится доминирующей Переход на e-стадию реальная ситуация, которая затронула много наук, оперирующих громадными объемами информации –физика (эл. частицы и высоких энергий, науки о земле, погода, астрономия, социология, медицина, биология

Наука стала другой eScience глобальная коллаборация Коллаборация людей и ресурсов, необходимых для решения новых задач науки и промышленности Это технология, инфраструктура –физика Grid (Open Grid) –астрономия VO (Virtual Observatory) –биология биоинформатика

Наука стала другой Другой «шаблон» работы в науке: коллективность, узкая специализация … Административная и финансовая научная политика: «Early Science» «Быстрая наука» Очень много информации/данных (распределенной)

Следствие предыдущего: 60 лет назад читали все вышедшие статьи; 40 лет назад все статьи по теме + абстр. РЖ 20 лет назад все абстр. по теме + нек. статьи; А что и как читают сегодня? Новый «шаблон» работы в науке Коллективность Узкая специализация Ограниченный кругозор Выписка из правил оценки научных достижений ИТЭФ: Категории статей: 1 категория до 100 авторов; 2 категория от 100 до 300 авторов; 3 категория от 300 до 500 авторов; 4 категория от 500 авторов. Например, программисты: Системные администраторы (стандартное железо и поддержка систем); Программирование устройств; Программирование интерфейсов; Программирование БД; Численные методы; Научное моделирование; Обработка данных; … и так далее Другой пример ученые: обработка сырых данных (человек - прибор) создатели приборов (установок …) экспериментаторы специалисты по статистики специалисты по статистике по написанию статей … и так далее

Предложить идею Изучить данные Добиться принятия проекта «Запуск» Провести наблюдения «Сырые » данные Обработка данных ПИАР ПИАР! ПИАР 2 Кто будет наблюдать? Что наблюдать? Успеть опубликовать!! ! Административная и финансовая политика «Early Science»

Очень много информации! (на примере астрономии)

Нейтринные телескопы: (Солнце, SN 1987A) Гравитационные антенны (начинают работать) Космические лучи Астрономия стала всеволновой Дипольные антенны Параболические антенны Болометры Телескопы-рефлекторы Зеркала косого падения Кодирующие маски Атмосферные черенковские телескопы, Широкие атмосферные ливни Электро- магнитное излучение Не электро- магнитное излучение

Астрономия стала всеволновой

Астрономия обзавелась историей Ряды наблюдений: двойной пульсар PSR (Нобелевский лауреат) 33 года некоторые переменные звезды до 150 лет (фототека ГАИШ первые с 1872, регулярные с 1895) остальные неоднородные ряды в лет в разных диапазонах

Астрономия стала широкопольной (много данных с одного снимка)

Стало очень много данных !

Hubble Space Telescope 15 years of operation 700,000 pictures ~ objects 15Gb of data per night Storage – 25 Tb ~ 2 library of Congress

\ Nightly data generation rate –Raw pixel data: 15 Tbytes (16 bit) –Image through pipelines: 30 Tbytes raw science (32 bits) TB (32 bit) intermediate images –Archived images + metadata: Tbytes (32 bits compressed to 16 bits) –Catalogs (transient phenomena): 1 Tbyte (32 bits compressed to 16 bits) Yearly data archive rate (average) –Images: 6.5 Pbytes –Catalogs: 6.5 Pbyte –Metadata: 0.5 Pbytes First light schedule: Spring, 2014 Primary mirror diameter: 8.40 m Pixel count: 3.2 Gpixels Whole sky survey: 3 nights Science Missions: Dark energy Solar system survey Optical transients Galactic map

Size of Databases Tycho Brahe's notebooks – ( ) ~ 500Kb Palomar Observatory Sky Survey –1950 – 10 Gb Sloan Digital Sky Survey – 2007 – 3 Tb (метаданные) Large Synoptic Survey Telescope – 2014 – 6.5 Pb per year (метаданные)

Данные всех астрономических экспериментов NASA, ESA и (частично) ESO и становятся полностью открытыми через 1 год (максимум через 2) после их получения Аналогичная политика для данных больших наземных оптических телескопов России проводится КТБТ (бывший КТШТ). Стало очень много данных (Научная политика)

Причины: Нельзя всё хранить в одном месте (слишком большой объем) Резервирование Скорость доступа «Физические» причины Данные становятся распределенными

«Физические» причины: SNAP

SN Ia 2006X in M100

Expansion of Universe More distant SN Ia, better accuracy !!! 2000 SN Ia/yr, z=2

Данные становятся распределенными «Физические» причины: SNAP Параметры: 1.Поле зрения ~7.5 градусов 2.Размер матрицы 600 мегапикселей 3.Нет обработки на борту 4.Прямая передача данных на Землю (мало памяти на борту) Следствие: Данные сбрасываются в несколько мест.

Что делать ? Старый подход «скачать все к себе на компьютер и обработать» не работает ! –трудно собрать (много разных архивов) –трудно хранить (много места, сохранность данных) –трудно обработать (разные форматы, производительность) –трудно актуализировать (данные меняются) –Очень дорого (трафик, стоимость носителей)

Ограничения со стороны компьютеров и интернет

Ограничения со стороны компьютеров Законы «Мура» Число транзисторов в микросхемах: удваивается за 2 года (~30 раз за 10 лет) Объемы памяти (RАМ): удваиваются за 2 года (~30 раз за 10 лет) Объемы дисков (HDD): удваиваются за 1.5 года (~100 за 10 лет) Скорость передачи данных: удваиваются за 2 года (~30 раз за 10 лет) Нет ограничений Ограничения далеко Ограничения видны!

Ограничения со стороны компьютеров Законы «Мура» Число транзисторов в микросхемах: удваивается за 2 года (~30 раз за 10 лет) Объемы памяти (RАМ): удваиваются за 2 года (~30 раз за 10 лет) Объемы дисков (HDD): удваиваются за 1.5 года (~100 за 10 лет) Скорость передачи данных: удваиваются за 2 года (~30 раз за 10 лет) Выходы: 1.Квантовый компьютер; 2.Параллелизм: «монолитный» Grid Когда размер = размеру атома

Архитектура программ Монолитные программы, Многопользовательские программы Клиент-Сервер Распределенные системы –RPC (Unix) удаленный вызов процедур –RMI (Java, SUN) удаленный вызов методов –COM/DCOM (Windows, Microsoft) –CORBA (OMG) Проблемы со стандартизацией интерфейсов !

text, smtp Общение и обмен данными 70-е годы прошлого века

WWW URI,HTML,HTTP TEXT text, smtp Общение и обмен данными 90-е годы прошлого века URI - Universal Resource Identifier HTML - Hypertext Markup Language HTTP Hypertext Transfer Protocol

WWW URI,HTML,HTTP TEXT Semantic Web RDF,RDF(s),OWL ДАННЫЕ text, smtp Общение и обмен данными начало 21 века RDF Resource Description Framework RDF(s) RDF Schema OWL Web Ontology Language

WWW URI,HTML,HTTP TEXT Semantic Web RDF,RDF(s),OWL ДАННЫЕ Web Services UDDI, WSDL,SOAP ПРОГРАММЫ text, smtp Общение и обработка данных начало 21 века UDDI -Universal Description, Discovery and Intergration WSDL WS Description Language SOAP Simple Object Access Protocol

Web Services Это программа, приложение Запускается через интернет Его описание доступно через интернет Как ее запускать описывается в WSDL файле, внутреннее устройство скрыто Результаты доступны как SOAP сообщение Обеспечивает межмашинное взаимодействие через сеть

Web Services Веб-сервисы можно рассматривать как подпрограммы. Отличия: – веб-сервис исполняемый код –веб-сервис распределенный код –унифированный интерфейс –унифицированные протоколы Веб-сервисы - «кубики лего» для создания сложных веб-сервисов

SOA (service-oriented architecture): сеть слабосвязанных взаимодействующих сервисов, например, web-сервисов. Макро-взгляд на компьютерные вычисления - создание новых систем используя старые системы. SOA

Web Services Architecture

WS composition WS Process Flow ORCHESTRATION BPEL4WS CHOREOGRAPHY WSCI Collaboration

Использование WS Человек нужен для постановки задачи и принятия решения использовать сервис. Счастье наступит когда программа сама сможет это сделать. Нужна семантика !

WWW URI,HTML,HTTP TEXT Semantic Web RDF,RDF(s),OWL ДАННЫЕ Web Services UDDI, WSDL,SOAP ПРОГРАММЫ Счастье ! ПРОГРАММЫ ДАННЫЕ WEB - unversal medium for data, information, and knowledge exchange. text, smtp

Virtual Observatory Счастье для астронома Технология, которая призвана доставить астроному любые данные, независимо от их расположения и методов хранения Базируется на SOA + астрономические стандарты и соглашения Позволяет автоматизировать рутинные процедуры от технологии «клик» к взаимодействию программных агентов WWT Word Wide Telescope, телескоп, который не зависит от погоды !

Виртуальная Обсерватория Где и какие серверы есть? Создание сложных сервисов Создание сложных запросов (заданий) Учет особенностей и потребностей астрономии Описание ресурсов (каталогов, содержания БД) Авторские права Платные ресурсы Политика доступа Real-time web-сервисы Мультиверсионность проблемы и потребности Нужен реестр Библиотеки сервисов Язык заданий: BPEL (Business Process Execution Lang.) Стандарты UCD (Unified Content Descriptors) Ещё не решенные проблемы.

μ (собственное движение) Сколько у него различных обозначений? В каких единицах измеряют расстояние? сантиметры метры километры мили километры в секунду А.Е. световые секунды световые годы парсеки килопарсеки мегапарсеки... Виртуальная Обсерватория: UCD Зачем нужен UCD? более 300

Архитектура Виртуальной Обсерватории

Обучение VO

Какие ресурсы доступны в VO ? Практически все крупные архивы данных

АСТРОНЕТ.RU

Астронет в картинках

SAI CAS Catalogs vo.astronet.ru/cas ConeSearch Service (VOTable, CSV): – USNO B1 – 1 миллиард – 2MASS xsc миллионов – 2MASS psc миллионов – Tycho миллионов – UCAC миллионов – NOMAD миллиарда – DENIS ~ 100 миллионов – others SDSS DR миллионов (2Tb) Linux SMP, HP rx1620, Dual Itanium GHz, 8Gb RAM, SmartArray 64XX HP controller, MSA 20, SATA-I 6 Tb,

Астронет в картинках

Астронет в цифрах Всего в базе данных зарегистрировано (июль 2007 года) – документов (включая версии) новости, статьи, книги, энциклопедии, обзоры, обсуждения, атласы – индексируемых фрагментов – поиск по 4,629,798 документов/1026 сайтов – >4,000,000,000 объектов (6 Тб) – >1Tb - DSS архив Доступ к данным – HTTP – веб-интерфейс – SOAP – веб-сервисы

Астронет в цифрах Всего компьютеров и рабочих станций – 18 Процессоры – 26/25 Ггц Память (RAM) – 30 Гб Дисковое пространство – 77/21 Тб

Астронет в цифрах Посещаемость ( – все роботы исключены – 181,000 уникальных IP адресов (май 2007) – 300,000 визитов в месяц – 2,000,000 страниц в месяц (картинки не считаются) Внешние оценки – Индекс интернет-цитируемости – 3700 – Место в каталоге Яндекс в разделе Наука – 17 из 3425 в общем – 381 из 79573

Узкое место - доступ к данным не качество каналов связи не доступность архивов а совместимость информационной инфраструктуры российской науки и международного сообщества Сервисно-ориентированная архитектура дает возможность интеграции Заключение

Поддерживать и пропагандировать исследования по SOA. Поддерживать практические разработки. Разрабатывать удобные инструменты работы в SOA системах. Планировать архитектуру будущих проектов, не забывать старые данные Обучать студентов !!! Что делать?

Спасибо за Внимание !