Цифровая библиотека научных статей по количественной спектроскопии З.В. Апанович 1, П.С. Винокуров 1, А.Ю.Ахлёстин 2, А.И. Привезенцев 2, А.З.Фазлиев 2.

Презентация:



Advertisements
Похожие презентации
Использование онтологий при анализе предметных областей и проектировании научных информационно-вычислительных систем Фазлиев А.З.
Advertisements

Система управления электронными библиотеками. Состояние Ограниченная доступность электронных представлений в центральных ЭБ Медленная оцифровка изданий.
1 Диаграммы реализации (implementation diagrams).
База данных – информационная модель, позволяющая упорядоченно хранить данные о группе объектов, обладающих одинаковым наборов свойств Базы данных Фактографические.
Н.Е. Филиппова, заведующая сектором научной информации по культуре и искусству.
Построение логической теории информационных ресурсов на примере молекулярной спектроскопии ВведениеВведение Всероссийская научная конференция «Электронные.
RDA Описание Ресурса и Доступ Е.И. Загорская Российская национальная библиотека Санкт-Петербург Всероссийский библиотечный конгресс : XV Ежегодная конференция.
Национальный цифровой ресурс «Руконт» Далее. Содержание Назад Национальный цифровой ресурс «Руконт»: общие сведения Национальный цифровой ресурс «Руконт»:
Онлайновые информационные ресурсы для исследователей по экономике: база данных RePEc и веб-портал RuPEc Thomas Krichel, Виктор Ляпунов, Сергей Паринов.
Каталожная карточка. Каталог – слово греческое. Оно означает «опись», «перечень». Библиотечный каталог – это перечень имеющихся в библиотеке документов,
Библиографическое описание электронных ресурсов: рекомендации и примеры.
Информационные системы. Базы данных. Информационная система – любая система обработки информации (шир)
Система управления электронными библиотеками Захаров А.А., Филиппов В.С. Вычислительный центр им. Дородницина РАН г. Москва.
Билет Табличные базы данных (БД): основные понятия (поле, запись, первичный ключ записи); типы данных. Системы управления базами данных и принципы.
Что такое связи между таблицами В реляционной базе данных связи позволяют избежать избыточности данных. Например, в ходе создания базы данных, содержащей.
Российские ресурсы ЭБД РГБ и "Консультант студента" Совет развития Директор НТБ Колюпанова И.Ю. 6 октября 2015.
Национальный цифровой ресурс «Руконт» Далее. Содержание Назад Национальный цифровой ресурс «Руконт»: общие сведения Национальный цифровой ресурс «Руконт»:
Системы управления базами данных СУБД является универсальным программным средством предназначенным для создания и ведения(обслуживания) баз данных на внешних.
Университетская информационная система РОССИЯ ( УИС РОССИЯ ) Режим доступа:
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ СТАВРОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ.
Транксрипт:

Цифровая библиотека научных статей по количественной спектроскопии З.В. Апанович 1, П.С. Винокуров 1, А.Ю.Ахлёстин 2, А.И. Привезенцев 2, А.З.Фазлиев 2 1. Институт систем информатики СО РАН, Новосибирск 2. Институт оптики атмосферы СО РАН, Томск Digital Scientific Library of Quantitative Spectroscopy Publications Zinaida.V. Apanovich, Pavel S. Vinokurov, Alexey Yu.Akhlyostin, Alexey I.Privezentsev, Alexander Z.Fazliev «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» RCDL-2012, Переславль-Залесский, Россия, октября 2012 г.

Содержание Модель публикации Независимые части публикации (первичные источники данных) Составные источники данных (агрегации первичных данных в статьях) Источник информации Цифровая библиотека научных статей Библиографическая запись – источник информации Каталоги – таксономии классов онтологии информационных ресурсов предметной области Пример цифровой библиотеки. ИВС Визуализация индивидов онтологии Независимые источники информации Источники информации, относящиеся к парам источников данных RCDL-2012

Модель публикации (атомарная часть, (нанопубликация) ) RCDL-2012 решения задачи названием молекулыбиблиографической ссылкой названием метода решения задачи Определение 1. Все части опубликованного решения задачи количественной спектроскопии, дополненные названием молекулы, библиографической ссылкой и названием метода решения задачи (или ссылкой на описание метода) называются первичным источником данных.

Модель публикации (неатомарная часть) RCDL-2012 Определение 2. Информационный объект, обладающий базовыми свойствами первичного источника данных, кардинальность любого из которых отличается от единицы, называется составным источником данных. Базовые свойства isSolutionOf, isRelatedToSubstance, hasMethod, hasReference

Источник информации RCDL-2012 первичным источником информации Определение 3. Первичный источник данных, наделенный дополнительными свойствами, называется первичным источником информации извлеченной из публикации. Качество данных

Независимые части публикации (первичные источники данных) Качество данных Модель публикации RCDL-2012

Зависимые части публикации (первичные источники данных) Модель публикации ( Функциональные требования к источнику информации ) RCDL-2012 Качество данных

Объекты группы 1: произведение, выражение, воплощение, физическая единица Объекты группы 2: лицо, организация Объекты группы 3: концепция, предмет, событие, место Произведение (Заглавие произведения, Форма произведения, Дата произведения, Другие отличительные характеристики, Предусмотренное завершение, Предназначенная аудитория, Контекст произведения, Средство исполнения (музыкальное произведение), Порядковое обозначение, (музыкальное произведение), Тональность (музыкальное произведение), Координаты (картографическое произведение), Равноденствие (картографическое произведение)) Выражение (Заглавие выражения, Форма выражения, Дата выражения, Язык выражения, Другие отличительные характеристики, Возможность расширения выражения, Возможность пересмотра выражения, Объем выражения, Краткое изложение содержания, Контекст выражения, Критический отклик на выражение, Ограничения использования выражения, Обозначение последовательных единиц (сериальное издание), Предполагаемая регулярность выхода (сериальное издание), Предполагаемая периодичность выхода (сериальное издание), Форма изложения нотного текста (нотная запись), Средство исполнения (нотная запись или звукозапись), Масштаб (картографическое изображение/объект), Проекция (картографическое изображение/объект), Способ представления (картографическое изображение/объект), Изображение рельефа (картографическое изображение/объект), Геодезические, вертикальные измерения и измерения для геодезических сетей (картографическое изображение/объект), Техника записи (дистанционное восприятие изображения), Особая характеристика (дистанционное восприятие изображения), Техника (графическое или проекционное изображение)) Functional Requirements for Bibliographic Records, UBCIM Publications – New Series Vol 19, Final Report, IFLA Study Group on the Functional Requirements for Bibliographic Records Approved by the Standing Committee of the IFLA Section on Cataloguing, K. G. Saur Munchen 1998 Функциональные требования к библиографической записи. Объекты и атрибуты RCDL-2012

Воплощение (Заглавие воплощения, Сведения об ответственности, Обозначение издания/выпуска, Место издания/распространения, Издатель/распространитель, Дата издания/распространения, Изготовитель/производитель, Сведения о серии, Форма носителя, Объем носителя, Физическое средство, Способ записи, Размеры носителя, Идентификатор воплощения, Источник приобретения/разрешения доступа, Условия доступности, Ограничения доступа к воплощению, Начертание шрифта (печатная книга), Размер шрифта (печатная книга), Фальцовка (книга ручной печати), Колляция (книга ручной печати), Статус публикации (сериальное издание), Нумерация (сериальное издание), Скорость воспроизведения (звукозапись), Ширина дорожки (звукозапись), Вид нарезки (звукозапись), Конфигурация ленты (звукозапись), Вид звука (звукозапись), Особая характеристика воспроизведения (звукозапись), Цвет (изображение), Кратность уменьшения (микроформа), Полярность (микроформа или визуальная проекция), Поколение (микроформа или визуальная проекция), Формат представления (визуальная проекция), Системные требования (электронный ресурс), Характеристики файла (электронный ресурс), Режим доступа (электронный ресурс удаленного доступа), Адрес доступа (электронный ресурс удаленного доступа)) Физическая единица (Идентификатор физической единицы, Фингерпринт, Происхождение физической единицы, Пометки/надписи, Выставочная история, Состояние физической единицы, История обработки, Запланированная обработка) Лицо (Имя лица, Даты лица, Звание лица, Другие обозначения) Организация (Наименование организации, Номер, ассоциируемый с организацией, Место, ассоциируемое с организацией, Дата, ассоциируемая с организацией, Другое обозначение, ассоциируемое с организацией) Концепция (Термин концепции) Предмет (Термин предмета) Событие (Термин события) Место (Термин места) Функциональные требования к библиографической записи. Объекты и атрибуты RCDL-2012

Библиографическое описание – источник информации RCDL-2012 Концепция Концепция: абстрактное понятие или идея. Объект, определённый как концепция, охватывает широкий диапазон абстракций, которые могут быть темой произведения: области знания, дисциплины, научные школы (философия, религия, политическая идеология и т. д.), теории, процессы, методы, практика и т. д. Концепция может быть широкой по природе или узко определённой и точной. Определение концепции как объекта дает также возможность установить связи между произведением и концепцией, которая служит темой произведения. Предмет Предмет: материальная вещь. Объект, определенный как предмет, охватывает широкий диапазон материальных вещей, которые могут быть темой произведения: одушевленные и неодушевленные предметы, встречающиеся в природе; неподвижные, передвижные, движущиеся предметы, которые являются продуктом человеческого творчества; предметы, которые более не существуют. Предметы считаются объектами лишь в той мере, в которой они служат темой произведения (например, темой научной работы и т. д.).

Упрощенная структура цифровой библиотеки Публикации (книги, журналы, …) Библио- графические записи Каталоги (Предметный, Авторский, …) (Rus,USA) Marc, … RCDL-2012 База данных цифровых публикаций Библио- графические записи Коллекция SQL запросов Цифровая библиотека Экспертные данные XML-схема Коллекция SQL запросов Виртуальный центр данных (VAMDC) Цифровая библиотека научных статей Библиотека

Распределенная информационная система по количественной спектроскопии Веб-сервис для синхронизации базы данных публикаций Веб-сервис для интеграции источников информации Веб-сервис для формирования онтологии информационных ресурсов по спектроскопии Интерфейс портала Protégé интерфейс Слой данных и приложений Информационный слой Слой знаний Импорт решений задач спектроскопии Представление данных для сравнения и экспорта Формирование составных источников данных Создание индивидов Декомпозиция составных источников информации Описание неформальных свойств решений задач Вычисление значений свойств решений задач ДанныеПриложения Интерфейсы Веб-сервисы Манипуляции с веществом (атомы, молекулы, …) Составные решение задач спектроскопии Онтология информационных ресурсов по спектроскопии Свойства решений задач спектроскопии Импорт публикаций и библиографических ссылок БД публикаций Формирование типовых классов онтологии Первичные решения обратных задач спектроскопии Визуализация свойств решений задач Визуализация и экспорт онтологий Первичные решения прямых задач спектроскопии Атомы, молекулы и химические реакции База данных публикаций Библио- графические записи Коллекция SQL запросов RCDL-2012 Пример цифровой библиотеки. ИВС

Онтология свойств решений задач количественной спектроскопии RCDL-2012 DL expressivity ALCOIN(D)

Статистика индивидов и аксиом RCDL-2012 Task Water Carbon dioxide {I1}{I2}{I1}{I2} T2, T6 140 / 200, / 360, / 80, / 60,000 T3, T5 357 / 210, / 550, / 550, / 310,000 Число индивидов и высказываний в онтологии (вода и диоксид углерода) N/M, N – число индивидов, M – число высказываний

Таксономия классов онтологии информационных ресурсов спектроскопии RCDL-2012

Примеры определении классов

Список классов соответствующих типовым запросам 1.Vibrational bands found in direct tasks (Колебательные полосы в прямых задачах) ; 2.Data sources containing a single vibrational band; 3.All data sources including the root-mean-square deviation for selected vibrational bands ; 4.Data sources containing transitions in a selected range of wavenumbers (Источники данных, содержащие переходы в выбранном диапазоне волновых чисел) ; 5.Data sources that satisfy a set of properties related to formal constraints; 6.Data sources with no transitions rejected by experts; 7.Data sources containing the same transitions as in the data source; 8.Data sources containing only unique transitions; 9.Canonical information sources; 10.Pairs of correlated information sources containing only measured data; 11.Pairs of correlated information sources containing only a selected vibrational band.

Примеры ограничений при определении классов RCDL-2012 Колебательные полосы в прямых задачах Источники данных, содержащие переходы в выбранном диапазоне волновых чисел VibrationalBand and inverse hasQuantumNumbersOfBand some (inverse hasVibrationalBand_MD some (inverse hasTransitionQuantumNumbers_MD some (inverse hasOutputData_MD some (InformationSource and (isSolutionOf value T2 or isSolutionOf value T3))))). (T2-IS or T3-IS or T5-IS or T6-IS) that hasOutputData_MD some (hasWavenumbers_MD some (Wavenumbers_MD and ((hasMinWavenumber some float[>=0.0, =0.0,

Визуализация индивидов онтологии (независимый индивид) Представление индивида, характеризующего свойства решения обратной задачи по определению параметров контура спектральной линии RCDL-2012

Визуализация индивидов онтологии (зависимый индивиды) Представление индивида, характеризующего свойства решения обратной задачи по определению параметров контура спектральной линии RCDL-2012 Индивид «Information source V4_T7_269_NaMaLeTe_D2O_to_V4_T1_284_ShZoPo_D2O_by_EnergyLevels_on_NormalModes_RMSPair Индивид «Information source V4_T7_269_NaMaLeTe_D2O_to_V4_T1_284_ShZoPo_D2O_by_EnergyLevels_on_NormalModes_RMSPair » V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_2_3_1_RMSStateBand hasQuantumNumberBand QuantumNumbers_on_NormalModes_0_3_3_Band hasBandMaxDifferenceValue hasBandNumberCorrelationLines 45 hasBandRMSDeviationValue V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_3_1_1_RMSStateBand hasQuantumNumberBand QuantumNumbers_on_NormalModes_0_3_3_Band hasBandMaxDifferenceValue hasBandNumberCorrelationLines 45 hasBandRMSDeviationValue V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_4_1_0_RMSStateBand hasQuantumNumberBand QuantumNumbers_on_NormalModes_4_1_0_Band hasBandMaxDifferenceValue hasBandNumberCorrelationLines 45 hasBandRMSDeviationValue V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_3_3_0_RMSStateBand hasQuantumNumberBand QuantumNumbers_on_NormalModes_3_3_0_Band hasBandMaxDifferenceValue hasBandNumberCorrelationLines 45 hasBandRMSDeviationValue V4_T7_269_NaMaLeTe_D2O_to_V4_T1_284_ShZoPo_D2O_by_EnergyLevels_on_NormalModes_ident_v1_v2_v3_R MSBandPair hasRMSStateBand V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_0_3_3_RMSStateBand hasRMSStateBand V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_1_1_3_RMSStateBand hasRMSStateBand V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_1_3_2_RMSStateBand hasRMSStateBand V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_2_1_2_RMSStateBand hasRMSStateBand V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_2_3_1_RMSStateBand hasRMSStateBand V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_3_1_1_RMSStateBand hasRMSStateBand V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_3_3_0_RMSStateBand hasRMSStateBand V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_4_1_0_RMSStateBand hasNumberOfRMSBands 8 V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_1_1_3_RMSStateBand hasQuantumNumberBand QuantumNumbers_on_NormalModes_0_3_3_Band hasBandMaxDifferenceValue hasBandNumberCorrelationLines 45 hasBandRMSDeviationValue V4_T7_269_NaMaLeTe_D2O_to_V4_T1_284_ShZoPo_D2O_by_EnergyLevels_on_NormalModes_RMSPair hasRMSMember V4_T7_269_NaMaLeTe_D2O hasRMSMember V4_T1_284_ShZoPo_D2O hasPhysicalQuantity EnergyLevels hasRMSBandPair V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_v1_v2_v3_RMSBandPair hasTotalRMSDeviationValue hasTotalMaxDifferenceValue hasTotalNumberCorrelationLines 530 V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_1_3_2_RMSStateBand hasQuantumNumberBand QuantumNumbers_on_NormalModes_0_3_3_Band hasBandMaxDifferenceValue hasBandNumberCorrelationLines 45 hasBandRMSDeviationValue V4_T1_284_ShZoPo_D2O …………. hasReference S.V. Shirin, N.F. Zobov, O.L. Polyansky, Theoretical line list of D 2 16 O up to cm -1 with an accuracy close to experimental, J. Quant. Spectr. Rad. Trans., 109 (2008) 549 V4_T7_269_NaMaLeTe_D2O ………. hasReference O.V.Naumenko, F. Mazzotti, O.M. Leshchishina, J. Tennyson and A. Campargue, Intracavity laser absorption spectroscopy of D 2 O between and cm -1. // Journal of Molecular Spectroscopy, 2007, v. 242, no. 1, p. 1-9 V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_2_1_2_RMSStateBand hasQuantumNumberBand QuantumNumbers_on_NormalModes_0_3_3_Band hasBandMaxDifferenceValue hasBandNumberCorrelationLines 45 hasBandRMSDeviationValue V4_T7_269_to_V4_T1_284_by_EnergyLevels_on_NormalModes_0_3_3_RMSStateBand hasQuantumNumberBand QuantumNumbers_on_NormalModes_0_3_3_Band hasBandMaxDifferenceValue hasBandNumberCorrelationLines 45 hasBandRMSDeviationValue ( N bands ) высказываний (триад, триплетов)

Визуализация отношений между зависимыми индивидами Графическое представление парных отношений (среднеквадратическое отклонение между отдельными колебательными полосами) между источниками информации на примере первичных источников данных, содержащих решение обратной задачи T6 для молекулы воды. RCDL-2012

Заключение Рассмотрен пример построения цифровой научной библиотеки публикаций. Основное внимание уделено описанию модели публикации в такой библиотеке. Предложено создавать модели публикаций, содержащих количественную информацию, состоящими из двух частей: результатов решений задач и свойств этих решений. Представление свойств решений в форме индивидов прикладной онтологии позволяет автоматически строить детализированные таксономии классов, главным образом по ограничениям на свойства онтологии. Существенным является то, что при построении таксономий пустые классы в них не включаются. Согласование фактологических частей публикаций осуществляется по выбранному набору свойств решений задач предметной области. В количественной спектроскопии такие свойства связаны характеристиками качества данных: удовлетворение правилам отбора, согласование значений данных в пределах ошибок измерений, согласование порядка следования значений идентифицированных физических величин. Рассмотрены примеры визуализации индивидов, характеризующих парные отношения между источниками информации. Авторы благодарны РФФИ (гранты и ) и РАН (проект РАН 15/10) за финансирование работы.