«Информационное обеспечение науки: Новые технологии» Новые возможности программного комплекса «SciRus» Михаил Якшин, БЕН РАН 2013.

Презентация:



Advertisements
Похожие презентации
Развитие платформы SciRus Якшин М. М. БЕН РАН. Исторический экскурс: платформа SciRus Разрабатывается с 2004 г. Инструмент для создания настраиваемых.
Advertisements

Создание базы данных терминологических словарей Якшин М. М. БЕН РАН.
Информационно- поисковая система «Архив документов»
это десятки миллионов Web-серверов Интернета, содержащих Web-страницы, в которых используется технология гипертекста. Технология WWW позволяет создавать.
База данных – это: а) специальным образом организованная и хранящаяся на внешнем носителе совокупность взаимосвязанных данных о некоторых объектах; б)
MS Access Основные элементы
СУБД Microsoft Access 2003 ЗНАКОМСТВО. Что такое Access? Access – Приложение, входящее в состав пакета Microsoft Office (разработано компанией Microsoft).
Базы данных и системы управления базами данных Тема:
Ekaterina B. Egorkina,© VEELTECH.RU Загрузка и вывод изображений Каким образом можно сохранить картинку в БД, а потом отобразить ее на странице?
Инструментальные средства создания Web-сайтов
Базы данных. СУБД – система управления базами данных Программное обеспечение, предназначенное для работы с базами данных, называется системой управления.
Основные элементы системы управления базами данных Access.
«Либэр. Электронная библиотека» - новый этап в автоматизации Программное решение для создания электронной библиотеки Сорокин И.В., менеджер проекта, ЗАО.
Е-МАСТЕР ® Документооборот Программно-методический комплекс (Система управления организационной информацией) +7 (812)
База данных – это совокупность структурированных данных определенного назначения. Структурирование данных – это объединение данных по определенным параметрам.
ТАБЛИЦЫ База данных может включать множество таблиц, в которых хранятся данные по различным темам. Каждая таблица может состоять из множества полей различного.
Powerpoint Templates Page 1 Язык разметки гипертекста HTML.
ПОИСК ИНФОРМАЦИИ В ИНТЕРНЕТ-БИБЛИОТЕКЕ СМИ PUBLIC.RU +7 (495)
Базы данных и системы управления базами данных – это упорядоченный набор данных, хранящих информацию о группе объектов, обладающих одинаковым набором.
CMS Система управления и отображения информации (издательская система)
Транксрипт:

«Информационное обеспечение науки: Новые технологии» Новые возможности программного комплекса «SciRus» Михаил Якшин, БЕН РАН 2013

Часть 1: новые возможности

Новый тип поля: длинный HTML-текст Новый способ отображения длинного текста без преобразования HTML-тэгов Используется в первую очередь для импорта из готовых HTML-документов с разметкой Потенциально опасен, не рекомендуется к использованию, если БД будет редактироваться средствами SciRus

Новый тип поля: ссылка на изображение Текст, введенные в текстовое поле, интерпретируется как ссылка на адрес изображения, доступного публично по http Например: – Содержимое поля: – Отображение: Используется для отображения изображений, выложенных на какой-то хостинг и уже доступных по http

Хостинг файлов Иногда файлы есть только на рабочей стацнии пользователя и не доступны публично по http Если пользователю проще загружать их по одному и вести их учет средствами SciRus – это можно сделать с помощью встроенного хостинга файлов и типа поля «Хранимый файл»

Хостинг файлов: добавление поля

Хостинг файлов: ввод записи

Хостинг файлов: отображение файла-фотографии

Хостинг файлов: отображение прочих файлов

Хостинг файлов: механизм работы Загружаемый файл размещается в локальной ФС сервера по пути, доступ к которому публично предоставляется по http (по умолчанию – hosted-files ) Имя файла формируется автоматически как функция от: – имени таблица (=типа сущности) – идентификатора записи – идентификатора поля

Хостинг файлов: хранение в таблице СУБД В таблице хранится расширения файла, по которому определяется его тип и связанные с ним действия: – показывать встроенным в документ с помощью тэга img – показывать ссылку для скачивания Пустое значение означает, что файл не загружен (файл в локальной ФС синхронизируются с этим значением)

Хостинг файлов: пример формирования файла Обязательная часть Имя таблицы Идентификатор поля Идентификатор записи Содержимое записи в БД

Рубрикатор Рубрикатор определенный заранее древовидный классификатор, использование ветвей и листьев которого приводит к выполнению поисковых запросов, выводящих все записи в ветви или листе Поиск производится по началу вхождения строки, тем самым достигается поиск внутри ветви, например: – FO1.1 => FO1.1, FO1.1.9, FO1.1.3, FO – FO1.1.9 => FO1.1.9 – FO1.1.3 => FO1.1.3, FO

Режим гостевого входа Исторически, SciRus всегда работал в режиме принудительной необходимости авторизации Для более эффективного публичного представления массивов в WWW (в том числе для индексации поисковыми роботами) нужен режим без авторизации Реализовано 2 режима: – публичный (без авторизации) доступ только для поиска и чтения; – авторизованный доступ на запись, авторизация через специальную страницу

Часть 2: новые проекты на основе SciRus

«История геологии и горного дела»: внешний вид

«История геологии и горного дела»: цель проекта Создание структурированной информационной системы, содержащий данные о выдающихся геологах Основная сущность персона – 18 полей – 4 из них – длинные слабоструктурированные тексты К персоне привязаны: – документы (полнотекстовые, доступны в формате PDF) – фотографии – организации, отношение к котором имела/имеет персона

«История геологии и горного дела»: структура БД Документы Персоналии ОрганизацииФотографии Источники Хостинг файлов

«История геологии и горного дела»: результаты 502 персон – 529 фотографий – 72 организации – 76 документов (41 полнотекстовый документ) 25 источников Первоначальная загрузка – импорт специальным конвертером из RDF (система на основе ЕНИП) Дальнейшие работы – через пользовательский интерфейс SciRus

Проект НЦВО («Волоконная оптика») Две разных базы объединены в одной структуре: – БД публикаций сотрудников НЦВО пополняется вручную сотрудниками НЦВО – БД публикаций по тематикам волоконной оптики пополняется за счет сложных тематических выборок из Web of Science и экспорта/импорта в формате RIS

Проект НЦВО («Волоконная оптика»): структура БД Публикации Персоналии Организации Источники

RIS-подобный формат загрузки: конвертер Разработан двухшаговый конвертер для загрузки присылаемых данных в БД Шаг 1: много файлов (рубрика в названии файла) в формате RIS -> один файл, рубрика внутри файла Шаг 2: загрузка получившегося файла в БД последовательно с созданием необходимых связанных записей

RIS-подобный формат загрузки: пример Файл с именем « Multimode optical fiber3.txt» # TI New method to calculate mode conversion coefficients in SI multimode optical fibers AU Zubia J., Durana G., Aldabaldetreku G., Arrue J., Losada M. A., Lopez-Higuera M. SO JOURNAL OF LIGHTWAVE TECHNOLOGY PY V. 21. Is. 3. P Address: /JLT Один общий файл: RUB # TI New method to calculate mode conversion coefficients in SI multimode optical fibers AU Zubia J., Durana G., Aldabaldetreku G., Arrue J., Losada M. A., Lopez-Higuera M. SO JOURNAL OF LIGHTWAVE TECHNOLOGY PY V. 21. Is. 3. P Address: /JLT

Проект НЦВО: внешний вид 1

Проект НЦВО: внешний вид 2

Проект НЦВО: рубрикатор

Проект НЦВО: поиск без авторизации

Проект НЦВО: срез БД по публикациям только сотрудников НЦВО

Проект НЦВО («Волоконная оптика»): результаты публикаций 6641 источников (журналов) авторов (70 сотрудников НЦВО) – 5 организаций