Тенденции развития средств тематического поиска в электронных информационных ресурсах Лаврёнова Ольга Александровна РГБ.

Презентация:



Advertisements
Похожие презентации
Интегрированная библиотека электронных диссертаций Лаврёнова Ольга Александровна Российская государственная библиотека
Advertisements

Электронный каталог как инструмент доступа к информации.
СБА библиотеки ( справочно - библиографический аппарат библиотеки ) Основы информационной культуры. Модуль « Библиотека как информационно - поисковая система.
RDA Описание Ресурса и Доступ Е.И. Загорская Российская национальная библиотека Санкт-Петербург Всероссийский библиотечный конгресс : XV Ежегодная конференция.
МИНИСТЕРСТВО КУЛЬТУРЫ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «ОРЛОВСКИЙ.
«Ты ищешь знаний, мудрости земной, Ты ищешь смысла жизни во Вселенной. Найди на полке книгу и раскрой. Источник мысли чистый, вдохновенный…»
Российские ресурсы ЭБД РГБ и "Консультант студента" Совет развития Директор НТБ Колюпанова И.Ю. 6 октября 2015.
Формирование поискового образа документа в современном справочно- библиографическом аппарате библиотеки Шевченко Татьяна Евгеньевна зав.отделом научной.
Презентацию подготовила студентка 2 курса, экономического факультета, очной формы обучения, группы Э 121 б Гуторова Анна.
ЭЛЕКТРОННЫЙ КАТАЛОГ КАК СОВРЕМЕННАЯ ИНФОРМАЦИОННО- ПОИСКОВАЯ СИСТЕМА БИБЛИОТЕКИ ЭЛЕКТРОННЫЙ КАТАЛОГ КАК СОВРЕМЕННАЯ ИНФОРМАЦИОННО- ПОИСКОВАЯ СИСТЕМА БИБЛИОТЕКИ.
1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Смирнов Иван Валентинович с.н.с. ИСА РАН.
О приоритетных направлениях использования информационно- коммуникационных технологий в области культуры Herceg Novi 2011 Докладчик: Суконкин Александр.
Информационный поиск Путеводитель по каталогам и картотекам библиотеки.
На пути от АБИС к корпоративным ЭБС Андрей Кедрин ведущий программист, Санкт-Петербургский государственный политехнический университет XII Международная.
Интеллектуальные системы для эффективного поиска электронных ресурсов.
Проекты федеральной целевой программы Министерства образования и науки Российской федерации Бабина Ольга Ивановна.
Интерактивные образовательные ресурсы – образовательному процессу.
Российская Государственная Библиотека Электронная библиотека диссертаций.
Индикаторы (показатели) деятельности национальных библиотек Тема 5.
Поиск научной литературы в процессе выполнения исследования Библиографические и полнотекстовые базы данных научной информации.
Транксрипт:

Тенденции развития средств тематического поиска в электронных информационных ресурсах Лаврёнова Ольга Александровна РГБ

Информационные ресурсы в любой форме сначала надо найти. Большие объёмы данных – труднее найти нужные. Качество средств поиска играет большую роль, чем темпы роста объёмов электронных ресурсов. Важные выводы

Требования к качеству поиска в электронных библиотеках растут с ростом объёмов имеющейся в них информации.

Высокое качество тематического поиска в полнотекстовых ресурсах возможно только при том условии, если система может учитывать при поиске семантические связи между поисковыми признаками (синонимию, иерархические и ассоциативные отношения).

Две основные тенденции повышения качества поиска в электронных ресурсах: использование формальных характеристик встречаемости и взаимного расположения поисковых признаков в текстах, создание и использование различных способов (систем) представления (организации) знаний, которые управляют семантическими связями между поисковыми признаками.

Работы по системам представления знаний и обработке полных текстов в материалах конференций: ДИАЛОГ, TPDL, RCDL

ОНТОЛОГИИ ТЕЗАУРУСЫ КЛАССИФИКАЦИИ

Онтологии содержат множества терминов для иерархически организованных дискретных объектов, их описания, связи, характеристики и правила вывода (органический мир, объекты географии, астрономии, геологии, языкознания, этнографии и т. д.)..

Информационно-поисковые тезаурусы (иерархия, синонимия, ассоциации) – прекрасны! НО: не существуют для универсальных информационных ресурсов.

Особый интерес представляет современный стандарт на тезаурусы ISO : учтены тенденции использования таких словарей для поиска электронных информационных ресурсов в сетях

Национальная Библиотечно- библиографическая классификация (ББК) как основа тематического поиска в ЭК и интегрированной электронной библиотеке РГБ

Многие библиотеки размещают полные классификации для своих ЭК в их исходной форме. НО: для пользователей не так- то просто конструировать поисковые признаки, если классификация имеет сложную структуру.

Пользователи, «родившиеся с компьютером», рассчитывают получить результат быстро и «по умолчанию».

2 варианта технологии использования семантических связей при поиске информации в РГБ : Включение интерпретаций иерархических цепочек формулировок индексов ББК в каждую библиографическую запись. Размещение в открытом доступе рабочего варианта классификации, связанной с ЭК, в качестве модели знаний.

Библиографическая запись включает: индексы ББК иерархические цепочки словесных формулировок индексов свободные (неконтролируемые) КС - дополнительно

Рабочие таблицы ББК будут включать: все сложные индексы, сформированные при каталогизации цепочки их словесных формулировок данные о количестве БЗ в ЭК для каждого индекса, найденного при поиске

Пример запроса пользователя:Волжская группа финно- угорских языков Одна из найденных диссертаций в ЭБ:

Индекс ББК Ш Заглавие Деривация отрицания в марийском языке : автореферат дис.... кандидата филологических наук : Словесная формулировка индекса ББК Филологические науки. Художественная литература -- Языкознание -- Финно-угорские языки -- Волжская группа языков -- Марийские (мари, черемисский) языки -- Грамматика -- Морфология -- Словообразование КС: деривация Эл. адрес в ЭБ 180/rsl pdf

Иерархические цепочки из электронного каталога РГБ Другие примеры

Щ103(0)320.6л62 Т3(0)324.54л62 |2 rubbk Art antique de Chypre : exposition] : [catalogue] Искусство. Искусствознание -- Изобразительное искусство -- История изобразительного искусства -- Изобразительное искусство древнего мира -- Античное изобразительное искусство -- Эгейское изобразительное искусство -- Изобразительное искусство Кипра -- Выставки История. Исторические науки -- Археология -- Археология Древнего мира -- Античная археология -- Археология народов и стран в античный период

084|a Ш ,0 |2 rubbk 084|a Ш ,0 |2 rubbk 24500|a Категория препозициональности в русском, английском и новогреческом языках : |b автореферат дис |a Филологические науки. Художественная литература -- Языкознание -- Индоевропейские языки -- Германские языки -- Западногерманские языки -- Английский язык - - Лексикология -- Семантика (семасиология) |2 rubbk 650 7|a Филологические науки. Художественная литература -- Языкознание -- Индоевропейские языки -- Греческий язык -- Новогреческий язык -- Лексикология -- Семантика (семасиология) |2 rubbk

084|a Е For-81,0 |2 rubbk 084|a Е685.9(2Р36),0 |2 rubbk 24500|a Структура населения муравьев тайги : 650 7|a Биологические науки -- Зоология -- Систематика животных -- Беспозвоночные -- Членистоногие -- Насекомые -- Перепончатокрылые -- Жалящие -- Муравьи -- Экология | a Биологические науки -- Зоология -- Зоогеография -- Российская Федерация -- Урал

Следующие задачи: - построение рабочих таблиц классификации - размещение их в открытом доступе

Оцифрованы разделители Генерального систематического каталога РГБ и получены деревья «индекс-конечная формулировка» Щ Искусство. искусствознание + Щ31 Музыка ++ Щ315Инструментальная музыка ++ +Щ315.3/9 Музыкальные инструменты. Инструментоведение ++++ Щ315.31Старинные инструменты ++++Щ315.32Народные инструменты ++++Щ315.4 Клавишные инструменты +++++Щ Клавикорд. Клавесин. Спинет +++++Щ Фортепьяно

Щ315.3/9 Искусство. искусствознание -- Музыка --Инструментальная музыка -- Музыкальные инструменты. Инструментоведение И.т.д. Щ315.4 Искусство. искусствознание -- Музыка -- Инструментальная музыка -- Музыкальные инструменты. Инструментоведение -- Клавишные инструменты Щ Искусство. искусствознание – Музыка-- Инструментальная музыка – Музыкальные инструменты. Инструментоведение -- Клавишные инструменты– Фортепьяно

Рабочие таблицы в открытом доступе Прямой иерархический поиск и поиск по свободным сочетаниям слов и их частей Указание актуального количества БЗ для каждого индекса Информационный поиск в ЭК и ЭБ

Следующая задача состоит в «декодировании» индексов в других (старых) записях для книг и диссертаций. Они должны получить иерархически цепочки словесных формулировок.

Проверка технологии «декодирования, расшифровки» индексов в старых БЗ по аналогии

На входе - E ,0 Из старой БЗ. Система находит в рабочих таблицах путем сравнения E и заимствует для заданного индекса цепочку: Биологические науки-- Зоология -- Таксономия животных -- Chordata. Хордовые – Vertebrata. Позвоночные -- Зоология позвоночных-- Pisces. Рыбы. Ихтиология – Физиология, биофизика и биохимия - - Физиология

Ш5(2=Р)75-65я44 (От филологии до поэзии, сборники) Р (От здравоохранения до перикардита) Примеры полностью расшифрованных индексов: Е (От биологических наук до дельфинов) В192.18,09 (От физ.-мат. наук до метода итерации)

Пример использования средств тематического поиска в электронной коллекции работ уникальных произведений великих русских учёных в.в. (грант РФФИ ).

Мережковский, Константин Сергеевич ( ). Исследования о губках Белого моря / К. С. Мережковский. - Санкт-Петербург : Тип. В. Ф. Демакова, Приписано 2 индекса ББК. Словесные формулировки:

Биологические науки -- Зоология -- Систематика животных -- Беспозвоночные -- Губки Биологические науки -- Гидробиология -- Региональная гидробиология морей и океанов - - Белое море

Дополнительно дескриптор из тезауруса географических названий: Белое море (внутреннее море Северного Ледовитого океана).

Обогащение полнотекстовых ресурсов путём дополнительной интеллектуальной обработки предоставляет более богатые, привычные человеческой логике и соответствующие принятой структуре наук средства поиска информационных ресурсов, обеспечивает дополнительные возможности найти конкретный текст по наибольшему количеству запросов,

И таким образом: с одной стороны, повышается полнота поиска информации, другой стороны, существенно повышается востребованность предоставляемых полнотекстовых электронных ресурсов, создание которых так дорого обходится.

В конце концов, люди просто будут читать и то, что никогда бы не догадались найти напрямую без интеллектуального обогащения ресурса.