Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 10 лет назад пользователемАлексей Меркулов
1 Тенденции развития средств тематического поиска в электронных информационных ресурсах Лаврёнова Ольга Александровна РГБ
2 Информационные ресурсы в любой форме сначала надо найти. Большие объёмы данных – труднее найти нужные. Качество средств поиска играет большую роль, чем темпы роста объёмов электронных ресурсов. Важные выводы
3 Требования к качеству поиска в электронных библиотеках растут с ростом объёмов имеющейся в них информации.
4 Высокое качество тематического поиска в полнотекстовых ресурсах возможно только при том условии, если система может учитывать при поиске семантические связи между поисковыми признаками (синонимию, иерархические и ассоциативные отношения).
5 Две основные тенденции повышения качества поиска в электронных ресурсах: использование формальных характеристик встречаемости и взаимного расположения поисковых признаков в текстах, создание и использование различных способов (систем) представления (организации) знаний, которые управляют семантическими связями между поисковыми признаками.
6 Работы по системам представления знаний и обработке полных текстов в материалах конференций: ДИАЛОГ, TPDL, RCDL
7 ОНТОЛОГИИ ТЕЗАУРУСЫ КЛАССИФИКАЦИИ
8 Онтологии содержат множества терминов для иерархически организованных дискретных объектов, их описания, связи, характеристики и правила вывода (органический мир, объекты географии, астрономии, геологии, языкознания, этнографии и т. д.)..
9 Информационно-поисковые тезаурусы (иерархия, синонимия, ассоциации) – прекрасны! НО: не существуют для универсальных информационных ресурсов.
10 Особый интерес представляет современный стандарт на тезаурусы ISO : учтены тенденции использования таких словарей для поиска электронных информационных ресурсов в сетях
11 Национальная Библиотечно- библиографическая классификация (ББК) как основа тематического поиска в ЭК и интегрированной электронной библиотеке РГБ
12 Многие библиотеки размещают полные классификации для своих ЭК в их исходной форме. НО: для пользователей не так- то просто конструировать поисковые признаки, если классификация имеет сложную структуру.
13 Пользователи, «родившиеся с компьютером», рассчитывают получить результат быстро и «по умолчанию».
14 2 варианта технологии использования семантических связей при поиске информации в РГБ : Включение интерпретаций иерархических цепочек формулировок индексов ББК в каждую библиографическую запись. Размещение в открытом доступе рабочего варианта классификации, связанной с ЭК, в качестве модели знаний.
15 Библиографическая запись включает: индексы ББК иерархические цепочки словесных формулировок индексов свободные (неконтролируемые) КС - дополнительно
16 Рабочие таблицы ББК будут включать: все сложные индексы, сформированные при каталогизации цепочки их словесных формулировок данные о количестве БЗ в ЭК для каждого индекса, найденного при поиске
17 Пример запроса пользователя:Волжская группа финно- угорских языков Одна из найденных диссертаций в ЭБ:
18 Индекс ББК Ш Заглавие Деривация отрицания в марийском языке : автореферат дис.... кандидата филологических наук : Словесная формулировка индекса ББК Филологические науки. Художественная литература -- Языкознание -- Финно-угорские языки -- Волжская группа языков -- Марийские (мари, черемисский) языки -- Грамматика -- Морфология -- Словообразование КС: деривация Эл. адрес в ЭБ 180/rsl pdf
19 Иерархические цепочки из электронного каталога РГБ Другие примеры
20 Щ103(0)320.6л62 Т3(0)324.54л62 |2 rubbk Art antique de Chypre : exposition] : [catalogue] Искусство. Искусствознание -- Изобразительное искусство -- История изобразительного искусства -- Изобразительное искусство древнего мира -- Античное изобразительное искусство -- Эгейское изобразительное искусство -- Изобразительное искусство Кипра -- Выставки История. Исторические науки -- Археология -- Археология Древнего мира -- Античная археология -- Археология народов и стран в античный период
21 084|a Ш ,0 |2 rubbk 084|a Ш ,0 |2 rubbk 24500|a Категория препозициональности в русском, английском и новогреческом языках : |b автореферат дис |a Филологические науки. Художественная литература -- Языкознание -- Индоевропейские языки -- Германские языки -- Западногерманские языки -- Английский язык - - Лексикология -- Семантика (семасиология) |2 rubbk 650 7|a Филологические науки. Художественная литература -- Языкознание -- Индоевропейские языки -- Греческий язык -- Новогреческий язык -- Лексикология -- Семантика (семасиология) |2 rubbk
22 084|a Е For-81,0 |2 rubbk 084|a Е685.9(2Р36),0 |2 rubbk 24500|a Структура населения муравьев тайги : 650 7|a Биологические науки -- Зоология -- Систематика животных -- Беспозвоночные -- Членистоногие -- Насекомые -- Перепончатокрылые -- Жалящие -- Муравьи -- Экология | a Биологические науки -- Зоология -- Зоогеография -- Российская Федерация -- Урал
23 Следующие задачи: - построение рабочих таблиц классификации - размещение их в открытом доступе
24 Оцифрованы разделители Генерального систематического каталога РГБ и получены деревья «индекс-конечная формулировка» Щ Искусство. искусствознание + Щ31 Музыка ++ Щ315Инструментальная музыка ++ +Щ315.3/9 Музыкальные инструменты. Инструментоведение ++++ Щ315.31Старинные инструменты ++++Щ315.32Народные инструменты ++++Щ315.4 Клавишные инструменты +++++Щ Клавикорд. Клавесин. Спинет +++++Щ Фортепьяно
25 Щ315.3/9 Искусство. искусствознание -- Музыка --Инструментальная музыка -- Музыкальные инструменты. Инструментоведение И.т.д. Щ315.4 Искусство. искусствознание -- Музыка -- Инструментальная музыка -- Музыкальные инструменты. Инструментоведение -- Клавишные инструменты Щ Искусство. искусствознание – Музыка-- Инструментальная музыка – Музыкальные инструменты. Инструментоведение -- Клавишные инструменты– Фортепьяно
26 Рабочие таблицы в открытом доступе Прямой иерархический поиск и поиск по свободным сочетаниям слов и их частей Указание актуального количества БЗ для каждого индекса Информационный поиск в ЭК и ЭБ
27 Следующая задача состоит в «декодировании» индексов в других (старых) записях для книг и диссертаций. Они должны получить иерархически цепочки словесных формулировок.
28 Проверка технологии «декодирования, расшифровки» индексов в старых БЗ по аналогии
29 На входе - E ,0 Из старой БЗ. Система находит в рабочих таблицах путем сравнения E и заимствует для заданного индекса цепочку: Биологические науки-- Зоология -- Таксономия животных -- Chordata. Хордовые – Vertebrata. Позвоночные -- Зоология позвоночных-- Pisces. Рыбы. Ихтиология – Физиология, биофизика и биохимия - - Физиология
30 Ш5(2=Р)75-65я44 (От филологии до поэзии, сборники) Р (От здравоохранения до перикардита) Примеры полностью расшифрованных индексов: Е (От биологических наук до дельфинов) В192.18,09 (От физ.-мат. наук до метода итерации)
31 Пример использования средств тематического поиска в электронной коллекции работ уникальных произведений великих русских учёных в.в. (грант РФФИ ).
32 Мережковский, Константин Сергеевич ( ). Исследования о губках Белого моря / К. С. Мережковский. - Санкт-Петербург : Тип. В. Ф. Демакова, Приписано 2 индекса ББК. Словесные формулировки:
33 Биологические науки -- Зоология -- Систематика животных -- Беспозвоночные -- Губки Биологические науки -- Гидробиология -- Региональная гидробиология морей и океанов - - Белое море
34 Дополнительно дескриптор из тезауруса географических названий: Белое море (внутреннее море Северного Ледовитого океана).
35 Обогащение полнотекстовых ресурсов путём дополнительной интеллектуальной обработки предоставляет более богатые, привычные человеческой логике и соответствующие принятой структуре наук средства поиска информационных ресурсов, обеспечивает дополнительные возможности найти конкретный текст по наибольшему количеству запросов,
36 И таким образом: с одной стороны, повышается полнота поиска информации, другой стороны, существенно повышается востребованность предоставляемых полнотекстовых электронных ресурсов, создание которых так дорого обходится.
37 В конце концов, люди просто будут читать и то, что никогда бы не догадались найти напрямую без интеллектуального обогащения ресурса.
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.