ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ АИС Лаврёнова Ольга Александровна, РГБ, lavr@rsl.ru.

Презентация:



Advertisements
Похожие презентации
Интегрированная библиотека электронных диссертаций Лаврёнова Ольга Александровна Российская государственная библиотека
Advertisements

ИСПОЛЬЗОВАНИЕ ИНФОРМАЦИОННО- ПОИСКОВЫХ ЯЗЫКОВ В ПРОЦЕССЕ НАУЧНОЙ ОБРАБОТКИ ДОКУМЕНТОВ И СОЗДАНИЯ ЭЛЕКТРОННОГО КАТАЛОГА. Пяткова И.Н.
Национальный файл географических названий России Лаврёнова Ольга Александровна Российская государственная библиотека
Скипор И.Л., канд. пед. наук, доцент кафедры ТАОИ Кемеровского государственного университета культуры и искусств (384-2)
Электронный каталог как инструмент доступа к информации.
Пирумова Лидия Николаевна Зам. директора ЦНСХБ, канд.пед.наук Индексирование документов для Сводного каталога НИУ АПК Индексирование документов для Сводного.
База данных ( БД ) это совокупность относящихся к определенной области знания ( теме, проблеме ) взаимосвязанных данных, представленных в определенном.
Интеграция библиотечных и архивных информационных систем Антопольский А.Б. (НП ЭЛБИ) Маркарова Т.С. (ГНПБ им К.Д. Ушинского)
Национальная информационная инфраструктура науки, культуры и образования: представление ресурсов электронных библиотек Е.Н.Филинов, А.В.Бойченко Институт.
Выполнила студентка группы ТУ-501 Полозова Ю.О. Виды документальных информационных систем Документальная информационная система (ДИС) единое хранилище.
Информационный потенциал Общероссийского свода книжных памятников И.П. Тикунова, заведующая сектором НИО редких книг РГБ,
Формирование поискового образа документа в современном справочно- библиографическом аппарате библиотеки Шевченко Татьяна Евгеньевна зав.отделом научной.
СВОДНЫЙ КАТАЛОГ ЭЛЕКТРОННЫХ РЕСУРСОВ Интеграция электронных ресурсов библиотек России Береснев В.А.
Лингвистическое обеспечение ЭК. Принципы индексирования: - Предметизационный принцип индексирования - Классификационный принцип индексирования - Координатное.
Тенденции развития средств тематического поиска в электронных информационных ресурсах Лаврёнова Ольга Александровна РГБ.
СБА библиотеки ( справочно - библиографический аппарат библиотеки ) Основы информационной культуры. Модуль « Библиотека как информационно - поисковая система.
Информационно-поисковые языки Лекция 3. Вопросы: 1.Информационно-поисковые языки (ИПЯ): понятие и структура. 2.ИПЯ: основные характеристики. 3.Типы и.
УДК КАК СРЕДСТВО ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ О ДОКУМЕНТАХ. ИСТОРИЧЕСКИЙ ЭКСКУРС Пугачёва С.А., заведующая отделом индексирования документов.
Основные принципы создания и использования предметных рубрик Селиванова Юлия Геннадьевна Жлобинская Ольга Николаевна.
ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ЭЛЕКТРОННОГО КАТАЛОГА: ОПЫТ И ПРОБЛЕМЫ Семененко Л. П., Непран Н. В., Кирко С. Ю. НТБ НТУ «ХПИ»
Транксрипт:

ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ АИС Лаврёнова Ольга Александровна, РГБ,

Электронные каталоги и электронные библиотеки – разновидности автоматизированных информационных систем.

Состав ЛО АИС форматы представления элементов данных; средства унификации элементов данных; информационно-поисковые языки (ИПЯ) для тематического поиска и правила их использования; алгоритмы поиска информации.

Поиск в электронных библиотеках (ЭБ): по обычным электронным каталогам ЭБ с использованием принятых в них средств; по метаданным, представленным не в форме записей ЭК (XML, HTML – разметка); по полным текстам документов с лингвистическими процессорами и без них; по частям полных текстов (например, оглавлениям, рефератам, аннотациям).

Форматы представления элементов данных MARC -> USMARC Национальные MARC - форматы Национальные форматы другого типа UNIMARC -> RUSMARC MARC 21

Форматы серии MARC 21: MARC 21 для библиографических данных MARC 21 для нормативных/ авторитетных данных MARC 21 для классификационных данных MARC 21 для фондовых данных MARC 21 для деловой информации

Структура кодов в MARC форматах: XXX YY $Z Содержание поля XXX - три цифры – метка поля YY - две цифры – индикатор поля $Z – условный знак начала идентификатора подполя и латинская буква - идентификатор

(индекс ББК) Транспорт -- Автодорожный транспорт -- Автомобильные дороги -- Снежные и ледовые дороги -- Дорожные покрытия -- Надёжность и долговечность

Средства унификации элементов данных нормативные/ авторитетные файлы (authority files); справочники – списки допустимых значений для данного элемента данных.

Нормативная/ авторитетная запись - машиночитаемая запись, исходным элементом данных которой является принятый заголовок, представляющий собой имя лица, наименование организации, предмета, темы, географическое название, унифицированное заглавие произведения или серии, устанавливаемые каталогизирующей организацией, ответственной за запись.

1001 |a Алексеева, Марина Анатольевна |d |a Маринина, Александра Борисовна |d |a Произведения этого авт. в жанре детектива см. под именем: |b Маринина, Александра Борисовна (1957- ) 670|a Из кн.: Septītais upuris, Cop SYS Имя лица

1001|a Горький, Максим |d |a Горький, Алексей Максимович |d |a Пешков, Алексей Максимович |d |a Gorky, Maxim |d |a Gorki, Maxime |d |a Русский писатель, публицист. В г. жил за границей. … 666|a Подлинное имя автора: Пешков Алексей Максимович

1102 |a Российская государственная библиотека 4102 |a Russian State Library 4102 |a Russische Staatsbibliothek 4102 |a ФГУ "Российская государственная библиотека" 4102 |a "Российская государственная библиотека", федеральное государственное учреждение 4102 |a Федеральное государственное учреждение "Российская государственная библиотека" 4102 |wd |a РГБ 5102 |wa |a Государственная библиотека СССР им. В. И. Ленина 663 |a До 2-й половины 1992 г. см. в кат.: |b Государственная библиотека СССР им. В. И. Ленина Наименование организации

00100 agkgn RuMoRGB | | | аzznnaаbn| | | | | | | | | | |n|anа| | | | # d 040## \aRuMoRGB \brus \erpk \frugeo 151## \aМурмозеро (юго-западнее оз.Ларинское) 451## \wa \aМурмозеро (Корвальское) 451## \wa \aНурмозеро 451## \wa \aМуромозеро 451## \wa \aНурм-озеро 551## \wg \aЛенинградская, область (Россия). Природные объекты Географическое название

670## \aАГКГН (ЦНИИГАиК) \bМурмозеро (Корвальское) ( ); Нурмозеро ( ); Муромозеро ( ); Нурм-озеро ( ); Мурмозеро ( ) 670## \aАдминистративная карта Ленинградской области, ## \aАдминистративная карта Ленинградской области, ## \aСловарь названий гидрографических объектов России и других стран-члено в СНГ, ## \iюго-западнее оз.Ларинское 680## \i60 град. 6 мин. С.Ш., 35 град. 1 мин. В.Д.

151|a Нерль, река (впадает в Угличское вдхр.) 451|w a |a Нерль (Векса Плещеевская), река 451|w a |a Нерль Волжская, река 670|a АГКГН (ЦНИИГАиК) |b Нерль (Векса Плещеевская) ( ); Нерль Волжская ( ); Нерль ( ) 680|i 57 град. 6 мин. С.Ш., 37 град. 40 мин. В.Д. 551|a Ярославская, область (Россия). Природные объекты |w g 551|a Тверская, область (Россия). Природные объекты |w g

151|a Нерль, река (левый приток р. Клязьма) 451|w a |a Нерль Клязьминская, река 665|a Данные в АГКГН: Нерль Клязьминская ( ) |a Данные в АГКГН: Нерль ( ) 670|a АГКГН (ЦНИИГАиК) 680|i 56 град. 11 мин. С.Ш., 40 град. 44 мин. В.Д. 551|a Ярославская, область (Россия). Природные объекты |w g 551|a Ивановская, область (Россия). Природные объекты |w g 551|a Владимирская, область (Россия). Природные объекты |w

Информационно- поисковый язык (ИПЯ) – искусственный язык, предназначенный для формализованного представления смыслового содержания документов и запросов или описания фактов с целью их последующего поиска в АИС.

Языковые способы передачи знаний обеспечивают экономию используемых средств. Ограничение передаваемой каждым сообщением информации. Следствие Невозможность передачи информации в АИС без восстановления фонда общих знаний

Распространённые ИПЯ дескрипторные; классификационные; языки предметных рубрик.

Средства тематического поиска в электронных каталогах Свободные КС Перечни ключевых слов Тезаурусы Предметные рубрики (предметные классификации) Иерархические классификации (индексы, наименования делений) Рубрикаторы (коды, наименования рубрик)

Имитация тематического поиска - поиск по всем элементам библиографических записей

Поисковые намерения пользователя ЭК при поиске по теме: 1) Найти хоть что-то, но точно по предмету поиска. 2) Подобрать максимально полную информацию по теме, но желательно без случайных документов. 3) Найти все, что касается темы поиска, пусть попадутся лишние документы. 4) Хорошо бы сначала определиться, какие бывают темы по интересующей меня области знания …

Сравнение возможностей тематического поиска в отечественных электронных каталогах

200: 1#$aСто великих заповедников и парков 686: ##$aЩ113(0)-487$2rubbk 606: 0#$aСадово-парковая архитектура$xИстория$2nlr- sh$3RU\NLR\auth\ : 0#$aНациональные парки$2nlr- sh$3RU\NLR\auth\ : 0#$aБотанические сады$2nlr- sh$3RU\NLR\auth\ : 0#$aЗоологические парки$2nlr- sh$3RU\NLR\auth\ : 0#$aЗаповедники 610: 0#$aПарки и сады 610: 0#$aЗоопарки и зоосады 686: ##$aБ12(0)$2rubbk 686: ##$aЕ5е(0)л64$2rubbk 686: ##$aЕ6е(0)л64$2rubbk ЭК РНБ

084 |a |2 rugasnti 084 |a Н87-00(0),0 |2 rubbk 084 |a Н0(0)-487,0 |2 rubbk 084 |a Б1е(0)л64,0 |2 rubbk |a Сто великих заповедников и парков |a Строительство -- Градостроительство -- Озеленение населённых мест -- Садово-парковая архитектура -- История архитектуры -- Всеобщая история архитектуры |2 rubbk |a Охрана окружающей среды -- Организация научно- исследовательской и практической работы -- Весь мир -- Заповедники, национальные парки |2 rubbk |a Строительство -- История архитектуры -- Всеобщая история архитектуры -- История градостроительства -- Озеленение населённых мест -- Садово-парковая архитектура |2 rubbk 6530 |a Парки и сады 6530 |a Зоопарки и зоосады ЭК РГБ

Два способа использования ББК для тематического поиска в электронном каталоге: - поиск по иерархическим цепочкам в библиографических записях; - поиск в машиночитаемых таблицах ББК.

Пример: 084__$a Е For-813.2,2 $2rubbk 650_7$a Биологические науки -- Зоология -- Систематика животных -- Беспозвоночные -- Членистоногие -- Насекомые -- Перепончатокрылые -- Жалящие -- Муравьи -- Экология муравьев -- Внутривидовые и межвидовые отношения у муравьев -- Экология питания у муравьев -- Пищевые зависимости у муравьев $2rubbk

Поиск по темам в базе данных нормативных записей АЛЕФ (в машиночитаемых таблицах ББК)

ЭК МГТУ им. Баумана

Тезаурус информационно- поисковый - словарь лексических единиц ИПЯ, в котором заданы парадигматические (базисные) смысловые отношения между этими единицами.

Ключевое слово (КС) - отдельное слово или словосочетание естественного языка, выделяемое из текста информационного документа и отражающее его основное содержание при индексировании.

Лексическая единица (ЛЕ) ИПЯ – выбранное для использования в ИПЯ слово, словосочетание или лексически значимая компонента сложного слова естественного языка.

Дескриптор – ключевое слово, выбранное из группы условно эквивалентных ключевых слов и представляющее данную группу при индексировании и поиске информации. Ключевые слова, не являющиеся таким представителем группы, называют аскрипторами.

Виды смысловых отношений в тезаурусах синонимия (условная эквивалентность): погода=метеообстановка=ме теоусловия=метеоявления= погодные условия=синоптические условия; «выше-ниже» («шире-уже») – иерархические связи: орехи - фундук; ассоциативные отношения (по сходству, смежности и т.д.):, безопасность - обледенение, опасное сближение, столкновение.

ИЕРАРХИЧЕСКОЕ ДЕРЕВО ИЗ ТЕЗАУРУСА ПО ГРАЖДАНСКОЙ АВИАЦИИ... летно-подъемный состав член летного экипажа..... бортнаблюдатель..... бортоператор..... бортпроводник..... борттехник..... летный состав бортинженер бортмеханик пилот командир (авиац.) летчик-истребитель пилот-инспектор пилот-испытатель пилот-курсант пилот-любитель пилот-оператор..... штурман

Летный состав с. летные кадры в. член летного экипажа н. бортинженер борттехник бортрадист пилот штурман а. авиаотряд

патологическое состояние организма с. патологические изменения патология расстройство в. отрицательное явление н. гипоксия заболевание интоксикация истощение обострение перенапряжение симптом утрата трудоспособности а. здоровье организм функциональное состояние

Метаданные – данные о данных

Документ БЗ Метки формата для библиографических данных Нормативные записи для элементов БЗ Метки формата для нормативных данных Метаданные Другие структуры метаданных

Распространенные способы структурирования метаданных для электронных документов в электронных библиотеках Dublin core - Дублинское ядро MARC - форматы в ЭК ЭБ представление метаданных с помощью языков разметки HTML и XML

АДРЕСА - Web – сайт РГБ - АЛЕФ (АИБС РГБ) list-tst01 - машиночитаемые таблицы ББК list-tst01