Поиск информации в Научной электронной библиотеке периодических изданий НАН Украины Проскудина Г.Ю. Міжнародна наукова конференція «Формування і розвиток.

Презентация:



Advertisements
Похожие презентации
3.1. Назначение онтологий. Информационный поиск..
Advertisements

ИНСТРУКЦИЯ ПО РАБОТЕ С ЭЛЕКТРОННОЙ БИБЛИОТЕКОЙ. Электронная библиотека НБ РГГУ предназначена для работы с полными текстами трудов преподавателей нашего.
ЭЛЕКТРОННЫЕ РЕСУРСЫ В ДОСТУПЕ СПбГУ. ЭЛЕКТРОННЫЕ РЕСУРСЫ ПО ТИПУ СОДЕРЖАНИЯ: 1. Электронные журналы и газеты 2. Электронные книги (Ebrary, издательств.
ЭЛЕКТРОННЫЕ РЕСУРСЫ БИБЛИОТЕКИ ЭФ. ЭЛЕКТРОННЫЕ РЕСУРСЫ ПО ТИПУ СОДЕРЖАНИЯ: 1. Электронные журналы и газеты 2. Электронные книги (Ebrary, издательств Springer.
Автоматизированная библиотечная система и электронный архив открытого доступа Разделение задач, функций и технологических решений Негуляев Е. А. Пятая.
Учитель информатики Артеменко Т.В. Поиск информации в Интернет.
Научно-образовательная электронная библиотека вуза © А.Г. Абросимов, Д.С. Зуев Казанский государственный университет.
Программная система «Портал научной группы» (разработано в рамках ПНР-5) 24 марта 2011 г. Челябинск Южно-Уральский государственный университет 1.
Поиск и копирование мультимедийных ресурсов в сети Лапшева Елена Евгеньевна, руководитель центра непрерывной подготовки IT-специалистов факультета КНиИТ.
Российская Государственная Библиотека Электронная библиотека диссертаций.
Национальный цифровой ресурс «Руконт» Далее. Содержание Назад Национальный цифровой ресурс «Руконт»: общие сведения Национальный цифровой ресурс «Руконт»:
Национальный цифровой ресурс «Руконт» Далее. Содержание Назад Национальный цифровой ресурс «Руконт»: общие сведения Национальный цифровой ресурс «Руконт»:
Технология поиска информации в Интернете. Поиск по адресам URL URL (Uniform Resource Locator) используется в World Wide Web для задания местоположения.
Тема Структура представления информации в мировых информационных сетях.
©Академия последипломного образования, 2012 Поиск информации в Internet.
Информационный поиск. План Векторная модель Ранжирование документов на основе весов, метаданных Определение весов на основе машинного обучения.
Тема 11 Медицинская помощь и лечение (схема 1). Тема 11 Медицинская помощь и лечение (схема 2)
ИСПОЛЬЗОВАНИЕ ИНФОРМАЦИОННО- ПОИСКОВЫХ ЯЗЫКОВ В ПРОЦЕССЕ НАУЧНОЙ ОБРАБОТКИ ДОКУМЕНТОВ И СОЗДАНИЯ ЭЛЕКТРОННОГО КАТАЛОГА. Пяткова И.Н.
Библиотека Муниципального общеобразовательного учреждения «Ивнянская средняя общеобразовательная школа 1»
Вопрос 1 Какой объект находится на верхнем уровне иерархии в операционной системе Windows?. ОТВЕТ: Рабочий стол.
Транксрипт:

Поиск информации в Научной электронной библиотеке периодических изданий НАН Украины Проскудина Г.Ю. Міжнародна наукова конференція «Формування і розвиток бібліотечного електронного середовища», Киів, 2011

2 Библиотека программ Lucene выполняет две функции – индексирования и поиска это - один JAR-файл размером < 1 Мб предоставляет возможности поиска, например, в системе ЭБ DSpace

3 Поиск – процесс нахождения слов в индексе, с помощью которого находятся документы, содержащие эти слова Индекс – специально разработанная структура данных, хранящаяся в виде набора файлов и являющаяся инструментом поиска

4 Показатели качества поиска Полнота (Recall) - насколько хорошо система поиска находит соответствующие документы #(кол-во найденных релевантных документов) Recall = #(общее кол-во релевантных документов) Точность (Precision) - насколько хорошо система отфильтровывает нерелевантные документы #( кол-во найденных релевантных документов ) Precision = #(кол-во извлеченных документов)

5 Функция поиска в ЭБ предоставляет возможность находить в системе информационные ресурсы, которые удовлетворяют тому или иному условию. можно сузить пространство поиска, а также осуществлять многошаговый поиск

6 Сужение пространства поиска: раздел (подраздел, …) ЭБ; вид ресурсов (книги, журналы, диссертации,...); определенные значения характеристик ресурсов (дата создания, автор, организация, язык, формат,...); использование иерархических словарей поисковых терминов, предметных рубрикаторов, тезаурусов или классификаторов.

7 Требования ЭБ к языку поиска: полные тексты и описательные характеристики (метаданные); отдельные поисковые слова или фразы; отсечение окончания или начала слов; групповые символы (?) и (*); логические связки И-ИЛИ-НЕ; поиск по словоформам и синонимам поисковых терминов, а также с учетом морфологии языка; чувствительность или нечувствительность к регистру символов; поиск по близости размещения слов в тексте; поиск по фонемному звучанию поисковых терминов.

8 Виды поиска в ЭБ: простой или стандартный расширенный профессиональный

9 Простой или стандартный поиск предоставляет некоторые минимальные поисковые возможности; осуществляется во всех индексах, которые построены в системе, т.е. во всех описательных полях и во всех текстах; среди поисковых терминов различают: - поиск слов; - поиск фраз.

10 Поиск слов

11 Стоп-слова это слова, по которым не производится поиск в английском языке: a, and, are, as, at, be, but, by, for, if, in, into, is, it, no, not, of, on, or, such, the, to, was. украинский и русский языки: наречия, союзы, предлоги пока не поддерживаются можно включить стоп-слово в поисковый запрос (например, используя знак +).

12 Поиск по нескольким словам производится поиск статей, которые содержат КАКИЕ-ЛИБО из указанных слов НЕТ каких-либо ограничений на количество слов в поисковом запросе

13 Использование групповых символов (?) и (*) (?) – спрашивающий не знает точного написания слова: dynamic или dinamic, то можно указать в поисковом запросе d?namic - ФАМИЛИЯ автора в разных статьях указывается на УКРАИНСКОМ либо на РУССКОМ языке Анісімов и Анисимов - Ан?с?мов

14 Использование групповых символов (?) и (*) * в слове известна лишь некоторая последовательность символов, а другие – не известны например, Антон* и будут найдены статьи: Антонюк, Антонцева, Антонов, Антонова… можно одновременно использовать символы * и ?, например, поисковое слово Р?зн*е?ко могут быть ограничения (например, не разрешается использовать символы ? и * в начале слова)

15 Поиск по близости звучания слова Нужно указать символ тильда (~) в конце слова На запрос: семантический~ будут найдены однокоренные слова семантическому, семантическими … а также такие близкие по звучанию слова, такие, как генетический, статический, механические, органический, электрические, математический, электрический...

16 Поиск по близости звучания слова факультативный параметр показывает меру близости звучания слов и находится в интервале 0–1. cемантический~0.4 чем больше число, тем большая понадобится схожесть звучания по умолчанию используется значение 0.5

17 Поиск фраз Фраза – это последовательность слов, расположенных в двойных кавычках Например, "база данных", "исчисление предикатов", "семантическая сеть" … Например, на запрос "knowledge base", получаем результат:

18 Поиск фраз

19 Использование слов и фраз Например, на поисковый запрос: библиотека поиск "база данных" oaі-pmh "интегрированный каталог" будут найдены статьи, которые содержат любые из перечисленных слов или фраз

20 Поиск с использованием расстояния между словами которое не превышает указанного числа Например, поисковое выражение "научных системы"~4 даст следующий результат:

21 Использование расстояния между словами Запрос: "научных системы"~4

22 Использование расстояния между словами Запрос: "научных системы"~3

23 Поиск по важности слов или фраз Запрос 1: parallel^4 programmіng Запрос 2: "база данных"^20, "информационная система"^10, библиотека^5 В качестве меры релевантности можно использовать неотрицательные целые числа и десятичные дроби в интервале 0-1. По умолчанию все слова/фразы имеют меру релевантности 1. Слова/фразы располагаются в порядке уменьшения их меры релевантности.

24 Обязательное наличие слов или фраз Запрос 1: +библиотека +научная электронная Запрос 2: +"база данных" библиотека Запрос 3: +библио* +электрон* +наук*

25 Расширенный поиск

26 Профессиональный поиск Примеры запросов: 1. author: Резн?ч*; 2. tіtle:( электр* катал* поиск); 3. abstract: ( библ* "электронный каталог" семантический~0.4); 4. система tіtle: баз* abstract: дан*; 5. база И (данные ИЛИ знания) НЕ прогр*; 6. author: Резн?ч * И tіtle: (электр* катал* поиск) ИЛИ (система tіtle: баз *);

27 Дополнительные поисковые функции настройка параметров поиска; сохранение результатов поиска для последующего использования; сохранение текстов запросов и их повторное использование самостоятельно или в составе других запросов; представление результатов поиска в разных форматах; помощь пользователям при использовании поисковых средств для повышения эффективности поиска.