ИССЛЕДОВАНИЕ МОДЕЛЕЙ ИНФОРМАЦИОННОГО ПОИСКА РЕСУРСОВ В ЭЛЕКТРОННОЙ БИБЛИОТЕКЕ РЕСПУБЛИКИ КАРЕЛИЯ Выполнил : студент 3 курса, гр. 22303, Банкет Вячеслав.

Презентация:



Advertisements
Похожие презентации
Информационно-поисковые системы. Сычев А.В г.1 Математические модели документального поиска Воронежский государственный университет Факультет компьютерных.
Advertisements

Информационный поиск. План Векторная модель Ранжирование документов на основе весов, метаданных Определение весов на основе машинного обучения.
Исследование, анализ и использование информационной системы «1 С: Бухгалтерия» на предприятиях РБ выполнили: студенты 2 курса отделения "Финансы и кредит.
РАЗРАБОТКА ИНФОРМАЦИОННОЙ СИСТЕМЫ УЧЁТА ВЫПОЛНЕННЫХ РАБОТ ПО РЕМОНТУ ОБОРУДОВАНИЯ Министерство образования Омской области бюджетное профессиональное образовательное.
«Лингвистический модуль электронного учебника болгарского языка» Диссертация на соискание степени магистра филологических наук Соискатель Соискатель –
3.1. Назначение онтологий. Информационный поиск..
«Название проекта» ФИО студент, магистр, аспират. «УМНИК»
Модели и принципы построения прототипа системы электронной библиотеки вуза © Д.С. Зуев Казанский государственный университет Специальность
«Название проекта» ФИО студент, магистр, аспират. ФИО научного руководителя «УМНИК»
Применение генетического программирования для реализации систем со сложным поведением Санкт-Петербургский Государственный Университет Информационных Технологий,
Расположение связей на диаграмме Савин Н.С. 345 гр. Научный руководитель Ю. Литвинов.
«УМНИК» «Название проекта» ФИО студент, магистр, аспират.
ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ МОДЕЛИРОВАНИЯ Классификационные признаки моделирования Эффективность моделирования систем.
Научно-образовательная электронная библиотека вуза © А.Г. Абросимов, Д.С. Зуев Казанский государственный университет.
ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ МОДЕЛИРОВАНИЯ Классификационные признаки моделирования Эффективность моделирования систем.
Методика поиска в Электронном каталоге НБ СФУ : краткое руководство.
Системный подход в управлении в таможенном деле Выполнил студент Арутюнян Гр.312.
«Мировые информационные ресурсы» Кафедра «Сетевой экономики и мировых информационных ресурсов» Селетков Сергей Николаевич.
Алгоритмические основы разработки поисковой системы Трегубов А.А., Кононова Т.С. Таганрогский Государственный Радиотехнический университет Факультет информационной.
Транксрипт:

ИССЛЕДОВАНИЕ МОДЕЛЕЙ ИНФОРМАЦИОННОГО ПОИСКА РЕСУРСОВ В ЭЛЕКТРОННОЙ БИБЛИОТЕКЕ РЕСПУБЛИКИ КАРЕЛИЯ Выполнил : студент 3 курса, гр , Банкет Вячеслав Научный руководитель : к. т. н., доцент кафедры ПМиК доцент Насадкина О. Ю.

В связи с увеличением количества изданий в Электронной библиотеке Республики Карелия (более 1500 электронных публикаций), возникли следующие проблемы, связанные с эффективностью поиска, реализованного на сайте: Проблематика Занимает длительное время; Нет ранжирования в порядке релевантности; Результаты могут содержать ошибки; Существуют запросы на которых поиск не работает.

Цель: Исследование существующих моделей информационного поиска ресурсов, которые могут быть использованы для реализации поиска изданий в ЭБ РК Задачи: Исследовать существующие модели поиска, их плюсы и минусы Выбрать наиболее подходящую для ЭБ РК модель поиска При необходимости доработать и адаптировать выбранную модель

Модели поиска теоретико - множественные ( булевская, нечетких множеств, расширенная булевская ) алгебраические ( векторная, обобщенная векторная, латентно - семантическая, нейросетевая ) вероятностные

Булевская и расширенная булевская модель простая, легко понимаемая структура запроса ; простота реализации ; недостаточно возможностей для описания сложных запросов ; результатов запроса либо слишком много, либо слишком мало ; ранжирование результатов в большинстве случаев невозможно.

Вероятностная модель Можно отметить следующие преимущества данной модели : хорошее теоретическое обоснование при имеющейся информации дают наилучшие предсказания релевантности могут быть реализованы аналогично векторным моделям В то же время есть ряд недостатков : требуется информация о релевантности или ее приближенные оценки оптимальные результаты получаются только в процессе обучения на основе информации о релевантности

Векторная модель Документы и запросы представляются в виде векторов в N-мерном евклидовом пространстве Компоненты вектора соответствуют N терминам, образующим пространство.

Векторная модель достоинства : учет весов повышает эффективность поиска позволяет оценить степень соответствия документа запросу косинусная метрика удобна при ранжировании имеет преимущество перед другими моделями ввиду простоты и изящества недостатки : нет достаточного теоретического обоснования для построения пространства терминов поскольку термины не являются независимыми друг от друга, то они не могут быть полностью ортогональными

Реализация векторной модели в ЭБ РК После изучения различных моделей, с учетом их достоинств и недостатков, для реализации в ЭБ РК была выбрана векторная модель. Координаты для документа – TF*IDF Мерой близости документа и запроса служит косинусная метрика : Все метаданные были проиндексированы, сохранены в таблицы БД Oracle. Вычислены координаты. Реализован интерфейс поиска в соответствии с моделью

Реализация

Заключение Таким образом, в процессе работы выполнено следующее : Исследованы основные модели информационного поиска. Для каждой модели определены основные преимущества и недостатки. Обозначены общие подходы к практической реализации моделей информационного поиска. Реализован поиск для ЭБ РК на основе векторной модели.

Спасибо за внимание!!!