Алгоритмические основы разработки поисковой системы Трегубов А.А., Кононова Т.С. Таганрогский Государственный Радиотехнический университет Факультет информационной.

Презентация:



Advertisements
Похожие презентации
Информационный поиск. План Векторная модель Ранжирование документов на основе весов, метаданных Определение весов на основе машинного обучения.
Advertisements

Информационный поиск в Интернете Павел Морозов
Задачи проектирования ИПС: Анализ предметной области Определение структуры ИПС Определение видов поиска документов в ИПС Разработка структуры БД для ИПС.
Правописание безударных падежных окончаний имён существительных можно проверить ударным падежным окончанием того же типа склонения.
ИССЛЕДОВАНИЕ МОДЕЛЕЙ ИНФОРМАЦИОННОГО ПОИСКА РЕСУРСОВ В ЭЛЕКТРОННОЙ БИБЛИОТЕКЕ РЕСПУБЛИКИ КАРЕЛИЯ Выполнил : студент 3 курса, гр , Банкет Вячеслав.
4. Что пишется на конце существительных женского рода после шипящих? а) и б) ы в) ь 5. Склонение- это... а) изменение существительных по числам б) изменение.
1 скл. 2 скл.3 скл. 1 склонение 2 склонение 3 склонение Имена существительны е мужского и женского рода с окончаниями - а - я Имена существительны е.
3.1. Назначение онтологий. Информационный поиск..
ИЗВЛЕЧЕНИЕ ЗНАНИЙ ИЗ ТЕКСТОВОЙ ИНФОРМАЦИИ С ПОМОЩЬЮ ШАБЛОНОВ. KNOWLEDGE PROSPECTOR.NET Участники проекта (Knowledge.Net) Новиков Антон Владимирович Сигалин.
Информационный поиск Лидия Михайловна Пивоварова Системы понимания текста.
Доклад «Теоретические аспекты информационного поиска» Автор Гречиц Алёна Анатольевна.
Воспроизведение лучших результатов ad hoc поиска семинара РОМИП Romip-base project Красильников Павел, Механико-математический факультет МГУ им. Ломоносова.
ИЗУЧЕНИЕ СТАТИСТИКИ ВСТРЕЧАЕМОСТИ ТЕРМИНОВ И ПАР ТЕРМИНОВ В ТЕКСТАХ ДЛЯ ВЫБОРА МЕТОДОВ СЖАТИЯ ИНВЕРТИРОВАННОГО ФАЙЛА. Губин Максим Вадимович «Информационная.
Склонение имен существительных Имена существительные.
Окончания имён существительных. Окончания 1 склонение папамама дядятётя Мужской род Женский род.
Государственное (коррекционное) образовательное учреждение для обучающихся, воспитанников с ограниченными возможностями здоровья специальная (коррекционная)
ТЕХНОЛОГИЯ ПОЛНОТЕКСТОВОГО ПОИСКА В МУЛЬТИЯЗЫЧНЫХ СЕТЕВЫХ РЕСУРСАХ Д.В. Ландэ 1,2, д.т.н., В.В. Жигало 2 1 Институт проблем регистрации информации НАН.
Разработка базы данных 1 этап: Проектирование БД системный анализ предметной области анализ данных и построение модели данных 2 этап: Создание БД Создание.
Лекция 21 Лекция 21 Логическая и физическая схема организации пространства в документальных БД. Примеры моделей хранения и организации доступа.
Склонение личных местоимений. Местоимения Я,ТЫ не имеют форм множественного числа. Местоимения МЫ, ВЫ обозначают не множество Я, не множество ТЫ, а группу.
Транксрипт:

Алгоритмические основы разработки поисковой системы Трегубов А.А., Кононова Т.С. Таганрогский Государственный Радиотехнический университет Факультет информационной безопасности, кафедра БИТ Росия, г. Таганрог, ул. Чехова 2

Структура организации поисковой системы

Пример таблицы парадигм склонения русских существительных Код скл.Падеж им.род.дат.вин.твор.пред. единственное число 1ØØØØØØ 2какикекукойке 3Øауаоме 4ØауØ е 5Øауаеме 6ØауØ е 7-у ю у 10-у---у Всего для существительных: 36 флективных парадигм в единственном числе 46 флективных парадигм во множественном числе

Пример таблицы типов машинного склонения русских существительных. Коды склонений машинное склонениеЕд. ч.Мн. ч Общее количество типов машинного склонения для существительных - 97

Организация словарной статьи для слова: модель Машинная основа слова: модел В единственном числе данная основа имеет следующий набор флексий: ь-и-и-ь-ью-и Во множественном числе: и-ей-ям-и-ями-ях Из таблицы парадигм: в единственном числе код склонения - 17 во множественном числе код склонения - 57 Из таблицы типов машинного склонения: код машинного склонения Словарная статья в автоматическом словаре основ: модел 0018 ь

Статистический метод индексирования Относительная частота появления термина ti : где Nt – число встречаемости термина в документе, N – число всех терминов в документе. Инверсная частота появления термина: где dfi - количество документов в коллекции, содержащих термин ti, N – число всех терминов в документе. Комбинированный метод индексации:

Алгебраический метод определения релевантности Представление множества индексов документов коллекции набором векторов в векторном пространстве индексируемых терминов; Представление запроса вектором в векторном пространстве индексируемых терминов; Определение степени релевантности как меры расстояния между векторами индекса документа и запроса по формуле Хемминга: где x – вектор индекса документа, С – вектор запроса.