Разработка и реализация системы семантически-ориентированного поиска с использованием Knowledge.NET Выполнил: Ким Сергей Владимирович E-mail: hedinsay@mail.ruhedinsay@mail.ru.

Презентация:



Advertisements
Похожие презентации
Базы данных Лекция 01 Информационные технологии баз данных.
Advertisements

Системы управления базами данных СУБД является универсальным программным средством предназначенным для создания и ведения(обслуживания) баз данных на внешних.
Чувашский Государственный педагогический университет имени И.я.Яковлева Тема учебного проекта: Базы данных в сети Интернет Автор: Студент ФМФ 5-го курса.
Современная система управления порталом для создания сервисов в Интернет нового поколения Фархадов М.П.*, Душкин Д.Н.*, Мясоедова М.А.* * Учреждение Российской.
СУБД Microsoft Access 2003 ЗНАКОМСТВО. Что такое Access? Access – Приложение, входящее в состав пакета Microsoft Office (разработано компанией Microsoft).
Базы данных Технология хранения, поиска, сортировки данных.
Web-узлы. Разработка и администрирование.. Часть 1. Web-технология.
ИРБИС 128: опыт внедрения, преимущества и новые решения для библиотек Сергиенко Татьяна Васильевна, вед. специалист Ресурсного центра БИК СФУ.
Введение в базы данных. Реляционное проектирование Затрагиваемые темы Проблемы, решаемые хранением данных в СУБД Проблемы, решаемые хранением данных в.
Сетевые службы Для конечного пользователя сеть это не компьютеры, кабели и концентраторы и даже не информационные потоки, для него сеть это, прежде всего,
Поиск информации в ИНТЕРНЕТЕ Для слушателей курсов. ХалкечеваЛ.В.
Разработка системы Выполнил: ст. гр. ПИ-051 Стародубцев Андрей Александрович Руководитель: ст. преподаватель Веревкин Сергей Анатольевич управления взаимоотношениями.
ФОРС-Центр Разработки Подсистема «Право». Подсистема «Право» предназначена для создания и ведения ведомственной базы данных электронных документов нормативно-правовой.
Технические спецификации и программные комплексы E2EDM Белов С.В., Сухоносов С.В., Булгакова К.В ЦОД ВНИИГМИ-МЦД,2006.
База данных (БД) – Совокупность определённым образом организованной информации на определённую тему (в рамках определённой предметной деятельности); Организованная.
это десятки миллионов Web-серверов Интернета, содержащих Web-страницы, в которых используется технология гипертекста. Технология WWW позволяет создавать.
Всемирная паутина Компьютерные телекоммуникации. 2 World Wide Web Популярнейшая служба Интернета - World Wide Web (сокращенно WWW или Web), еще называют.
Универсальное решение для микрофинансовых организаций.
Универсальная система учёта и паспортизации. Назначение системы Система предназначена для хранения семантических данных и представления их в объектно-ориентированном.
Microsoft Office Access Презентация на тему:. Что такое базы данных? Базы данных 1.Это организованная совокупность данных предназначенная для длительного.
Транксрипт:

Разработка и реализация системы семантически-ориентированного поиска с использованием Knowledge.NET Выполнил: Ким Сергей Владимирович Научный руководитель: Сафонов В.О.

Введение Локальные сети. Основные протоколы – SMB и FTP. Ресурсы, выложенные на общий доступ. Поиск с учетом смыслового содержания слов запроса пользователя и имен (содержания) проиндексированных информационных ресурсов Основа поиска по смыслу: иерархия папок всегда несет какую-то смысловую нагрузку

Подобные системы Системы, ведущие семантический поиск по содержанию проиндексированных ресурсов RetrievalWare компании Convera Семантический поиск, основанный на смысловых значениях слов в тексте Универсальная технология индексирования и поиска информации (APRP), которая позволяет поиск по содержанию текстовых документов, изображений, звука, видео и др. Обычные системы поиска Google Desktop, Spilight (для Mac OS 10.4 Tiger)

Работа с иерархией папок Основная часть – ресурсы, созданные человеком В зависимости от специфики сети четко прослеживаются общие свойтсва создания иерархии Ресурсы, созданные программами Avalanche - система управления Интернет-данными Концепция "умных папок" (Smart Folders) Семантическая рубрикация загруженных данных

Базовая поисковая система Система находится в рабочем состоянии Распределенность Модуль индексирования ресурсов (C#) Серверный логический модуль (Java) СУБД Oracle Прототип модуля, работающего со знаниями Реализованы разные подходы к ведению поиска ресурсов Реализован прототип поиска по смыслу

Необходимые программы JDK 1.4 и выше.NET Framework 2.0 Tomcat Oracle 9.2

Архитектура поисковой системы

База данных системы

Обычный поиск по названию

Поиск по смыслу

Требования Реализация полноценного поиска по смыслу, основанного на анализе иерархий папок для ресурсов Создание модуля, базирующегося на знаниях, с помощью системы Knowledge.NET Максимальная простота установки и использования системы Универсализация Создание документации Максимальная производительность работы системы

Универсализация Возможность работы системы с множеством СУБД Использование «наката» схемы БД Использование Hibernate Замена PL/SQL кода Переписывание модуля индексирования на Java Возможность работы системы на разных Java Web контейнерах

Создание онтологии С помощью Knowledge.NET для каждой конкретной локальной сети будет создаваться онтология Первоначальное задание множества концептов и их взаимосвязей Специалист в данной конкретной области или администратор поисковой системы Анализ хоста с «идеальными» и максимально полными иерархиями папок

Модуль работы со знаниями GUI приложение для Windows, написанное на.NET, с использованием Knowledge.NET Должно позволять пользователю создавать и обновлять концепты и взаимосвязи между ними в удобном виде Должно взаимодействовать с другими частями системы (по сокетам)

Обновление онтологии Впервые рассматриваемая папка для конкретной иерархии – это либо новый концепт, либо экземпляр уже существующего концепта Выбор зависит от файлов, которые содержатся в этой папке Необходимо ли сразу фиксировать множество имен только созданного концепта? Если «да», как это сделать, если не вручную?

Q & A