Онтологический подход и его использование для структурирования предметных областей Научная библиотека им. Н.И. Лобачевского Казанского государственного.

Презентация:



Advertisements
Похожие презентации
2.1. Типы онтологий: верхнего уровня, предметных областей, прикладных онтологий. Лексические онтологии.
Advertisements

4.1. Онтологии верхнего уровня: SUMO, Sowas ontology SUMO (Suggested Upper Merged Ontology) Онтология Джона Совы (Sowas ontology)
Доклад на тему «Создание онтологической базы знаний рекрутинговой системы» Подготовил : Нифталиев В.Э. Руководитель: Привалов М.В.
Онтологии: понятие, методы, применение. Онтологии предметных областей. Лекция 5.
Исследование применения онтологических моделей для семантического поиска Цель: определение основных способов и средств построения онтологических моделей.
Теория экономических информационных систем Семантические модели данных.
От сложного – к простому. От непонятного – к понятному.
Вопрос I. Основные понятия. Вопрос 2. Проектирование баз данных.
Лекция 3 Архитектура информационных систем. Вопросы лекции 1. Архитектура информационной системы 2. Архитектурный подход к реализации информационных систем.
XML-ТЕХНОЛОГИИ Лекция 5 Семантический Веб: микроформаты RDF, OWL и FOAF.
1 Концепция Web 3.0 Web как семантическая паутина : традиционные информационные ресурсы + метаданные, описывающие семантические связи в информационных.
СЕТЕВАЯ МОДЕЛЬ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ ЛЕКЦИЯ (С): Доц., к.т.н. Шкаберин В.А. Брянский государственный технический университет Кафедра «Компьютерные технологии.
Система управления электронной библиотекой LibMeta Каленкова Анна ВЦ РАН.
Стандарт IDEF1X Рассмотрим методологию IDEF1X. Методология IDEF1X представляет собой формализованный язык семантического (контекстного) моделирования данных,
1 Средства автоматической интеграции разнородных онтологий Панасенко Алексей, 525 группа Научный руководитель Большакова Е.И.
ОНТОЛОГИЧЕСКИЙ ПОДХОД и аспекты обработки естественно- языковых объектов (ЕЯО) Содержание 1.Введение. 2.Известные определения онтологии ПдО. 3.Схема формальной.
Основные понятия в области научного-педагогического исследования 1) Проблема, объект и предмет научно-педагогического исследования 2) Цели и задачи научно-педагогического.
Языки и методы программирования Преподаватель – доцент каф. ИТиМПИ Кузнецова Е.М. Лекция 7.
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ СТАВРОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ.
ПОСТРОЕНИЕ ОНТОЛОГИЧЕСКОГО СПРАВОЧНИКА ОТРАСЛЕВОГО УРОВНЯ С УЧЕТОМ РЕКОМЕНДАЦИЙ СТАНДАРТА ISO
Транксрипт:

Онтологический подход и его использование для структурирования предметных областей Научная библиотека им. Н.И. Лобачевского Казанского государственного университета Кузьмина Варвара Юрьевна, заведующая отделом автоматизации

Что такое онтология ? На протяжении веков философы пытались найти универсальные категории для классификации всего, что существует; лексикографы стремились к универсальной терминологии для определения всего, что можно сказать; библиотекари стремятся к универсальным системам предметизации и классификации для хранения и поиска всего, что было написано; в 70-х годах 20 века ANSI SPARC предложил три схемы архитектуры для разработки и интеграции баз данных, которые управляют мировой экономикой; семантический веб расширил задачу до уровня классификации, маркировки, определения, поиска, интеграции, и использования всего World Wide Web, который быстро становится универсальным хранилищем всех накопленных знаний, информации, данных и мусора человечества.

Что такое онтология ? Онтология –точная (выраженная формальными средствами) спецификация концептуализации. (Gruber) Концептуализация процесс перехода от представления предметной области на естественном или ограниченном естественном языке к точной спецификации этого описания на некотором формальном языке, ориентированном на компьютерное представление. Концептуализация также трактуется как результат подобного процесса, т. е. описание множества понятий (концептов) предметной области, знаний о них и связях (отношениях) между ними. Концептуализация – структура реальности, независимо от Словаря Конкретной ситуации Концептуализация - процедура введения онтологических представлений в накопленный массив эмпирических данных; первичная теоретическая форма, обеспечивающая теоретическую организацию материала; схема связи понятий и т.д.

Интерпретации понятия «онтология» 1. неформальная концептуальная система (представление концептуализации); 2. формальный взгляд на семантику; 3. спецификация концептуализации; 4. представление концептуальной системы через логическую теорию; 5. словарь, используемый логической теорией; 6. метауровневая спецификация логической теории.

Что такое онтология ? Онтологией называют: словарь с определениями; простую таксономию; тезаурус (таксономия с терминами); модель с произвольным набором отношений; таксономию и произвольный набор отношений полностью аксиоматизированную теорию.

Таксономические отношения Варианты названий: «принадлежит к классу» («a kind-of» («is- a»)) Класс - подкласс Лингвистика: гипоним – гипероним Родовидовое отношение

Свойства таксономических отношений Транзитивность: A is_a B, B is_a C, => A is_a C Наследование: S= свойство (А) B is_a A => S=свойство (B)

фрагмент таксономии УДК

Что такое онтология ? На формальном уровне, онтология это система, состоящая из набора понятий и набора утверждений об этих понятиях, на основе которых можно строить классы, объекты, отношения, функции и теории. Основные компоненты: Классы или понятия Отношения Функции Аксиомы Примеры

Типы онтологий: верхнего уровня; предметных областей; прикладные онтологии (онтологии задач); лексические онтологии

Онтологии верхнего уровня Cycs upper ontology ( -2-1/cover.html) Top-level ontologies of universals and particulars ( Sowas top-level ontology ( The Standard Upper Ontology(SUMO) (

Характеристики онтологий верхнего уровня (ОВУ) Набор основных отношений: Иерархические класс-подкласс часть-целое Ассоциативные Типичные концепты и принципы разделения: Сущность Явление Объект Процесс Роль Нацеленность на многократное повторное использование онтологии

Онтология CYC Lenat D. Самый амбициозный проект Начат в млн. утверждений common sense Микротеории: пространство, время, причинность Онтология 3 тысяч понятий верхнего уровня – в открытом доступе

Характеристики онтологий предметных областей Существенные отличия от ОВУ: Охват конкретной области знаний (авиация, медицина, культура), Круг решаемых задач и вопросов, на которые онтология отвечает, ограничен выбранной областью, Больший по сравнению с ОВУ объем онтологии, Наличие отношений специфичных для конкретной области. Повторное использование только в рамках предметной области

Онтологии предметной области (библиографические): Выражение основных концепций Функциональных требований к библиографическим записям (FRBR) в RDF ( MarcOnt онтология представляющая структуру формата MARC21 и Dublin Core на языке OWL ( SKOS семейство формальных языков для описания классификационных схем, тезаурусов, авторитетных файлов. SKOS построенная на RDF и RDFS В настоящее время разработки ведутся в рамках W3C

Применение онтологий Организация эффективного поиска в базах данных, информационных каталогах, базах знаний

Применение онтологий Семантический поиск в Internet; Представление смысла в метаданных об электронных информационных ресурсах; Построение и использование баз общих знаний (онтологий верхнего уровня) для различных интеллектуальных систем

Методики построения онтологии и требования к средствам их спецификации Стандарт онтологического исследования IDEF5 подготовлен фирмой Knowledge Base Systems, Inc. в качестве проекта национального стандарта США. Процесс построения онтологии в рамках IDEF5 состоит из пяти основных этапов 1. Изучение и систематизация начальных условий. Этот этап устанавливает основные цели и контекст разработки онтологии, а также распределяет роли членов проекта. 2. Сбор и накопление данных для построения онтологии. 3. Анализ и группировка собранных данных для облегчения согласования терминологии. 4. Начальное развитие онтологии. На этом этапе формируется предварительная онтология на основе систематизированных данных. 5. Уточнение и утверждение онтологии (заключительный этап).

Онтологический подход к описанию ПрО Процесс онтологического (концептуального) моделирования предполагает: отбор значимых для рассматриваемой предметной области понятий экспертом предметной области и/или отправляясь от представительного корпуса текстов; категоризация (начальная классификация) отобранных понятий; дальнейшая систематизация внутри категорий - таксономическая (иерархическая) организация понятийного словаря; установление отношений между понятиями в рамках некоторого априори принимаемого ограниченного списка значимых отношений (обычно используются не зависящие от выбора предметной области универсальные отношения: часть - целое, принадлежать к совокупности, быть связанным с, иметь местом и т.п.; могут исполь­зоваться и более конкретные, специфичные для данной предметной области отношения). Иначе говоря, в процессе реконструирования ПрО в виде онтологии необходимо ответить на следующие вопросы: Какие объекты существуют в ПрО; Какие атрибуты (свойства) имеют объекты и каковы их возможные значения; Состоят ли объекты из частей; Меняются ли атрибуты и отношения со временем; Какие события происходят в различные моменты времени; В каких процессах участвуют объекты; Каковы причинно-следственные связи событий и состояний. По сути, ответы на эти вопросы определяют возможные виды отношений между понятиями онтологии ПрО.

Фундаментальные правила разработки онтологии: 1) Не существует единственного правильного способа моделирования предметной области – всегда существуют жизнеспособные альтернативы. 2) Разработка онтологии – это обязательно итеративный процесс. 3) Понятия в онтологии должны быть близки к объектам (физическим или логическим) и отношениям в интересующей вас предметной области. Скорее всего, это существительные (объекты) или глаголы (отношения) в предложениях, которые описывают предметную область.

Проекты в сфере семантических цифровых библиотек SIMILE развивает DSpace за счет поддержки произвольных схем и метаданных; Corrib.org разрабатывает семантическую цифровую библиотеку компонентов, таких, как JeromeDL, MarcOnt, FOAFRealm и HyperCuP; BRICKS крупнейший проект в области культурного наследия в рамках 6-й программы ЕС применяет технологии семантического веб для управления метаданными в общеевропейской сети цифровых библиотек. FEDORA гибкая, ориентированная на сферу услуг, архитектура управления и доставки цифрового контента