Андон Ф.И., Резниченко В.А. Онтологии – проблемы создания и применения Институт программных систем НАН Украины.

Презентация:



Advertisements
Похожие презентации
Андон Ф.И., Резниченко В.А. Онтологии – проблемы создания и применения Институт программных систем НАН Украины.
Advertisements

Теория экономических информационных систем Семантические модели данных.
Даталогическое проектирование. 1. Представление концептуальной модели средствами модели данных СУБД Общие представления о моделях данных СУБД С одной.
Учебная дисциплина «Базы данных» для студентов специальности Бизнес-информатика (бакалавриат) ЛЕКЦИЯ 3 ВВЕДЕНИЕ В РЕЛЯЦИОННУЮ МОДЕЛЬ ДАННЫХ Вопрос.
Онтологии: понятие, методы, применение. Онтологии предметных областей. Лекция 5.
Введение в формальные (аксиоматические) системы. Формальные системы - это системы операций над объектами, понимаемыми как последовательность символов.
Методы дискретной математики: теоретико-множественные представления Эмомов А.М.
Модели представления знаний. 1. Логические; 2. Продукционные; 3. Представление знаний на основе фреймов; 4. Представление знаний на основе семанти- ческих.
СЕТЕВАЯ МОДЕЛЬ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ ЛЕКЦИЯ (С): Доц., к.т.н. Шкаберин В.А. Брянский государственный технический университет Кафедра «Компьютерные технологии.
Так С 1- С 4 представляют собой составное задание, или так называемый мини - тест. Он включает фрагмент источника и четыре вопроса - задания на его анализ.
Литература 1. Андрейчиков А.В, Андрейчикова О.Н. Интеллектуальные информационные системы: Учебник. – М.: Финансы и статистика, – 424 с. 2. Гаврилова.
Моделирование как метод познания Моделирование это метод познания, состоящий в создании и исследовании моделей.
Модуль 1. Математические основы баз данных и знаний.
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ СТАВРОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ.
От сложного – к простому. От непонятного – к понятному.
Компьютерное математическое моделирование в среде Excel.
Реляционное исчисление. Общая характеристика Запрос – формула некоторой формально-логической теории; описывает свойства желаемого результата. Ответ –
Моделирование и исследование мехатронных систем Курс лекций.
Базы данных Лекция 4 Базисные средства манипулирования реляционными данными: реляционная алгебра Кодда.
Методология IDEF1X (IDEF1 Extended) – язык для семантического моделирования данных, основанных на концепции « сущность - связь ». Является расширением.
Транксрипт:

Андон Ф.И., Резниченко В.А. Онтологии – проблемы создания и применения Институт программных систем НАН Украины

Содержание 1.Базовые понятия 2.Способы придания смысла понятиям управляемые словари таксономии тезаурусы онтологии 3.Онтологии концептуализация спецификация формализация 4.Инженерия онтологий жизненный цикл операции над онтологиями выводы в онтологии Языки онтологий

Базовые понятия Суждение – форма мысли, в которой утверждается или отрицается что-либо относительно предметов и явлений окружающего мира, их свойств, связей и отношений и которая обладает свойством выражать либо истину или ложь. Понятие (концепт) – целостная совокупность суждений, то есть мыслей, в которых что-либо утверждается об отличительных признаках исследуемого объекта, ядром которого являются суждения о наиболее общих и в то же время существенных признаках этого объекта. Объем (экстенсионал) понятия – класс обобщенных в понятии объектов. Содержание (интенсионал) понятия – совокупность (обычно существенных) признаков, по которым произведено обобщение и выделение объектов в данном понятии. Термин – слово или словосочетание, точно и однозначно именующее понятие и его соотношение с другими понятиями.

Веб и семантический веб

Концептуальная модель предметной области

Инфологическая модель

Логическая модель данных

Фреймовая модель представления знаний

Семантическая сеть

Тезаурус

Онтология

От словаря к онтологии

Управляемый словарь (Controlled Vocabulary) Управляемый словарь – это способ организации знаний с целью облегчения их представления и последующего поиска Управляемый словарь – это список явно заданных тщательно отобранных терминов (слов, фраз или нотаций). Все термины должны иметь однозначное и неизбыточное толкование (определение). Управляемые словари – это основа классификации. В библиотечных ИС управляемый словарь представляет собой список тщательно отобранных слов и фраз, которые используются для разметки информационных единиц (слов, выражений, документов). Управляемые словари фиксируют возможные варианты выбора значений Управляемые словари уменьшают неопределенность и неоднозначность, присущую естественному языку

Примеры управляемых словарей

Пример управляемого словаря тематических разделов журнала «Доповiдi Нацiональної академiї наук України Біологія Біофізика Біохімія Екологія Енергетика Інформатика та кібернетика Інформація Математика Матеріалознавство Медицина Механіка Науки про Землю Теплофізика Фізика Хімія

Примеры использования словарей Библиотечное дело - предметная индексация, предметные рубрики, каталоги, авторитетные файлы Лингвистика - разметка информационных единиц Информационные системы – индексация Программные системы – меню, ниспадающие и всплывающие списки Тематические рубрики в журналах

Таксономия Таксоно́мия (от др.-греч. τάξις строй, порядок и νόμος закон) учение о принципах и практике классификации и систематизации. Термин «таксономия» впервые был предложен в 1813 г. для классификации растений и животных и изначально применялся только в биологии. Позже этот термин стал использоваться для обозначении общей теории классификации и систематизации сложных систем как в биологии, так и в других областях знаний: в лингвистике, географии, геологии и т.д. Таксономия – это предметная классификация, которая группирует термины в виде управляемых словарей и упорядочивает их (словари) в виде иерархических структур.

Биологическая иерархическая таксономия, ведущая к человеку: Простая иерархическая таксономия «управляющего объекта»:

Таксономическая структура Математически таксономией является древовидная структура классификаций определенного набора объектов. Вверху этой структуры объединяющая единая классификация корневой таксон которая относится ко всем объектам данной таксономии. Таксоны, находящиеся ниже корневого, являются более специфическими классификациями, которые относятся к подмножествам общего множества классифицируемых объектов. Современная биологическая классификация, к примеру, представляет собой иерархическую систему, основание которой составляют отдельные организмы (индивиды), а вершину один всеобъемлющий таксон; на различных уровнях иерархии между основанием и вершиной находятся таксоны, каждый из которых подчинён одному и только одному таксону более высокого ранга.

Фрагмент таксономии УДК

Иерархическая структура данных и таксономия В иерархической структуре данных связь понятий означает единственное - наличие между ними взаимосвязи «один ко многим» При этом каждое из понятий, как правило, является самостоятельным в том смысле, например, что «сотрудник» НЕ является ни «организацией» и ни «проектом». В каждой организации работает множество сотрудников и имеется множество проектов, но каждый сотрудник работает в одной организации и каждый проект выполняется в одной организации. Другим примером такой иерархии является структура папок в операционной системе компьютера.

Суть таксономической иерархического отношения Таксономические отношения также называются: отношением «обобщения/специализации», «родовидовым» отношением отношением «супертип/подтип» отношением «суперкласс/подкласс» В англоязычной литературе также говорится об отношении «Is a»

Тезаурус Тезаурус (от греч. thesaurós сокровище, сокровищница), В широком смысле Тезаурус интерпретируются как описание системы знаний о действительности. Тезаурус является расширением такономии в том смысле, что в тезаурусе помимо родо-видовых отношений могут существовать любые другие отношения, которые на множестве понятий формируют сложную сетевую структуру. Тезаурусы, особенно в электронном формате, являются одним из действенных инструментов для описания отдельных предметных областей.

Тезаурус в лингвистике С точки зрения лингвистики тезаурус - это множество смысловых единиц некоторого языка с заданной на нём системой семантических отношений. Тезаурус фактически определяет семантику языка (национального языка, языка конкретной науки или формализованного языка для автоматизированной системы управления). Например, лингвистический, тезаурус содержит: Морфологические и синтаксические свойства (часть речи, род, склонение, корень, словоформы в различных падежах, родах и числах) Семантика (значение, синонимы, антонимы, гиперонимы, гипонимы) Родственные слова Происхождение Фразеологизмы и устойчивые сочетания Перевод на другие языки

Пример тезауруса слова «замок» в Викисловаре

Информационно-поисковые тезаурусы В 70-х гг. 20 в. получили распространение информационно- поисковые тезаурусы В этих тезаурусах выделены специальные лексические единицы дескрипторы, по которым можно осуществлять автоматический поиск документальной информации. С каждым словом такого тезауруса сопоставляется дескриптор (дескрипторная статья), Дескрипторная статья может иметь следующую структуру: заглавный дескриптор; ключевые слова из класса эквивалентности; дескрипторы, подчиняющие заглавный; дескрипторы, подчиненные заглавному; дескрипторы, ассоциированные с заглавным. Для дескрипторов явным образом указываются семантические отношения: род - вид, часть - целое, ассоциации (причина - следствие; сырье - продукт; процесс - объект; процесс – субъект; свойство – носитель свойства).

ANSI/NISO Monolingual Thesaurus Standard ANSI/NISO Monolingual Thesaurus Standard (NISO - National Information Standards Organization) определяет тезаурус как «упорядоченный управляемый словарь, структурированный таким образом, что в нем между терминами четко определены и идентифицированы отношения эквивалентности, гомографии, иерархии и ассоциации с использованием стандартизированных индикаторов этих отношений… Первичная задача тезаурусов заключается в том, чтобы облегчить поиск документов и достигнуть согласованности в выполнении индексации письменных или другим способом полученных документов». Таким образом, согласно этого определения»в тезаурусах определяется четыре различных типа связей: эквивалентность, омонимия, иерархия, ассоциация

Отношения и их эквиваленты СмыслПримеры эквивалентность, синоним, аналогично, используется вместо Термин Х имеет тот же или почти тот же смысл, что и термин Y «электронная библиотека» является синонимом для «цифровая библиотека» омоним, имеет такое же написание, гомография Термин Х имеет такое же написание, что и Y, но они имеют различный смысл Закрыть замок на замок, чтобы замок не замок шире, чем иерархия: является родительским для Термин Х шире по смыслу, чем Y Организация шире по смыслу, чем «финан- совое учреждение» уже, чем иерархия: является дочерним для Термин Х уже по смыслу, чем Y «финансовое учреж- дение» уже по смыслу, чем «организация» ассоциация, ассоциируется с, связан с, используется для Термин Х ассоциируется с термином Y. Существует неспецифицируемая связь между ими. «гвоздь» связан с «молотком»

Пример: тезаурус как связь двух таксономий

Пример фрагмента тезауруса для понятия «успеваемость» СвязьТермин (понятие) Используется дляСредний балл Оценка знаний Оценка преподавания Более узкое понятиеУспеваемость в школе Успеваемость в колледже Успеваемость в ВУЗе Успеваемость по математике Более широкое понятиеУспех Связан сМотивация успеваемости Прогнозирование успеваемости Способности к обучению Образование Учебный процесс

Таксономии, тезаурусы и онтологии

Тезаурусы и онтологии Правила переходов для свойства «Семейное положение» Два ИССЛЕДОВАТЕЛЯ сотрудничают, если 1)они имеют общую цель и 2)предпринимают определенные действия для достижения этой цели

Назначение словарей, таксономий, тезаурусов, онтологий Это основа для выработки единой, согласованной, нормативной, однозначно понимаемой, полной и непротиворечивой терминологии, используемой всеми, кто имеет отношение к ПО. Это средства, предназначенные для классификации, структурирования, систематизации, моделирований и придания смысла понятиям и связям, относящимся к ПО. Это средства для исчерпывающего описания информационной модели ПО, включая и ее семантику, самостоятельно, то есть не зависимо от задач (оперативных знаний), которые будут решаться с использованием этой модели. Это основа для коммуникации между людьми, компьютерными агентами и людьми и компьютерными агентами.

Определения онтологий N. Guarino and P. Giaretta. Ontologies and Knowledge Bases: Towards a Terminological Clarification. In N. Mars, editor, Towards Very Large Knowledge Bases: Knowledge Building and Knowledge Sharing, pages 25–32. IOS Press, Amsterdam, Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем. Учебник. СПб.: Питер, с. 1)Онтология как философская дисциплина. ( ντος сущее, то, что существует и λόγος учение, наука ) 2)Онтология как неформальная концептуальная система. 3)Онтология как формальный взгляд на семантику. 4)Онтология как формальная, явная спецификация согласованной концептуализации. 5)Онтология как представление концептуальной системы через логическую теорию, характеризуемую: а) специальными формальными свойствами или б) только ее назначением. 6)Онтология как словарь, используемый логической теорией. 7)Онтология как (метауровневая) спецификация логической теории.

Что такое концептуализация? – концептуализация в базах данных ANSI/X3/SPARC Study Group on Data Base Management Systems: (1975), Interim Report. FDT, ACM SIGMOD bulletin. Volume 7, No. 2 ISO TC97/SC5/WG3. Concepts and terminology for the conceptual schema and the information base (edited by J.J. van Griethuysen) March 15, 1982, 150 p.

Что такое концептуализация? – концептуализация в ИИ M.R. Genesereth and N. J. Nilsson. Logical Foundations of Artificial Intelligence. Morgan Kaufmann, Los Altos, CA, «Основой формального представления знаний является концептуализация, представляющая собой множество объектов, понятий и других сущностей, которые, как предполагается, существуют в некоторой представляющей интерес предметной области, и имеющиеся между ними отношения. Концептуализация является абстрактным упрощенным взглядом на мир, который мы хотим представить для каких-то целей. Каждая база знаний, система, базирующаяся на знаниях, агент знаний прямо или косвенно используют концептуализацию».

Используемый пример наша предметная область состоит из множества лиц (Person); среди них выделяются руководители (Manager) и исследователи (Researcher); исследователи отчитываются (reports-to) перед руководителями; исследователи могут сотрудничать (cooperates-with) между собой

Формальное определение концептуализации - экстенсиональная реляционная структура Определение 1. Экстенсиональная реляционная структура – это кортеж (D,R), где: D – множество, называемое доменом (универсумом) R – множество отношений на D Здесь R – обычные математические отношения различной арности, то есть множества кортежей элементов из D Пример D = {P1, P2,.. } R = {Person, Manager, Researcher, cooperates-with, reports-to}

Формальное определение концептуализации – система, мир, состояние мира Под системой мы будем подразумевать часть реального мира, которая представляет для нас интерес с точки зрения процесса моделирования, и которая, при заданном уровне детализации, воспринимается наблюдающим ее агентом (который обычно является внешним по отношению к самой системе) в виде совокупности «наблюдаемых переменных». Определение 2. (мир и состояния мира). По отношению к конкретной моделируемой системе S, состоянием мира для S является уникальное присвоение значений наблюдаемым переменным, которые характеризуют систему. Мир – это линейно упорядоченное множество ( linearly ordered set ) состояний мира, которые отражают эволюцию системы во времени. Если для простоты абстрагироваться от времени, то мир совпадает с состоянием мира.

Формальное определение концептуализации – интенсиональное отношение и концептуализация Определение 3 (интенсиональное отношение или концептуальное отношение). Пусть S является произвольной системой, D является произвольным множеством выделенных элементов S, а W – множество состояний мира для S (также называемыми мирами или возможными мирами). Интенсиональным отношением (или концептуальным отношением) ρ n арности n на является функция ρ n : W из множества W во множество всех n-арных экстенсиональных отношений на D. Определение 4. (интенсиональная реляционная структура или концептуализация). Интенсиональная реляционная структура (или концептуализация) – это тройка (D,W, ) где: D – домен (универсум) W – множество возможных миров – множество интенсинальных (концептуальных) отношений

Пример концептуализации D = {Р1,Р2,...} – универсум W = {w1, w2,...} – множество возможных миров = {PERSON, MANAGER, RESEARCHER, COOPERATES-WITH, REPORTS-TO} – множество концептуальных отношений Если предположить, что унарные отношения не изменяются (являются постоянными во всех состояниях мира) и множество людей совпадает с универсумом, а бинарные отношения изменяются, то можно таким образом специфицировать интенсиональные отношения (как функции) во всех мирах w из W: PERSON(w) = D во всех мирах w из W: MANAGER(w) = {..., Р3,...} во всех мирах w из W: RESEARCHER(w) = {..., Р4,..., Р5,...} REPORTS-TO(w1) = {..., (Р4, Р3), (Р5, Р3),,...} REPORTS-TO(w2) = {..., (Р4, Р3), (Р5, Р3, (Р17, Р3),...} REPORTS-TO(w3) =... COOPERATES-WITH(w1) = {..., (Р4, Р5),...} COOPERATES-WITH(w2) =...

Спецификация – экстенсиональная и интенсиональная Экстенсиональная спецификация концептуализации заключается в перечислении всех экстенсионалов (экстенсиональных отношений) каждого из концептуальных отношений для всех состояний возможных миров. Интенсиональная спецификация – это выбор языка и ограничения его интерпретации интенсиональным способом путем определения в этом языке набора подходящих аксиом (правил, ограничений, смысловых постулатов). Например, мы могли бы сформулировать аксиомы, что: reports-to является асимметричным и нетранзитивным, а cooperates-with – симметричным и иррефлексивным. В этом случае онтология – это просто множество таких аксиом, то есть это логическая теория, предназначенная для представления только подразумеваемых моделей, соответствующих определенной концептуализации.

Спецификация – подразумеваемая модель

Мир, концептуализация, язык, интерпретация, онтологии

Спецификация - Онтологическое сопоставление Определение 5 (экстенсиональная структура первого порядка / модель). Пусть L – логический язык первого порядка со словарем V и S = (D,R) – экстенсиональная реляционная структура. Экстенсиональная структура первого порядка (также называемая моделью L), это кортеж M = (S, I), где I называется функцией экстенсиональной интепретации и представляет собой функцию I : V D U R, которая отображает символы словаря V в D или R. Определение 6 ( интенсиональная структура первого порядка / онтологическое сопоставление) Пусть L – логический язык первого порядка со словарем V и С = (D,W, ) – концептуализация. Интенсиональная структура первого порядка (также называемая онтологическим сопоставлением), это кортеж K = (C, I ), где I называется функцией интенсиональной интепретации и представляет собой функцию I : V D U, которая отображает символы словаря V в D или.

Подразумеваемая модель и онтология Определение 7 (Подразумеваемая модель) Пусть и С = (D,W, ) является концептуализацией, пусть L – логический язык первого порядка со словарем V и с онтологическим сопоставлением K = (C, I ). Модель M = (S, I) с экстенсиональной реляционной структурой S = (D,R), называется подразумеваемой моделью языка L согласно K тогда и только тогда, когда: Для всех символов-констант c V имеем I(c) = I (c) Для любого состояния мира w W выполняется следующее: для каждого предикатного символа v V существует интенсиональное отношение ρ такое, что I (v) = ρ и I(v) = ρ(w) Определение 8 (Онтология) Пусть и С = (D,W, ) является концептуализацией, пусть L – логический язык первого порядка со словарем V и с онтологическим сопоставлением K = (C, I ). Онтология О К – это логическая теория, состоящая из множества таких формул L, что получаемые при этом модели насколько это возможно приближаются к подразумеваемым моделям L согласно К.

Пример онтологии 1.Таксономические правила, указывающие, что исследователи и руководители являются видовыми понятиями человека O 1 = {Researcher(x) Person(x), Manager(x) Person(x)} 2.Введем правила, определяющие области допустимых значений для бинарных отношений O 2 = O 1 U {cooperates-with(x, y) Person(x) & Person(y), reports-to(x, y) Person(x) & Person(y)} 3.Отношение cooperates-with является симметричным отношением O 3 = O 2 U {cooperates-with(x, y) cooperates-with(y, x)} 4.Отношение reports-to является транзитивным O 4 = O 3 U {reports-to(x, y) & reports-to(y, z) reports-to(x, z)} 5.Непересекаемость исследователей и руководителей O 5 = O 4 U {Manager(x) ¬Researcher(x)}

Компоненты онтологий Индивиды (объекты, элементы, экземпляры, термины) Классы (множества, коллекции, типы, унарные отношения, понятия) Атрибуты - аспекты, свойства, характеристики, особенности, параметры, которые могут быть присущими индивидам Отношения (связи) – способ выражения взаимосвязи между индивидами Аксиомы (ограничения, правила) – выражение суждений, которые имеют место в рассматриваемой предметной области Правила вывода (умозаключение) – логическое действие, в результате которого из одного или нескольких известных и определенным образом связанных суждений получается новое суждение (дедукция, индукция, традукция, вывод по аналогии) Функции (процессы, процедуры,…)

Онтология онтологии АКСИОМЫ: Термин может именовать либо Индивид, либо Понятие, либо Свойство Термин именует не более одного Индивида или не более одного Понятия или не более одного Свойства Понятие в качестве объема может иметь множество Индивидов Понятие в качестве содержания может иметь множество Свойств ПРАВИЛО: ЕСЛИ в транзитивном Отношении экстенсионал понятия слева включает в себя экстенсионал понятия справа, ТО это отношение является Родо-видовым

Инженерия онтологий - определение Инженерия онтологий в компьютерных науках – это дисциплина, которая изучает методы, методологии и средства построения и использования онтологий. Инженерия онтологий направлена на явное извлечение и представление знаний, содержащихся в компьютерных системах предметных областей различного назначения. Инженерия онтологий направлена на решение проблем интероперабельности, вызванных семантическими проблемами, то есть проблемами возможного неоднозначного понимания терминов той или иной предметной области. Инженерия онтологий включает следующие аспекты: жизненный цикл онтологий; процесс разработки онтологий; методы и методологии построения онтологий; набор инструментов и языков для их построения и поддержки

Инженерия онтологий – жизненный цикл Стратегия: –Для каких целей создается онтология? –Какую область будет охватывать онтология? –Кто и как будет использовать и поддерживать онтологию? Анализ – это, в частности: - извлечение знаний (knowledge discovery); - интеллектуальный анализ данных (data mining)

Инженерия онтологий – создание Выявление и четкое определение понятий. Это основа для создания управляемых словарей Выявление и четкое определение множества свойств (атрибутов, характеристик), характеризующих каждое понятие. Обязательное выделение множества свойств, идентифицирующих понятия. Выявление и четкое определение родовидовых зависимостей (связей) между понятиями и, тем самым задание таксономий на множестве понятий. Выявление и четкое определение других произвольных бинарных связей между понятиями с указанием к какому типу связей они относятся (часть/целое, агрегация, ассоциация, причина-следствие и т.д.). Тем самым строится тезаурус. Выявление и четкое определение аксиом (правил, прикладных ограничений), характеризующих углубленную семантику понятий, атрибутов и связей. Тем самым строится онтология. Построение экстенсионалов.

Инженерия онтологий – операции Унификация Уточнение Отображение Согласование Интеграция Наследование Композиция Слияние Объединение, пересечение, разность

Манипулирование онтологиями – операция унификации Унификация (unification) – Онтология приводится к некоему каноническому (эталонному) представлению. Для унификации должна задаваться исходная онтология, которая приводится к результирующей согласно заданной канонической онтологии. Задача унификации множества исходных онтологий становится актуальной при работе с гетерогенными онтологиями. Каноническая онтология Результирующая онтология Исходная онтология Унификация

Манипулирование онтологиями – операция уточнения Уточнение (refinement). Под уточнением онтологий понимают такое сопоставление онтологии A с другой онтологией B, что каждому понятию из онтологии A ставится в соответствие эквивалентное ему понятие в B. Примитивные понятия из онтологии A могут соответствовать непримитивным понятиям онтологии B. Уточнение А В

Манипулирование онтологиями – операция отображения Отображение Отображение (mapping). Отображение одной онтологии в другую – это функция преобразования одной онтологии в другую (способ перевода объектов одной онтологии в другую), либо сам результат такого преобразования. Часто это означает перевод между понятиями и отношениями. Отображение может быть частичным в том смысле, что не все понятия исходной онтологии отображаются в результирующую. В частности, это означает, что в исходной онтологии существует подонтология, для которой существует полное отображение.

Манипулирование онтологиями – операция согласования Согласование (alignment) - это процесс отображения онтологий в обоих направлениях. Согласование, как и отображение, может быть лишь частичным. Спецификация согласования называется артикуляцией (articulation)

Манипулирование онтологиями – операции интеграции и наследования Интеграция (integration). Это процесс поиска одинаковых частей двух разных онтологий, A и B, при разработке новой онтологии C, которая позволяет выполнить перевод между онтологиями A и B, и, таким образом, позволяет взаимодействие между двумя системами, где одна использует онтологию A, а другая - онтологию B. Новая онтология C может заменить онтологии A и B или может использоваться в качестве промежуточной онтологии для перевода между двумя онтологиями. Интеграция может меняться от согласования к унификации. Наследование (inheritance). Означает, что онтология A наследует все из онтологии B. Она наследует все понятия, отношения и ограничения или аксиомы, и дополнительные знания, содержащиеся в онтологии, не внося при этом какой-либо несогласованности.

Манипулирование онтологиями – операция композиции G1G1 G2G2 G 1 (G 2 ) (n 1,n 2 )(n 2,n 1 ) (n 2,n 3 ) (n 1,n 1 ) (n 1,n 3 ) (n3,n 3 )(n1,n 3 ) (n 2,n 1 )(n 1,n 1 ) (n 1,n 3 ) (n 2,n 1 ) (n 2,n 3 ) Композиция (composition) двух графов G1 и G2, G=G1(G2) – это транзитивное замыкание двух графов, если рассматривать их как бинарные отношения. Дед (Х, Y) = Отец(Отец(Х, Y))

Манипулирование онтологиями – операция слияния Слияние (merge) онтологий означает создание новой онтологии посредством объединения существующих. Общепринятым правилом является требование, что результирующая онтология содержит ВСЕ ЗНАНИЯ исходных онтологий. Слияние может не выполняться полностью, например, в связи с тем, что исходные онтологии могут быть несогласованными (противоречивыми). Результирующая онтология может содержать новые понятия и отношения, которые служат для установления соответствия между терминами и отношениями исходных онтологий.

Манипулирование онтологиями – операции объединения, пересечения и разности Операции объединения, пересечения и разности онтологий. Это обычные теоретико-множественные операции, предполагающие, что онтология – это множество бинарных отношений. G1G1 G2G2 G 1 U G 2 G 1 G 2 (n 1,n 2 ) (n 1,n 3 ) (n 2,n 1 ) (n 2,n 3 ) (n 3,n 3 ) (n 1,n 1 ) (n 1,n 3 ) n 1,n 2 ) (n 1,n 3 ) (n 2,n 1 ) (n 2,n 3 ) (n 3,n 3 ) (n 1,n 1 ) (n 1,n 3 )(n 1,n 2 )

Вывод в онтологиях Вывод предполагает возможность выводить новые данные (знания) из имеющихся. Решать проблему вывода в онтологии в достаточной степени полноты можно в том случае, когда онтология формализована. Языком формализации онтологий является дескриптивная логика (DL), которая формализует такие два языка онтологий, как RDF и OWL.

Способы задания вывода Вывод можно задавать процедурно, например, указывая, что определяемое понятие является последовательностью операций над уже определенными понятиями. Например, можно указать, что понятие ДЕД является композицией (транзитивным замыканием) понятия ОТЕЦ. ДЕД(X, Y) = (ОТЕЦ(ОТЕЦ(X, Y)) Вывод также можно задавать посредством правил вывода. Они могут быть логическими (дедуктивные, индуктивные и т.д.) или прикладными, то есть правилами типа Если…то, описывающие семантику предметной области. Например, ЕСЛИ ОТЕЦ(x, y) & ОТЕЦ(y, z) ТО ДЕД(x, z) ЕСЛИ СОТРУДНИЧАЕТ(x, y) ТО СОТРУДНИЧАЕТ(y, x)

Вывод в RDF, OWL, DL В основу RDF, OWL и DL положены такие понятия, как индивид, класс и свойство (свойство вбирает в себя такие традиционные понятия, как свойство и бинарная связь (отношение) ). В связи с этим, если за основу описания онтологий берутся эти языки, важно иметь выводы, которые характеризуют эти три составляющие онтологии. Поэтому можно говорить о выводах на уровне индивидов, классов и свойств.

Вывод на индивидах Основная проблема вывода заключается в проверке, допустим ли индивид в ПО. Если предположить, что индивид может существовать только посредством его принадлежности тому или иному классу, то тогда вопрос существования индивида в ПО сводится к проверке его принадлежности классу. Класс, с точки зрения его экстенсионала может задаваться: явным перечислением принадлежащих ему индивидов, то есть экстенсионально (в этом случае индивид имеется в ПО, если он явно задан приписан классу) указанием характеристик, которым должен обладать индивид, чтобы являться экземпляром класса – интенсиональное определение класса. указанием процедуры получения элементов данного класса и элементов других классов. В связи с этим механизмы проверки принадлежности индивида классу могут быть разными. Еще одной задачей вывода является установление, являются ли два индивида тождественными (эквивалентными) или нет. Для установления этого факта могут использоваться свойства классов, которым они принадлежат, а также их личные свойства.. На приведенном ниже рисунке дается графическое представление правила, выраженное на конкретных индивидах: has (x, z) & has (y, u) & z = u x = y areEquivalent (x, y) z u(has (x, z) & has (y, u) & z = u)

Вывод на классах Основная задача вывода на классах – это, в общем случае, определение взаимоотношения классов между собой, и, в частности, является ли класс В подклассом класса А. Эта частная задача называется задачей обобщения- специализации классов (задача выявления родовидовых зависимостей на классах). По сути задача обобщения – это выявление факта, являются ли критерии принадлежности одному из классов частным случаем (специализацией, родом, выводимыми из) критериев принадлежности другому классу. Если критерии принадлежности классам взаимовыводимы, то они эквивалентны. Если класс принадлежит пустому классу, то его критерии противоречивы (невыполнимы). Полный граф обобщения, построенный на всех класах онтологии называется таксономической иерархией классов.

Вывод на свойствах Так как бинарные отношения являются множествами, то можно говорить об обощении/специализации свойств. Например, свойство Иметь ребенка является обобщением свойств Иметь сына, Иметь дочь, свойства Являться младшим (старшим, ведущим,…) научным сотрудником является специализацией свойства Являться научным сотрудником. В связи с этим для свойств существуют такие же проблемы вывода, как и для классов (обобщение/специализация, эквивалентность, выполнимость, таксономия свойств). Вывод на свойствах – это вывод новых свойств из существующих. Так как свойства – это бинарные отношения, то в качестве вывода могут использоваться традиционные свойства бинарных отношений: рефлексивность, симметричность, транзитивность, а также их отрицания: иррефлексивность, ассиметричность и антитранзитивность. Пример использования транзитивности свойства Предок (Ancestor):

Инженерия онтологий - языки онтологий