Оценивание онтологий Альперин Б.Л., гр. 8204. Оценивание онтологии Оценивание онтологии – оценка (judgment) содержания онтологии, отвечающая некоторым.

Презентация:



Advertisements
Похожие презентации
СУЩНОСТЬ-СВЯЗЬ (ER МОДЕЛЬ) Основные элементы: СущностиСущности –Атрибуты –Ключи СвязиСвязи.
Advertisements

От сложного – к простому. От непонятного – к понятному.
Методология IDEF1X (IDEF1 Extended) – язык для семантического моделирования данных, основанных на концепции « сущность - связь ». Является расширением.
Нормализация таблиц реляционной базы данных © Панова И.В
OOП Инна Исаева. Подпрограмма – это большая программа, разделённая на меньшие части. В программе одна из подпрограмм является главной. Её задача состоит.
Определения Банк данных (БнД) это система специальным образом организованных дан­ных - баз данных, программных, технических, языковых, организационно-
Введение в формальные (аксиоматические) системы. Формальные системы - это системы операций над объектами, понимаемыми как последовательность символов.
Полиморфизм. Полиморфизм – это свойство системы использовать объекты с одинаковым интерфейсом без информации о типе и внутренней структуре объекта.
{ определение – правила равенства, суммы и произведения – принцип включений – исключений – обобщение правила произведения – общее правило произведения.
Алгоритм Эдмондса Лекция 11. Идея алгоритма Эдмондса Пусть есть некоторое паросочетание M, построим M-чередующийся лес F. Начинаем с множества S вершин.
Лекция 1 Основные понятия ст.преп Касекеева А.Б..
Методология информационного моделирования IDEF1X.
Базы данных Лекция 7 Элементы теории реляционных баз данных: функциональные зависимости и декомпозиция без потерь.
Логическое программировыание Презентация 5 Списки в Прологе.
База данных – это совокупность структурированных данных определенного назначения. Структурирование данных – это объединение данных по определенным параметрам.
Два уравнения f (x)= g (x) и f (x)= g (x) называются равносильными, если множества их корней совпадают. Уравнения f (x)= g (x) называется следствием уравнения.
Моделирование данных Модель «сущность-связь». Рассматриваемые вопросы: Элементы модели «сущность-связь» Диаграммы «сущность-связь» Слабые сущности Подтипы.
Лекция 2 КИНЕМАТИЧЕСКИЙ АНАЛИЗ СООРУЖЕНИЙ. Внешняя нагрузка может вызвать значительные перемещения элементов сооружения, в результате чего оно может перестать.
XML-ТЕХНОЛОГИИ Лекция 5 Семантический Веб: микроформаты RDF, OWL и FOAF.
ЛАБОРАТОРНАЯ РАБОТА 1 ПРОЕКТИРОВАНИЕ И РЕАЛИЗАЦИЯ ТАБЛИЦ, ИСПОЛЬЗУЕМЫХ В ТРАНСЛЯТОРЕ Рейн Т. С.
Транксрипт:

Оценивание онтологий Альперин Б.Л., гр. 8204

Оценивание онтологии Оценивание онтологии – оценка (judgment) содержания онтологии, отвечающая некоторым критериям в процессе каждой фазы и между фазами ее жизненного цикла. Оценка онтологии складывается из оценки: Каждого отдельного определения (definition) и аксиомы Наборов определений и аксиом, которые явно присутствуют в онтологии Определений, импортированные из других онтологий Определений, которые могут быть выведены из других определений и аксиом

Критерии оценки онтологий Consistency (согласованность) Completeness (полнота) Conciseness (выразительность) Expandability (расширяемость) Sensitiveness (чуствительность)

Согласованность Согласованность связана с тем, можно ли получить противоречивые выводы из корректных входных определений (definition). Определение является согласованным, тогда и только тогда, когда 1) оно является индивидуально-согласованным (individually consistent) 2) из него не может быть получено противоречивых выводов при использовании других определений и аксиом

Согласованность Определение является индивидуально согласованным (individually consistent) тогда и только тогда, когда выполняются следующие условия: 1)Формальное определение является «метафизически целостностным» (metaphysically consistent), т.е. нет противоречий в интерпретации формального определения по отношению к реальному миру 2)Неформальное определение является «метафизически целостностным», т.е. нет противоречий в интерпретации неформального определения по отношению к реальному миру 3)Определение в целом (формальная и неформальная части) является внутренне согласованным, т.е. формальное и неформальное определение имеют одинаковое значение

Согласованность Пример: рассмотрим определение класса month-name (define-class MONTH-NAME (?month) The months are: house, February, March, April, May, June, July, August, September, October, November, December. ::iff-def (member ?month (setof house, February, March, April, May, June, July, August, September, October, November, December))) Поскольку формальное и неформальное определение имеют одинаковые значения, то определение является внутренне согласованным. Но и формальное, и неформальное определение являются метафизически несогласованными, потому что house не является месяцем.

Полнота Полнота – степень, с которой онтология передает информацию о реальном мире. Онтология полна тогда и только тогда, когда вся информация, которая должна быть в онтологии, либо задана явно, либо может быть выведена с использованием определений и аксиом. Полноту онтологии можно показать, показывая полноту каждого определения онтологии. Узнать, является ли определение полным можно, выяснив: какая информация содержится в определении для всей информации, которая не задана явно, нужно проверить, что она может быть выведена с использованием других определений и аксиом. Если она (информация) может быть выведена, то определение является полным, в противном случае – неполным.

Выразительность Онтология является выразительной, если В ней не содержится необходимой или избыточной информации Отсутствует явная избыточность между определениями. Например, если класс определен перечислением множества объектов, и эти объекты определены как экземпляры, то такая онтология избыточна (не выразительна). Избыточная информация не может выведена из определений или аксиом. Например, если атрибут класса, который может быть выведен с учетом наследования от суперкласса, явно объявлен в этом классе, то такой атрибут является избыточным.

Расширяемость, чуствительность Под расширяемостью понимается усилия, необходимые для добавления новых определений в онтологию, а также усилия, необходимые для добавления новой информации к существующему определению. Чуствительность – насколько малые изменения можно внести в определение, чтобы они не нарушили ее согласованности.

Примитивы для построения таксономий. Subclass-of (?child-class ?parent-class) класс child-class является подклассом класса parent-class. Instance-of (?instance ?class) экземпляр instance является экземпляром класса class. Class-partition (?set-of-classes) Определяет множество непересекающихся классов. Разбиение класса C на множество классов class_p1 … class_pn, где class_pi != class_pk для любого i != k определено, если любой экземпляр подкласса любого класса class_pi не принадлежит любому другому классу class_pk. Disjoint-Decomposition (?C ?Class-partition) (декомпозиция на неперекающиеся классы). Определяет множество непересекающихся классов Class-partition как подклассы класса С. Разбиение может быть не полным, т.е. могут существовать экземпляры класса С, которые не являются экземпярами классов из Class-partition. Partition(?C ?Class-partition). Определяет множество классов Class-partition (классы из этого множества являются подклассами класса С), причем класс C является объединением всех классов из разбиения. Partition является исчерпывающим (exhaustive), если оно добавляет ограничение полноты к множеству Class-partition (Например, разбиение класса «число» на подклассы «четное число» и «нечетное число»).

Ошибки при разработке таксономий

Ошибки семантической несогласованности Ошибки семантической несогласованности (semantic inconsistency errors). Возникают, когда разработчик производит неправильную семантическую классификацию, т.е. классифицирует понятие как подкласс другого понятия, которому оно (исходное понятие) на самом деле не принадлежит. Пример – классификация понятия «собака» как подкласс понятия «дом». То же самое может произойти с экземплярами понятий – экземпяр «Плуто» может быть классифицирован как экземпляр класса «дом».

Ошибки циклической зависимости Ошибки циклической зависимости (circularity errors). Происходят, когда класс определяется как специализация (specialization) или генерализация (generalization) самого себя. В зависимости от длины цепочки классов, вовлеченных в циклическую зависимость, такие ошибки могут быть разбиты на группы по длине цепочки.

Ошибки разбиения Ошибки разбиения (partition errors). Ошибки такого рода возникают при разбиении класса на несколько непересекающихся подклассов (disjoint-decomposition). Можно выделить следующие категории ошибок разделения: Subclass partition with common classes (разбиение на подклассы с общими классами) Subclass partition with common instances (разбиение на подклассы с общими экземплярами) Exhaustive subclass partition with common classes (исчерпывающее разбиение на подклассы с общими классами) Exhaustive subclass partition with common instances (исчерпывающее разделение на подклассы с общими экземплярами) Exhaustive subclass partition with external instances (исчерпывающее разбиение на подклассы с внешними экземплярами)

Ошибки разбиения Subclass partition with common classes (разбиение на подклассы с общими классами). Происходят, когда имеется разбиение класса A на классы p1 … pn, и один или более классов B1 … Bk являются подклассами более, чем одного класса pi. Например, если определить классы «собака» и «кошка» как подклассы класса «млекопитающие», то ошибка данного типа произойдет при попытке определить класс «доберман» как подкласс обеих классов «собака» и «кошка». Чтобы решить проблему, разработчику необходимо удалить некорректную связь («доберман» - «кошка»)

Ошибки разбиения

Subclass partition with common instances (разбиение на подклассы с общими экземплярами). Происходит, когда один или несколько экземпляров являются экземплярами более одного класса. Например, если имеются классы «кошка» и «собака», которые являются подклассами класса «млекопитающие», то ошибка данного типа произойдет, если определить «Плуто» как экземпляр обоих классов. Чтобы разрешить проблему, необходимо удалить некорректную связь.

Ошибки разбиения

Exhaustive subclass partition with common classes (исчерпывающее разбиение на подклассы с общими классами). Например, если определить классы «четное число» и «нечетное число» как исчерпывающее разбиение класса «число», ошибка такого типа возникнет, если определить класс «простое число» как подкласс классов «четное число» и «нечетное число». Если определить «число 3» как экземпляр класса «простое число», то получается, что «число 3» является одновременно и четным, и нечетным.

Ошибки разбиения

Exhaustive subclass partition with common instances (исчерпывающее разбиение на подклассы с общими экземплярами). Происходит, когда один или несколько экземпляров является экземпляром больше одного класса, входящего в исчерпывающее разбиение.

Ошибки разбиения Exhaustive subclass partition with external instances (исчерпывающее разбиение на подклассы с внешними экземплярами). Происходит, когда имеется разбиение базового класса A на множество классов p1..pn, и существует один или более экземпляров класса А, который не принадлежит ни одному из подклассов p1..pn из разбиения.

Ошибки неполноты таксономий Для того, чтобы предоставить механизм оценки полноты таксономии, могут быть полезны следующие действия: Проверка полноты иерархии классов. Ошибки возникают, когда суперкласс данного класса неопределен и когда не хватает информации о суперклассе, для которого имеется исчерпывающее разделение. Проверка полноты классов. Цель состоит в том, чтобы убедиться, что класс содержить ровно столько информации, столько необходимо. Ошибки возникают, когда имеются атрибуты, пропущенные при определении класса, когда различные классы имеют одинаковое формальное определение и т.д.

Неполная классификация понятий Неполная классификация понятий. Как правило, ошибки такого типа возникают, когда понятия классифицируются без учета всех существующих в предметной области понятий (некоторые понятия ПО остаются бех внимания). Например, ошибка такого типа возникнет, если при рассмотрении ПО «музыкальные инструменты» рассматривать только классы из «струнных инструментов» и «духовых инструментов», и не рассматривать классы «ударных инструментов»

Ошибки разделения Ошибки разделения (partition errors) (не тоже самое, что ранее). Могут появляться, когда отбрасывается информация о разбиении класса. Можно выделить 2 типа ошибок: Subclass partition omission (отбрасывание информации о разбиении класса). Происходит, когда разработчик определяет множество подклассов данного класса, но забывает указать, что элементы данного множества (классы из этого множества) не пересекаются. Например, можно определить классы «кошка» и «собака» как подклассы класса «млекопитающие», но забыть указать, что эти классы образуют разбиение (хоть и не полное) класса «млекопитающие»

Ошибки разделения Exhaustive subclass partition omission (отбрасывание информации о исчерпывающем разбиении класса). Происходит, когда разработчик определяет разбиение класса и забывает про ограничения полноты для установленного разбиения. Например, разработчик определяет классы «четное число» и «нечетное число» как разбиение класса «число», но не указывает, что такое разбиение являтся исчерпывающим.

Определение избыточности Избыточность – тип ошибки, возникающий при определении определений онтологии, которое уже задано явно или может быть выведено из других определений. Существует 3 типа ошибок, связанных с избыточностью: Grammatical redurancy errors (ошибки грамматической избыточности) Identical formal definition of some classes (идентичность формальных определений классов) Identical formal definition of some instances (идентичность формальных определений экземпляров)

Grammatical redurancy errors Grammatical redurancy errors (ошибки грамматической избыточности). Происходят, когда в ней имеется более, чем одно явное определение любого иерархического отношения. Ошибки такого типа можно разделить на 2 категории: Redundancies of subclass-of relation (избыточность отношения subclass-of). Происходит, когда между классами имеется больше одного отношения «subclass-of» (является подклассом). Можно выделить «прямое» и «косвенное» дублирование. Прямое дублирование происходит, когда имеется более одного отношения между двумя фиксированными классами. Пример косвенного дублирования – при определении класса «собака» как подкласс класса «домашнее животное», а «домашнее животное» – как подкласс класса «животное», тогда определение класса «собака» подклассом «животное» является косвенное дублирование.

Grammatical redurancy errors Redundancies of instance-of relation (избыточность отношения instance-of). Происходит в случае, когда имеется больше одного отношения «instance-of». Аналогично предыдущему случаю, может быть прямым и косвенным. Пример косвенного дублирования: Имеется класс «домашнее животное», который является подклассом класса «животное», и экземпляр «Плуто» объявлен экземпляром как класса «домашнее животное», так и «животное»

Identical formal definition Identical formal definition of some classes (идентичность формальных определений классов). Происходит, когда в онтологии есть 2 или более класса с одинаковым формальным определением, отличающиеся только своими именами. Решение – добавить атрибуты в один из классов, или удалить его. Identical formal definition of some instances (идентичность формальных определений экземпляров). Происходит, когда в онтологии есть 2 или более экземпляра с одинаковым формальным определением, отличающиеся только своими именами. Решение – добавить атрибуты в один из экземпляров, или удалить его.

Итоги Проводить оценку онтологии следует на каждом этапе ее жизненного цикла для того, чтобы обнаруживать ошибки как можно раньше, а не тогда, когда разработка онтологии завершена. В настоящее время не существует документов, описывающих процесс оценивания онтологий до того, как делать их общедоступными. Semantic Web онтологии. Для лучшего использования их в приложениях, или для возможности их переиспользования в других онтологиях, необходимы зависимые от языка средства оценивания онтологий. Инструмент, предназначенный для конкретного языка (RDF, RDFS, OWL) будет учитывать особенности языка для выполнения качественной оценки. Необходимы средства оценивания как уже созданных онтологий, так и онтологий, которые находятся в процессе разработки. Такие средства должны оценивать не только таксономии понятий (concept taxonomies), но и другие компоненты онтологий (атрибуты, отношения, экземпляры и т.д.)