Совместимость OWL и RIF КОМБИНАЦИИ ОНТОЛОГИЙ И ПРАВИЛ М.К.Валиев (ИПМ РАН) М.И.Дехтярь (Тверской госуниверситет)

Презентация:

Advertisements

Похожие презентации

Введение в формальные (аксиоматические) системы. Формальные системы - это системы операций над объектами, понимаемыми как последовательность символов.

Advertisements

Базы данных Лекция 6 Базисные средства манипулирования реляционными данными: реляционное исчисление.

Реляционное исчисление. Общая характеристика Запрос – формула некоторой формально-логической теории; описывает свойства желаемого результата. Ответ –

XML-ТЕХНОЛОГИИ Лекция 5 Семантический Веб: микроформаты RDF, OWL и FOAF.

1 Концепция Web 3.0 Web как семантическая паутина : традиционные информационные ресурсы + метаданные, описывающие семантические связи в информационных.

Архитектура метаданных WWW. Язык RDF Архитектура метаданных WWW RDF.

Теория экономических информационных систем Семантические модели данных.

Онтологическая семантика текста: форматирование лексики в семантическом словаре Г.В. Лезин Санкт-Петербургский экономико-математический институт РАН

Модуль 1. Математические основы баз данных и знаний.

Модели представления знаний. 1. Логические; 2. Продукционные; 3. Представление знаний на основе фреймов; 4. Представление знаний на основе семанти- ческих.

Базы данных Лекция 4 Базисные средства манипулирования реляционными данными: реляционная алгебра Кодда.

Модели представления знаний. 1. Логические; 2. Продукционные; 3. Представление знаний на основе фреймов; 4. Представление знаний на основе семанти- ческих.

Базы данных Лекция 7 Элементы теории реляционных баз данных: функциональные зависимости и декомпозиция без потерь.

Логика предикатовЛогика предикатовЛогика предикатов расчленяет элементарное высказывание на субъект (буквально - подлежащее, хотя оно и может играть роль.

Функции и отображения Отображения. N-местные функции. Понятие образов и прообразов элементов. Свойства функций: инъекция, сюръекция и биекция. Обратные.

Логика первого порядка ХНУРЭ, кафедра ПО ЭВМ, Тел , Лекции Н.В. Белоус Факультет компьютерных наук Кафедра.

Теория вычислительных процессов 4 курс, 8 семестр Преподаватель: Веретельникова Евгения Леонидовна 1.

Движения. Движения. Движением в геометрии называют Движением в геометрии называют отображение, сохраняющее расстояния. отображение, сохраняющее расстояния.

От сложного – к простому. От непонятного – к понятному.

8. Моделирование логической структуры системы Диаграмма классов Диаграмма классов служит для моделирования классов и отношений между ними.

Транксрипт:

Совместимость OWL и RIF КОМБИНАЦИИ ОНТОЛОГИЙ И ПРАВИЛ М.К.Валиев (ИПМ РАН) М.И.Дехтярь (Тверской госуниверситет)

ПЛАН Необходимость комбинации онтологий и правил Два подхода к интеграции: однородный и гибридный Сценарии обмена правилами со ссылками на онтологии/RDF-графы Синтаксис RIF+RDF/OWL Семантика RIF+RDF: совместные интерпретации Семантика RIF+OWL Full и RIF+OWL DL Заключительные замечания

Для чего нужны комбинации? Онтологии : - Богатые средства описания предметной области - Ограниченные средства вывода следствий из имеющихся знаний Пример. Пусть в онтологии имеется информация, что Иван – отец Петра и Николая, Петр и Николай – мужчины и Михаил – брат Ивана (и другой информации о них нет). Как отсюда вывести, что Михаил – дядя Петра, Петр – сын Ивана и Петр с Николаем - братья? Первые две из этих задач решаются в OWL2 довольно просто. В частности, в первом случае достаточно в онтологию ввести аксиому, что отношение «дядя» является композицией (property chain) отношений «отец» и «брат». Второй случай несколько сложнее, а третий вероятно вообще не имеет решения в рамках OWL2. В то же время все три задачи имеют очень простое единообразное решение, если в онтологиях допустить правила типа «если…, то…»

Языки правил - Специально построены для вывода следствий - Для эффективности поиска вывода обычно в основе языка лежат продукции или Хорновские правила, что сильно ограничивает описательные возможности языка. Комбинация онтологий и правил позволяет объединить достоинства подходов и обойти их недостатки. Пример (продолжение). Использование правила «если x – отец у, x – отец z, у и z – мужчины, то у и z – братья» совместно с вышеупомянутой онтологией позволяет вывести, что Петр и Николай –братья.

Однако синтаксис и семантика языков онтологий (в частности, OWL) и языков правил (в частности, RIF) довольно сильно отличаются, поэтому возникает вопрос, как их совмещать.

Однородный подход Онтологии и правила используются на одинаковых правах, т.е. создается единый язык, в котором одни и те предикаты используются как для выражения онтологических утверждений, так и в формулировках правил (в частности, правила можно использовать для определения классов и свойств онтологии). SWRL (Semantic Web Rules Language, OWL DL+Хорновы правила)

В этом случае проблема совместимости фактически исчезает: Синтаксис общий Интерпретации тоже общие, их только нужно распространить на правила, что делается достаточно стандартным образом.

Недостатки: Совмещение в одном языке разных средств сильно затрудняет его реализацию: в частности, известно, что основные проблемы (выполнимость, следование) для SWRL неразрешимы (хотя разрешимы по отдельности для онтологической компоненты и компоненты правил). Однородный подход часто неприменим, так как онтологии и системы правил могут строиться независимо разными специалистами.

Гибридный подход Строго различаются обычные предикаты, которые определяются правилами (они могут участвовать как в условиях (антецедентах) правил, так и в их заключениях (головах)), и предикаты онтологий, которые используются как ограничения в условиях правил. Вывод происходит путем взаимодействия отдельно реализуемых (существующих) программ вывода (reasoner) для правил и для онтологий. Гибридный подход развязывает строителей онтологий и систем правил друг от друга, но, к сожалению, также требуют дополнительных ограничений, чтобы гарантировать разрешимость основных проблем для комбинаций онтологий и систем правил (с разрешимыми проблемами).

Подход рабочей группы RIF В применении к RIF-BLD описан в документе «RIF RDF and OWL Compatibility» Этот подход в чистом виде нельзя отнести ни к однородным, ни к гибридным. Хотя точное определение синтаксиса комбинаций отсутствует, по некоторым примерам видно,что предикаты из RDF/OWL могут быть как в теле так и голове правила. Однако RIF- и RDF/OWL-интерпретации определяются по отдельности и склеиваются по общей части. Неразрешимость основных проблем для комбинаций, используемых при таком подходе без дополнительных ограничений, сохраняется как в гибридном подходе.

Типичные сценарии совместного использования RDF/OWL 2 и RIF Типичный сценарий использования RIF совместно с RDF/OWL состоит в обмене правилами, которые используют данные из RDF и/или OWL. У одного из партнеров A имеется язык правил, поддерживающий RDF-данные, он использует некоторую RDFS или OWL онтологию или расширяет RDF(S)/OWL. A посылает свои правила, используя RIF, возможно со ссылкой на соответствующий RDF-граф (или графы), партнеру B. B получает правила и восстанавливает RDF-граф(ы), на которые имеются ссылки. Эти правила транслируются во внутренний язык B и обрабатываются вместе с RDF графами механизмом вывода (rule engine ) B, поддерживающим RDF/OWL Публикация системы правил со ссылками: один ко многим.

Application A Data Rules Rule system 1 Application B Data Rules Rule system 2 Data model (OWL, RDF-S, XML-S, XMI, …) Передача правил и данных (слайд из [Christian de Saint Marie. W3C rule interchange format, ILOG, 30 October 2008]) serializede-serial. Rules serializede-serial. data

Еще один сценарий Обмен наборами правил, расщиряющих OWL. В этом сценарии публикатор правил намеревается расширить правилами некоторую OWL онтологию. Партнер по обмену A имеет язык правил, расширяющих OWL. A разбивает описание своего набора онтология + правила на отдельные описания OWL онтологии и RIF-документа, публикует OWL онтологию и посылает (или публикует) RIF-документ, содержащий ссылку на эту OWL онтологию. Потребитель правил извлекает OWL онтологию и транслирует ее вместе с документом в совместное описание пары онтология + правила в своем собственном расширении OWL правилами.

Синтаксис RIF+RDF/OWL Комбинация: RIF-документ R и RDF-графы u 1,… u n. R содержит директивы импорта вида import(, ). Предикаты из u i импортируются в R c использованием так называемого профиля p i, который, грубо говоря, указывает, какой из шести вариантов семантик используется при интерпретации графа u i (не все графы могут интерпретироваться во всех шести вариантах). Профили: Simple, RDF, RDFS, D,OWL Direct, OWL RDF-based.

Тройки RDF переходят в RIF как фрейм-формулы Пример: RDF-граф с тройками ex:john ex:brotherOf ex:jack. ex:jack ex:parentOf ex:mary. и RIF-документ с правилом Forall ?x ?y ?z (?x[ex:uncleOf -> ?z] :- And(?x[ex:brotherOf -> ?y] ?y[ex:parentOf -> ?z])) RDF-тройка ex:john ex:brotherOf ex:jack отображается в RIF как фрейм-формула ex:john[ex:brotherOf -> ex:jack] (аналогично для parentOf) Отсюда следует RIF-формула ex:john[ex:uncleOf -> ex:mary], которая в RDF становится тройкой ex:john ex:uncleOf ex:mary

Пустые вершины Пустые вершины в RDF соответствуют переменным с квантором существования, такую можно унифицировать в теле RIF-правила с некоторой переменной ?x, и если ?x входит в голову, то после применения правила получаем эту переменную с квантором существования Пример: RDF-граф с тройкой _:x ex:hasName "John". и RIF-документ с правилами Forall ?x ?y ( ?x[rdf:type -> ex:named] :- ?x[ex:hasName -> ?y] ) Forall ?x ?y ( [ -> ?y] :- ?x[ex:hasName -> ?y] ) Из первого правила получаем RIF-формулу Exists ?z (?z[rdf:type -> ex:named]) и RDF-тройку _:y rdf:type ex:named. Из второго правила получаем RIF-формулу [ -> "John"] и RDF_тройку "John"

Коллизия с константами Множества констант у RIF и RDF несколько отличаются Например, константе "literal string" из RDF в RIF соответствует "literal Поэтому из пустого RIF-документа и графа с RDF-тройкой "abc" следует RIF-формула [ -> "abc"^^xs:string] (т.е. при обратном переходе тройка "abc"^^xs:string).

Семантика комбинаций (все должно быть согласовано) Семантика определяется в терминах совместных (common) моделей для RIF и RDF/OWL. RDF: Простая интерпретация ( Simple interpretation) словаря V - это наборSimple interpretation I=, где IR – непустое множество ресурсов (область интерпретации), IP – множество свойств, IEXT – функция расширения, которая отображает IP в множество подмножеств IR × IR, IS – это отображение из множества IRI из V в объединение IR и IP, IL – это отображение типизированных литералов из V в IR, LV – это множество значений литералов, являющееся подмножеством IR и включающее все простые литералы. RDF-, RDFS- и D-интерпретации –это простые интерпретации, удовлетворяющие дополнительным условиям.

RIF-интерпретация(без списков, для упрощения) Семантика RIF-BLD задается через семантическую структуру I, которая представляет собой набор вида. Совместимость комбинации RIF-RDF связана только с компонентами DTS, D, IC, IV, Ilist, Itail, Iframe, Isub, Iisa, и Itruth. Остальные компоненты не используются при определении комбинаций.RIF-BLD Пусть Const – множество символов констант и Var – множество символов переменных из RIF. DTS – это множество типов данных, с которыми связаны идентификаторы типов данных, D – это некоторое множество (область), Dind – непустое подмножество D, Dfunc – непустое подмножество D, IC – это отображение из констант в D такое, что константы в позициях индивидов (individual position) отображаются в Dind, а константы в позициях функций отображаются в Dfunc, IV – это отображение из Var в Dind, Iframe – это отображение из Dind в функции вида SetOfFiniteBags(Dind × Dind) D, Isub – это отображение из Dind × Dind в D, Iisa – это отображение из Dind × Dind в D, and Itruth – это отображение из D в TV.

Совместная интерпретация (без списков и импорта других RIF-документов) Пара (Î, I), где Î -- это RIF-интерпретация, I – простая интерпретация словаря V. Для этой пары выполнено 8 условий: 1. (IR union IP) = Dind; Т.е. объединение ресурсов и свойств в точности соответствует области RIF (если I является RDF-, RDFS- или D интерпретацией, то IP входит в IR и IR=Dind. 2. IP содержит все такие k из D ind, для которых существуют a, b из Dind, что I truth (I frame (a)(k,b))=t; Множество RDF-свойств по крайней мере содержит все элементы, которые используются как свойства во фреймах области RIF. 3 LV содержит объединение всех пространств значений (value spaces) всех рассматриваемых типов данных (datatypes);datatypes Все конкретные значения из Dind входят также и в LV (по определению Dind содержит пространства значений всех рассматриваемых типов данных) 4. IEXT(k) = {(a, b) | a, b и k из D ind и I truth (I frameme (a)(k,b))=t}; Т.е. RDF-тройки интерпретируются так же как соответствующие фрейм-формулы.

Продолжение 5. IS(i) = I C ( ) для каждого IRI i из V U ; Т.е. все IRI интерпретируются одинаково в RDF и RIF. 6. IL((s, d)) = IC("s"^^d) для каждого правильно типизированного литерала( well-typed literal) (s, d) из V TL ;well-typed literal Т.е. все типизированные идентификаторы интерпретируются одинаково. 7. IEXT(IS(rdf:type)) = { (a, b) из D ind × D ind | Itruth(Iisa(a,b))=t}; Типизация в RDF соответствует типизации в RIF, т.е. тройка a rdf:type b истинна утверждение a # b истинно. 8.EXT(IS(rdfs:subClassOf)) содержит множество всех пар (a, b) из Dind × Dind, для которых I truth (I sub (a,b))=t; Для всякого истинного в RIF утверждения о подклассах соответствующее утверждение о подклассах из RDF также истинно, т.е., a rdfs:subClassOf b истинно, если a ## b истинно.

Выполнимость и модели RIF-RDF комбинация C= выполняется на совместной RIF-RDF-интерпретации (Î, I), если Î является моделью R и каждый RDF-граф S из S выполняется на I. В этом случае (Î, I) называется RIF-простой(Simple)-моделью или просто моделью C, а C является выполнимой (совместной). RIF-RDF комбинация Обобщенный RDF-граф S выполняется на (Î, I), если он выполняется на I. Формула условия φ выполняется на (Î, I), если TVal Î (φ)=t. Выполнимость для комбинаций RIF-RDF-, RIF-RDFS- и RIF-RIF-D- определяется аналогично, с помощью добавления соответствующих ограничений на I.

Логическое (семантическое) следование Определяется обычным образом: Пусть C – это комбинация RIF-RDF, S – обобщенный RDF-граф, φ - формула условия и D – это отображение типов данных, согласованное с множеством рассматриваемых типов данных. C RIF- D-влечет (entails) S (или S RIF-D следует из C), если S выполняется на каждой RIF-D-модели C. Аналогично, C RIF-D-влечет φ, если φ выполняется на каждой RIF-D-модели CRIF-D-моделRIF-D-модел Понятия логического следования для комбинацийRIF- Simple-, RIF-RDF- и RIF-RDFS- определяются аналогично.

RIF-OWL комбинации Синтаксис определяется аналогично RIF+RDF: RIF-документ и несколько импортируемых онтологий. Семантика тоже в целом следует такому же принципу построения общих интерпретаций, но имеются некоторые серьезные различия в рассмотрении RIF+OWL Full и RIF+OWL DL.

Причины различия В OWL Full (так же как и в RDF) свойства являются такими же объектами как остальные, поэтому их интерпретация определяется в два шага: IS сопоставляет свойству p некоторый элемент области интерпретации, которому IEXT в свою очередь сопоставляет множество пар.

OWL DL Свойства отделены от ресурсов и им дается прямая (в духе логики первого порядка) интерпретация в виде множества пар. Чтобы соотнести смысл фреймовых формул RIF со смыслом OWL DL утверждений, приходится несколько изменить интерпретацию фреймовых формул и ввести для них некоторые синтаксические ограничения на использование переменных в фреймовых формулах, формулах вхождения в класс и формулах подклассов.

Cемантика на основе RDF для RIF-OWL Full Строится как простое обобщение семантики для RIF+RDF: такие же совместные интерпретации, но имеются дополнительные ограничения на интерпретацию словаря (Vocabulary).

Прямая семантика для RIF- OWL DL Модифицируется семантика RIF-формул (фреймовых, вхождения в класс и подклассов). Для этого в RIF-интерпретации I изменяются интерпретации отображений I sub I Ica I frame так, чтобы формулы s[rdf:type->o] и s#o интерпретировались как вхождение s в множество, в которое отображается o, а формулы s[p->o], где p – не rdf:type, как вхождение пары (s,o) в бинарное отношение, в которое отображается p.

Совместная прямая интерпретация для RIF+OWL2 DL Это пара (I,J), где I – RIF-интерпретация, модифицированная как сказано выше, а J – интерпретация для ОWL2 DL. Эта пара должна удовлетворять десяти условиям взаимного согласования, которые аналогичны условиям для совместных RIF+RDF-интерпретаций. Понятия модели и следования определяются обычным образом.

Конформность RIF-OWL Определяется обычным образом через понятия преобразований RIF+OWL-комбинаций в язык L процессора и обратно, сохраняющих отношение логического следования.

Новый семантический Веб-стек (слайд взят из [I.Herman.Semantic Web Adoptions and Applications]