1 Ремарович С.С. Области применения онтологий – культурное наследие, биологические системы Институт программных систем НАН Украины 2012.

Презентация:



Advertisements
Похожие презентации
Проектирование архитектуры ИСО 1. UML 2 Структура определения языка 4.
Advertisements

Использование онтологий при анализе предметных областей и проектировании научных информационно-вычислительных систем Фазлиев А.З.
1 Использование онтологий при создании интеллектуальных систем И.Л. Артемьева Дальневосточный государственный университет.
1 Диаграммы реализации (implementation diagrams).
1 Основы надежности ЛА Надежность сложных систем.
Методология IDEF1X (IDEF1 Extended) – язык для семантического моделирования данных, основанных на концепции « сущность - связь ». Является расширением.
Стандарт IDEF1X Рассмотрим методологию IDEF1X. Методология IDEF1X представляет собой формализованный язык семантического (контекстного) моделирования данных,
1 Понятие «Информация» 1. Информация фундаментальная научная абстракция 2. Информация фундаментальная философская категория. 3. Информация это определенный.
Лекция 5 Способы конструирования программ. Основы доказательства правильности.
Лекция 2 Языки, операции над языками. Определение 2.1 Языком в алфавите называется произвольное множество цепочек в. Как следует из определения языка,
Современные направления интеллектуализации глобальной сети Интернет Сорокин Арсений Николаевич Вологда, 2008.
От сложного – к простому. От непонятного – к понятному.
Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках Новицкий А.В. Институт программных систем НАН Украины.
Кафедра математики, логики и интеллектуальных систем ИЛ РГГУ 1 Система управления базой понятий ЭЗОП Е. М. Бениаминов © Институт лингвистики.
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ СТАВРОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ.
Методология информационного моделирования IDEF1X.
Теория экономических информационных систем Семантические модели данных.
Моделирование данных Модель «сущность-связь». Рассматриваемые вопросы: Элементы модели «сущность-связь» Диаграммы «сущность-связь» Слабые сущности Подтипы.
8. Моделирование логической структуры системы Диаграмма классов Диаграмма классов служит для моделирования классов и отношений между ними.
Языки и методы программирования Преподаватель – доцент каф. ИТиМПИ Кузнецова Е.М. Лекция 7.
Транксрипт:

1 Ремарович С.С. Области применения онтологий – культурное наследие, биологические системы Институт программных систем НАН Украины 2012

2 Культурное наследие Что такое культурное наследие? Разнообразие культурного наследия Функции информации о культурном наследии Онтология CIDOC CRM - ISO21127 Терминология CRM Список сущностей (фрагмент) Пример описания сущностей Рассуждение о пространственной информации Рассуждения о темпоральной информации Сущности верхнего уровня CIDOC CRM Основные идеи CRM FRBRoo и исполнительные виды искусства (Performing Arts) Другие онтологии: ABC, DOLCE Главные Терминологические Системы

3 Что такое культурное наследие? В более узком смысле мы можем рассматривать культурное наследие как вещи, сохраненные учреждениями памяти, т.е. музеями, архивами и библиотеками. В действительности культурное наследие - больше чем предметная область. Оно включает широкий спектр функций исследования и сохранения вещественных доказательств всех видов деятельности человека в прошлом. Главные международные организации: Международный Совет Музеев (International Council of Museums - ICOM), Международная федерация библиотечных ассоциаций (International Federation of Library Associations - IFLA) и Международный Совет Архивов (International Council of Archives - ICA). Они поддерживают свои политики и стандарты специфической документации. Обработка информации обо всех видах вещей подразумевает использование очень богатой терминологии, многоязычная и часто специфическая для особых сообществ или даже определенных ученых. Соглашение по общей терминологии является трудным и эквивалентные термины на других языках часто отсутствуют.

4 Разнообразие культурного наследия Главные виды коллекций: история искусств и современные искусства (графика, живопись, фотография, скульптура, архитектура, рукописи, религиозные объекты); историческое наследие (соглашения, письма, рукописи, рисунки, фотографии, фильмы, личные объекты, оружие); археология (черепки, скульптуры, инструменты, оружие, домашние изделия, человеческие остатки); дизайн (мебель, столовая посуда, автомобили, и т.д.); наука и техника (машины, инструменты, оружие, транспортные средства, известные эксперименты, открытия); этнология (костюмы, инструменты, оружие, домашние изделия, религиозные объекты, и т.д.); неподвижные места (Immobile sites) (архитектура, скульптура, горное искусство, пещеры); коллекции естествознания, такие как палеонтология, био- разнообразие, минералогия - также доказательства деятельности человека (т.е. исследование) и следовательно культура.

5 Функции информации о культурном наследии Виды информационных систем культурного наследия по их главным функциям: управление коллекцией (приобретение, регистрация, пополнение (deaccession), инвентарь, ссуды, выставки, страховка, права, зоны защиты); сохранение (диагностика состояния, превентивные меры, вмешательства, обработки и химические вещества); научное исследование (исследование, описание, интерпретация); представление (порталы, обучение, публикация). Информация во всех этих системах частично совпадает и должна быть взаимно доступной. Одна из основных проблем управления информацией о культурном наследии - способность к взаимодействию этих систем и интеграция информации.

6 Проблема интеграции схемы Большинство профессиональных информационных систем основано на довольно сложных схемах баз данных. Например, CIDOC, предложенная в 1995 г., стандартная реляционная схема для музеев, содержит более чем 400 таблиц. Информация о культурном наследии распределена во многих разных системах, которые дополняют друг друга. Например, один источник может связать римские имена с римскими надписями, другой - римские надписи с камнями, следующий - камни с местом обнаружения и другой - места с координатами. Онтология CIDOC CRM (Conceptual Reference Model )(теперь ISO21127, с 2006 г.) в настоящее время является наиболее разработанной онтологией для интеграции информации о культурном наследии. CIDOC CRM - формальная онтология, которая предназначена, чтобы облегчить интеграцию, посредничество и обмен гетерогенной информацией о культурном наследии. Была разработана междисциплинарными командами экспертов, которые представляют такие области как информатика, археология, музейная документация, история искусств, естествознание, библиотечная наука, физика и философия, под эгидой Международного комитета Документации (CIDOC) Международного Совета Музеев (ICOM).

7 ISO21127 CIDOC CRM онтология представлена в текстовой форме, чтобы продемонстрировать независимость от форматов представления знаний. Существует формальное определение в TELOS. CRM отличает отдельные классы от свойств (бинарные отношения). Свойства являются направленными и двунаправленными с определенными метками для каждого направления. Использует строгое многократное наследование (без исключений) для классов и свойств, предусматривает многократное создание экземпляра (instantiation), т.е. один определенный элемент может быть экземпляром больше чем одного класса. Существуют эквиваленты в KIF, RDFS и OWL. Содержит 80 классов и 132 свойства.

8 Терминология CRM "Entity" для чего-либо, что можно назвать "классом", "сущностью" или "узлом(class, entity or node ). "Links" для чего-либо, что можно назвать "атрибутом", "ссылкой", "связью" или "свойством(attribute, reference, link, or property ). Superclass - Subclass отношения относятся к isA отношениям, подкласс – суперкласс, родительский класс - производный класс, обобщение - специализация, и т.д (subclass – superclass, parent class - derived class,generalization - specialization). По умолчанию все ссылки (links) (или свойства) рассматриваются как необязательные(optional), и потенциально многократные(multiple). Ссылки строго наследуются подклассами. У ссылок могут самостоятельно быть ссылки, которые указывают на другие сущности.

9 Список сущностей (фрагмент) E1 CRM Entity E2 - Temporal Entity E3 - - Condition State E4 - - Period E Event E Activity E Acquisition E Move E Transfer of Custody E Modification E Production E Attribute Assignment E Condition Assessment E Identifier Assignment E Measurement E Type Assignment E Conceptual Creation E Formation E Beginning of Existence E Birth E Production E Conceptual Creation E Formation E End of Existence E Destruction E Dissolution E Death E72 - Stuff E Physical Stuff E Physical Object E Biological Object E Person E Man-Made Object E Iconographic Object E Physical Man-Made Stuff E Man-Made Object E Iconographic Object E Man-Made Feature E Physical Feature E Site E Person E Man-Made Feature E Man-Made Stuff E Physical Man-Made Stuff E Man-Made Object E Iconographic Object E Man-Made Feature E Conceptual Object E Information Object E Iconographic Object

10 Пример описания сущностей E1 CRM Entity Belongs to: Meta Entity Superclass of:Temporal Entity Actor Appellation Contact Point Time-Span Place Dimension Type Number Stuff Legal Object Scope note:This is the abstract concept of the entities of our universe of discourse. It carries the rule that all entities can be classified by a type, which further refines the specific subclass an instance belongs to, and a free text field for anything we want to express and that is not captured by formal links. Properties: identification is identified by (identifies): Appellation classifications has type (is type of): Type other descriptions has note: String (has type : Type) The entity is referenced by: Type Assignment: classified (was classified by) Document: documents (is documented in) Conceptual Object: refers to (is referred to by) (has type : Type) End of Existence: took out of existence (was taken out of existence by) Beginning of Existence: brought into existence (was brought into existence by)

11 E4 Period Belongs to: Period Type Subclass of: Temporal Entity Superclass of: Event Scope note:A period is characterized by a coherent set of phenomena and or manifestations (explicitly intended or not), which are assumed to have taken place over a certain space and time. Examples: Glacial period, bronze period, Ming Dynasty, Impressionism, Neolithic Period, Mc Carthy Era, The Sixties, Niniveh, 'Sturm und Drang'. Properties: identifications is identified by (identifies): Appellation classifications has type (is type of): Type spatial definitions took place at (witnessed): Place spatial definitions, short cut took place on or within (witnessed): Physical Object temporal definitions has time-span (is time-span of): Time-Span structures consists of (forms part of): Period falls within (contains): Period other descriptions has note: String (has type : Type) The entity is referenced only by itself. The entity inherits references: Type Assignment: classified (was classified by) Document: documents (is documented in) Conceptual Object: refers to (is referred to by) (has type : Type) Beginning of Existence: brought into existence (was brought into existence by) End of Existence: took out of existence (was taken out of existence by)

12 Рассуждение о пространственной информации

13 Рассуждения о темпоральной информации

14 Сущности верхнего уровня CIDOC CRM

15 Папа Римский Leo І встречает Attila

16 Основные идеи CRM 1.Возможная двусмысленность отношений между сущностями и идентификаторами («Appellations» – "Названия"), которые используются, чтобы обратиться к сущностям, которые являются частью исторической действительности, которые будут описаны онтологией. Поэтому, CRM отличает узлы, представляющие реальные элементы, от узлов, представляющих только названия элемента. 2."Type" и системы классификации являются не только средством, чтобы структурировать информацию о действительности с внешней точки зрения, но также и частью исторической действительности как человеческие изобретения. Как таковые, они подпадают под Conceptual Objects, наследуя свойства создания, использования и т.д. Точно так же вся документация видится как часть действительности, и может быть описана непосредственно вместе с описанным содержанием. С этой проблемой материализации не имеют дело текущие языки онтологии. CRM вынужден использовать некоторые искусственные приемы, которые мы не анализируем здесь.

17 Основные идеи CRM (продолжение) 3. Нормальный человеческий способ проанализировать прошлое состоит в том, чтобы разделить развитие сущностей на дискретные события в пространстве и времени. Таким образом, описанное прошлое может быть сформулировано как серия событий, вовлекающих Persistent Items (постоянные элементы) (названные endurants) подобно Physical Things и Persons. Соединение элементов, мест и времени через события создает понятие " world- lines (мировых линий)" вещей, встречающихся в пространстве и времени (см. рис.). События, замеченные как процессы произвольного масштаба, обобщены как Periods" и далее как Temporal Entities (названные perdurants). Последние два класса непосредственно связаны с пространством и временем в онтологии.

18 Основные идеи CRM (продолжение) 4. Невещественные объекты (Conceptual Objects) являются элементами, которые могут быть созданы, но могут находиться больше чем на одном физическом носителе в то же самое время, включая человеческие мозги. Невещественные элементы могут присутствовать в событиях через соответствующие физические информационные носители (см. рис.). Невещественные элементы не могут быть разрушены, но они исчезают, когда последний носитель потерян.

19 FRBRoo и исполнительные виды искусства (Performing Arts) Модель FRBR (Functional Requirements for Bibliographic Records - Функциональные Требования для Библиографических записей) была разработана как модель сущность-отношение исследовательской группой, назначенной Международной федерацией Библиотечных ассоциаций и Учреждений (International Federation of Library Associations and Institutions - IFLA) в 1991–1997г.г. В 1998 она была издана. Отличает четыре уровня абстракции - от понятия до книги в моих руках: Работа, Выражение, Проявление, Пункт (Work, Expression, Manifestation, Item). Формирование в 2003 г. Международной Рабочей группы по гармонизации FRBR/CIDOC CRM. Цель - выразить модель IFLA FRBR понятиями, онтологической методологией и соглашениями нотации, обеспеченными CIDOC CRM, и слить две объектно-ориентированные модели.

20 FRBRoo (продолжение) 2008 г. - заключительный проект FRBRoo, то есть объектно- ориентированная версия FRBR, согласованная с CIDOC CRM. Эта формальная онтология предназначена, чтобы охватить и представить основную семантику библиографической информации и облегчить интеграцию, посредничество и обмен библиографической и музейной информацией. Главное новшество FRBRoo - реалистическая, явная модель интеллектуального процесса создания, которая должна быть развита далее в будущем в пользу библиотекарей и ученых из различных музейных дисциплин. FRBRoo делает фундаментальное различие между внутренними представлениями нашего ума (Work), наборами знаков или символов, которые человек может интерпретировать (Expression), и физическими информационными носителями. Текущая версия FRBRoo включает модель исполнительных видов искусства (performing arts), соединяя интерпретацию театральных игр с записью и документацией действий. Отличает и связывает три интеллектуальных вклада (работы) создания игры, интерпретации и записи со связанными символическими формами и физическими носителями.

21 Другие онтологии Онтология ABC - результат Проекта Гармонии, который финансировался совместно Технологическим Кооперативным Научно-исследовательским центром Распределенных Систем (Distributed Systems Technology Cooperative Research Centre - DSTC) (Австралия), Объединенным Комитетом по Информационным системам (Joint Information Systems Committee - JISC) (Великобритания) и Инициативой Национального научного фонда Цифровых Библиотек (National Science Foundation Digital Libraries Initiative - NSF DLI2) (США). Цель - потребность объединить информацию от множества жанров мультимедийной информации в пределах цифровых библиотек. Содержит13 классов и 14 свойств. Как CIDOC CRM, ABC описывает темпоральность. ABC включает оба понятия "events" и " situations", которые соответственно моделируют переходы (transitions) (т.е. глаголы) и экзистенциальные свойства. ABC основывается на понятиях, развитых в модели FRBR. Эти понятия – работы, выражения, проявления и пункты – дают ABC возможность связать сущности, у которых есть общее происхождение интеллектуальной собственности.

22 Графическое представление Модели ABC (пример) Рассказ в качестве примера: 14 июня 2001 в Wesley Hospital, была доставлена девочка 8 фунтов 11 унций к родителям Jill и John Smith. Акушеркой при доставке была Jane Kildare и акушером был Carl Nightingate. Этот пример демонстрирует, как Action type детализирует, или более узко определяет действия, которые происходят в Event. Agent Role далее детализирует или более узко определяет роль определенных агентов в действии.

23 Другие онтологии (продолжение) Онтология DOLCE (Descriptive Ontology for Linguistic and Cognitive Engineering) - продукт переработки основных концептов WordNet, лингвистический ресурс, полученный из словарей, обогащенных на основе теории основополагающих отношений, таких как участие, часть- целое, состав и т.д. Строго сформулировано в логике, делая ее довольно трудной для экспертов области, чтобы постигать и использовать ее. В отличие от CRM, пространство и время рассматриваются как зависимые свойства вещей, а не как вещи, существующие в потенциально пустом пространстве-времени – единственная, но глубокая несовместимость между обеими онтологиями.

24 Характеристики онтологий для культурного наследия Культурное наследие может быть рассмотрено как материальное доказательство деятельности человека в прошлом. Поэтому: информация является мезоскопической, т.е. в человеческом масштабе, ни астрономической, ни микроскопической, за исключением микроскопического анализа следов и материалов. Информация дискретна. О процессах сообщают или становятся очевидными как дискретные события, вовлекающие дискретные вещи, в отличие от геологического или метеорологического явления; информация является центральным событием. Вещи, люди и идеи соединяются и имеют отношение через события; описание является ретроспективным, в отличие от информации, чтобы планировать будущее.

25 Терминология в культурном наследии Терминология для библиотекарей - обеспечение доступа к информации. Терминология культурного наследия - поддержка построения гипотезы. Поэтому терминология культурного наследия могла быть разделена на верхний, устойчивый уровень, подходящий для поиска, и более низкий изменчивый уровень, который поддерживает построение гипотезы. Проблема с классификацией материальных объектов - различные аспекты (aspects) (facets), под которыми может быть сделана классификация. Доминирующие аспекты - функция объекта, его формы или появления, элементы или принципы конструкции. Эти три аспекта частично связаны. Например, у типичного молотка могут быть классическая форма и конструкция, но моторизованный молоток может только разделить функцию, но не другие аспекты. Другие аспекты - формы, определенные для исторических периодов или стран. Результат может сбить с толку редакторов тезауруса и онтологии, при построении иерархии IsA, и может ввести в заблуждение пользователей, когда они применяют термины классификации.

26 Главные Терминологические Системы AAT (Art & Architecture Thesaurus )- самая широко распространенная онтология в культурном наследии. Ее тема - искусство и архитектура, но покрывает широкий диапазон археологических и этнологических материалов, а также любые виды объекта, которые могут быть предметом искусства. Построена для фасетной классификации. Ее главные фасеты: Действия (Activities), Агенты (Agents), Материалы (Materials), Объекты (Objects), Физические атрибуты (Physical Attributes), Стили & Периоды (Styles & Periods), Связанные Концепты (Associated Concepts). Используются отношение IsA. Ее первоначально моноиерархическая (tree") обобщенная структура была расширена до полииерархической (направленый нециклический граф). English Heritage ( EH) поддерживает большие тезаурусы терминов для мобильных и неподвижных объектов для Соединенного Королевства, а также французский тезаурус MERIMEE. SHIC - система классификации деятельности человека, для описания музейных экспонатов несколькими британскими музеями. Вместо того, чтобы характеризовать объект, рассматривается только функция или полезность объекта для деятельности человека. ICONCLASS - единственная широко распространенная система для иконографической классификации. CAMEO - доступный для поиска информационный центр, созданый Музеем изобразительных искусств, Бостон. База данных MATERIALS содержит химическую, физическую, визуальную и аналитическую информацию о более чем исторических и современных материалах, используемых в производстве и сохранении артистических, архитектурных, археологических и антропологических материалов. Она предлагает только поиск по ключевым словам и алфавитный порядок.

27 Источники (культурное наследие) 1. Martin Doerr, Ontologies for Cultural Heritage (Steffen Staab, Rudi Studer,Handbook on Ontologies, Second Edition, Springer) 2. M. Doerr, The CIDOC CRM - An Ontological Approach to Semantic Interoperability of Metadata, AI Magazine, 24(3), Carl Lagoze, Jane Hunter, "The ABC Ontology and Model", DC-2001, International Conference on Dublin Core and Metadata, Tokyo, October 2001,

28 Онтологии для формального представления биологических систем Онтологические артефакты Цели использования онтологий в биомедицинском исследовании Построение гипотез и моделей биологических систем Задачи разработки формального представления Роль Семантической паутины Примеры онтологий Foundational Model of Anatomy - FMA Основополагающие принципы дисциплинированного моделирования Схема основных классов АТ(Anatomy Taxonomy) Примеры определений классов Схема Анатомической Структурной Абстракции (ASA) Схема Абстракции Анатомического Преобразования (ATA) Среда моделирования знаний - Protégé-2000 Архитектура Anatomy Information System - AIS

29 Онтологические артефакты: - управляемые словари (controlled vocabularies - CV). CV обеспечивает список терминов, которые используются обычно, чтобы индексировать записи в базе данных. Генная онтология (Gene Ontology - GO) наиболее широко использует CV. - информационная модель (модель данных) описывает, как различные части информации связаны друг с другом. Microarray Gene Expression Object Model (MAGE-OM) является примером информационной модели. - онтология - спецификация сущностей (или понятий) и отношений между ними в области обсуждения; наряду с декларациями свойств каждого отношения и набором явных аксиом, определенных для этих отношений и сущностей. Примером является Foundational Model of Anatomy (FMA) - основополагающая модель анатомии, которая представляет классы и отношения, необходимые для символического моделирования структуры человеческого тела, в форме, которая является понятной людям и является также управляемой, синтаксически анализируемой и поддающаяся толкованию машинными системами.

30 Использование онтологий в биомедицинском исследовании -интегрировать разнообразную информацию о биологических системах, чтобы сформулировать гипотезы -создать базы знаний, чтобы получить соответствующие факты, организовать и интерпретировать несопоставимые знания, вывести неочевидные отношения и оценить гипотезы, выдвигаемые учеными -использование онтологий для формального представления биологических систем

31 Построение гипотез и моделей биологических систем Задачи процесса биомедицинского исследования : сбор информации различных типов о биологических объектах, которые участвуют в биологическом процессе; формулирование гипотезы (или модели) об отношениях среди этих объектов; исследование различных данных, чтобы оценить степень, до которой поддерживается гипотеза; совершенствование гипотезы, чтобы достигнуть самого лучшего соответствия с данными.

32 Построение гипотез и моделей биологических систем (продолжение) Требуемые свойства формального представления для моделей биологических процессов: 1). Возможность представить структуру, функции и динамику биологического процесса. 2). Формальное представление должно включать объединенную онтологию, которая однозначно идентифицирует объекты и отношения в процессе. 3). Возможность представить биологические процессы в различных масштабах и позволить иерархическое представление подпроцессов, чтобы управлять сложностью. 4). Возможность включать новые данные и новые категории информации. 5). Концептуальная (математическая) платформа должна позволять проверку системных свойств, используя моделирование и/или логические механизмы вывода. 6). Представление должно иметь интуитивную визуальную схему.

33 Задачи разработки формального представления Представление знаний. Представление различных видов биологических объектов, участвующих в любом процессе болезни, и многих качественно различных видов отношений между ними. Необходимы различные онтологии, чтобы представлять биологические процессы на разных уровнях детализации, поскольку биологические процессы и соответствующие данные можно рассматривать на переменных уровнях детализации, в пределах от молекулярных механизмов до общих процессов, таких как деление клетки, и от матриц исходных данных до качественных отношений. Концептуальное представление. Концептуальная структура биологической системы позволяет рассуждать о биологической системе и выполнять мысленные эксперименты. Концептуальная основа для представления биологических систем должна вмещать модульный принцип и темпоральное поведение биологических систем. Концептуальные основы, используемые, чтобы представить биологические модели, изменяются от уравнений полного дифференциала до булевских выражений, от сетей Байеса, сетей Петри до исчисления процессов, специальных логик и систем правил. Знания и сбор данных. Сбор, хранение и кодирование существующей информации. Информация находится в отдельных репозитариях, с пользовательскими форматами хранения и разнообразными методами доступа.

34 Роль Семантической паутины Ожидание от Семантической паутины в науках о жизни состоит в том, что отношения, которые существуют неявно в умах ученых, будут явно объявлены (используя онтологии OWL) и затем использоваться, чтобы агрегировать геномные, белковые, клеточные, физиологические и химические данные. Семантические определения зададут, какие объекты связаны с другими и как. Такое связывание позволит семантическим инструментам вытащить вместе разнообразную информацию, представить ее способом, определенным пользователем, и возможно рассуждать над сопоставленной информацией, чтобы получить новое понимание.

35 Gene Ontology Главная инициатива биоинформатики с целью стандартизации представления гена и атрибутов генных продуктов по разновидностям и базам данных. Проект обеспечивает управляемый словарь терминов для того, чтобы описать характеристики генного продукта и данные аннотации генного продукта от участников GO Consortium, а также инструменты, чтобы получить доступ и обработать эти данные. Foundational Model of Anatomy (FMA) Является доменной онтологией концептов и отношений, которые принадлежат структурной организации человеческого тела. FMA как ссылочная онтология в биомедицинской информатике, чтобы коррелировать другие представления анатомии, выравнивая существующие и появляющиеся онтологии в онтологиях биоинформатики и обеспечивая структурный шаблон для представления биологических функций. Примеры онтологий

36 Foundational Model of Anatomy - FMA Модель содержит различных анатомических понятий представление структур от некоторых макромолекулярных комплексов и компонентов клетки к главным частям тела. Эти понятия связаны более чем с термов и связаны друг с другом более чем 1.5 миллионами экземпляров из более чем 170 видов отношений. Подход к моделированию - дисциплинированное моделирование (disciplined modeling).

37 Основополагающие принципы дисциплинированного моделирования Объединенный контекстный принцип. Абстракция должна соответствовать строго структурному контексту. Принцип абстрактного уровня. Абстракция должна моделировать каноническую анатомию и служить основой для анатомических вариантов, но должна исключить инстанцированную анатомию (instantiated anatomy). Принцип специфики разновидностей. Начальная итерация абстракции должна смоделировать анатомию Homo sapiens, но одновременно она должна служить платформой для анатомии других млекопитающих и, в конечном счете, других видов позвоночных. Принцип определения. Определение атрибутов класса в модели должно быть определено в терминах физических и других структурных (т.е., анатомических) атрибутов анатомических сущностей, которые включает класс. Принцип доминирующего концепта. Доминирующий класс онтологии– это класс, в отношении которого в онтологии определены другие классы.

38 Основополагающие принципы дисциплинированного моделирования (продолжение) Принцип организационного элемента (Organizational unit principle). Абстракция должна иметь два элемента, с точки зрения которых определены подклассы Анатомической структуры (Anatomical structure): Клетка (Cell) и Орган (Organ). Принцип ограничения контента. Самая большая представленная анатомическая структура должна быть целым организмом (в текущей итерации, человеческое тело) и самое маленькое Биологическая макромолекула. Если возникает потребность, молекулы, не синтезируемые через выражение собственных генов организма, должны быть представлены в отдельных онтологиях. Принцип ограничения отношения. Абстракция должна моделировать три типа отношений, которые появляются между анатомическими сущностями: 1) отношения категоризации класса; 2) статические физические отношения; 3) отношения, которые описывают преобразование анатомических сущностей во время онтогенеза (индивидуальное развитие) организма. Принцип когерентности. У абстракции должен быть один корень, Anatomical entity, который включает все объекты (entity), которые касаются структурной организации тела; понятия, относящиеся к этим объектам, должны быть расположены в единственной и всеобъемлющей иерархии категоризации класса наследования. Принцип представления. Абстракция должна быть смоделирована как онтология анатомических концептов и должна разместить все поименованные соглашения, связанные с этими концептами.

39 Высокоуровневая схема FMA = (АТ, ASA, ATA, Mk), где АТ - Таксономия Анатомии (Anatomy Taxonomy); ASA - Анатомическая Структурная Абстракция (Anatomical Structural Abstraction) описывает разделительные (meronymic) (partitive (meronymic)) и пространственные отношения понятий, представленных в таксономии; ATA - Абстракция Анатомического Преобразования (Anatomical Transformation Abstraction) описывает морфологические преобразования с временной зависимостью понятий, представленных в таксономии во время жизненного цикла человека, который включает пренатальное развитие, послеродовой рост и старение; Mk - Метазнания (Metaknowledge), которые включают принципы и наборы правил, согласно которым представляются отношения в других трех компонентных абстракциях модели.

40 Схема основных классов АТ Anatomical Entity Physical Anatomical Entity Non-physical Anatomical Entity Material Physical Anatomical Entity Non-material Physical Anatomical Entity Anatomical Relationship - is a - Anatomical spaceBody Substance (вещество) Anatomical Structure Biological Macromolecule CellOrgan Cell Part Tissue (ткань) Organ Part Organ System Body Part Human Body

41 Примеры определений классов Anatomical entity is a biological entity, which constitutes the structural organization of a biological organism, or is an attribute of that organization. Anatomical structure is a material physical anatomical entity which has inherent 3D shape; is generated by coordinated expression of the organisms own structural genes; consists of parts that are anatomical structures; spatially related to one another in patterns determined by coordinated gene expression. Cell is a anatomical structure which consists of cytoplasm surrounded by a plasma membrane with or without the cell nucleus.

42 Примеры определений классов (продолжение)_ Organ is an anatomical structure, which consists of the maximal set of organ parts so connected to one another that together they constitute a self-contained unit of macroscopic anatomy morphologically distinct from other such units. Organ part is an anatomical structure, which consists of two or more types of tissues, spatially related to one another in patterns determined by coordinated gene expression; together with other contiguous organ parts it constitutes an organ. Tissue is an anatomical structure, which consists of similarly specialized cells and intercellular matrix, aggregated according to genetically determined spatial relationships.

43 Часть таксономии структурных отношений

44 Схема Анатомической Структурной Абстракции (ASA) ASA Anatomical Structural Abstraction DT Dimensional Taxonomy Bn Boundary network Pn Part-of network SAn Spatial Association network Cn Connectivity network On Orientation network Ln Location network CTMn Containment network AJn Adjacency network QCn Qualitative coordinate network CTn Continuity network ATn Attachment network SYn Synaptic Connectivity network

45 Схема Абстракции Анатомического Преобразования (ATA) ATA Anatomical Transformation Abstraction DevT Developmental Taxonomy DL Developmental Lieneage PTr Phenotypic Transformation Rn Regulatory Networks DPT Developmental Time Parameter A 1 Immediate Precursor D 1 Immediate Descendant Pt Phenotype Change PC 1 Immediate Precursor S 1 Immediate Descendant Pt Phenotype Change DStrT Developmental Structure Taxonomy DSpT Developmental Space Taxonomy DPT Developmental Process Taxonomy POT Post-ovulatory Time DSt Developmental Stage TAg Transformating Agent Sc Source of TAg Tg Target of TAg G f Gene facilitated G r Gene repressed Prop Propagation of TAg Pt Phenotype Change

46 Среда моделирования знаний - Protégé-2000 Фрейм концепта Vertebra

47 Среда моделирования знаний - Protégé-2000 Разнообразие терминов, связанных с понятием Uterine tube

48 Среда моделирования знаний - Protégé-2000 Отношения приписанной смежности и преемственности для понятия Esophagus (пищевод)

49 Архитектура Anatomy Information System - AIS Protege GAPP Image Manager FME Emily GOQAFMA FMA Server 3D Model Server Image Server Other agents and interfaces Image Database Annotated Image Model Database 3D Models

50 Источники (биосистемы) 1. Nigam Shah, Mark Musen, Ontologies for Formal Representation of Biological Systems (Steffen Staab, Rudi Studer, Handbook on Ontologies, Second Edition, Springer) 2. C. Rosse, J. L. V. Mejino, A reference ontology for biomedical informatics: the foundational model of anatomy, J Biomed Inform, 36(6):478–500, Dec