Онтологии и тезаурусы Добров Б.В., Иванов В.В., Лукашевич Н.В., Соловьев В.Д. 1.1. Определение понятий: онтология, концепт, отношение, аксиомы.

Презентация:



Advertisements
Похожие презентации
5.2. Онтологии товаров и услуг. Онтология Онтология это система, состоящая из набора понятий и набора утверждений об этих понятиях, на основе которых.
Advertisements

Б.В. Добров, Н.В. Лукашевич, Лингвистическая онтология по естественным наукам и технологиям: основные принципы разработки и текущее состояние АНО Центр.
Онтологический подход и его использование для структурирования предметных областей Научная библиотека им. Н.И. Лобачевского Казанского государственного.
Константинова Наталья. Актуальность На данном этапе существования компьютерных технологий и техники, с развитием наукоемких областей все быстрее растет.
1 Средства автоматической интеграции разнородных онтологий Панасенко Алексей, 525 группа Научный руководитель Большакова Е.И.
4.1. Онтологии верхнего уровня: SUMO, Sowas ontology SUMO (Suggested Upper Merged Ontology) Онтология Джона Совы (Sowas ontology)
Онтологии: понятие, методы, применение. Онтологии предметных областей. Лекция 5.
Б.В. Добров, Н.В. Лукашевич, М.Н. Синицын, В.Н. Шапкин Разработка лингвистической онтологии по естественным наукам для решения задач информационного поиска.
XML-ТЕХНОЛОГИИ Лекция 5 Семантический Веб: микроформаты RDF, OWL и FOAF.
Исследование применения онтологических моделей для семантического поиска Цель: определение основных способов и средств построения онтологических моделей.
2.1. Типы онтологий: верхнего уровня, предметных областей, прикладных онтологий. Лексические онтологии.
Эволюция понятий «Тезаурус» и «Онтология» Альперин Борис, Новосибирск, 2013.
Text Mining. Анализ текстовой информации. Text Mining- методы анализа неструктурированного текста Обнаружение знаний в тексте Обнаружение знаний в тексте.
Архитектура метаданных WWW. Язык RDF Архитектура метаданных WWW RDF.
Анализ тональности сообщений Лидия Михайловна Пивоварова Системы понимания текста.
1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Смирнов Иван Валентинович с.н.с. ИСА РАН.
Автоматическое определение авторства Лидия Михайловна Пивоварова Системы понимания текста.
1 Концепция Web 3.0 Web как семантическая паутина : традиционные информационные ресурсы + метаданные, описывающие семантические связи в информационных.
3.1. Назначение онтологий. Информационный поиск..
Н.В.Лукашевич, Д.С Чуйко Автоматическое разрешение лексической многозначности на основе тезаурусных знаний АНО Центр информационных исследований МГУ им.
Транксрипт:

Онтологии и тезаурусы Добров Б.В., Иванов В.В., Лукашевич Н.В., Соловьев В.Д Определение понятий: онтология, концепт, отношение, аксиомы

Коллекции электронных документов и задачи их автоматической обработки Миллионы текстов в электронной форме Множество разнообразных насущных задач по автоматической обработке электронных документов Но: для решения этих задач используются пословные статистические методы (bag of words models) Information retrieval community: текст – это набор features, закономерности которых хорошо учитываются cтатистическими методами

Онтологии. Концептуальное индексирование Ресурс для автоматического индексирования. Индекс: не слова, а понятия. –Многозначные слова разведены к разным понятиям –Синонимы приводят к одному понятию –Отношения могут использоваться для расширения или уточнения запроса

Онтологии. Semantic Web (2001) Тим Бернес-Ли, Джеймс Хендлер, Ора Лассила Страницам сайта приписана некоторое формально описание, которое помогают автоматическим процессам в сети взаимодействовать RDF (Resource Description Framework) Web Ontology Language (OWL) Единицы описаний – из Онтологий «Сеть наполнится семантикой»

Онтология: 2 значения Философская дисциплина изучает наиболее общие характеристики бытия и сущностей Онтология – артефакт, структура, описывающая значения элементов некоторой системы

Онтология (артефакт) Неформально, онтология представляет собой некоторое описание взгляда на мир применительно к конкретной области интересов. Это описание состоит из терминов и правил использования этих терминов, ограничивающих их значения в рамках конкретной области

Онтология (3) На формальном уровне, онтология это система, состоящая из набора понятий и набора утверждений об этих понятиях, на основе которых можно строить классы, объекты, отношения, функции и теории. Основные компоненты: –Классы или понятия –Отношения –Функции –Аксиомы –Примеры

Онтология – спецификация концептуализации (Gruber) Концептуализация – структура реальности, независимо от –Словаря –Конкретной ситуации –Кубики на столе: концептуализация: - набор возможных положений, но не конкретное расположение

Онтологией могут быть: Глоссарий Простая таксономия Тезаурус Понятийная структура с произвольным набором отношений Структура с аксиоматикой

Таксономические отношения Варианты названий: Is_a – отношение Класс - подкласс Лингвистика: гипоним – гипероним Родовидовое отношение

Свойства таксономических отношений Транзитивность: A is_a B, B is_a C, –=> A is_a C Наследование: –S= свойство (А) –B is_a A –=> S=свойство (B)

Инициатива (КА) Предметная область разработки – сообщество специалистов по приобретению знаний Несколько таксономий: people, publications, events, organizations, research topics (KA)2 Knowledge Annotation Initiative of the Knowledge Acquisition Community (

Таксономия публикаций Publication Article –Article in book –Conference paper –… Book Journal –IEEE expert

Отношения в (КА) Employee Head-of-projectProject Works-on-ProjectProject AffiliationOrganization Head-of-groupResearch group

Пример аксиомы Работник, являющийся руководителем проекта, работает в проекте Переменные Е, Р Forall (E,P) Employee (E) and Head-Of- Project (E,P) => Works-At-Project (E,P)

Языки для описания онтологий Ontobroker CycL Description Logics RDF/RDFS OWL

Ontobroker Подклассы (Subclass): С1::С2 – класс С1 является подклассом С2 Экземпляры (Instance of): O:C – O является экземпляром C Описания атрибутов (Attribute Declaration): C1 [А=>>C2 ] – для экземпляра класса С1 определен атрибут А, значением которого должен быть экземпляр класса С2

Ontobroker - 2 Значения атрибутов (Attribute value): O [A->>V] – Экземпляр О имеет атрибут А со значением V Часть-Целое (Part-of) – O1

Ontobroker - 3 Запрос Forall Obj, FN, EM >FN; –Lastname->>»Иванов»; ->>EM].

Типы онтологий Общие Предметно-ориентированные Различаются по способу применения Онтологии для автоматического анализа текста

Проблемы построения общих онтологий: верхние уровни Верхние уровни в разных онтологиях: CYC, EuroWordNet, WordNet Сравнение. Почему они различаются Критический анализ Nicola Guarino и предложения, как нужно строить верхний уровень Онтология SUMO

Онтология CYC Lenat D. Самый амбициозный проект Начат в млн. утверждений common sense Микротеории: пространство, время, причинность Онтология 3 тысяч понятий верхнего уровня – в открытом доступе

Лингвистические онтологии The main characteristic of this kind of ontologies is that they are bound to the semantics of grammatical units (words, nominal groups, etc) Основной источник понятий в онтологии – значения языковых единиц Лингвистические онтологии: WordNet, Mikrokosmos, Sensus, РуТез

WordNet Реляционное описание лексики английского языка Иерархическая сеть понятий (synset) Каждое слово относится к одному или нескольким понятиям Отдельная иерархическая сеть для различных частей речи – психолингвистическое обоснование Автор: George Miller (50-e годы статья «Магическое число 7») Версия 1.6: 95 тысяч понятий, около 130 тысяч слов и понятий

EuroWordNet Структурные лингвистические ресурсы Структурные лингвистические ресурсы Интерлингва: английский WordNet Интерлингва: английский WordNet Первоначально: испанский, итальянский, голландский Первоначально: испанский, итальянский, голландский Далее: немецкий, французский, чешский, эстонский Далее: немецкий, французский, чешский, эстонский Известны попытки создать свои структурные ресурсы на базе WordNet: японский, болгарский, румынский, шведский и др. Известны попытки создать свои структурные ресурсы на базе WordNet: японский, болгарский, румынский, шведский и др.

Онтология MikroKosmos New Mexico State University Nierenburg Sergey 5 тысяч понятий Автоматический перевод английский – испанский Узкая предметная область: слияния предприятий

Тезаурус русского языка РуТез Ресурс для автоматической обработки текстов Содержит общезначимые лексические единицы и терминологию общественно политической области – 115 тысяч слов и выражений Иерархическая сеть

АНО Центр информационных исследований МГУ им. М.В.Ломоносова Научно-исследовательский вычислительный центр Университетская информационная система РОССИЯ

Лингвистические онтологии и информационный поиск Электронные коллекции разнообразных текстов Возможности систем автоматической обработки текста для анализа релевантности контекста ограниченны Нет возможности подробно проанализировать контекст упоминания понятия в тексте. Онтологии специального типа?

Многоязычные онтологии EuroWordNet MikroCosmos RuThes содержит двуязычный ресурс Общественно-политический тезаурус (75 тысяч русский терминов – 70 тысяч англоязычных) Чем установления языковых соответствий отличается в традиционных словарях и онтологиях

Онтологии и вопросно-ответные системы Система ищет в сверхбольшой текстовой коллекции Сравнение систем в соревновании TREC и CLEF Конкретные системы Практическая актуальность: поиск в Интернет не по краткому запросу, а по развернутому вопросу

Онтологии и вопросно-ответные системы Постановка задачи: 60-е годы: поиск в специальных базах знаний Сейчас: поиск в громадных текстовых массивах Примеры вопросов: What does the Peugeot company manufacture? How long did the Charles Manson Murder trial last? Who is the first American in space?

Как создать онтологию для конкретной области Тексты Набор словосочетаний: автоматическое извлечение терминов Выделение понятия Отношения между понятиями: –Извлечение из текстов по шаблонам –Статистические методы –Методы на основе синтаксической структуры

Как использовать созданные онтологии Слияние онтологий Использование общих онтологий для эффективного создания онтологий в конкретных предметных областях Semantic web: одна (или несколько) онтология верхнего уровня, к которой достраиваются специализированные онтологии

Вопросы к лекции Что такое онтология? Составные части онтологий Классификация онтологий