АНАЛИЗ МНОГОЗНАЧНОСТЕЙ В ЕСТЕСТВЕННО-ЯЗЫКОВЫХ ТЕКСТАХ Кучуганов Валерий Никанорович, доктор техн. наук, профессор ГОУ ВПО "Ижевский государственный технический.

Презентация:



Advertisements
Похожие презентации
Ижевский Государственный Технический Университет Факультет информатики и вычислительной техники Кафедра АСОИУ.
Advertisements

Стандарт IDEF1X Рассмотрим методологию IDEF1X. Методология IDEF1X представляет собой формализованный язык семантического (контекстного) моделирования данных,
Естественные науки и онтологии. Онтологии Служат для описания предметных областей. Используют: объектно-ориентированный подход; логические средства.
Глава 4 Базовые информационные процессы, их характеристика и модели. Информационные технологии основаны на реализации информационных процессов, разнообразие.
Онтологии: понятие, методы, применение. Онтологии предметных областей. Лекция 5.
Концептуальные модели представления гетерогенных данныхданных Гарипов Олег
8. Моделирование логической структуры системы Диаграмма классов Диаграмма классов служит для моделирования классов и отношений между ними.
М ОДЕЛИРОВАНИЕ КАК МЕТОД ПОЗНАНИЯ Статистические и динамические информационные модели.
1 Системный подход в моделировании МОДЕЛИРОВАНИЕ И ФОРМАЛИЗАЦИЯ.
Исследование применения онтологических моделей для семантического поиска Цель: определение основных способов и средств построения онтологических моделей.
Отработка навыка составления формулы изобретения на устройство Семинар.
Доклад на тему «Создание онтологической базы знаний рекрутинговой системы» Подготовил : Нифталиев В.Э. Руководитель: Привалов М.В.
ОНТОЛОГИЧЕСКИЙ ПОДХОД и аспекты обработки естественно- языковых объектов (ЕЯО) Содержание 1.Введение. 2.Известные определения онтологии ПдО. 3.Схема формальной.
Text Mining. Анализ текстовой информации. Text Mining- методы анализа неструктурированного текста Обнаружение знаний в тексте Обнаружение знаний в тексте.
Онтологическая семантика текста: форматирование лексики в семантическом словаре Г.В. Лезин Санкт-Петербургский экономико-математический институт РАН
Базы данных Реляционная база данных MS Access. Повторение База данных организованная совокупность данных из какой-либо предметной области, предназначенная.
Модели решения функциональных и вычислительных задач Четвертый раздел (ДЕ 4)
Методология IDEF1X (IDEF1 Extended) – язык для семантического моделирования данных, основанных на концепции « сущность - связь ». Является расширением.
Методология информационного моделирования IDEF1X.
Моделирование как метод познания. Модели Модель – это объект, который используется для представления другого объекта (оригинала) с определенной целью.
Транксрипт:

АНАЛИЗ МНОГОЗНАЧНОСТЕЙ В ЕСТЕСТВЕННО-ЯЗЫКОВЫХ ТЕКСТАХ Кучуганов Валерий Никанорович, доктор техн. наук, профессор ГОУ ВПО "Ижевский государственный технический университет", , г. Ижевск, ул. Студенческая, 7. ИжГТУ. тел. (3412) , В работе предлагается подход к задаче разрешения семантических противоречий и сокращения смысловой вариативности в процессе семантического анализа и построения модели естественно-языкового текста, основанный на поисковой логике – стратегиях поиска сущностей с помощью предметной онтологии и аппарата логических поисковых функций. Подход апробируется на автоматизированных системах обучения иностранному языку.

МОДЕЛЬ ЗНАНИЙ О ПРЕДМЕТНОЙ ОБЛАСТИ ДеревоКонцептЭкземпляр Рис. 1. Конструктивные элементы базы знаний ПредметПроцесс ЭпизодСвойствоОтноше- ние Концепт Рис. 2. Виды концептов Отношение Толеран- тность РольВхожде- ние Сравне- ние Рис. 3. Виды отношений 2

КОНЦЕПТ-СВОЙСТВО ::=, [ ],, [ ], где: – непрерывный, дискретный, денежный, качественный (напр. "малый", "средний", "большой"), текстовый, ссылочный; – способ вычисления (измерения) атрибута. ПРЕДМЕТЫ Предметы имеют состав (детали), схему соединения и геометрические модели (кинематическая схема, чертеж, карта, 3D-модель): ::=,,, [, [ ] ], ] ::= [ ],,,, [ ], [ ] Список отношений между компонентами определяет относительное положение, типы соединений, степени свободы и т.п. СУБЗ имеет два механизма наследования: наследование «предок - потомок»;заимствование «сборка - деталь». Особенностью заимствования является инструмент параметрического конструирования новых деталей из старых, принадлежащих разным деревьям. 3

ПРОЦЕССЫ И МЕТОДЫ ОПИСАНИЕ ОТНОШЕНИЙ ::=,,, [ ],,, [ ], [, ] Роли участников действия (входных/выходных концептов): ::=, [ ],,,,, [ ], - актор (исполнитель);- сцена; - бенефициант (заказчик);- инструмент; - реципиент (приемник действия);- коагент; - объект воздействия;- эффект и т.д. 4

ЭПИЗОДЫ Граф эпизода – это связный полихромный граф, описывающий сюжет (бытовой, производственный и проч.), ограниченный по количеству процессов, участников и времени. Атрибуты эпизода: главный герой; место действия; другие участники; основной процесс; цель. 5 СУЩНОСТЬ В ПРЕДМЕТНОЙ ОНТОЛОГИИ Термин – Определение – Модель – Атрибуты, где: модель предмета – однородный пространственный граф (геометрическая модель); модель процесса – вычислительная (алгоритмическая) модель; модель эпизода – пространственный полихромный граф, позволяющие получать путем параметризации множество экземпляров, удовлетворяющих данному понятию.

ПРИМЕРЫ ФУНКЦИЙ ПОИСКА (РАСПОЗНАВАНИЯ) 1. Утверждение роли субъекта Sub2 в процессе Р1: (memberi MEMBER (P1)) (area(memberi) AREA(Sub2)) SearchRole(P1,Sub2) = 'True'; role(Sub2) = name(memberi); entity(Sub2) = memberi(P1) – если среди участников процесса Р1 имеется такой, что область существования (значение) участника принадлежит одной из областей существования субъекта Sub2, то роль и сущность Sub2 найдены. 2. Взаимная конкретизация сущностей субъектов Sub1 и Sub2: (area i AREA(Sub1), area j AREA(Sub2)) (area i (Sub1) areaj(Sub2) ) SearchEntity(Sub1,Sub2) = 'True'; entity(Sub1) = area i ; entity(Sub2) = area j – если одна из областей существования субъекта 1 совпадает с какой-либо областью существования субъекта 2, то сущности субъектов Sub1, Sub2 в данном контексте найдены. 3. Утверждение субъекта Sub1 в качестве свойства/атрибута субъекта Sub2: area i AREA(Sub1), property j PROPERTY(Sub2) (area i (Sub1) = = area.property j (Sub2) SearchProperty(Sub1,Sub2) = 'True'; entity(Sub1) = area i – если одна из областей существования субъекта 1 совпадает с областью существования какого-либо свойства субъекта 2, то субъект 1 является характеристикой субъекта 2. Например, в предложении "The time flies like an arrow" [Рафаэл, 1979] время (time) не может быть свойством мух (flies). 6

Пример 1. "Я выхожу на следующей остановке". Транс- порт акто р ДвижениеОстановк а Движение … Я акто р Выхожу где Остановка Следующая когда пассажир транспорт V t 7

МОРФОЛОГИЧЕСКИЙ АНАЛИЗ. ПРИЗНАКИ ОСНОВНЫЕ ФОРМЫ СЛОВА 8

МОРФОЛОГИЧЕСКИЙ АНАЛИЗ. СПРАВОЧНИКИ Словари и справочники в дереве концептов Классификация справочников 9

МОРФОЛОГИЧЕСКИЙ АНАЛИЗ. СЛОВАРИ Словари и справочники в дереве концептов Классификация словарей 10

СИНТАКСИЧЕСКИЙ АНАЛИЗ. ПРИМЕРЫ ПРАВИЛ Пример 1 Пример 2 11

ПРИМЕР СОСТАВЛЕНИЯ УРОКА И РАБОТА С НИМ Пример 1 12

РЕЗУЛЬТАТ ВЫПОЛНЕНИЯ УПРАЖНЕНИЯ 13

ПРИМЕР УПРАЖНЕНИЙ ПО СИНТАКСИСУ 14