Программная поддержка языка лексико-синтаксических шаблонов Носков А. А. Научный руководитель: Большакова Е.И. Московский Государственный Университет им.

Презентация:



Advertisements
Похожие презентации
ЛЕКСИКО-СИНТАКСИЧЕСКИЕ ШАБЛОНЫ В ЗАДАЧАХ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТА Большакова Е.И., Баева Н.В., Бордаченкова Е.А., Васильева Н.Э., Морозов С.С. МГУ.
Advertisements

ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ ТЕРМИНОЛОГИЧЕСКИХ ВАРИАНТОВ В ТЕКСТАХ Антонов Вадим Юрьевич Научный руководитель: Ефремова Наталья Эрнестовна Дипломная.
ЛЕ КСИКО-СИНТАКСИЧЕСКИЕ ШАБЛОНЫ ДЛЯ АВТОМАТИЧЕСКОГО АНАЛИЗА НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ Е. И. Большаков а, Н. Э. Васильева, С.С. Морозов МГУ им. М.В. Ломоносова.
Поддержка разработки Parallels Business Automation в среде Eclispe Научный руководитель: Сергушенков Ю. А. Рецензент: доцент кафедры системного программирования,
Задачи проектирования ИПС: Анализ предметной области Определение структуры ИПС Определение видов поиска документов в ИПС Разработка структуры БД для ИПС.
Model/View-архитектура CASE-пакета REAL-MV Тимофей Брыксин, гр. 545 Научный руководитель: А.Н.Терехов Рецензент: Д.В.Кознов.
Объектная модель многофункциональных словарей Докладчик: Носков А. А. Группа: 525 Научный руководитель: Большакова Е. И.
Построение правил для автоматического извлечения словосочетаний из текста Загорулько Максим Юрьевич Научный руководитель н.с. ИСИ СО РАН, к.ф.-м.н. Е.А.Сидорова.
ТЕРМИНОЛОГИЧЕСКИЙ АНАЛИЗ ТЕКСТА НА ОСНОВЕ ЛЕКСИКО-СИНТАКСИЧЕСКИХ ШАБЛОНОВ Ефремова Н.Э., Большакова Е.И., Носков А.А., Антонов В.Ю. МГУ имени М.В. Ломоносова,
Дипломная работа Программная поддержка морфемного словаря Швейкина О.А., 525 гр. Научный руководитель: к.ф.-м.н. доцент Большакова Е.И.
СИСТЕМА SLS-УПРАВЛЕНИЕ БИЗНЕС-ПРОЦЕССАМИ Июль, igr.net.
Программное обеспечение. Графический интерфейс операционных систем и приложений.
Text Mining. Анализ текстовой информации. Text Mining- методы анализа неструктурированного текста Обнаружение знаний в тексте Обнаружение знаний в тексте.
Информационные системы. Базы данных. Информационная система – любая система обработки информации (шир)
Разработка пользовательских интерфейсов Выполнил: Бредихин Юрий Вячеславович студент 3 курса, 31-И группы Старый Оскол, 2015.
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ КОМПЬЮТЕРА Ключевые слова программа программное обеспечение (ПО) системное ПО прикладное ПО система программирования.
АВТОР: ДИПЛОМНЫЙ ПРОЕКТ «Разработка программы по работе с корпоративными клиентами на примере ООО «ЭнергоСтройСервис» в среде Delphi 6.0» Слайд 1.
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ СТАВРОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ.
«Поиск шаблонов в программном коде» Автор: студент 445 группы Евгений Куделевский Руководитель: к.ф.-м.н., ст. разработчик компании JetBrains Максим Мосиенко.
Операционная система это комплекс взаимосвязанных системных программ, назначение которого организация взаимодействия пользователя с компьютером и выполнение.
Транксрипт:

Программная поддержка языка лексико-синтаксических шаблонов Носков А. А. Научный руководитель: Большакова Е.И. Московский Государственный Университет им М.В Ломоносова Факультет Вычислительной Математики и Кибернетики

2 Выделение конструкций в тексте Именные группы – Усталое солнце – Уходящий поезд Глагольные группы – Шел по тротуару – Писать стихи Характерные для стиля конструкции – Под A будем понимать B – Предположим, что C Нужны средства описания и выделения – Разметка корпусов (НКРЯ) – Инструментальные системы (GATE, Ellogon) – Лексические шаблоны (Alex) – Лексико-синтаксические шаблоны (LSPL)

3 Лексико-синтаксические шаблоны языка LSPL Предназначен для описания языковых конструкций в виде шаблонов Позволяет задавать условия согласования Проблема: эффективная реализация Большакова Е.И. и др. Лексико-синтаксические шаблоны в задачах автоматической обработки текстов // Труды межд. конф. Диалог '2007 – М.: Издательский центр РГГУ, 2007, с Тяжелый шаг Красные листья Черного дерева Первого снег A N прилагательное существительное падеж Тяжелый шаг Красные листья Черного дерева Первого снег A N прилагательное существительное условие согласования

4 Задачи дипломной работы Добавление средств задания словарной информации в язык LSPL Разработка метода поиска в тексте языковых конструкций по их описанию в виде шаблонов на языке LSPL Реализация программного комплекса, позволяющего осуществлять поиск языковых конструкций по их описанию в виде LSPL-шаблонов

5 Задание словарной информации A N прилагательное существительное условие согласования условие вхождения в словарь Словарь множество допустимых наборов слов функция из множества наборов слов в { True, False } Пользователь регистрирует в системе словарь D Унаследован от класса Dictionary Реализует метод accepts( const vector & words )

6 Основные идеи метода Использование специального представления текста для поиска Переиспользование уже найденных сопоставлений Индексирование слов текста по частям речи Индексирование конструкций в тексте по шаблонам Сокращение объема результатов за счет склеивания неразличимых сопоставлений

7 Внутреннее представление текста Текст разбивается на значимые и незначимые отрезки Интерпретации значимых отрезков образуют ребра графа Конструкции также представлены ребрами графа Ребра проиндексированы по различным признакам (часть речи, шаблон)

8 Поиск конструкций в графе С помощью индексов определяется множество начальных ребер С каждого ребра происходит поиск пути в графе Принимаются пути, соответствующие последовательности элементов шаблона Проверяются характеристики и условия согласования Неразличимые варианты склеиваются

9 Основные компоненты комплекса Ядро системы Консольные утилиты Интерфейс для Java Пользовательский интерфейс Интеграция комплекса с Java-приложениями Поиск и визуализация языковых конструкций в тексте Основные функции по поиску языковых конструкций Автоматическая обработка текста с использованием шаблонов LSPL

10 Пользовательский интерфейс Список шаблонов Список найденных фрагментов Фрагменты, отмеченные в тексте

11 Результаты дипломной работы Язык дополнен средствами задания словарной информации Разработан метод выделения языковых конструкций в тексте по их описанию в виде LSPL-шаблонов Разработан программный комплекс, позволяющий находить языковые конструкции в тексте – Кроссплатформенность – Интеграция с приложениями на C++ и Java – Графический пользовательский интерфейс

12 ?