«Морфологический анализатор имен существительных русского языка» Дипломная работа студента 544 группы Галлямова Антона Фаридовича Научный руководитель:

Презентация:



Advertisements
Похожие презентации
Абрамович Максим, 545 группы Научный руководитель: Тузов Виталий Алексеевич Морфологический анализ русского языка.
Advertisements

Имя существительное Имя существительное- часть речи, которая отвечает на вопросы : кто? что? обозначает предмет.
Примеры обработки информации (Алгоритмы) Примеры обработки информации (Алгоритмы)
-часть речи, которая обозначает предмет и отвечает на вопрос: Кто?Что?
Падежи имён существительных Составитель: Хмелёва Ирина Юрьевна учитель начальных классов МОУ «СОШ 2» г. Краснотурьинска (Технологический приём: заслонка)
Генерация средств импорта данных в рамках проектов ИС, реализованных в технологии REAL-IT Выполнил Комиссаров Антон Научный руководитель: Иванов А.Н. Рецензент:
Эффективное сопоставление полигональных объектов Дипломная работа Белоног О.С. Научный руководитель: к.ф.-м.н., доц. Вяткина К.В. Рецензент: Васильева.
Построение правил для автоматического извлечения словосочетаний из текста Загорулько Максим Юрьевич Научный руководитель н.с. ИСИ СО РАН, к.ф.-м.н. Е.А.Сидорова.
Тест по русскому языку «Падежи» Учитель начальных классов: Молодых Н.М.
Использование информационно - коммуникационных технологий на занятиях с дошкольниками Дидактические упражнения для активизации и обогащения словаря дошкольников.
ВИНИТЕЛЬНЫЙ и РОДИТЕЛЬНЫЙ падежи имени существительного ТЕМА: «ИМЯ СУЩЕСТВИТЕЛЬНОЕ» 4 класс Программа «Школа России» учитель начальных классов Ольга Петровна.
Автоматический перевод это - выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст.
Русский язык в таблицах и схемах (часть3) склонение имён существительных Презентацию подготовила: Настаченко Т.Л. Учитель русского языка и литературы МБОУ.
Двумерный массив. Матрица Прямоугольная таблица, состоящая из чисел А=
Дипломная работа Ивановой О.О., группа 545 Научный руководитель: д. ф.-м. н., профессор Терехов А.Н. Генерация кода по диаграмме активностей.
Проверка эквивалентности срединной и линейной осей многоугольника Дипломная работа студента 545 группы Подколзина Максима Валериевича Санкт-Петербургский.
Урок повторения в 5 классе по теме «Имя существительное» Конкурс знатоков русского языка «Орфографическая зоркость»
Русский язык 3 класс Тема: Склонение имён существительных (общее понятие)
Двумерный массив. Матрица Прямоугольная таблица, состоящая из чисел А=
На тему: «ТЕМА ДИПЛОМНОГО ПРОЕКТА » Выполнила студентка Руководитель: группы ЭЗ-6 Адоц., к.э.н. Дипломный проект.
Транксрипт:

«Морфологический анализатор имен существительных русского языка» Дипломная работа студента 544 группы Галлямова Антона Фаридовича Научный руководитель: Тузов Виталий Алексеевич Рецензент: Фоминых Николай Федорович Санкт-Петербург 2007

Постановка задачи: Прямая и обратная и дополнительная задачи. Прямой задачей является генерация по исходной форме слова (единственное число, именительный падеж – для существительных, инфинитив для глаголов) всей парадигмы этого слова. Обратная задача – по произвольной форме слова восстановить его основную форму. Ещё одна задача – по входным данным, содержащим неисходную форму слова, а также информацию о форме слова, которую мы хотим получить, построить желаемый результат (пример: утятах; родительный падеж, единственное число -> утёнка).

Основные таблицы базы данных: 1. словарь русского языка (таблица MorfDictionary); 2. наборы окончаний с правилами изменения основы слова (таблица Endings); 3. имена и описатели классов слов русского языка (таблица Classes); Дополнительная таблицы: 1. NounEndings для имен существительных Структура база данных:

Основные таблицы базы данных: MorfDictionary ID Word ClassID Endings Osnovi Classes ID Name Description PartOfSpeech Endings ID Content

Массив индексов и таблица NounEndings: Содержит номера основы для каждого окончания, позволяя установить однозначное соответствие между набором всевозможных окончаний, содержащимися в таблице NounEndings и всевозможными основами данного слова. На основе установленного соответствия, массив индексов позволяет решить задачу построения конкретной(нужной) формы слова. И (как обобщение) задачу построения полной парадигмы слова.

Примеры использования: Вводим в поисковой строке чаек: // - производное от слова чай [word] => чаек [padej] => Именительный [mn] => Единственное [rod] => Муж [word] => чаек [padej] => Винительный [mn] => Единственное [rod] => Муж // словоформа слова чайка [word] => чаек [padej] => Родительный [mn] => Множественное [rod] => Жен [word] => чаек [padej] => Винительный [mn] => Множественное [rod] => Жен

Выводы: Создана адекватная структура базы, удовлетворяющая поставленной задаче; Реализован морфологический анализатор для имен существительных русского языка, использующий оригинальный алгоритм обработки входного слова(таблица NounEndings и массив индексов)

Перспективы использования: Нормализация слов Построение произвольной формы слов Важная составляющая семантического анализатора