Оценка качества машинного перевода Критерии и методы.

Презентация:



Advertisements
Похожие презентации
Вспомогательные средства в работе переводчика Автор презентации Кокорева Инга.
Advertisements

Принципы отражения лингвистической терминологии в автоматическом словаре.
Компания ПРОМТ представляет: Оптимизация документооборота с использованием интегрированных решений компаний ПРОМТ и TRADOS Елена Косматова Менеджер по.
«Современные технологии для качественной подготовки издания на иностранном языке» To view full-screen, press Ctrl+L Ольга Дерягина, Руководитель отдела.
1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Смирнов Иван Валентинович с.н.с. ИСА РАН.
Критерии оценивания раздела «Письмо» Для оценивания коммуникативных заданий раздела «Письмо» применяется сочетание двух рейтинговых шкал. Система предусматривает.
Квачев Алексей Компания ПРОМТ Технологии автоматизированного перевода как средство повышения эффективности работы с иноязычными документами в системе документооборота.
Компьютерная лингвистика как наука. 1. Определения компьютерной лингвистики 2. Компьютерная лингвистика и искусственный интеллект 3. Разделы компьютерной.
Иностранный язык как лингвистическое открытие. В основе темы должен быть анализ одного или нескольких понятий (терминов) лингвистики; должен быть представлен.
Комплексная технология автоматической классификации текстов ИПИ РАН Васильев В.Г.
Александр Андреев Директор по маркетингу Компания ПРОМТ 15 сентября 2004 г. Пресс-конференция «Новая технология компьютерного перевода PROMT 7.0» Революция.
Автоматический перевод это - выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст.
Естественно-языковые системы Выполнили: Книга А., Мишалевский С., Нагорный А., Крупский П. Группа – 9ВМ40-04.
Русский язык. 9 класс Государственная итоговая аттестация по русскому языку выпускников 9-х классов в новой форме.
ПРОГРАММНАЯ СИСТЕМА ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ТЕКСТОВ (ПС INEX) Исследовательский центр искусственного интеллекта Института программных систем РАН г. Переславль-Залесский.
Требования к оценочным средствам для проведения Всероссийской олимпиады профессионального мастерства обучающихся по специальностям СПО в.
кака КАК НИКТО НЕ МОЖЕТ ДАТЬ ДРУГОМУ ТОГО, ЧТО НЕ ИМЕЕТ САМ, ТАК И НЕ МОЖЕТ РАЗВИВАТЬ, ОБРАЗОВЫВАТЬ И ВОСПИТЫВАТЬ ДРУГИХ ТОТ, КТО НЕ ЯВЛЯЕТСЯ САМ РАЗВИТЫМ,
Матрица связи между ISO 9001:2008 и ISO 9001:2015.
Сообщество аналитиков России Управление качеством требований Уровни зрелости процесса управления требованиями.
По материалам «Учебно-методических материалов для подготовки председателей и членов территориальных предметных комиссий по заданий с развернутым ответом.
Транксрипт:

Оценка качества машинного перевода Критерии и методы

Характеристика исследования Объект: качество полученного МП Предмет: критерии оценки и методы их измерения Материал: машинный перевод текстов, представляющих собой аннотации (раздел Abstract) к статьям с диска Machine Translation Summit VIII, выполненные системой Прагматика Метод: сопоставление выходных и оригинальных текстов.

Категории пользователей систем машинного перевода обычные пользователи администраторы профессиональные переводчики

Классификации критериев Стандарты Международной Организацией по Стандартизации (ISO, ) Стандарты Экспертного совета в области инженерной лингвистики (EAGLES 1, 1996) Международные стандарты инженерной лингвистики (EAGLES II – ISLE, 2000) Итоговая таксономия характеристик оценки качества машинного перевода (ISLE, 2004)

Системные характеристики скорость и время выполнения перевода характеристики редактирования словари (возможность и легкость их обновления) отказоустойчивость удобство представления информации стоимость

Критерии оценки выходных текстов в качестве характеристик сопоставления смысла оригинала и перевода: точность перевода правильный перевод терминологии в качестве характеристик содержания текста: вразумительность понятность в качестве характеристик представления на языке перевода: естественность лингвистическая правильность связность

Методы оценки качества выходных текстов обратный перевод сравнение с эталонным переводом трансформационный метод денотативный метод анкетирование пользователей анализ ошибок по лингвистическим уровням (лексика, грамматика)

Нарушение лексической правильности при переводе имен собственных: Key–Sun Choj - Ключевое Солнце Цой Daniel J Walker – Даниель J Ходок при переводе аббревиатур: ISLE (International Standards for Language Engineering) - ОСТРОВ D.C (District Columbia) - Постоянный Ток

Нарушение лексической правильности при переводе терминологии (использование общеязыкового значения из автоматического словаря): evaluators - вычислители (надо: оценщики) fidelity - преданность (надо: точность) fuzziness - расплывчатость (надо: неопределенность) mining - горная промышленность (надо: извлечение)

Неверное снятие конверсионной омонимии : Исходный текста: Section 4 presents evaluation results in the context of MSR-MT… Машинный перевод - Определение качества подарков раздела 4 приводит в контексте MSE-MT… (Наличие в рамках одного фрагмента нескольких конверсионных омонимов)

Лексическая правильность и лексические ошибки система настроена на перевод текстов данной предметной области лексические ошибки - следствие неправильного снятия лексической многозначности конверсионная омонимия - источник синтаксической омонимии

Решения занесение лексических единиц и их сочетаний в автоматический словарь. усовершенствование способа описания лексических единиц в автоматическом словаре

Анкетирование корреляция критериев: понятности и лексической правильность связности и грамматической правильности тексты в целом являются приемлемыми завышенные ожидания анкетируемых

Итог Необходимость организации и обеспечения эффективной обратной связи между пользователем и разработчиком для получения качественного машинного перевода