Your single-source partner for corporate product communication Опыт внедрения машинного перевода Полина Акопян STAR SPb, Россия STAR Group.

Презентация:



Advertisements
Похожие презентации
Автоматический перевод это - выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст.
Advertisements

Системы памяти переводов. Trados, Memsource Cloud, SmartCat.
Компания ПРОМТ представляет: Оптимизация документооборота с использованием интегрированных решений компаний ПРОМТ и TRADOS Елена Косматова Менеджер по.
Перевод с гибридным приводом. Структура презентации Современные тенденции на рынке перевода Отраслевые решения PROMT Гибридная технология PROMT Выводы.
Семинар учителей начальных классов Формирование навыка решения задач у младших школьников.
Дистанционный курс Master English (English Language Course For Masters of Mathematical and Mechanical Faculty) Центр сетевой педагогики Института современных.
Вебинар Программа вебинара 1.«Оценивание читательской грамотности обучающихся» Камзеева Елена Евгеньевна, начальник экспертно-аналитического.
Внедрение SDL Groupshare 2011 ООО «Прима Виста». Цели внедрения Повышение качества переводов в плане единства терминологии и согласованности. Сокращение.
Вспомогательные средства в работе переводчика Автор презентации Кокорева Инга.
Э ЛЕКТРОННЫЕ ОБРАЗОВАТЕЛЬНЫЕ РЕСУРСЫ В СИСТЕМЕ ОЦЕНКИ ПЛАНИРУЕМЫХ РЕЗУЛЬТАТОВ ЛИЧНОСТНО - ОРИЕНТИРОВАННОГО ОБРАЗОВАТЕЛЬНОГО ПРОЦЕССА Издательский комплекс.
«Современные технологии для качественной подготовки издания на иностранном языке» To view full-screen, press Ctrl+L Ольга Дерягина, Руководитель отдела.
Первая презентация для инвестора. О чем нужно сказать Список слайдов Название (титульный слайд) Проблема Решение Ноу-хау (ключевая технология) Бизнес-модель.
Требования к оценочным средствам для проведения Всероссийской олимпиады профессионального мастерства обучающихся по специальностям СПО в.
Название проекта Cформулируйте суть проекта в одном предложении Команда проекта.
Дистанционный курс Master English (English Language Course For Masters of Mathematical and Mechanical Faculty) Центр сетевой педагогики Института современных.
Готовимся к ЕГЭ по русскому языку Готовимся к ЕГЭ по русскому языку Школьная площадка.
Платформа обработки больших данных для анализа работы инфраструктуры энергосетей.
Рекомендации по разделу « Чтение » в ЕГЭ и ГИА Учитель английского языка МОУ СОШ 4: Полякова И. П.
Проверка боеготовности или как сделать сайт продающим? Татьяна Газизуллина, руководитель отдела продаж компании Webmaster.SPb.
Транксрипт:

Your single-source partner for corporate product communication Опыт внедрения машинного перевода Полина Акопян STAR SPb, Россия STAR Group

Your single-source partner for corporate product communication TFR 2015, Москва, июнь Машинный перевод, базирующийся на правилах (RBMT) Старейшая технология Основа: анализ текста на базе лингвистических правил Статистические системы машинного перевода Наиболее широко используемая Основа: подобранные базы перевода, Star Moses Гибридные системы Комбинация RBMT + SBMT Машинный перевод: типы систем

Solutions for Communication and Content Strategists TFR 2015, Москва, июнь Статистические системы Идея: перевод после обучения машины «Тренировка» на базе статистической модели перевод с помощью базы двуязычных текстов Собственно перевод: поиск/выдача переводов наибольшей вероятности Очевидное: высокая чувствительность к качеству текстовой базы

Solutions for Communication and Content Strategists TFR 2015, Москва, июнь Машинный перевод - стоит ли овчинка выделки ?

Solutions for Communication and Content Strategists TFR 2015, Москва, июнь Тестовый проект: ресурсы Star Moses, Transit NXT Существующая инфраструктура Инженеры Менеджер Переводчики в 37 странах мира 30-летние текстовые и терминологические базы данных

Solutions for Communication and Content Strategists TFR 2015, Москва, июнь Тестовый проект: зачем? Цель: Узнать, для каких заказов применима технология MП Где и сколько можно сэкономить Критерии: Статистика использования предложений MП Живые отзывы

Solutions for Communication and Content Strategists TFR 2015, Москва, июнь Тестовый проект: этапы «Тренировка» движка Претрансляция (с использованием TM) Формирование вариантов MП Перевод Оценка результатов: статистика использования MП- предложений, статистика правки и живые отзывы. Следующий круг

Solutions for Communication and Content Strategists TFR 2015, Москва, июнь Этап 1: «Тренировка» движка Основа: 10-летние референсы (экстракт млн. знаков) Подготовка базы Статистический анализ огромной, заточенной под проекты узкой тематики и единообразной структуры текстовой базы

Solutions for Communication and Content Strategists TFR 2015, Москва, июнь Этап 2: Претрансляция (на базе TM) Понятная всем процедура Стандартная опция Transitа Формирование экстракта референтов

Your single-source partner for corporate product communication Этап 3: Формирование вариантов MП Создание вариантов системой MT на этапе импорта Ответственные: заказчик/менеджер TFR 2015, Москва, июня

Your single-source partner for corporate product communication Варианты МП вместо непереведенного Варианты МП в дополнение к Fuzzy Matches Доперевод слов во фразах из памяти переводов Этап 4: Перевод TFR 2015, Москва, июнь

Solutions for Communication and Content Strategists TFR 2015, Москва, июнь Этап 5: Оценка результатов Автоматическая статистика сравнения результатов МП и «живого» перевода (в %) «Хорошо» = 20 % вариантов МП приняты без изменений «Хорошо» = более 90 % варианта МП, принятого с изменениями, не поправлено

Solutions for Communication and Content Strategists TFR 2015, Москва, июнь Этап 5: Оценка результатов Анкеты от переводчиков Когда работает – все довольны Хорошо работает на коротких сегментах Раздражает следующее: Если качество предлагаемого текста плохое, то неоправданно много времени тратиться на чтение. Дочитав, понимаешь, что лучше бы сразу перевел сам Множество вариантов перевода забивают окно - неудобно

Solutions for Communication and Content Strategists TFR 2015, Москва, июнь Таблицы «BLEU Score» Квалификация ошибок и подсчет их количества Типы ошибок: пропуск слов, потеря слов, неправильная грамматическая форма, не то слово Результаты для русского языка: пассивные/активные конструкции сложносочиненные предложения и однородные сказуемые предложные конструкции durch, mit Этап 5: Оценка результатов

Solutions for Communication and Content Strategists TFR 2015, Москва, июнь Итого: стоит ли? Очень хорошо на языках одной группы Хорошо на коротких предложениях База – это очень важно (результат МП: 20 % или 60%) Заметная экономия времени при большом объеме

Your single-source partner for corporate product communication Веб-сайт группы компаний Веб-сайт компании Спасибо за внимание Полина Акопян STAR SPb, Россия TFR 2015, Москва, июнь 2015