SDL Proprietary and Confidential Постредактирование МП Новые горизонты в переводах и локализации Мелисса Кейн.

Презентация:



Advertisements
Похожие презентации
Профессиональные переводчики и МП: выбор стратегии Постредактирование МП.
Advertisements

Квачев Алексей Компания ПРОМТ Технологии автоматизированного перевода как средство повышения эффективности работы с иноязычными документами в системе документооборота.
SDL BeGlobal Trainer: как очень быстро настроить МП, имея хорошую (-ие) ТМ.
Александр Андреев Директор по маркетингу Компания ПРОМТ 15 сентября 2004 г. Пресс-конференция «Новая технология компьютерного перевода PROMT 7.0» Революция.
Вспомогательные средства в работе переводчика Автор презентации Кокорева Инга.
Michael Jackson
«Современные технологии для качественной подготовки издания на иностранном языке» To view full-screen, press Ctrl+L Ольга Дерягина, Руководитель отдела.
Компания ПРОМТ представляет: Оптимизация документооборота с использованием интегрированных решений компаний ПРОМТ и TRADOS Елена Косматова Менеджер по.
Александр Андреев Директор по маркетингу Компания ПРОМТ 15 сентября 2004 г. Пресс-конференция « Новая технология компьютерного перевода PROMT 7.0» Позиционирование.
Урок повторения по теме: «Сила». Задание 1 Задание 2.
Системы памяти переводов. Trados, Memsource Cloud, SmartCat.
Типовые расчёты Растворы
Ребусы Свириденковой Лизы Ученицы 6 класса «А». 10.
Innovation Day. 12 основных фактов о SaaS-бизнесе Оценка стоимости размещения в Azure.
Школьная форма Презентация для родительского собрания.
1. Определить последовательность проезда перекрестка
Компания ПРОМТ представляет: Интегрированные решения компаний TRADOS и ПРОМТ - залог успешного бизнеса Елена Косматова Менеджер по работе с корпоративными.
Алексей Иванов Агентство ISEE Marketing Анализ поведения пользователей на сайте и управление конверсией.
© 2007 Cisco Systems, Inc. All rights reserved.SMBE v Cisco SMB University for Engineers Настройка маршрутизаторов Cisco с интегрированными услугами.
Транксрипт:

SDL Proprietary and Confidential Постредактирование МП Новые горизонты в переводах и локализации Мелисса Кейн

Мир меняется

Меняется ландшафт Рост рынков экспорта Рост глобальной конкуренции Основа - выбор потребителя Новые каналы коммуникации

4 Рост потребности в автоматизированном переводе

Прирост контента по языкам за десятилетие 5 Арабский - в 20 раз Китайский – в 20 раз Португальский – в 9 раз Испанский – в 7 раз Французский – в 6 раз Английский – в 3 раза

6

Основные факторы роста потребности в МП 7

Улучшение отношения к МП

75% используют бесплатный МП Примерно ¾ всех пользователей интернета применяют легкодоступные бесплатные переводческие сервисы МП по умолчанию 54% неанглоязычных пользователей применяют МП при посещении сайтов на английском языке Язык влияет на покупки 85% респондентов отмечают, что наличие предпродажной информации на их родном языке является существенным фактором ВОСПРИЯТИЕ МП ПОТРЕБИТЕЛЯМИ (НА ОСНОВАНИИ ОТЧЕТА Common Sense Advisory)

Предложение услуги Post-Editing MT (PEMT): Common Sense Advisory From: Why Every LSP Needs to Consider Post-Edited MT, Copyright © 2012 by Common Sense Advisory, Inc., March 2012

Выбор правильного продукта

Определение типов контента Websites Help Software User Interface Blogs Wikis Volume User Forums Support FAQ User Reviews User Guides IM Product Descriptions Knowledge Base Alerts/Notifications Documentation/Manuals SMS Требуются переводы высокого качества Качество Ручной перевод Постредактирование Машинный перевод В требуемых объемах переводить не сможет никто Объем Legal / Contracts HR Docs Marketing Content Newsletters Advertising КАЧЕСТВО vs ОБЪЕМ vs ВИДЫ ПЕРЕВОДОВ

Определение целей получения перевода Высококачественный перевод ПостредактированиеЧерновой МП Для высококачественного контента Для последующего доведения до уровня публикуемого контента Для получения перевода в условиях, когда наиболее всего актуальны общее понимание сути текста и стоимость результата Если заказчик перевода требует строгого соблюдения терминологии, брендинга, культурных и качественных соответствий Если существенным фактором является корректное использование терминологии заказчика, а также терминологии предметной области и брендинга Когда брендинг и точное соблюдение терминологии менее важны, чем скорость получения результата перевода

Понимание различий Исходный текст на немецком языке Черновой МПМП после постредактиров ания Ручной перевод Aber nicht nur äußerlich hat dieses Festplatten- gehäuse einiges zu bieten. But not only on the outside, this hard drive enclosure has something to offer. But it's not only on the outside where this hard drive casing has something to offer. However, this hard drive casing boasts more than just great design.

Понимание различий II Исходный немецкий Черновой МПОтредактирован ный МП Ручной перевод Die hochwertigen Kopfhörer sind ergonomisch geformt und mit einem 13,5mm Lautsprecher versehen um das höchstmögliche Klangspektrum darzustellen. The high-quality earphones are ergonomically designed and provided with a 13.5 mm speaker in order to represent the highest possible spectrum of sound. The high-quality earphones are ergonomically designed and equipped with a 13.5 mm speaker in order to represent the highest possible range of sound. The high-quality earphones are ergonomically designed and feature a 13.5 mm speaker which delivers an unparalleled sound experience.

Понимание различий III Исходный немецкий Черновой МПОтредактирован ный МП Ручной перевод Mit unserer Erfahrung im technischen und organisatorischen Bereich, sind wir der kompetente Ansprechpartner für unseren Kunden. With our experience in technical and organizational area, we the skilled point of contact for our customers. With our experience in the technical and organizational area, we are a skilled point of contact for our customers. With our technical and organizational experience, we are a trusted partner for our customers.

Как добиться высокого качества МП? 17 Ни одна из систем МП без дополнительной настройки не в состоянии производить результат перевода высокого качества Это особенно верно для технической документации, богатой специальной терминологией Которая может быть как общепредметной, так и специфической для данной компании Какой процесс предлагается SDL iMT для получения нужного результата? Настройка модуля МП под проект Обучение навыкам постредактирования МП Правильная интеграция МП в переводческий процесс

Обучение модуля статистического машинного перевода (СМП): особенности 18 Почему обучение модуля СМП так важно? Для настройки терминологии и стиля на перевод конкретного контента, что делает процесс постредактирования менее трудозатратным Как настраиваются модули СМП? Используется корпус параллельных текстов определенной предметной области, например, в формате базы Translation Memory (TM) TM очищается и подготавливается по специальной процедуре Виды модулей СМП Baseline (Базовый) – для МП любого контента Verticals (Специализированный) – для определенных предметных областей, например, Автомобили, Путешествия, IT Customized (Пользовательский) – для конкретных областей применения пользователями

Базовые модули МП для языковых направлений Содержат сотни миллионов слов Использован контент из различных публичных источников, различных предметных областей При настройке специализированных и пользовательских модулей используются как база При получении дополнительных объемов контента значительным образом расширяются Базовые модули SDL (Baselines) 19

Обучаются и настраиваются на основе клиентских данных на двух языках Основные преимущества после выполнения настройки: соблюдение терминологии и стиля Чем больше контента, тем лучше качество МП Пользовательские модули (Customized) 20

Case Study

1000 веб-страниц, на 12 языков, на 50% быстрее? Сценарий 1 –Традиционный ручной перевод (без ТМ) Сценарий 2 –Традиционный ручной перевод + использование Translation Memory (TM) Сценарий 3 –Настроенный машинный перевод (MП) + постредактирование (PE) + Translation Memory (TM) Среднее число слов на страницу = 500 Объем проекта –1000 x 500 = слов 22

Сценарий 1 – Традиционный перевод (без TM) Объем = слов Скорость перевода = слов в день на 1 переводчика Условная стоимость перевода 1 слова = 0.17 Срок перевода на 1 язык, 5 переводчиков – /2 500/5 = 40 дней Стоимость проекта – x 0.17 = на 1 язык 23

Сценарий 2 – Традиционный перевод + ТМ Объем = слов Средняя скорость перевода = слов в день на 1 переводчика Условная стоимость перевода 1 слова = 0.17 Процент объема совпадений с Translation Memory = 50% Объем к переводу с учетом ТМ = x 0.5 = слов Срок перевода на 1 язык, 5 переводчиков – /2 500/5 = 20 дней Стоимость проекта – x 0.17 = на 1 язык 24

Сценарий 3 – Настроенный МП + PE Факторы, влияющие на прирост производительности –Качество МП: технология, язык, исходный контент, контент для настройки –Среда перевода (инструменты и технологии) –Ресурсы 25

Прирост производительности при использовании настроенного модуля МП Общее среднее - 43% Среднее сокращение временных затрат (1 – 1/(1+0.43)) = 30% 26

Сценарий 3 – Настроенный модуль МП + Постредактирование + TM Объем = слов Средняя скорость постредактирования =1.43 x 2,500 = ~3,500 слов в день Стоимость постредактирования при условии применения скидки 30% = 0.7 x 0.17 = 0.12/слово Процент объема совпадений с Translation Memory = 50% Объем для постредактирования = x 0.5 = 250,000 слов Срок выполнения перевода, 5 постредакторов на 1 язык – /3 500/5 = 14 дней Стоимость проекта – x 0.12 = на 1 язык 27

Результаты Настроенный МП + PE + TM –Сокращение времени на 30% по сравнению со сценарием Перевод + TM –Экономия - 150,000, что означает образование бюджета для перевода на 5 дополнительных языков ПереводПеревод + TM Настроенный МП+ PE + TM Слов для перевода, на 1 язык Слов для постредактирования, на 1 язык Срок перевода, 5 переводчиков на 1 язык40 дней20 дней 14 дней Стоимость перевода на 1 язык 85,000 42,500 30,000 Стоимость перевода на 12 языков1,020, , ,000 Экономия по сравнению с Перевод + TM 150,000 28

Высокопроизводительная технология МП –Общее качество МП –Наличие базовых языковых направлений как основы для настройки пользовательских модулей –Легкость настройки, доступность, безопасность Настройка модулей МП– возможность обучить систему работать с определенным контентом Интеграция – с современными переводческими инструментами и технологиями Ресурсы – опытные профессионалы Что необходимо для достижения такого уровня производительности? 29

Для соблюдения терминологии и стиля данной предметной области Для роста эффективности и производительности процесса постредактирования Для оценки прироста производительности Почему важна настройка модуля МП 30

Исходный текстНастроенный МППостредактированиеБазовый модуль МП Комментарии к базовому модулю In the event of a discharged battery, it is recommended that the 12 V battery be recharged via the charging lead connected to the mains supply (observe the minimum charge of 8 hours). In caso di batteria scarica, si raccomanda che la batteria 12 V essere ricaricata tramite il cavo di ricarica collegato all'alimentazione di rete (rispettare la carica minima di 8 ore). In caso di batteria scarica, si raccomanda chedi ricaricare la batteria da 12 V essere ricaricata tramite il cavo di ricarica collegato all'alimentazione di rete (rispettare la carica minima di 8 ore). In caso di batteria scarica, si raccomanda che i 12 V batteria ricaricabile tramite il cavo di ricarica collegata alla rete di alimentazione (osservare la tariffa minima di 8 ore). wrong word order Wrong translation in this context: "charge" translated as "fee" Disconnect the boot lid open sensor mounted on the lower arm of the boot lid mechanism (for access to the retractable roof). Scollegare il sensore sportello del bagagliaio aperto montato sul braccio inferiore del meccanismo dello sportello del bagagliaio (per accedere al tetto apribile). Scollegare il bagagliaio aperto sensore montato sul braccio inferiore del bagagliaio (per accedere al tetto apribile). wrong word order "lid mechanism" missing in the output Check auditive and tactile functioning of the exhaust camshaft dephaser solenoid valve (noise, vibration). Controllo tattile e uditivo del funzionamento dell'elettrovalvola del variatore di fase dell'albero a camme di scarico (rumore, vibrazioni). Effettuare un cControllo tattile e uditivo del funzionamento dell'elettrovalvola del variatore di fase dell'albero a camme di scarico (rumore, vibrazioni). Controllo funzionamento uditiva e tattile dell'albero a camme di scarico variatore (rumore, vibrazioni). Checking the passenger compartment heating resistor supply connection in relation with earth Controllo del collegamento dell'alimentazione resistenza riscaldamento abitacolo rispetto alla massa Controllare l'alimentazione della resistenza del riscaldamento abitacolo collegamento in relazione con la terra The term in bold is very long, very specific, and such terms are very challenging for MT if they are not in the training material. Важность настройки МП Настроенный МП: постредактирование 8% Базовый МП: постредактирование 45% 31

Эффективное постредактирование МП

Различные определения постредактирования МП (PEMT) The term used for the correction of machine translation output by human linguists/editors (Veale and Way 1997) checking, proof-reading and revising translations carried out by any kind of translating automaton (Gouadec 2007) In basic terms, the task of the post-editor is to edit, modify and/or correct pre-translated text that has been processed by a machine translation system from a source language (a) in to target language(s). (Allen 2003)

Основные виды постредактирования МП 34 Постредактирование до финального качества Наиболее часто выполняемый вид работ Обычно применяется для текстов повышенной видимости Постредактирование для понимания Требуется реже Применяется для текстов, не требующих массового использования

Отличные языковые навыки Знание предметной области Опыт работы с системами CAT и средствами автоматической проверки Положительное отношение к МП Практика, практика, практика Хорошему постредактору МП явно требуются… 35

Постредактирование в сравнении с редактированием 36 Постредактирование МП заменяет традиционный этап перевода Весьма отличается от редактирования ручного перевода Требуется понимание поведения системы После постредактирования МП может (или нет) потребоваться этап стандартного редактирования

Постредактирование для понимания 37 Менее высокие ожидания по качеству Фокус на смысле, а не на терминологии или стиле Ожидания основаны на требованиях клиента Требуется определить эти ожидания Типовые задачи для получения результата перевода: Предложение пользователям быстрого ответа на вопрос о том, как решить ту или иную проблему Предложение перевода для определенного типа контента (FAQs, блоги, Knowledge Bases)

38 Принципы постредактирования Убедитесь, что вся информация передана корректно Проверяйте все числовые выражения Проверяйте корректность терминологии Вносите необходимые изменения только в том случае, если значение передано неправильно или искажено Проверяйте корректность стиля Не меняйте структуру текста, если значение передано верно Всегда помните, что конкретные требования заказчика превалируют

Постредактирование и традиционный перевод 39 Базовые принципы традиционного перевода: Результат перевода должен быть корректным и истинным отображением исходного текста Перевод должен соответствовать всем правилам выходного языка Обязательным условием является последовательное использование правильной терминологии Необходимо применение соответствующего документу стиля Форматы дат и времени, единиц измерения, числовых выражений, валют и пр. должны быть адаптированы к правилам выходного языка Должно воспроизводиться форматирование исходного документа Перевод должен быть читабельным и пригодным для целей его использования Должны использоваться справочные материалы (проектные указания, базы TM, глоссарии, терминологические базы и т.д.) Постредакторы должны следовать стандартным процедурам (Q&A и т.д.)

Для того, чтобы эффективно постредактировать Пытайтесь использовать результат МП по максимуму Не стоит старатьсягениально переписать все заново – равно как и оставить все как есть Всегда перечитывайте результат перевода после постредактирования Находите те фрагменты в результате МП, использование которых может значительно ускорить работу

Внимание Прочитать исходный текст, затем МП Определить пригодные для использования фрагменты На старт Откорректир овать МП Не пытаться все переписать или оставить как есть Фокус – на корректности Пуск Проверить наличие всех элементов Исправить опечатки Проверить терминологию Этапы постредактирования 41

Порядок слов Дополнительные или отсутствующие слова Отрицание Составные конструкции или конструкции с дефисом Контекстная терминология Имена собственные Строчные или прописные Управление Антонимы Специальные проверки в случае СМП 42

Может ли в результате постредактирования МП быть получен высококачественный документ для публикации? Да Заметит ли заказчик разницу в стиле между документом, полученным в результате традиционного перевода – и в результате МП? Возможно Будет ли качество документа, полученного в результате постредактирования МП, быть менее приемлемым? Нет, поскольку оно основано на тех же принципах качества Вопрос последовательности соблюдения терминологии и стиля существенен только для постредактирования МП? Нет, при традиционном переводе этот вопрос так же важен Вывод: возможны некоторые стилистические различия между переводом, полученным традиционным путем, и результатом постредактирования МП. Ожидания по качеству 43

Copyright © SDL plc. All rights reserved. All company names, brand names, trademarks, service marks, images and logos are the property of their respective owners. This presentation and its content are SDL confidential unless otherwise specified, and may not be copied, used or distributed except as authorised by SDL.