Автоматизация работы переводчиков по опыту работы Центра переводов технической документации Олег Выгодский Глеб Яльчик.

Презентация:



Advertisements
Похожие презентации
Александр Андреев Директор по маркетингу Компания ПРОМТ 15 сентября 2004 г. Пресс-конференция «Новая технология компьютерного перевода PROMT 7.0» Революция.
Advertisements

Квачев Алексей Компания ПРОМТ Технологии автоматизированного перевода как средство повышения эффективности работы с иноязычными документами в системе документооборота.
Системы памяти переводов. Trados, Memsource Cloud, SmartCat.
Александр Андреев Директор по маркетингу Компания ПРОМТ 15 сентября 2004 г. Пресс-конференция « Новая технология компьютерного перевода PROMT 7.0» Позиционирование.
Компания ПРОМТ представляет: Интегрированные решения компаний TRADOS и ПРОМТ - залог успешного бизнеса Елена Косматова Менеджер по работе с корпоративными.
Машинный перевод как инструмент переводчика Выгодский Олег Центр переводов «Аргонавт»
Программы переводчики. Словари. СРЕДСТВА АВТОМАТИЗАЦИИ ПЕРЕВОДОВ 2.
На дом: §17 Системы перевода и распознавания текстов.
Компания ПРОМТ представляет: Оптимизация документооборота с использованием интегрированных решений компаний ПРОМТ и TRADOS Елена Косматова Менеджер по.
Мы делаем мир понятным! Новая линия продуктов PROMT XT (eXcellent Translator) - эффективное средство по автоматизированному переводу иноязычного контента.
Системы машинного перевода. 2 СРЕДСТВА АВТОМАТИЗАЦИИ ПЕРЕВОДОВ.
Компьютерные словари и системы компьютерного перевода текста Урок информатики 10 класс.
Интерфейс текстового процессора Microsoft Word. С помощью ленты можно быстро находить необходимые команды (элементы управления: кнопки, раскрывающиеся.
В данной презентации к вашему вниманию предлагается обзор комплекса C&CTools, состоящего из двух программ C&CView и C&CEditor.
Сетевое решение по переводу для отрасли информационных технологий PROMT Translation Server 10 IT и телекоммуникации.
Компьютерные словари и системы компьютерного перевода текста Урок информатики 10 класс.
Текстовая информация и компьютер 2014 г.. Тексты в компьютерной памяти Как представляются тексты в памяти компьютера Для представления текстовой информации.
Компьютерные словари и системы машинного перевода текстов.
ИНСТРУМЕНТЫ РАСПОЗНОВАНИЯ ТЕКСТОВ И КОМПЬЮТЕРНОГО ПЕРЕВОДА ОБРАБОТКА ТЕКСТОВОЙ ИНФОРМАЦИИ.
Транксрипт:

Автоматизация работы переводчиков по опыту работы Центра переводов технической документации Олег Выгодский Глеб Яльчик

Центр переводов Тематика переводов –телекоммуникации –оборудование и ПО –электроника –механика Локализация ПО Используемые DTP –Microsoft Word –Corel Ventura –QuarkXpress –Page Maker –Frame Builder –Frame Maker –Interleaf Особенности –большие объемы ( стр в месяц на переводчика) –согласование терминологии с заказчиком –использование MT –использование TM –обновление версий документации

Одна из основных идей работы - разделение труда переводчиков и верстальщиков. В нашем случае текст, подлежащий переводу, извлекается из исходного файла. В результате получается обычный ASCII-файл (вся служебная информация о формате сохраняется в отдельном служебном файле). Таким образом, переводчик просто переводит текст и не занимается его оформлением. Как правило, формат ASCII-файла не зависит от исходного формата.

Разделение труда Исходный документ Исходный документ (в формате DTP) Исходный документ Текст для перевода (ASCII) Исходный документ Служебная информация Исходный документ Переве- денный текст (ASCII) Исходный документ Исходный документ (в формате DTP)

Разделение труда Пакетная обработка Машинный перевод Постредактирование Постобработка Сам процесс перевода документации распадается на следующие базовые операции

Разделение труда Исходный документ Исходный документ (в формате DTP) Исходный документ Текст для перевода (ASCII) Исходный документ Служебная информация Исходный документ Переве- денный текст (ASCII)

Разделение труда Исходный документ Перевед. документ (в формате DTP) Исходный документ Служебная информация Исходный документ Переве- денный текст (ASCII) Исходный документ Готовый перевод (в формате DTP) По окончании этапа перевода текст и служебная информация объединяются в конечный документ в исходном формате DTP

Этапы процесса перевода Извлечение текста (разборка) Дополнительная фильтрация Перевод текста Восстановление файла (сборка) Корректирующая верстка Корректура (по бумаге)

Поддерживаемые форматы RTF MIF HTML SGML Interleaf TROFF/NROFF

Для повышения комфортности и скорости работы переводчиков мы создали рабочее место переводчика на базе текстового процессора MultiEdit 7.0. Этот редактор был выбран с учетом его открытости и возможности расширения, что позволило реализовать (наряду со стандартными функциями ввода/обработки текста) такие дополнительные функции, как синхронный просмотр текста, доступ к удаленным словарям, цветовое выделение и пр.

Организация рабочего места переводчика

Особенности MultiEdit Многофайловые поиск/замена Регулярные выражения Цветовое выделение Расширяемость –синхро-просмотр –дополнительные буферы обмена –вызов удаленных словарей

Применение машинного перевода

Одним из основных инструментов, облегчающих работу переводчика в нашем центре переводов, является система машинного перевода Stylus (ПРОМТ).

Основные требования к MT корректная обработка грамматических правил корректная работа с несколькими словарями, включая их настройку сохранение исходного формата переводимого текста

Информация, вводимая в словарь Очень серьезное влияние на качество работы системы машинного перевода оказывает степень настройки словарей (системы). Кроме генерального, должны использоваться специализированные словари (отражающие как тематику перевода, так и специфику конкретных документов).

Информация, вводимая в словарь общая лексика базовая терминология терминология, специфичная для переводимой документации часто встречающиеся обороты/фразы/выражения (т.н. микросегменты)

Примеры микросегментов it is assumed that - предположим, что if otherwise not specified - если не указано иное note that - следует отметить, что this command displays/enters/deletes - по этой команде отображается/вводится/удаляется the following window is appeared - появляется следующее окно

Для эффективной настройки словаря необходимо: знать предмет перевода знать основы грамматики постоянно пополнять и обновлять словарь сильно не "вредить" Например, если введено "even if" (даже в том случае, если), то фраза "The bit selected is even if... в нашем случае будет переведена неправильно: Выбранный бит - даже в том случае, если...

Мы полагаем, что одним из критериев качества специализированного словаря является доля статей, состоящих из нескольких слов (словосочетаний). Специализированность словаря напрямую связана с количеством словосочетаний, уникальных для рассматриваемой тематики перевода.

Анализ словарей по числу слов

Преимущества системы МТ упрощение работы по постредактированию управление единообразием терминологии/стиля генерация online-словарей упрощение процесса адаптации нового персонала

Еще одним важным инструментом в работе переводчика является система Translation Memory (ТМ). В нашем центре переводов применяется система Transit (STAR).

Применение Translation Memory

Функции Translation Memory использование ранее переведенных фрагментов сохранение терминологии сохранение стиля сохранение оформления увеличение комфортности для переводчика

Принцип TM Исходный документ Исходный документ (в формате DTP) Текст содержа- щийся в документе Текст included в документе Text included in document Слово содержа- щийся стражник красный Word included watchguard red Текст содержа- щийся в документе Text included in document Текст содержа- щийся в документе Text included in document Исходный документ Перевод докумен- та (в формате DTP) фильтрация сегментация претрансляция перевод сохранение

Transit: операции фильтрация сегментация претрансляция перевод верификация сохранение

В настоящее время мы состыковали системы МТ (Stylus) и ТМ (Transit) в единую технологическую цепочку. Перед поступлением файла переводчику он сначала обрабатывается системой Тranslation Memory, а затем непретранслированные сегменты переводятся системой МТ. Только после этого обработанный файл поступает переводчику.

Интеграция MT + TM

Интеграция системы Transit Исходный документ Исходный документ (в формате DTP) Исходный документ Текст для перевода (ASCII) Исходный документ Служебная информация Исходный документ Переве- денный текст (ASCII) Исходный документ Исходный документ (в формате DTP) TRANSIT

Интеграция системы Transit TRANSIT Текст для перевода (ASCII) сегментацияпретрансляция претранслировано не распознано к переводчику МТ-перевод MT

Интеграция системы Transit Исходный документ Перевед. документ (в формате DTP) Исходный документ Служебная информация Исходный документ Переве- денный текст (ASCII) Исходный документ Готовый перевод (в формате DTP) По окончании этапа перевода текст и служебная информация объединяются в конечный документ в исходном формате DTP

Резюме Разработанная нами технология работы по переводу позволяет: –существенно ускорить процесс перевода, –сделать его более комфортным, –минимизировать ручной труд, –повысить качество/единообразие переведенных документов

Наши реквизиты Центр переводов С-Петербург, , ул. Благодатная, д. 2 тел: +7 (812) факс: +7 (812)