21.03.20131 27 НИИ МО СССР (1957-1980гг.) и в ВИНИТИ РАН (1980-2002гг.) 27 НИИ МО СССР (1957-1980гг.) и в ВИНИТИ РАН (1980-2002гг.) Состояние и перспективы.

Презентация:



Advertisements
Похожие презентации
Использование систем RETRANS-MetaFraz в правительственных и государственных организациях, а также в центрах анализа информации Юрий Викторович Никитин.
Advertisements

"Электронные библиотеки " Дубна Россия Метаданные в системе управления многоязычной лингвистической базой знаний Н.В. Лунева Институт.
Компьютерная лингвистика как наука. 1. Определения компьютерной лингвистики 2. Компьютерная лингвистика и искусственный интеллект 3. Разделы компьютерной.
Автоматический перевод это - выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст.
Квачев Алексей Компания ПРОМТ Технологии автоматизированного перевода как средство повышения эффективности работы с иноязычными документами в системе документооборота.
Александр Андреев Директор по маркетингу Компания ПРОМТ 15 сентября 2004 г. Пресс-конференция « Новая технология компьютерного перевода PROMT 7.0» Позиционирование.
Системы памяти переводов. Trados, Memsource Cloud, SmartCat.
DocsVision 4.0 DocsVision 4.0 универсальная система управления документами и бизнес-процессами.
RusBroker (RB). Общие сведения Система «RusBroker» была разработана Департаментом ИТ инвестиционной компании OOO «Уником Партнер». Программный комплекс.
1 Новые решения по автоматическому переводу: линейка PROMT Translation Server 10.
Система мониторинга новостей InfoStream ©. Информационное пространство из одних рук Ландэ Дмитрий Владимирович, доктор технических наук, заместитель директора.
Translation Server 9.5. Государственные учреждения Банки Энергетика Нефть и газ Горнодобывающая и металлургическая промышленность КБ, НИИ и исследовательские.
Перевести? ЛЕГКО! ® Система электронного перевода SOYLEM Презентация продукта Астана, 2010 г.
Компания ПРОМТ представляет: Оптимизация документооборота с использованием интегрированных решений компаний ПРОМТ и TRADOS Елена Косматова Менеджер по.
Проекты ONLINE Ведение проектов в распределённом режиме, с участием заказчиков, исполнителей и соисполнителей Назначение.
Consilium credo experto Решения доверяйте экспертам «ИБР: Бюджетирование» «Информационные Бизнес Решения» © 2010 Москва Алексей АНДРЕЕВ коммерческий директор.
Перевод текста с помощью онлайновых переводчиков.
НАЧАТЬ ТЕСТ по КИТ2 Разработчики: Оскерко В.С., доцент, к.э.н. Панько Н.Г., студентка ДФФ-1, 2-й курс 2011 г.
Вспомогательные средства в работе переводчика Автор презентации Кокорева Инга.
Транксрипт:

НИИ МО СССР ( гг.) и в ВИНИТИ РАН ( гг.) 27 НИИ МО СССР ( гг.) и в ВИНИТИ РАН ( гг.) Состояние и перспективы развития систем фразеологического машинного перевода RETRANS-MetaFraz А.А. ХОРОШИЛОВ ЗАО RETRANS Technologies г. Москва 2009 г.

Традиционный перевод текстов Текст документа на исходном языке Переведенный текст документа Передача содержания текста средствами выходного языка Восприятие и понимание исходного текста

Концепция фразеологического машинного перевода Элементарные мыс- лительные образы Понятия (фразеологи- ческие словосочетания) Совокупность понятий и отношений между ними Сложные мысли- тельные образы Исходный текст Переведенный текст

Эволюция систем машинного перевода Традиционные системы машинного перевода (МП) Системы типа Translation Memory (ТМ) Системы фразеологического машинного перевода (ФМП)

Концепция построения систем фразеологического машинного перевода Основная единица смысла Иерархия словарей Интеллектуальные алгоритмы Фразеологические единицы (словосочетания, фразы) Словари Translation Memory Пользовательские словари Тематические словари Политематический словарь Процедуры морфологического и синтаксического анализа и синтеза, построенные на основе принципа аналогии

Машинный фразеологический перевод текстов Текст документа на исходном языке Переведенный текст документа Семантико- синтаксический синтез выходного текста Семантико- синтаксический и концептуальный анализ исходного текста Переход от понятий на исходном языке к поня- тиям на выходном языке

Архитектура ядерной части системы Политематические словари API ядра Определение локальной конфигурации Обработка исходного текста Определение глобальной конфигурации Ввод исходного текста Вывод выходного текста Ввод настроек перевода Обработка исходного предложения Обработка слов исходного текста Обработка исходного словосочетания ТРАНСФЕР Обработка выходного текста Обработка выходного предложения Обработка выходного словосочетания Обработка слов выходного текста Концептуальный анализ исходного текста Синтаксический анализ исходного текста Синтаксический анализ исходного словосочетания Морфологический анализ слов исходного текста Синтаксический синтез выходного текста Синтаксический синтез выходного словосочетания Морфологический синтез слов выходного текста Тематические словари Словарь пользова- телей Словари ТМ Словарь пользова- телей Личный поль- зовательский словарь Общий поль- зовательский словарь Грамматические таблицы для концептуального и семантико- синтаксического анализа и синтеза исходного текста Грамматические таблицы для семантико- синтаксического анализа и синтеза выходного текста Общий поль- зовательский словарь Общий поль- зовательский словарь

Покрытие текстов частотным словарем наименований понятий

Технология составление тематического словаря по корпусу текстов Корпус текстов по заданной тематической области (5-10 мгб.) Двуязычный тематический словарь ( тыс.) Автоматизированное назначение эквивалентов Выделение из текста наименований понятий Составление частотного словаря наименований понятий и выделение его частотной части Требуемые трудозатраты – 5-10 чел/мес.

Фрагмент тематического словаря

Комплекс программ и технологий АСС Исходный корпус текстов Пользовательские словари Автоматизированная словарная Служба (АСС) Параллельные Тексты (билингвы) Словарная база Комплекс программ и технологий АСС

Соотношение фразеологических словосочетаний в словаре

Пользовательские словари КоллективныйИндивидуальный Отраслевые (тематические) словари Отрасль 1Отрасль 2Отрасль N Translation Memory Политематический словарь Ядро RETRANS Взаимодействие словарей системы RETRANS в процессе перевода

Перевод текстов в автоматическом режиме

Перевод текстов в интерактивном режиме (вкладка - параллельный текст)

Перевод текстов в интерактивном режиме (вкладка - редактор предложения)

Высококачественный перевод Обучение системы Высококачественный автоматический перевод Редактирование промежу- точных результатов Автоматизированное составление пользовательских словарей Динамическое подключение пользовательских словарей Возможности интерактивного режима перевода cистемы RETRANS

RETRANS Персональная система RETRANS Windows-приложение (MS Word, Internet Explorer) Перевод документа SU RETRANS ML-2 Интерфейс интерактивного режима перевода Модуль пополнения словарной базы Словарная база системы RETRANS Исходный документ Пользовательские словари

RETRANS Преимущества персональной системы RETRANS Точно передают смысл наименований понятий Обеспечивают быстрое обучение системы на тематику предметной области или конкретных текстов Иерархия используемых в системе словарей позволяет: Точно настраиваться на тематику конкретных текстов (пользовательские словари) Адекватно переводить отраслевую терминологию (тематические словари) Обеспечить покрытие общеязыковой и периферийной лексики (политематические словари)

Сервер многопользовательской системы MU RETRANS ML-2 Словарная база системы RETRANS Модуль управле- ния сервером (АРМ администратора) Клиентское место переводчика Клиентское место переводчика Клиентское место переводчика RETRANS Корпоративная система RETRANS

RETRANS Многопользовательский сервер- переводчик RETRANS Сервер-переводчик Web-сервер Хранилище словарей пользователей АРМ-администратора АРМ рук. группы Web-клиентГруппа web-клиентов Поток запросов Группа переводчиков

Реализует все преимущества системы персональной системы Обеспечивает: Коллективную работу группы переводчиков Параллельный терминологически согласованный перевод больших текстов Совместное пополнение и использование всеми переводчиками пользовательских словарей Возможность использования коллективного опыта перевода аналогичных текстов Преимущества Преимущества корпоративной системы RETRANS

Сервер-переводчик Web-сайт Англоязычная web-страница Управление сервером переводчиком Русскоязычный Web-страница Перевод Web- страницы FTP-сервер Пользова- тельский словарь Обновление словарей сервера Модуль управ- ления сервером- переводчиком Модуль динамического пополнения словарей Словарная база Сервер-переводчик Web-сайта (Вариант с динамическим пополнением словарной базы ) Лингвисты АРМ адми- нистратора Запрос на перевод web-страницы

Портальный многомашинный RETRANS сервер-переводчик RETRANS Управляющий сервер База данных запросов Рабочие сервера Web-сервер Хранилище словарей пользователей АРМ-администратора АРМ рук. группы Web-клиентГруппа web-клиентов Группа пользователей Поток запросов

Результат автоматического перевода страницы сайта Федерального Агентства РосОЭЗ

Модификации систем MetaFraz (2009 г.) C 2009 г. Коммерческие версии системы RETRANS выйдут на рынок по торговой знаком MetaFraz MetaFraz Personal ML-2- п ерсональная двуязычная система MetaFraz Сorporate ML-2- м ногопользовательская двуязычная система MetaFraz Personal ML-3- п ерсональная трехъязычная система MetaFraz Сorporate ML-3- м ногопользовательская трехъязычная система MetaFraz Server ML-2- с ервер-переводчик Интернет-сайтов 3 направления перевода (Rus-Eng,Eng-Rus,Gen-Rus) 18 тематических словарей Общий объем тематических словарей – 0.8 млн. фраз.ед. Общий объем политематических словарей – 5.2 млн. фраз.ед.

Перспектива развития MetaFraz ( г.) MetaFraz Personal ML-4- п ерсональная четырехъязычная система MetaFraz Сorporate ML-4- м ногопользовательская четырехъязычная система MetaFraz Personal ML-6- п ерсональная шестиязычная система MetaFraz Сorporate ML-6- м ногопользовательская шестиязычная система MetaFraz Server ML-6- с ервер-переводчик Интернет-сайтов 6 направления перевода 50 тематических словарей Общий объем тематических словарей – 3.0 млн. фраз.ед. Общий объем политематических словарей – 8.0 млн. фраз.ед.

ПРЕССА О СИСТЕМЕ RETRANS Computerworld #12(317) от 2 апреля "Первое знакомство с Retrans Vista". …Особое внимание уделили пользователь- скому интерфейсу. Появились развитые возможности интерактивного перевода с автоматическим пополнением пользовате- льского словаря … Chip октябрь "Процент перевода". …Секрет успеха детища команды прост: в основе лежит оригинальная и, на мой взгляд, наиболее перспективная теория семантического, преимущественно фразеологического перевода профессора Г. Белоногова … Журнал Chip # "Экзамен по английскому". …Система машинного перевода Retrans из всех имеющихся у меня под рукой оказалась наиболее точной … PCWEEK #12 от 2-8 апреля "Новый инструментарий для переводчиков" …Программа базируется на уникальной технологии фразеологического перевода... предоставляет пользователю возможность создания собственного словаря … Chip апрель "Тайна сия велика есть". …машина предлагает, а человек выбирает наилучший вариант возможного толкования отдельных слов и целых словосочетаний … Подводная лодка октябрь "Матч переводчиков"....перспективная, на наш взгляд, система фразеологического машинного перевода Retans вполне достойна того, чтобы стать Выбором редакции…

СПАСИБО ЗА ВНИМАНИЕ Генеральный директор компаний ЗАО RETRANS Technologies ООО МетаФраз Доктор технических наук ХОРОШИЛОВ АЛЕКСАНДР АЛЕКСЕЕВИЧ Тел: (495) ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ ОБРАБОТКИ ТЕКСТОВ Системы фразеологического машинного перевода Информационно-аналитические и поисковые системы