ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЕКТА ABBYY Оптическое распознавание и машинный перевод Давид Ян (ABBYY)

Презентация:



Advertisements
Похожие презентации
Система понимания и перевода естественного языка ABBYY Compreno Александр Костюченко ABBYY.
Advertisements

Компьютерный анализ естественно-языкового текста Кафедра информационных систем в искусстве и гуманитарных науках.
Компьютерная лингвистика как наука. 1. Определения компьютерной лингвистики 2. Компьютерная лингвистика и искусственный интеллект 3. Разделы компьютерной.
Связь правовой информатики с другими науками 1. Кибернетика Семиотика Лингвистика Когнитивная психология Теория информации Информациология 2.
ЗАДАЧИ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ. 1.Что такое компьютерная лингвистика? 2. История. 3. Направления компьютерной лингвистики. 4. Заключение.
"Электронные библиотеки " Дубна Россия Метаданные в системе управления многоязычной лингвистической базой знаний Н.В. Лунева Институт.
Система оптического распознавания документа. Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг.
Гипертекст. Используется для отображения в тексте смысловых связей между основными разделами или понятиями. Позволяет структурировать документ путем выделения.
ИНСТРУМЕНТЫ РАСПОЗНОВАНИЯ ТЕКСТОВ И КОМПЬЮТЕРНОГО ПЕРЕВОДА Информатика и ИКТ.
Технологии ABBYY для работы с документами и данными Юрий Корюкин, Директор по корпоративным проектам Юрий Корюкин, Директор по корпоративным проектам ABBYY.
L/O/G/O Системы оптического распознавания документов 10 КЛАСС.
ИНСТРУМЕНТЫ РАСПОЗНОВАНИЯ ТЕКСТОВ И КОМПЬЮТЕРНОГО ПЕРЕВОДА ОБРАБОТКА ТЕКСТОВОЙ ИНФОРМАЦИИ.
Организация корпоративных архивов и баз знаний с помощью платформы eDocLib. Технологии и успешные проекты. Сергей Полтев.
Для реализации интеграции с другими АС существует методология, регламентирующая выполнение работ по организации информационного взаимодействия между ЭА.
Анализ тональности сообщений Лидия Михайловна Пивоварова Системы понимания текста.
Исследование рынка труда в области компьютерной лингвистики Татьяна Ландо
Технологии обработки бумажных документов в ECM системах 2010.
ПРОГРАММНАЯ СИСТЕМА ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ТЕКСТОВ (ПС INEX) Исследовательский центр искусственного интеллекта Института программных систем РАН г. Переславль-Залесский.
Оптическое распознавание символов Боровикова Ксения ФЛ-401 г. Ростов-на-Дону 2011г.
ИНСТРУМЕНТЫ РАСПОЗНОВАНИЯ ТЕКСТОВ И КОМПЬЮТЕРНОГО ПЕРЕВОДА ОБРАБОТКА ТЕКСТОВОЙ ИНФОРМАЦИИ.
Транксрипт:

ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЕКТА ABBYY Оптическое распознавание и машинный перевод Давид Ян (ABBYY)

Тренды Технологии О компании

ТРЕНДЫ ТЕХНОЛОГИИ О КОМПАНИИ

Диджитализация Компьютеризация Интернетизация Глобализация РОСТ ОБЪЕМА ИНФОРМАЦИИ

ЦИФРОВАЯ ВСЕЛЕННАЯ

КОЛИЧЕСТВО ДАННЫХ – ЭТО ЕЩЕ НЕ ВСЕ … Данные плохо структурированы Часто существуют в нередактируемых форматах Информация существует на разных языках

ВЫЗОВЫ ЦИФРОВОЙ ЭПОХИ Инфраструктурные: хранение большого количества данных организация быстрого и безопасного доступа из любой точки мира Сервисные: трансформация данных в знания (оцифровка, распознавание, понимание) удобный и эффективный поиск информации в неструктурированном массиве данных

ТРЕНДЫ ТЕХНОЛОГИИ О КОМПАНИИ

ТЕХНОЛОГИИ ABBYY Распознавание Трансформация данных (бумага/pdf –редактируемый формат/MS-Office) Извлечение особенно данных из структурированных и гибких форм (data capture) Семантико-синтаксический анализ и построение семантических представлений для предложений в текстах на естественных языках Перевод (происходит за счет полного синтаксического анализа предложения, его семантической интерпретации и синтеза из универсальной семантической структуры предложения на выходном языке) Извлечение данных из неструктурированных текстов

РАСПОЗНАВАНИЕ

COMMONLY USED RECOGNITION TECHNOLOGIES

ПРИМЕРЫ РАСПОЗНАВАНИЯ ABBYY FINEREADER

ПРИМЕРЫ РАСПОЗНАВАНИЯ ABBYY FINEREADER 1 2 3

ПРИМЕРЫ РАСПОЗНАВАНИЯ ABBYY FINEREADER

СЕМАНТИКО-СИНТАКСИЧЕСКИЙ АНАЛИЗ И ПОСТРОЕНИЕ ПРЕДСТАВЛЕНИЙ ДЛЯ ПРЕДЛОЖЕНИЙ В ТЕКСТАХ НА ЕСТЕСТВЕННЫХ ЯЗЫКАХ

ПРИМЕРЫ ПЕРЕВОДА So at last I took my courage in both hands, and I came down to get the papers for myself. Итак, наконец я взял себя в руки и я спустился, чтобы получить документы для себя. Так наконец я взял свою храбрость в обе руки, и я снизился, чтобы получить бумаги для меня непосредственно. Так в конце концов я взял смелость в обеих руках, и я пришел, чтобы получить документы для себя. Оригинал: ABBYY: МТ1: МТ2:

ПРИМЕР СЕМАНТИКО- СИНТАКСИЧЕСКОГО ПРЕДСТАВЛЕНИЯ СТЕКЛО СТЕКЛО НА СТЕКЛО

Распознавание речи Умный поиск. (получение ответа на вопрос, заданный на естественном языке) Реферирование Определение авторства текста ИСПОЛЬЗОВАНИЕ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ ДЛЯ ДРУГИХ ПРИКЛАДНЫХ ЗАДАЧ

ТРЕНДЫ ТЕХНОЛОГИИ O КОМПАНИИ

МЫ ПОМОГАЕМ ЛЮДЯМ ПОНИМАТЬ ДРУГ ДРУГА