На дом: §17 Системы перевода и распознавания текстов.

Презентация:



Advertisements
Похожие презентации
Система оптического распознавания документа. Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг.
Advertisements

Система оптического распознавания документа Шинкаренко Евгений Александрович МОУ Гимназия 2 г. Чернняховск Калининградской области.
Система оптического распознавания документа. Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг.
Системы оптического распознавания символов. Оптическое распознавание символов механический или электронный перевод изображений рукописного, машинописного.
помочь учащимся получить представление об OCR – программах распознавания текста, познакомиться с возможностями данных программы, воспитание информационной.
Компьютерные словари и системы машинного перевода текстов.
Системы распознавания текста Технология обработки текстовой информации.
Информатика в школе Системы распознавания текста Технология обработки текстовой информации.
Системы распознавания текста Технология обработки текстовой информации.
L/O/G/O Системы оптического распознавания документов.
Текстовая информация и компьютер 2014 г.. Тексты в компьютерной памяти Как представляются тексты в памяти компьютера Для представления текстовой информации.
Презентация к уроку по информатике и икт (9 класс) по теме: Презентация к уроку в 9 классе "Системы оптического распознавания документов"
Системы оптического распознавания форм. При проведении Единого государственного экзамена, при заполнении налоговых деклараций и т. д. используются различного.
Гипертекст. Используется для отображения в тексте смысловых связей между основными разделами или понятиями. Позволяет структурировать документ путем выделения.
ИНСТРУМЕНТЫ РАСПОЗНОВАНИЯ ТЕКСТОВ И КОМПЬЮТЕРНОГО ПЕРЕВОДА ОБРАБОТКА ТЕКСТОВОЙ ИНФОРМАЦИИ.
ИНСТРУМЕНТЫ РАСПОЗНОВАНИЯ ТЕКСТОВ И КОМПЬЮТЕРНОГО ПЕРЕВОДА ОБРАБОТКА ТЕКСТОВОЙ ИНФОРМАЦИИ Информатика и ИКТ.
Устройства ввода информации Выполняла Сорокина К. 9б.
ИНСТРУМЕНТЫ РАСПОЗНОВАНИЯ ТЕКСТОВ И КОМПЬЮТЕРНОГО ПЕРЕВОДА Информатика и ИКТ.
Системы оптического распознавания текста Программа FINEREADER.
Работа с текстовыми документами. Ввод текста При подготовке текстовых документов на компьютере используются три основные группы операций: ввод редактирование.
Транксрипт:

На дом: §17 Системы перевода и распознавания текстов

Основные вопросы: как работают программы-переводчики; как работают программы-переводчики; распознавание текста; распознавание текста; ввод в компьютер печатного и рукописного текста. ввод в компьютер печатного и рукописного текста.

Как работают программы- переводчики Чтобы найти перевод неизвестного иностранного слова, пользователю электронного словаря достаточно ввести это слово в строке поиска, и уже через несколько мгновений будет получен перевод. Современные текстовые процессоры имеют в своем составе словари, позволяющие производить орфографическую проверку правильности написания слов (на разных языках).

Рассмотрим простой пример. Переведем с помощью системы перевода на английский язык фразу: Информатика это наука об информации. Результат перевода: The computer science is an information science. А теперь с помощью той же программы переведем эту фразу на русский язык. Получим: Информатика информатика.

Электронные устройства: Ectaco partner er 900 delux может не только переводить слова и выражения с русского на английский и с английского на русский языки, но и распознавать вашу речь, проигрывать музыку и даже обучать английскому языку! Переводчик оснащён цветным сенсорным дисплеем, может воспроизводить музыку с карты памяти.

Корпус и комплектующие:

Крупные кнопки, цветной сенсорный экран

Например ABBY Fine Reader Программы оптического распознавания текста

Распознавание текста

Окно программы FineReader Строка меню Панели инструментов Текущий пакет страниц Блочная структура текста Результат распознавания

Процесс обработки FineReader Сканирование (сканер, цифровой фотоаппарат, цифровая видеокамера). Сканирование (сканер, цифровой фотоаппарат, цифровая видеокамера). Сегментация - выделение блоков на изображении. Сегментация - выделение блоков на изображении. Распознавание – неоднозначно опознанные символы выделяются цветом. Распознавание – неоднозначно опознанные символы выделяются цветом. Проверка ошибок- можно провести проверку грамматики. Проверка ошибок- можно провести проверку грамматики. Сохранение результатов в виде отформатированного или неотформатированного документа, или прямой передачи в другое приложение - WORD, Excel в буфер обмена Windows. Сохранение результатов в виде отформатированного или неотформатированного документа, или прямой передачи в другое приложение - WORD, Excel в буфер обмена Windows.

Система оптического распознавания символов Если исходный документ имеет типографическое качество (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений), то задача распознавания решается методом сравнения с растровым шаблоном. Если исходный документ имеет типографическое качество (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений), то задача распознавания решается методом сравнения с растровым шаблоном. При распознавании документов с низким качеством печати (машинописный текст, факс и т.д.) используется метод распознавания структурных элементов (отрезков, колец, дуг и др.) символов. В искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов. При распознавании документов с низким качеством печати (машинописный текст, факс и т.д.) используется метод распознавания структурных элементов (отрезков, колец, дуг и др.) символов. В искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов.

Система оптического распознавания форм Бланком называется стандартный лист бумаги, на котором размещается постоянная информация и отведено место для переменной. Бланком называется стандартный лист бумаги, на котором размещается постоянная информация и отведено место для переменной. Сложность состоит в том, что необходимо распознать написанные от руки символы, довольно сильно различающиеся у разных людей. Сложность состоит в том, что необходимо распознать написанные от руки символы, довольно сильно различающиеся у разных людей. Кроме того система должна определить, к какому полю относится распознаваемый текст. Кроме того система должна определить, к какому полю относится распознаваемый текст. FineReader Forms

Система оптического распознавания форм Для обработки бланков предназначено специальное приложение FineReader Forms. Для обработки бланков предназначено специальное приложение FineReader Forms. Для распознавания содержимого бланка необходимо предварительно создать шаблон формы. Для распознавания содержимого бланка необходимо предварительно создать шаблон формы. Сервис/ Шаблоны Шаблон используют на этапе сегментации. Сегментация в данном случае состоит в наложении шаблона. Шаблон используют на этапе сегментации. Сегментация в данном случае состоит в наложении шаблона. Положение шаблона корректируется в соответствии с тем, насколько ровно был размещён бланк при сканировании. Положение шаблона корректируется в соответствии с тем, насколько ровно был размещён бланк при сканировании. Заключительный этап состоит в распознавании содержимого бланка. Заключительный этап состоит в распознавании содержимого бланка.

Система распознавания рукописного текста С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ. С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.

Распознавание рукописного текста