Информатика в школе www.klyaksa.netwww.klyaksa.net Системы распознавания текста Технология обработки текстовой информации.

Презентация:



Advertisements
Похожие презентации
Системы распознавания текста Технология обработки текстовой информации.
Advertisements

Системы распознавания текста Технология обработки текстовой информации.
помочь учащимся получить представление об OCR – программах распознавания текста, познакомиться с возможностями данных программы, воспитание информационной.
Система оптического распознавания документа. Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг.
Система оптического распознавания документа. Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг.
Система оптического распознавания документа Шинкаренко Евгений Александрович МОУ Гимназия 2 г. Чернняховск Калининградской области.
Системы распознавания текста Технология обработки текстовой информации.
Сканирование в программе оптического распознавания документов OCRAD Ахмедова Е.В. МОУ «СОШ 1» г.Осташков Лекция 10.
На дом: §17 Системы перевода и распознавания текстов.
Системы оптического распознавания символов. Оптическое распознавание символов механический или электронный перевод изображений рукописного, машинописного.
L/O/G/O Системы оптического распознавания документов 10 КЛАСС.
Информатика в школе Текстовые редакторы.
Системы распознавания и перевода текста В этой работе использована презентация учителя информатики Сердюковой Т.А. (г. Ставрополь)
Как сканировать книгу Установка режима сканирования Ставить разрешение сканирования 300 dpi (300 точек на дюйм) Для страниц, содержащих только текст –
Системы оптического распознавания текста Программа FINEREADER.
Сканирование
Системы оптического распознавания информации. Борисов В.А. Красноармейский филиал ГОУ ВПО «Академия народного хозяйства при Правительстве РФ» Красноармейск.
L/O/G/O Системы оптического распознавания документов.
Оптическое распознавание символов Боровикова Ксения ФЛ-401 г. Ростов-на-Дону 2011г.
Презентация к уроку по информатике и икт (9 класс) по теме: Презентация к уроку в 9 классе "Системы оптического распознавания документов"
Транксрипт:

Информатика в школе Системы распознавания текста Технология обработки текстовой информации

Информатика в школе Необходимость в системах распознавания символов С помощью сканера достаточно просто получить изображение страницы текста в графическом файле. Однако работать с таким текстом невозможно: как любое сканированное изображение, страница с текстом представляет собой графический файл - обычную картинку. Текст можно будет читать и распечатывать, но нельзя будет его редактировать и форматировать. Для получения документа в формате текстового файла необходимо провести распознавание текста, то есть преобразовать элементы графического изображения в последовательности текстовых символов.

Информатика в школе Программы распознавания текста Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition - OCR). Наиболее распространенные системы оптического распознавания символов: BBYY FineReader CuneiForm от Cognitive

Информатика в школе Получение электронного документа 1. Отсканировать изображение (с помощью ПО сканера); 2. Распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и т.д. 3. Выделенные текстовые фрагменты графического изображения страницы необходимо преобразовать в текст; 4. Проверка орфографии (если необходимо); 5. Сохранение в файл или передача текста в другое приложение, например в Word.

Информатика в школе Методы распознавания символов Если исходный документ имеет типографское качество то задача распознавания решается методом сравнения с растровым шаблоном. При распознавании документов с низким качеством печати используется метод распознавания символов по наличию в них определенных структурных элементов (отрезков, колец, дуг и др.).

Информатика в школе ABBYY FineReader FineReader - омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати. FineReader имеет массы дополнительных функций и удобный интерфес.

Информатика в школе Оптимальное разрешение при сканировании Оптимальным разрешением для обычных текстов является dpi и dpi для текстов, набранных мелким шрифтом (9 и менее пунктов). Сканирование в сером является оптимальным режимом для системы распознавания. В случае сканирования в сером режиме осуществляется автоматический подбор яркости. Если Вы хотите, чтобы содержащиеся в документе цветные элементы (картинки, цвет букв и фона) были переданы в электронный документ с сохранением цвета, необходимо выбрать цветной тип изображения. В других случаях используйте серый тип изображения.

Информатика в школе Вопросы: Зачем нужны программы распознавания текста? Как происходит распознавание текста? Какие программы распознания текста вы знаете? Какими пользовались? Какое разрешение является оптимальным для сканирования текста, изображений?