Оптическое распознавание символов Боровикова Ксения ФЛ-401 г. Ростов-на-Дону 2011г.

Презентация:



Advertisements
Похожие презентации
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ СОЗДАНИЯ И ОБРАБОТКИ ТЕКСТОВ.
Advertisements

Системы распознавания текста Технология обработки текстовой информации.
Распознавание изображений. 1 Принципы IPA: - Принцип целостности (integrity) -Принцип целенаправленности (purposefulness) -Принцип адаптивности (adaptability)
Система оптического распознавания документа. Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг.
Информатика в школе Системы распознавания текста Технология обработки текстовой информации.
Системы распознавания текста Технология обработки текстовой информации.
Система оптического распознавания документа. Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг.
помочь учащимся получить представление об OCR – программах распознавания текста, познакомиться с возможностями данных программы, воспитание информационной.
Ю.Н.Филиппович, А.Ю.Филиппович, ИНТЕГРИРОВАННЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ В МЕДИАИНДУСТРИИ Слайд-лекции для студентов специальности «Информационные технологии.
Система оптического распознавания документа Шинкаренко Евгений Александрович МОУ Гимназия 2 г. Чернняховск Калининградской области.
Системы оптического распознавания символов. Оптическое распознавание символов механический или электронный перевод изображений рукописного, машинописного.
L/O/G/O Системы оптического распознавания документов 10 КЛАСС.
L/O/G/O Системы оптического распознавания документов.
НОМИНАЦИЯ : ПРОЕКТНАЯ И ТВОРЧЕСКАЯ ДЕЯТЕЛЬНОСТЬ УЧАЩИХСЯ/ ИНФОРМАТИКА И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ НАЗВАНИЕ РАБОТЫ: ABBYY FINEREADER АВТОР: ГРЕЧУШНИКОВА.
Презентация к уроку по информатике и икт (9 класс) по теме: Презентация к уроку в 9 классе "Системы оптического распознавания документов"
Электронный офис. Это система автоматизации работы учреждения, основанная на использовании компьютерной техники.
Системы оптического распознавания информации. Борисов В.А. Красноармейский филиал ГОУ ВПО «Академия народного хозяйства при Правительстве РФ» Красноармейск.
Цели и задачи урока: Формирование знаний о системах оптического распознавания документов. Контроль знаний и умений: тестирование, выполнение зачетной.
На дом: §17 Системы перевода и распознавания текстов.
Программы работы с текстом. Текстовые редакторы и процессоры Программы работы с текстом. Текстовые редакторы и процессоры Информатика и ИКТ 8 класс Гимназия.
Транксрипт:

Оптическое распознавание символов Боровикова Ксения ФЛ-401 г. Ростов-на-Дону 2011г.

Оптическое распознавание - это механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе.

Плюсы Перевод в текстовый вид очень сложных текстовых документов, включая таблицы, формы, диаграммы, рисунки Проверка орфографии Сохранение файла в любом текстовом формате, а также в форматах электронных таблиц и баз данных

OCR - optical character recognition (оптическое распознавание символов)

История OCR Программы появились сначала в США, а затем, и в России. OCR - optical character recognition (оптическое распознавание символов) 1978 год - компания «Курцвейл Компьютер Продактс» начала продажи коммерческой версии компьютерной программы оптического распознавания символов

Программы OCR Recognita Plus DTK фирмы Recognita Corporation †, Венгрия TextBridge фирмы †Xerox Imaging Systems TypeReader фирмы ExperVision †, США СharacterEyes фирмы Ligature, Израиль IRIS OCR фирмы I.R.I.S.,Бельгия Easy Reader фирмы† Inovatic International, Франция WordScan Plus и OmniPage Professional †фирмы Caera, США

Системы OCR в России OCR CuneiForm; † † ABBYY FineReader

Этапы преобразования документа в электронный вид OCR-системами Сканирование и предварительная обработка изображения Анализ структуры документа Распознавание Проверка результатов Реконструкция документа (воссоздание его исходного вида) Экспорт

Описание OCR-процедуры 1.Предварительная обработка изображения 2.Распознавание объектов высших уровней. Бинаризация 3.Распознавание символов 4.Структурирование гипотез. Словарная проверка 5.Синтез электронного документа

Базовые принципы технологий распознания текста Принципы IPA: Целостность (integrity) Целенаправленность (purposefulness) Адаптивность (Adaptability) Многоуровневый анализ документа

Принципы IPA Согласно принципу целостности (integrity), созерцаемый объект рассматривается как целое, состоящее из связанных частей

Принципы IPA Принцип целенаправленности (purposefulness) - любая интерпретация данных преследует определенную цель. Согласно этому принципу, распознавание представляет собой процесс выдвижения гипотез о целом объекте и целенаправленной их проверки

Принципы IPA Принцип адаптивности (adaptability) подразумевает способность системы к самообучению.