А.А. Рогов, А.В. Скабин, И.А. Штеркель Петрозаводский Государственный Университет.

Презентация:



Advertisements
Похожие презентации
Лекция 12 Быстрое преобразование Фурье Нахождение спектральных составляющих дискретного комплексного сигнала непосредственно по формуле ДПФ требует комплексных.
Advertisements

Анализ вариационных рядов. Анализ вариационных рядов. Основные понятия и определения Генеральная совокупность – множество всех значений, характеризующих.
МИНИСТЕРСТВА ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ СУМСКОЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ КАФЕДРА КОМПЬЮТЕРНЫХ НАУК Комплексная магистерская работа: Разработка информационного.
Выполнил: Горелов С.С. Под руководством: с.н.с. Афонин С.А., проф. Васенин В.А. Усечение пространства поиска в полуструктурированных данных при помощи.
Лекция по предмету интеллектуальные информационные системы Искусственный интеллект в обработке изображений и распознавании образов на них Автор: к.т.н.
Разработка алгоритмов распознавания текста на основе клеточных автоматов Автор: Суясов Д. И. Руководитель: Шалыто А. А., д.т.н., профессор.
Распознавания речи распознавания речи. Что такое распознавание речи? Система преобразования речевых сигналов в текст либо в набор управляющих команд.
Проблемы распознавания речи славянских языков Хейдоров И.Э. Белорусский государственный университет Сакрамент ИТ.
Лектор Янущик О.В г. Математический анализ Раздел: Определенный интеграл Тема: Определенный интеграл и его свойства. Формула Ньютона - Лейбница.
Исследование физических моделей Преподаватель Иванская С.А.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Визуализация данных Визуализация данных Точечные оценки Точечные оценки Групповые характеристики Групповые характеристики Метод.
Запись ответов и замена ошибочных меток осударственная тоговая ттестация 9 классов 2013 ГБУ ПО «Центр оценки качества образования»
Метод поиска лиц на изображениях по симметрии и лицевым признакам к.т.н. Варламов А.Д
ИНФОРМАЦИОННАЯ ЧУВСТВИТЕЛЬНОСТЬ КОМПЬЮТЕРНЫХ АЛГОРИТМОВ И ЕЁ КОЛИЧЕСТВЕННЫЕ МЕРЫ д.т.н., профессор М.В. Ульянов Кафедра «Управление разработкой программного.
ПРОБЛЕМЫ ПРИМЕНЕНИЯ КЛАССИЧЕСКИХ МЕТОДОВ РАСПОЗНАВАНИЯ ДЛЯ ФОТОГРАФИЧЕСКИХ ИЗОБРАЖЕНИЙ ПЫЛЬЦЕВЫХ ЗЕРЕН АИСТ-2013 КОНФЕРЕНЦИЯ ПО РАСПОЗНАВАНИЮ ИЗОБРАЖЕНИЙ.
Алгебра и начала анализа. Логарифмическая функция.
Распознавание двух- и трехмерных жестов ладони на основе анализа скелетного представления ее силуэта Куракин Алексей Владимирович Московский Физико-Технический.
Анализ информации, содержащейся в изображении На примере бинарных изображений Бинарное изображение – изображение, пиксели которого принимают всего два.
Классификация, кластеризация и поиск изображений на основе низкоуровневых характеристик Наталья Васильева Руководитель: Новиков Б. А.
1 Составление алгоритмов с ветвлением Цель: научиться составлять блок-схемы с ветвлением.
Транксрипт:

А.А. Рогов, А.В. Скабин, И.А. Штеркель Петрозаводский Государственный Университет

На сегодняшний день в архивах России накопился большой объем нерасшифрованных стенографических документов. В XIX и начале XX веков стенография в России находилась в процессе становления, поэтому существующие документы записаны в разных системах.

Бинаризация документов; создание БД графики стенографических символов; кластеризация изображений стенографических символов; создание базы данных стенографических символов; выделение строк; разработка математической модели распознавания символа; поиск символа в базе данных;

Гистограммы RGB и HSB

оригинальное изображение имеет низкое качество; при бинаризации происходят разрывы символов; при сегментации возникает необходимость разбиения символов

Отношение высоты к ширине; Подсчет количества сегментов; Поиск по шаблону; Сравнение проекций; Граф на основе точек сопряжения; Сравнение длин отрезков; Моменты Ху; Метод «Shape context».

Отношение высоты к ширине Подсчет количества сегментов Поиск по шаблону h w

Сравнение проекций Граф на основе точек сопряжения;

Сравнение длин отрезков

Моменты Ху Hu1 0,21470,20940,21760,21170,1938 Hu2 0,01390,01090,01360,00530,0034 Hu3 1,5925E-051,8696E-055,60783,0727E-055,6286E-06 Hu4 1,2413E-051,7896E-054,3674E-059,3077E-064,7169E-06 Hu5 1,7090E-103,1893E-102,1551E-091,5224E-102,4304E-11 Hu6 8,5411E-071,2221E-063,6388E-061,6644E-077,9079E-08 Hu7 3,5408E-11-7,3859E-11-1,6609E-103,9974E-111,5291E-13

Метод «Shape context» Определение номера корзины для точки:

Сравнение гистограмм: K – множество корзинок h i (k), h j (k) – значения гистограмм p i, q j – точки изображений π(i) – i-й вариант назначений

Методы, основанные на проекции изображения на вертикальную ось (центров символов, количества символов, черных пикселей символов); Метод поиска символа, ближайшего к уже найденному символу в строке; Комбинированный алгоритм

Искривление строк при письме: Подстрочные и надстрочные символы: Исправления в тексте:

- последовательность стенографических символов - множество его возможных распознаваний для символа - возможные трактовки распознанного символа - распознанный текст

Ставится задача найти такой набор индексов, чтобы вероятность правильного распознавания была максимальной., где На основании формулы Байеса равна Оценка k-го (k>3) имеет вид

Ac – точность вычисления - расстояние между символом и его возможным эталонным значением - частота появления комбинации символов

, где частота появления фрагмента текста Данная оценка производится на основании анализа текстов автора, в данном случае Ф.М. Достоевского.