Алексей Дмитриевич Варламов Руслан Владимирович Шарапов Владимирский государственный университет RCDL2012 Переславль-Залесский, 17 октября 2012 г.

Презентация:



Advertisements
Похожие презентации
Метод поиска лиц на изображениях по симметрии и лицевым признакам к.т.н. Варламов А.Д
Advertisements

ПРОГНОЗИРОВАНИЕ ДЕЯТЕЛЬНОСТИ ПРЕДПРИЯТИЯ Теоретические основы анализа результатов прогнозирования Лекция 7.
ФАКУЛЬТЕТ ПРИКЛАДНОЙ МАТЕМАТИКИ и ИНФОРМАТИКИ Тарасюк Александр Евгеньевич СИСТЕМА РАСПОЗНАВАНИЯ ЛИЦ НА ОСНОВЕ НЕЙРОННОЙ СЕТИ.
Информационный маркетинг Лекция 5 Основы формирования спроса и предложения на рынке ИПУ. Оценка конкурентоспособности ИПУ.
ТРЕХЭТАПНАЯ ОБРАБОТКА ЦИФРОВЫХ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ ЭВОЛЮЦИОНИРУЮЩИХ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ* Цой Ю.Р., Спицын В.Г. Кафедра вычислительной.
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Проект : Ассоциативный поиск информации с помощью нейронных сетей. Задача: методы кластеризации данных.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Лекция по предмету интеллектуальные информационные системы Искусственный интеллект в обработке изображений и распознавании образов на них Автор: к.т.н.
Система управления РТК Основная задача системы управления роботом – автоматизация деятельности человека-оператора. Составные части: Система технического.
Выполнил: Горелов С.С. Под руководством: с.н.с. Афонин С.А., проф. Васенин В.А. Усечение пространства поиска в полуструктурированных данных при помощи.
Воспроизведение лучших результатов ad hoc поиска семинара РОМИП Romip-base project Красильников Павел, Механико-математический факультет МГУ им. Ломоносова.
ОЦЕНКА УРОВНЯ КАЧЕСТВА ПРОДУКЦИИ. Технический уровень качества – это оценка технического уровня, которая заключается в установлении соответствия продукции.
О ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ МЕТОДОВ КОМПЛЕКСНОЙ СРАВНИТЕЛЬНОЙ ОЦЕНКИ ДЛЯ АНАЛИЗА СИСТЕМЫ ЗАЩИТЫ ПЕРСОНАЛЬНЫХ ДАННЫХ ШИРОКОВ Е.В. Омский государственный технический.
ОЦЕНКА УРОВНЯ КАЧЕСТВА ПРОДУКЦИИ. Технический уровень качества – это оценка технического уровня, которая заключается в установлении соответствия продукции.
Лекция 8: Метод группового учёта аргументов (МГУА) Метод наименьших квадратов Общая схема алгоритмов МГУА Алгоритм с ковариациями и квадратичными описаниями.
Регрессионный анализ. Основная особенность регрессионного анализа: при его помощи можно получить конкретные сведения о том, какую форму и характер имеет.
Выделение терминов из документов с заданным тематическим делением Голомазов Денис Дмитриевич Механико - математический факультет МГУ 5 курс 15 апреля 2008.
Прогнозирование финансовых рынков с использованием нейронных сетей Выполнила: Кокшарова А.А. ПНИПУ, ФПММ гр. ММЭм-12 Руководитель: к. ф.-м.н. Шумкова Д.Б.
Применение генетических алгоритмов для генерации тестов к олимпиадным задачам по программированию Буздалов М.В., СПбГУ ИТМО.
Транксрипт:

Алексей Дмитриевич Варламов Руслан Владимирович Шарапов Владимирский государственный университет RCDL2012 Переславль-Залесский, 17 октября 2012 г.

Существует несколько направлений поиска по изображениям: поиск по описаниям (найти изображение, помеченное как «Совершенно секретно» или «Москва»), поиск по содержанию (найти фотографию человека или изображение, к примеру, берёзы), поиск по визуальному образцу (найти изображения, похожие на заданное) и т.д.

Цель работы: рассмотрение вопросов построения системы поиска по визуальному образцу в относительно больших (десятки тысяч) коллекциях изображений. Рассматриваемые вопросы: - Выявление ключевых признаков изображений для поисковых задач, - Применение нейронных сетей для реализации машинного обучения оценке тематической близости изображений, - Результаты исследований и перспективы развития.

изображения, обладающие визуальным подобием изображения, обладающие частичным визуальным подобием изображения, не обладающие визуальным подобием

Поиск изображений по визуальному образцу сводится к решению задачи определения степени визуального подобия двух произвольных изображений или отнесению пары картинок к одному из двух классов: подобные или не подобные между собой. С этой точки зрения данную проблему можно рассматривать как задачу из теории распознавания образов, где каждый образ (пара изображений) необходимо представить набором существенных признаков. Пара изображений Признаки пары Близость изображений в паре Однако, в реальных информационно-поисковых системах при индексации анализируются не пары, а отдельные изображения. Поэтому признаки пар должны быть основаны на признаках отдельных изображений, которым посвящена следующая часть.

Докладчик: Варламов А.Д.

Можно использовать очень большое число признаков для анализа пар изображений на визуальное подобие, но такая численность является крайне нежелательной. Во-первых, время работы результирующего алгоритма напрямую зависит от количества признаков, так как в данном случае велико количество величин, которые требуется рассчитать. Во-вторых, большее число признаков усложняет архитектуру нейронной сети, что приводит к увеличению требований к ресурсам, задействованным в процессе машинного обучения, и времени самого обучения. В третьих, существует избыточность признаков из-за их взаимной корреляции и потенциальное наличие признаков, которые могут не влиять не результат. Такую избыточность желательно устранить.

Многие признаки коррелированны между собой. Это видно на диаграммах рассеяния. Признаки: средние значения красной и зеленой составляющих (k = 0,79) Признаки: средняя яркость и медиана (k = 0,87) Признаки: наличие симметрии и медиана (k = 0,26) Кроме того, различные признаки имеют разную степень корреляции с целью. Также признаки различаются по трудоемкости алгоритмов их вычисления. Все эти факторы необходимо учесть при их отборе!

Таким образом, необходимо сокращение числа признаков, но проводимое не вслепую в ущерб качества результата, а с обеспечением наибольшего снижение трудоемкости их вычисления при наименьшей потери точности результата обучения. В основе метода сокращения количества признаков можно использовать различные методы понижения размерности данных, например факторный анализ, feature selection и другие. Мы предлагаем в качестве критерия отбора признаков использовать величину: где x – значимость признака, определенная методом сокращения размерности данных, t – время вычисления признака, ca – корреляция значения признака с целью, j – номер признака.

Ключевые признаки в дальнейшем используются: - для обучения нейронной сети оценки близости изображений. - (при приемлемых результатах) при индексации изображений для формирования их поисковых образов (сигнатур) в информационно поисковой системе. Отбор предлагается выполнять классическим способом анализа графика каменистой осыпи, в которой значимость признаков определена по предложенному авторами критерию. Признак Значимость

докладчик : Варламов А.Д.

Была сконструирована двухслойная нейронная сеть, структура которой приведена на рисунке. 1 слой – значения признаков; 2,3 слои – формальные нейроны Мак-Каллока; 4 слой – выходное значение, соответствующее степени близости.

Для обучения нейронной сети использовался генетический алгоритм. Причины выбора данного способа обучения: Генетические алгоритмы хорошо распараллеливаются, при этом обладая свойством масштабируемости (больше потоков – быстрее обработка). Многие алгоритмы обучения могут свести решение к локальному оптимальному результату (локальный минимум ошибки) и не смогут его улучшить при сколь угодно большом количестве попыток. Генетический алгоритм в данном случае способен выйти из данного локального минимума и найти более оптимальное решение (процедура мутации). Авторы обладают опытом обработки и анализа изображений с использованием технологий машинного бучения, который реализовался в нейроимитаторе Сигнейро ( Данная технология успешно опробована в различных задачах работы с цифровыми изображениями. С использованием эвристик разработан быстрый генетический алгоритм обучения нейросети.

Существует большое количество метрик, оценивающих качество работы информационно-поисковых систем (полнота, точность и т.д.). В работе в качестве критерия оптимизации используется количество безошибочных откликов сети на все пары выборки. Это позволяет максимизировать аккуратность (метрика accuracy) или минимизировать ошибку (метрика error). График изменения аккуратности от количества прошедших поколений генетического алгоритма обучения нейросети представлен на рисунке. Аккуратность Кол-во поколений % 50

ХарактеристикаОсобенность значение ПрецедентПара изображений и степень их близости Количество входовСоответствует количеству используемых признаков Количество выходовОдин, со значением 1 или 0. Количество эпох нейросети в процессе обучения Равно произведению количества особей генетического алгоритма на количество поколений обучения Особь генетического алгоритмаНабор синаптических весов сети Необходимость предварительной обработки данных перед обучением Имеется. Заключается в вычислении признаков для всех пар изображений значений признаков

Значения ключевых признаков Формирование обучающей выборки Вычисление признаков изображений Отбор изображений Обучение нейронной сети Пары изображений Изображения Экспертны е оценки степени близости каждой пары Значения признаков Параметры сети Прогон нейронной сети Показатели качества оценки на обучающей выборке Отбор изображений Изображения Формирование тестовой выборки Пары изображений Выбор признаков, которые можно использовать для оценки тематической близости Признаки Факторный анализ признаков и анализ временных характеристик их вычисления Показатели качества оценки на тестовой выборке Оценки асессоров степени близости каждой пары Вычисление признаков изображений Ключевые признаки Сопоставление результатов. Вывод о репрезентативности обучающей выборки Значения ключевых признаков Требование к расширению обучающей выборки Коллекция изображений

Этап 1. Из коллекции изображений формируется обучающая выборка. Она состоит из множества прецедентов, каждый из которых включает в себя пару изображений и степень их близости, оцененную экспертом. Этап 2. Программно реализуются (при необходимости и разрабатываются) алгоритмы вычисления всевозможных признаков на изображениях. Этап 3. Для каждой пары изображений вычисляются значения всех признаков. Этап 4. Проводится факторный анализ признаков, в результате которого определяются главные признаки, значения которых будут использоваться в обучении нейронной сети и алгоритмы вычисления которых станут частью конечного алгоритма оценки визуального подобия изображений. Этап 5. Обучается нейронная сеть. По завершению этого процесса запоминаются данные, характеризующие величины ошибок нейронной сети относительно входной выборки. Эти показатели преобразуются в полноту и точность целевые значения оценки качества выполняемой работы. Этап 6. Из коллекции изображений формируется тестовая выборка. Ее структура и характеристики (объем, соотношение близких и неблизких пар) должны соответствовать структуре и характеристикам обучающей выборки. Этап 7. Вычисляются значения ключевых признаков всех изображений, входящих в тестовую выборку. Этап 8. Прогоняется нейронная сеть на тестовой выборке с определением полноты и точности. Этап 9. Сравниваются полнота и точность анализа нейронной сетью изображений обучающей выборки с полнотой и точностью анализа нейронной сетью изображений тестовой выборки. При приблизительно одинаковых значениях соответствующих показателей работа считается завершенной.

докладчик : Шарапов Р.В.

В проведенном исследовании мы остановились на работе с 25 признаками, наиболее часто используемыми в задачах анализа изображений. В связи с тем, что поиск может осуществляться в больших коллекциях изображений, в качестве признаков мы рассматривали только те, которые можно просчитать для изображений заранее и занести в некое подобие поискового индекса. По этой причине, нами не рассматривались те признаки, которые необходимо рассчитывать по парам изображений непосредственно при осуществлении поиска.

Средние значения компонент R, G, B изображения в цветовой модели RGB; Медиана яркости; Детализированность; Признак симметрии изображения; Признак наличия текстур; Пропорции сторон; Наличие лиц на изображении; Нормированные 16-ти уровневые гистограммы по компонентам Y (яркости), U, V изображения в цветовой модели YUV; Среднеквадратичное отклонение яркостей уменьшенных копий (размером 32х32 пикселя) образца и рассматриваемого изображения.

В качестве набора исходных данных использовалась коллекция Flickr семинара РОМИП. В ней содержится фотографий разного качества и без единой темы; имеются фотоснимки людей, пейзажи, городские сцены и т.д. Фотографии сделаны при разном освещении, в помещениях, на улице и т.д. Из данной коллекции в обучающую выборку были отобраны 500 пар, среди которых 125 являются тематически близкими, а 375 нет. Тестовой выборкой являлось специальное задание дорожки семинара РОМИП с результатами работы группы асессоров.

Для осуществления поиска изображений по визуальному подобию на основе полученной нейронной сети была разработана программная оболочка Axioma. В процессе поиска она извлекает данные сигнатур (значения признаков) из поискового индекса, осуществляет вычисление меры близости образца к изображениям коллекции и ранжирует результаты поиска.

Полнота (recall) Точность (precision) значения метрик для изображений обучающей выборки значения метрик для изображений тестовой выборки значения метрик для изображений тестовой выборки РОМИП

Таким образом, была создана экспериментальная система, способная осуществлять поиск изображений по визуальному подобию в достаточно больших коллекциях. Вошедшая в оптимизационный критерий временная характеристика позволила минимизировать трудоемкость итогового алгоритма, который обладает линейным порядком временной сложности. В дальнейшем, при увеличении объемов обучающей и тестовой выборок, качественный показатель может быть улучшен и даже превзойден значения аналогов, так как на данный момент имеются расхождения в показателях обучающей и тестовой выборок.

Увеличение объемов обучающей выборки. Более жесткий отбор пар обучающей выборки. Расширение набора признаков изображений.

Спасибо за внимание!