Курсовая работа по теме Алгоритмы и технологии сжатия цифрового видео Выполнил: студент гр с-54 Куликов В.А.

Презентация:



Advertisements
Похожие презентации
Введение в сжатие видео Дмитрий Ватолин Московский Государственный Университет CS MSU Graphics&Media Lab Version 2.4.
Advertisements

Лекция 1 Алгоритмы сжатия изображений Медведева Елена Викторовна дисц. Цифровая обработка изображений.
Обзор методов сжатия видео Выполнили: Муравьев А. Пилин Д.
Видео в МСС Иванов Сергей, гр Содержание Аналоговые системы Цифровые системы Видео - приложения в МСС.
Цифровое фото и видео. Цифровая фотография Цифровые фотокамеры позволяют получить изображение высокого качества непосредственно в цифровом формате. Полученное.
Цифровое фото и видео Проверка домашнего задания: Оценить информационный объём цифровых звуковых файлов длительностью 10 секунд при глубине.
Видеоинформация-это изображение, зафиксированное на магнитной ленте, кинопленке, фотоснимке или оптическом диске, с которых оно может быть воспроизведено.
Сжатие информации - проблема, имеющая достаточно давнюю историю, гораздо более давнюю, нежели история развития вычислительной техники, которая обычно.
M ULTIMEDIA Natalya Solomeshch. MPEG-4 VISUAL Стандарт MPEG-4 Visual состоит из некоторой стержневой модели кодера/декодера и множества дополнительных.
Цифровое видео Мультимедиа технологии. Основные понятия Видеопоток характеризуется : Разрешением частотой кадров системой представления цветов. Из телевизионных.
Омпьютерная рафика Государственное образовательное учреждение начального профессионального образования ЯНАО «Надымское профессиональное училище» Работу.
Двоичное кодирование звука. Представление видеоинформации Информация и информационные процессы.
Сигнал, кодирование, декодирование, сжатие. Для передачи дискретных данных по каналам связи применяется два способа физического кодирования: - на основе.
Курсовая работа «Мультимедийные технологии» на тему «Мультимедийные технологии» по дисциплине «Информационные технологии» Студентки группы ВИС-31 Русаковой.
Методики первичной обработки оперативных фонограмм лекция по дисциплине «СПЕЦИАЛЬНЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ПРАВООХРАНИТЕЛЬНОЙ ДЕЯТЕЛЬНОСТИ»
Кодирование информации 9 класс (повторение). Кодирование информации Кодирование числовой информации Диапазон целых чисел, кодируемых одним байтом, определяется.
Фрактальное сжатие Домашних И.А.. Кодирование изображений Закодировать изображение – значит получить некоторый набор данных, по которому известный алгоритм.
Двоичное кодирование звука. Представление видеоинформации Информация и информационные процессы Скачать конспект к данной презентации Qo.do.aM - >>>мир.
Мультимедиа технологии. Лекция 4. Составляющие мультимедиа. Видео Антон Викторович Кудинов, доцент кафедры ВТ.
Описание формата МР 3 MP3 – это наиболее популярный формат хранения и передачи информации в цифровой.
Транксрипт:

Курсовая работа по теме Алгоритмы и технологии сжатия цифрового видео Выполнил: студент гр с-54 Куликов В.А

Основные проблемы с несжатым видео: -Большой видео поток -Несжатые данные занимают очень много места -Каналы передачи и возможности хранения ограничены Пример: Видео 720х576 пикселов 25 кадров в секунду в системе RGB и прогрессивной развертке потребует потока данных примерно в 240 Мбит/сек (т.е. 1.8 Гб в минуту). На DVD-ROM диск размером 4.7Гб войдет всего 2.5 минуты. => Нужно сжатие в 35 раз для записи фильма. Причины сжатия видео

Не существует метода оценки кадра полностью адекватному человеческому восприятию Не существует метода оценки пропущенных кадров, полностью адекватного человеческому восприятию Разные кодеки "затачиваются" под разные типы фильмов. Качество сжатия конкретного фильма может сильно зависеть от параметров кодирования. Любой кодек дает разное качество по кадрам одного и того же фильма

Технологии сжатия Без потерь качества С потерями качества Без потерь с точки зрения восприятия С естественной потерей качества С неестественными потерями качества

Что используется при сжатии Используется избыточность: Пространственная ( используется DCT или Wavelet преобразования) Временная (между кадрами, сжимается межкадровая разница) Цветового пространства ( RGB переводится в YUV и цветовые компоненты прореживаются) Когерентность областей изображения малое локальное изменение цвета Избыточность в цветовых плоскостях используется большая важность яркости для восприятия Подобие между кадрами на скорости 25 кадров в секунду соседние кадры, как правило, изменяются незначительно

Просторанственная и временная избыточность Пространственная избыточность – цвет большинства соседних точек одинаков. Временная избыточность – кадры весьма похожи

Межкадровая разница Именно такие кадры (с учетом поправки на компенсацию движения) и сжимает кодек. Их больше 99% в потоке. (Амплитуды – малы, изображение практически однородно)

Последовательное кодирование длины ПКД Особенности: 1)Хорошо подходит для черно-белых или 8 разрядных графических изображений, таких как кадры анимации. 2)Не подходит для естественных изображений с высоким разрешением. Кодек, использующий ПКД - Microsoft RLE (MRLE) КРАТКОЕ ОПИСАНИЕ ПКД кодирует последовательность пикселей одинакового цвета (например, черного или белого) как одиночное ключевое слово. Так, например, последовательность пикселей: может быть закодирована как 7 77 (семь 77).

Векторная квантизация VQ Особенности: 1)Процесс кодирования в вычислительном отношении интенсивен и не может быть выполнен в реальном времени без специализированных аппаратных средств. 2)Быстрый процесс декодирования. 3)Появление блочных артефактов при высоком сжатии. Кодеки, использующие VQ - Indeo, Cinepak КРАТКОЕ ОПИСАНИЕ При векторной квантизации изображение делится на блоки. Кодер идентифицирует класс подобных блоков и заменяет их на "универсальный" блочный представитель, составляет поисковую таблицу коротких двоичных кодов к "универсальным" блокам. Декодер использует поисковую таблицу, чтобы транслировать приблизительное изображение, составленное из "универсальных" блоков согласно поисковой таблице.

Дискретное косинус преобразование ДКП Особенности: 1)Появление блочных артефактов при высоком сжатии. 2)Излом острых граней. Случайное размытие в острых граней. 3)Большие требования к вычислительным мощностям. Кодеки, использующие ДКП - Motion JPEG, MPEG-1,MPEG-2, MPEG-4, H.261, H.263, H.266 КРАТКОЕ ОПИСАНИЕ ДКП - широко используемое преобразование при сжатии изображения. Данные о яркости и цвете сохраняются в виде коэффициента частоты.

Дискретное преобразование элементарной волны DWT Особенности: 1)большинство DWT кодеков осуществляют преобразование без блочных артефактов. 2)Алгоритмы сжатия, основанные на DWT, часто превосходят по быстродействию ДКП. 3)Субъективное качество видеоизображений, сжатых с DWT, может быть лучше, чем при ДКП с таким же коэффициентом сжатия. Кодеки, использующие DWT - - VxTremem, Intel Indeo 5.x, Intel Indeo 4.x

Кодирование разности кадров Особенности: 1)Может достигать лучшего сжатия, чем независимое кодирование отдельных кадров. 2)Ошибки накапливаются в кадрах после ключевого кадра, в конечном счете, требуя следующий ключевой кадр. КРАТКОЕ ОПИСАНИЕ Обычно изменения между соседними кадрами незначительны (например, в случае шара, летящего перед статическим фоном, большая часть изображения не меняется между кадрами). На этом основан алгоритм кодирования разности кадров.

Компенсация движения КД Особенности: 1) Cжатия видео выше, чем при кодировании разности кадров. 2)Стадия кодирования алгоритма КД в вычислительном отношении интенсивна. 3)Схема КД, используемая в международных стандартах MPEG, H.261, и H.263 работает лучше всего для сцен с ограниченным движением. Кодеки, использующие КД: VxTreme, MPEG-1,2, и 4, H.261, H.263, H.264 КРАТКОЕ ОПИСАНИЕ При сжатии, изображение делится на блоки. Для каждого блока кодируется вектор движения, указывающий на блок в предыдущем или следующем кадре, который схож с кодируемым блоком. Блок ссылки может совпадать с исходным или отличаться от него. Кодеку не требуется распознавать присутствие шара или другого объекта. Он лишь сравнивает блоки пикселей в декодированном кадре и кадре ссылки.

Типы кадров в потоке I-тип - кодирования данных на основе только текущего изображения; Р-тип - кодирование на основе текущего и предыдущего кадров; В-тип - кодирование с учетом текущего предыдущего и последующего кадров;

Форматы файлов -AVI (Audio Video Interlive) -MPEG (Motion Picture Experts Group) - ASF (Advanced Streaming Format)

AVI -Формат с перемежающимися блоками аудио- и видеоинформации -«Чанковый» формат -Неприспособленность к стримингу -Ограничение на размер файла в 2Гб

MPEG-1 -Битрейт порядка 1-2 Мбит/с -Произвольный доступ к фрагментам -Обратное воспроизведение -Быстрый поиск вперед/назад -Синхронизация видео и аудио потоков -Основная сфера применения MPEG-1 - формат VideoCD -Средний размер фильма 700mb

Свойства MPEG – 2 Совместимостьс MPEG-1 Поддержка множества форматов Видеопоследовательностей Кадровая/блочная структура картинки Кадровая/блочная двунаправленная адаптивная компенсация движения Кадровое/блочное адаптивное DCT Альтернативное сканирование DCT коэффициентов Формат картинки: (4:2:0),(4:2:2),(4:4:4) Нелинейная таблица квантования Отличия от MPEG-1 Кодирование последовательностей с интерлейсингом Масштабируемость– позволяет декодировать видеопотокс меньшим качеством, разрешением и частотой кадров, чем он был закодирован

MPEG-4 -Технология фрактального сжатия - Wavelet - MC - спрайты - обьекты с прозрачным фоном -3d-рендеринг -Встроенный язык описания BIFS

H.264 Кодирование

Метрики

Где x, y – пиксели изображений; n,m – размеры по горизонтали и вертикали. PSNR Метрика, которую часто используют на практике, называется мерой отношения сигнала к шуму (peak- to-peak signal-to-noise ratio PSNR).

Blocking measure Значение метрики пропорционально визуальной степени "блочности изображения. В контрастных областях кадра границы блоков почти незаметны, а в однородных та же граница будет хорошо видна

Bluring measure Данная метрика позволяет сравнить степень размытия двух изображений, относительно друг друга. Чем ближе её значение к 0, тем больше размыто изображение. Исходное Обработанное Bluring Measure Красный цвет - первое изображение чётче второго, зелёный цвет - второе изображение чётче первого.

Конец