Стандарт JPEG
СТАНДАРТ JPEG СЖАТИЯ ЦВЕТНЫХ ИЗОБРАЖЕНИЙ
Список стандартов
Варианты кодирования
Упрощенная структурная схема конвейера обработки изображений с потерями
Общая схема кодирования с потерями
Квантование коэффициентов преобразования
Квантование с учетом визуального восприятия
Использование таблиц квантования JPEG
Квантование
Квантование
Общая схема кодирования без потерь
Варианты предсказания
Режимы работы кодера
Структура компрессированных данных
Базовый процесс кодирования
Расширенный процесс кодирования
Процесс кодирования без потерь
Процесс иерархического кодирования
1.28M
Category: informaticsinformatics

Стандарт JPEG. Компрессия полутоновых и цветных изображений

1. Стандарт JPEG

Компрессия полутоновых и
цветных изображений

2. СТАНДАРТ JPEG СЖАТИЯ ЦВЕТНЫХ ИЗОБРАЖЕНИЙ

Предполагается выполнение следующих требований:
• возможность адаптивного выбора параметров для оптимизации соотношения
сжатие - качество восстановленного изображения;
• универсальность процедуры обработки изображений любых размеров с любой
цветовой гаммой;
• приемлемая сложность вычислений при обработке изображений, реализуемых
на компьютерах различной мощности;
• наличие следующих операционных режимов программы сжатия:
• пространственно-поступательная обработка, при которой изображение обрабатывается слева
направо и сверху вниз;
• обработка с последовательным углублением четкости, при которой наблюдатель получает
сначала грубое приближение, а затем повышается его четкость;
• возможность сжатия без потерь, гарантирующего полное восстановление информации, даже
если степень сжатия оказывается небольшой;
• обеспечение многоуровневого кодирования, при котором четкость изображения связана не
только с пространственно-частотными диапазонами, но и с уровнем точности передачи.
В стандарте JPEG оговаривается, что сжатие изображений может осуществляться
либо с помощью ДКП двумерных блоков 8 8 пикселов, либо с помощью ДИКМ.
Ко всем компонентам изображения во время обработки должно применяться
одно и то же преобразование.

3. Список стандартов

• Рекомендация МСЭ-Т (ITU-T Recommendation) T.81 INFORMATION TECHNOLOGY – DIGITAL COMPRESSION AND
CODING OF CONTINUOUS-TONE STILL MAGES – REQUIREMENTS
AND GUIDELINES
• Рекомендация МСЭ-Т T.84 - INFORMATION TECHNOLOGY –
DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE
STILL MAGES: EXTENSIONS
• Рекомендация МСЭ-Т T.87 - Information technology – Lossless
and near-lossless compression of continuous-tone still images –
Baseline
• Рекомендация МСЭ-Т T.851 - ITU-T T.81 (JPEG-1)-based still-image
coding using an alternative arithmetic coder
• Рекомендация МСЭ-Т T.870 - Information technology – Lossless
and near-lossless compression of continuous-tone still images:
Extensions

4. Варианты кодирования

• Кодирование с потерями (lossy) на основе
ДКП
• Кодирование без потерь (lossless)

5. Упрощенная структурная схема конвейера обработки изображений с потерями

6. Общая схема кодирования с потерями


Разбиение на блоки 8х8
ДКП – 64 коэффициента (DC и 63 АС)
Квантование с использованием таблицы
Энтропийное кодирование
– DC – с предсказанием, AC – после Z-упорядочивания
– Хаффмановское кодирование по таблицам из стандарта или
арифметическое кодирование (возможно использование таблиц
пользователя)

7.

8. Квантование коэффициентов преобразования

При большом числе уровней преобразования близким к оптимальному является
квантование с равномерной шкалой: Fq = round (F/k), где F и Fq –квантуемая и
квантованная величины соответственно, k – коэффициент преобразования. При
восстановлении изображения компоненты унитарных преобразований умножаются на
коэффициент k.
При этом минимизируется среднеквадратичное отклонение восстановленного после
обратного ортогонального преобразования Т изображения от исходного (последняя
строка вытекает из равенства Парсеваля).
2
[ X вых (i, j) X вх (i, j)]
i, j
2
{T [k Fq (u,v) F (u,v)]}
u, v
2
[k Fq (u,v) F (u,v)]
u, v
2
{k round[ F (u,v)/ k ] F (u,v)}
u, v

9. Квантование с учетом визуального восприятия

С учетом субъективной чувствительности глаза к различным пространственным
частотам, результаты унитарного преобразования подвергаются квантованию:
Fq(u,v) = round {F(u,v)/[k Q(u,v)]}, u,v = 0,...., N-1.
Применение общего множителя k позволяет линейно изменять таблицу квантования.
Например, известна функция VHS (video home system) Q(u,v):
Q(u,v) = a( ) h( ), где h( ) = (0,31 + 0,69 ) exp(-0,29 ),
( )
1 1
4 2
2
ln
2
2 2
1
, 11,636 deg 1, u 2 v 2
16
Таблицы квантования JPEG
для сигнала яркости
для сигналов цветности
11 10 16 24 40 51 61
17 18 24 47 99 99 99
99
12
12
14
19
26
58
60
55
18
21
26
99
99
99
99
99
14
13
16
24
40
57
69
56
24
26
56
99
99
99
99
99
14
17
22
29
51
87
80
62
47
99
99
99
99
99
99
99
18
22
37
56
68
109 103
77
99
99
99
99
99
99
99
99
24
35
55
64
81
104 113
92
99
99
99
99
99
99
99
99
49
64
78
87
103 121 120 101
99
99
99
99
99
99
99
99
72
92
95
98
112 100 103
99
99
99
99
99
99
99
99
99

10. Использование таблиц квантования JPEG

Использование таблиц квантования обеспечивает более высокое качество изображений.
Варианты использования таблиц при дискретном косинусном преобразовании
изображений для двух значений коэффициента k:

11. Квантование

Применение единой таблицы квантования, что при относительно больших
коэффициентах сжатия приводит к искажениям восстанавливаемых изображений в виде
нарушений воспроизведения мелких деталей, возникновения эхо-сигналов при
резких переходах яркости и цвета и блочной структуры (коэффициент сжатия 16):

12. Квантование

Дефекты стандартного JPEG могут быть уменьшены, если применять различные
таблицы квантования в зависимости от сложности рельефа в каждом блоке. При
этом производится обратное преобразование каждого блока и, если искажения велики,
коэффициент квантования уменьшается. Коэффициент сжатия также 16.

13. Общая схема кодирования без потерь


Предсказание (используется до трех соседей)
Вычитание предсказателя
Энтропийное кодирование (хаффмановское или арифметическое)
Возможно уменьшение точности отсчетов (например, 12 бит – 8 бит)

14. Варианты предсказания

ДИКМ может осуществлять предсказание с помощью восьми
различных масок по одному, двум или трем отсчетам:
№ маски
Формула предсказания
0
0
1
X(i-1,j)
2
X(i,j-1)
3
X(i-1,j-1)
4
X(i-1,j)+ X(i,j-1)- X(i-1,j-1)
5
X(i-1,j)+[X(i,j-1)-X(i-1,j-1)]/2
6
X(i,j-1)+[X(i-1,j)-X(i-1,j-1)]/2
7
[X(i-1,j)+X(i,j-1))]/2

15. Режимы работы кодера


Последовательный (sequential) с использованием ДКП
– Кодирование блок за блоком, минимальные требования к памяти
Прогрессивный (progressive) с использованием ДКП
– Несколько проходов по изображению
– После квантования в буфере сохраняются все коэффициенты ДКП изображения, которые
затем частично кодируются в несколько проходов
Спектральный отбор
Последовательная аппроксимация
Смешанный режим
Без потерь
Иерархический




Кодируется последовательность кадров
Каждый кадр образует базу для восстановления последующих кадров
Кодируются разностные кадры (кроме первого)
Кодирование разностей может быть на основе ДКП, без потерь или смешанное (ДКП,
потом без потерь)
– Для построения пространственной пирамиды используются фильтры upsampling и
downsampling
– Иерархический режим может использоваться для улучшения качества изображения при
заданном разрешении

16.

17.

• Базовое последовательное кодирование использует
только хаффмановские коды, арифметическое
кодирование возможно только при кодировании
без потерь или при расширенном режиме с ДКП
• Точность представления пикселей:
– Для режимов с ДКП 8 или 12 бит на отсчет (базовый
режим – только 8 бит)
– При кодировании без потерь точность от 2 до 16 бит на
отсчет
• Единица данных (data unit):
– Один отсчет при кодировании без потерь
– Блок 8х8 при кодировании с ДКП
• Чередование компонент данных
– Кодирование с чередованием и без чередования
– MCU – minimum coded unit – зависит от режима
чередования

18.

19. Структура компрессированных данных


Данные состоят из непосредственно компрессированных данных изображения и
наборов параметров, характеризующих режим кодирования
Части компрессированных данных идентифицируются двухбайтовыми кодами –
маркерами
За некоторыми маркерами следуют определенные последовательности параметров,
например, таблицы, заголовок кадра, заголовок прохода (скана); другие используются
без параметров, например маркеры начала и конца изображения
Маркер и следующие за ним параметры образуют маркированный сегмент
Маркер рестарта служит для разделения энтропийно кодированных сегментов данных,
причем эти сегменты могут быть декодированы независимо
Три формата компрессированных данных:



Формат обмена (включает все необходимое для декодирования)
Сокращенный формат компрессированных данных (не содержит таблиц для декодирования)
Сокращенный формат для таблиц (содержит только таблицы)
Компрессированные данные изображения содержат только одно изображение,
изображение содержит один или несколько (в иерархическом режиме) кадров, кадр
содержит один или несколько сканов

20. Базовый процесс кодирования

• Основан на ДКП
• Исходное изображение – 8 бит на отсчет
каждой компоненты
• Последовательный режим кодирования
• Хаффмановское кодирование – по 2 таблицы
для DC и AC коэффициентов
• Декодер должен обрабатывать данные с 1, 2, 3
и 4 компонентами
• Сканы с чередованием и без чередования

21. Расширенный процесс кодирования

• Основан на ДКП
• Исходное изображение – 8 или 12 бит на отсчет
каждой компоненты
• Последовательный или прогрессивный режим
кодирования
• Хаффмановское или арифметическое кодирование
– по 4 таблицы для DC и AC коэффициентов
• Декодер должен обрабатывать данные с 1, 2, 3 и 4
компонентами
• Сканы с чередованием и без чередования

22. Процесс кодирования без потерь

• Кодирование с предсказанием
• Исходное изображение – от 2 до 16 бит на
отсчет каждой компоненты
• Последовательный режим кодирования
• Хаффмановское или арифметическое
кодирование – 4 таблицы
• Декодер должен обрабатывать данные с 1, 2, 3
и 4 компонентами
• Сканы с чередованием и без чередования

23. Процесс иерархического кодирования

• Несколько кадров (исходных и разностных)
• Используется расширенное кодирование с
ДКП или без потерь
• Декодер должен обрабатывать данные с 1,
2, 3 и 4 компонентами
• Сканы с чередованием и без чередования
English     Русский Rules