667.02K
Category: informaticsinformatics

Перцептивное кодирование

1.

Перцептивное кодирование
• MP3 - MPEG 1 audio layer 3
• MPEG - «Moving Picture Experts Group»
• 1993 год – документ ISO/IEC
11172: стандарт MPEG 1
• Layer 3 – слой 3

2.

Цифровой звук
• ИКМ (PCM) - импульсно-кодовая модуляция
• Sample rate (частота дискретизации)
Качество CD – 44,1 кГц
• Bit depth (битность) – длина двоичного слова
для каждого сэмпла
16 бит – каждый сэмпл в виде двоичного
кода длиной в 16 цифр (либо 0, либо 1) –
Для каждого сэмпла не менее 65 536
значений (216 )

3.

• 44100/ 16 бит: 88 200 байт в секунду - моно
176 400 байт в секунду – стерео
Для записи 1 миниту стереозвука – 10 584 000
байт

4.

• Теорема Котельникова (ШеннонаНайквиста):
• Самая высокая частота, которая может быть
точно записана, составляет половину
используемой частоты дискретизации
(«предел Найквиста»)
• CD – 44,1 кГц – частоты до 22,05 кГц

5.

Иллюстрация искажения, вносимого использованием низкой битовой глубины
— в данном случае 3-битной записи. Из-за ограниченного диапазона
значений, доступных для записи каждого сэмпла, фактическое значение
приходится записывать неправильно, что приводит к так называемым
«ошибкам квантования».

6.

• Модели PCM:
DPCM - дифференциальная импульснокодовая модуляция
ADPCM - адаптивная дифференциальная
импульсно-кодовая модуляция

7.

Кодирование mp3
Частотная маскировка: сплошная линия показывает минимальный порог
слышимости в зависимости от частоты. Пунктирная линия показывает,
как этот порог изменяется в присутствии трех громких тонов на 250 Гц, 1
кГц и 4 кГц. Хотя более тихий тон 5 кГц (показанный вертикальной
линией) был бы слышен сам по себе, в присутствии других тонов он
«замаскирован» и, следовательно, неслышим.

8.

Маскировка
Маскировка во временной области: громкий сигнал будет маскировать
более тихие сигналы, возникающие как за короткий период до его начала,
так и в течение более длительного периода после его прекращения.
English     Русский Rules