13.48M
Category: informaticsinformatics

Преобразование речевых сигналов в цифровую форму. Лекция № 4

1.

Дисциплина «Радиотехнические системы»
Лекция № 4.
Преобразование
речевых сигналов в
цифровую форму
Читает лекцию доцент кафедры
инженерной криптографии
к.т.н., проф.
Гурский Сергей Михайлович
тел.+79313983868
[email protected]
1

2.

Целевая установка
Учебные цели - раскрыть:
1. Классификацию методов цифрового кодирования
речевых сигналов
2. Методы разностного квантования речевых сигналов.
Кодеры формы
3. Методы низкоскоростного кодирования речевых
сигналов
Воспитательные цели – формирование и развитие у
обучающихся качеств и отношений гражданинапатриота, военного профессионала и
высоконравственной разносторонне развитой
личности
2

3.

Учебные вопросы:
1. Классификация методов цифрового
кодирования речевых сигналов
2. Методы разностного квантования
речевых сигналов. Кодеры формы
3. Методы низкоскоростного
кодирования речевых сигналов
3

4.

Первый учебный вопрос:
1. Классификация методов
цифрового кодирования
речевых сигналов
4

5.

Цифровая система передачи информации
5

6.

Импульсно-кодовая модуляция – PCM-pulse code
modulation-1960
Fчеловеч. речь (200 3400) Гц теор.Котельникова Fдискр. 8кГц
8000отсчётов / сек.преобраз.в.8 бит.цифров.код
VPCM сигн. 8 8000отсчётов / сек. 64 _ Кбит / сек.
6

7.

Преобразования PCM-сигн., повыш.эффективн.
их передачи
Алгоритмы сжатия речи,
фильтрация,
квантизация
предсказание - с целью точного
восстановления сигнала на приёмном конце
радиолинии
7

8.

Список сокращений
Сокраще
ния
Расшифровка сокращения
(на англ.яз.)
Расшифровка сокращения
(на русском языке)
ADPCM
Adaptive differential pulse-code
modulation
Адаптивная дифференциальная импульснокодовая модуляция
APCM
Adaptive pulse-code modulation
Адаптивная импульсно-кодовая модуляция
DM
Delta Modulation
Метод дельта-модуляции
PCM
pulse-code modulation
метод импульсно-кодовой модуляции
LPC
Linear Predictive Coding
Линейное кодирование с предсказанием
ABS
Analysis-by-synthesis
Анализ через синтез
SBC
Sub-Band Coding
Многополосное кодирование
ATC
Adaptive Transform Coding
Кодирование с адаптивным преобразованием
APC
Adaptive Predictive Coding
Адаптивное кодирование с предсказанием
VSELP
Vector-sum-excited linear
prediction
Метод линейного предсказания с векторным
возбуждением
8

9.

Список сокращений
Сокращени Расшифровка сокращения (на
я
англ.яз.)
Расшифровка сокращения
(на русском языке)
CELP
Code-Excited Linear Prediction
Метод линейного предсказания с кодовым
возбуждением
PCELP
Predictive Code-Excited Linear Prediction
Метод линейного предсказания с предиктивным
кодовым возбуждением
RPE
Regular Pulse Excitation
Метод регулярного импульсного возбуждения
LD-CELP
Low delay CELP
Метод линейного предсказания с кодовым
возбуждением с низкой задержкой
RELP
Regular -Excited Linear Prediction
Линейное предсказание с возбуждением
регулярной последовательностью импульсов
SELP
Sum-Excited Linear Prediction
Метод линейного предсказания с возбуждением
RPE-LPC
Regular Pulse Excitation LPC
Метод регулярного импульсного возбуждения
линейного кодирования с предсказанием
9

10.

Вокодер - (англ. voice coder – кодировщик голоса)
– устройство синтеза речи на основе
произвольного сигнала с богатым
спектром
Был разработан в целях экономии
частотных ресурсов радиолинии
системы связи при передаче речевых
сообщений
10

11.

Вокодер - (англ. voice coder – кодировщик голоса)
Экономия достигается за счёт того, что
вместо собственно речевого сигнала
передают только значения его
определённых параметров,
которые на приёмной стороне
управляют синтезатором речи.
11

12.

Структурная схема вокодера
12

13.

Основу синтезатора речи составляют три элемента:
Генератор тонального сигнала для
формирования гласных звуков;
Генератор шума для формирования
согласных;
И система формантных фильтров для
воссоздания индивидуальных
особенностей голоса
13

14.

Формантный фильтр
это система резонансных фильтров,
предназначенная для генерации
речевого сигнала с
заданной фонетической структурой.
Формантный фильтр является одним из
ключевых компонентов в
системах синтеза речи и речеподобных
сигналов.
14

15.

Формантный фильтр
В основу структуры формантного фильтра
заложена упрощённая модель голосового
тракта.
В соответствии с моделью, голосовой тракт
представляет собой резонатор с несколькими
пиками АЧХ, частоты которых определяют
вид произносимой фонемы.
Эти пики АЧХ получили
название форманты.
15

16.

Пример спектра фонемы «А»:
16

17.

Форма́нта
— термин фонетики,
обозначающий акустическую характеристику
звуков речи (прежде всего гласных),
связанную с уровнем частоты голосового
тона и образующую тембр звука[1]
Введён в практику научных исследований
немецким физиологом Лудимаром
Германом в 1894 году.
17

18.

Спектр и спектрограмма
русской гласной «е», показывающие 5
формант
спектр
спектрограмма
18

19.

Формантный фильтр создаёт
формантные области в спектре входного
сигнала с помощью нескольких параллельно
соединённых полосовых или фазовых
фильтров.
Количество звеньев в схеме определяет
порядок формантного фильтра.
19

20.

Схема формантного фильтра третьего порядка:
20

21.

Схема формантного фильтра :
Чтобы синтезировать речевой
сигнал, соответствующий
определённой фонеме, необходимо
настроить центральную частоту
каждого полосового фильтра
системы на соответствующую
частоту форманты.
21

22.

Для формантного фильтра :
Входным воздействием могут служить
различные сигналы с различной окраской тембра.
Основными параметрами входного сигнала
являются частота повторения и ширина спектра.
Частота повторения определяет высоту тона
синтезируемой фонемы и лежит в пределах от 200
Гц до 2000 Гц.
22

23.

Для формантного фильтра :
При этом нижние частоты данного диапазона
соответствуют тембру мужского голоса,
верхние — женского.
Занимаемый входным сигналом диапазон
частот должен быть как можно шире.
В качестве такого сигнала часто используется
импульсная последовательность.
23

24.

Второй учебный вопрос:
2. Методы разностного
квантования речевых сигналов.
Кодеры формы
24

25.

Структурная схема системы связи с предсказанием
25

26.

Структурная схема системы с дельта-модуляцией
26

27.

Принцип формирования сигналов с дельта-модуляцией
27

28.


b( k t ) b( k )
- последовательность
коррелированных отсчётов
b ( k ) - сигнал предсказания
(k ) - сигнал ошибки предсказания
ˆ
- предсказанное значение нового отсчёта
b (k )
ˆ(k ) - принятое значение сигнала ошибки предсказания
28

29.

Восстановленный истинный отсчёт
ˆ
b ( k ) b ( k ) ˆ ( k )
29

30.

При ЦСПИ
• Сигнал ошибки подвергается операциям квантования и
кодирования
• Результат такого преобразования – импульсно-кодовое
представление сигнала ошибки, или
• Сигнал дифференциальной импульсно-кодовой
модуляции (ДИКМ)
30

31.

Дельта-модуляция
• кв (k )
• где
(k ) b
- квантованный сигнал ошибки,
1, если (k ) 0;
(k )
1, если (k ) 0
31

32.

Система передачи информации дельта-модуляцией
• Достоинство - сравнительная простота
кодирующих и декодирующих
устройств
• Недостаток - явление размножения
ошибок
32
32

33.

Третий учебный вопрос:
3. Методы низкоскоростного
кодирования речевых сигналов
33

34.

Методы низкоскоростного кодирования речевых
сигналов
Передача речи в цифровой форме
Микрофон
АЦП
Кодер
речи
Кодер
канала
Модулятор
34

35.

Методы низкоскоростного кодирования речевых
сигналов
Упрощенная схема вокодера системы
УО
Т-Ш
ОТ
Квантование,
кодирование,
уплотнение
ЦФ
Разделение
КАНАЛ
ФНЧ
КЛ
Декодирова
ние
Тот
ГТ
ГШ
35

36.

Передача речи с применением LPC
В схемах с линейным предсказанием (Linear Predictive Coding) необходимые
характеристики извлекаются не из частотного спектра, а из временной формы сигнала.
Речь воссоздается
пропусканием возбуждающего сигнала через модель
речеобразующего тракта на основе знания:
- типа возбуждения (гласные, звонкие/глухие согласные) speech/noise;
периода основного тона, обычно бывает в диапазоне 2-18 мсек;
- коэффициентов усиления;
- коэффициентов предсказания (параметры модели речеобразующего
тракта)predictive coefficients.
Метод линейного предсказания
L
S k pi S k i ,
i 1
Остаток предсказания
L
k S k S k S k i S k 1
i 1
36

37.

Передача речи с применением LPC .
Кодер речи
Микро
фон
АЦП
Разбение
сигнала на
20-мс
сегменты
Вычисление
параметров
фильтра LPC
Параметры
фильтра
Фильтранализатор
Аа (Z)
Сигнал
возбуждения
Теле
фон
ЦАП
Декодер
речи
Фильтрсинтезатор
Ас (Z)
37

38.

Схема процедуры «анализ через синтез»
Sn
ГИВ
СФ-LPC
s
____
εn
МВО
38

39.

КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР
CELP - метод линейного предсказания с кодовым
возбуждением (дальнейшее развитие LPC). В этом
случае в канал связи дополнительно передаются
параметры отклонения от модели сигнала, в результате
качество речи повышается, однако CELP требует
минимум пропускной способности канала связи 4.8
кбит/с.
39

40.

КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР
CELP применяется в системах одноканальной спутниковой
связи (DAMA в ИСЗ "Интелсат"), мобильной (в ИСЗ
"Инмарсат" и др.), системе ДЦМЕ типа DTX-360, сети
Интернет и наземных системах сотовой связи. Различные
разновидности CELP стандартизованы международными
рекомендациями, например:
- G.728 - LD-CELP (Low Delay - CELP), 16 кбит/с;
- G.729 - CS-ACELP (Conjugate Structure - Algebraic
CELP), 8 кбит/с.
- FD-STD-1016 (CELP-3.2).
40

41.

КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР
Разновидности CELP и иных алгоритмов
RELP (Residual Exited Linear Prediction) - линейное предсказание
с усеченным возбуждением (сигнал погрешности предсказания
ограничивается по частоте и прореживается). Используется в
стандарте сотовой связи GSM.
A-CELP (Algebraic CELP) - одна из наиболее перспективных
разновидностей CELP. Используется в таких широко
распространенных алгоритмах, как G.723.1, G.729. «Algebraic» метод поиска нужного вектора в кодовой книге.
RELP (Relaxation Code Excited Linear prediction) - используется в
кодеке EVRC американского стандарта сотовой связи CDMA IS127.
41

42.

КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР
MELP (Mixed Excitation Linear Prediction) – используется в
новейших низкоскоростных военных алгоритмах США и НАТО
и в новом международном стандарте НКР.
VSELP (Vector Sum Excited Coder) – используется в стандартах
сотовой связи США IS-54 и европейском стандарте сотовой
связи GSM-HR.
MPE (MultiPulse Excitation) - линейное предсказание с
многоимпульсным возбуждением. Вместо сигнала ошибки
предсказания используют искусственную последовательность
возбуждения речевого сигнала на
некотором временном
интервале. На основе данного метода разработан стандарт GSM.
42

43.

КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР
MP-MLQ (MultiPulse Maximum Likelihood Quantazation) алгоритм многоимпульсного возбуждения с квантованием по
максимальному правдоподобию. Краткое описание данного
метода приведено при описании стандарта G.723.1.
HVEC (Harmonic Vector Excitation Coding) - алгоритм,
позволяющий добиваться скоростей передачи даже ниже, чем
при CELP (2-4 кбит/с, а при переменной скорости передачи
возможно временное понижение до 1.2 кбит/с).
Данный
алгоритм используется в качестве одного из алгоритмов
кодирования аудио в мультимедийном стандарте МPEG-4 и
ряде фирменных стандартов.
43

44.

Кодек речи стандарта GSM 414
БПО
Оценка
параметро
в фильтра
STR
Оценка
параметро
в фильтра
LTR
Фильтранализатор
STR
Фильтранализато
р LTR
εn
Постфильтра
ция
dn
Фильтрсинтезато
р STR
Оценка
параметров
сигнала
возбуждени
я
Фильтрсинтезато
р LTR
dn.
Формирова
ние
сигнала
возбуждени
я
44

45.

Сравнительная характеристика кодеров речи по
параметру качества передачи речи
Алгоритм
кодирования
Рекоменд.
Direct
РСМ
AD PCM
SB-ADPCM
G.711
G.726
G.722
LD-CELP
CA-ACELP
MPC-MLQ
VSELP
VSELP
G.728
G.729(A)
G.723.1
GSM-HR
IS-54
QCELP
IS-96
APC
LPC-10
CELP-3.2
MELP
Inmarsat-B
FD-1015
FD-1016
US FD
Скорость,
кбит/с
Оценка MOS
кач-ва речи
Вычислит.
сложность,
MIPS
4,6
Стандартные алгоритмы
64
4,3
0.01
32/24/16
4,1/3,2/2.0
2
64/56/48
4.1//
5
Алгоритмы низкоскоростного кодирования речи
16/12.8
4,0/3.1
30
8
4.0(3.8)
20(11)
6.3/5.3
4.0/3.7
11-22
5.6
3.4
14
8
3.5
14
9.6/4.8/2.4/1
3.3///
15
.2
12.8/9.6
3.4/3.1
10
2.4
2.3
7
4.8
3.2
16
2.4
3.2
40
Длина
кадра,
мсек
Примечание
0
0.125
0.125
0.625
10
30+7.5
20
20
20
20
22.5
30
22.5
45

46.

Аудиоданные, кодированные в соответствии с рекомендацией
G.722
46

47.

Структура сигнала с дельта-модуляцией
47

48.

Примеры структур кадров кодеров речи в битовом
представлении
Структура потока G.728 16 кбит/c (период 80 бит)
48

49.

Примеры структур кадров кодеров речи в битовом
представлении
Канал G.729 8 кбит/сек в режиме молчания (кадр 80
бит с начала кадра)
49

50.

Примеры структур кадров кодеров речи в битовом
представлении
Канал G.729 8 кбит/сек в режиме передачи (кадр 352
бита с начала кадра)
50

51.

Примеры структур кадров кодеров речи в битовом
представлении
Кадр G.723.1, длина 192 бита, 6.4 кбит/с
51

52.

Примеры структур кадров кодеров речи в битовом
представлении
Структура сигнала GSM, 13 кбит/с, кадр 260 бит
52

53.

Примеры структур кадров кодеров речи в битовом
представлении
Кадр FED-STD 1016, 144 бита (4.8 кбит/с)
53

54.

Примеры структур кадров кодеров речи в битовом представлении
Синхрокомбинация
42 бита бита
16 битный блок
Структура кадра потока GSM 16 кбит/с
54

55.

Основные учебники и учебные пособия
Семенов К.В., Карасев В.Т., Гурский С.М. Радиотехнические
системы: курс лекций. – Часть 1. – / К.В. Семенов, В.Т. Карасев,
С.М. Гурский. – СПб.: ВКА имени А.Ф. Можайского, 2016. – 195
с.
Семенов К.В., Карасев В.Т., Гурский С.М. Радиотехнические
системы: Курс лекций. Часть 2. – / К.В. Семенов, В.Т. Карасев,
С.М. Гурский. – СПб.: ВКА имени А.Ф. Можайского, 2016. – 141
с.
Бережной И.В., Гурский С.М., Сазонов К.В. Радиотехнические
системы: Сборник заданий на практические занятия / И.В.
Бережной, С.М. Гурский, К.В. Сазонов. – СПб.: ВКА имени А.Ф.
Можайского, 2016. – 243 с.
55

56.

Дополнительные учебники
https://sites.google.com/site/eltech
digicom/course_materials
Сергиенко А.Б. Цифровая связь:
материалы курса «Цифровая
связь» для магистрантов СПбГЭТУ
«ЛЭТИ», в том числе учебные
пособия, презентации и
видеолекции
56

57.

https://sites.google.com/site/eltechdigicom/
57

58.

Дополнительные учебники
Информационные
технологии в
радиотехнических
системах: Учебное пособие /
В.А.Васин, И.Б.Власов,
Ю.М.Егоров и др.; Под ред.
И.Б.Федорова. – М.: Изд-во
МГТУ им. Н.Э.Баумана, 2003. –
672 с. – (Сер. Информатика в
техническом университете)
58

59.

Дополнительные учебники
Радиоэлектронные
системы: основы
построения и теория.
Справочник / Ширман Я.Д.,
Лосев Ю.И., Минервин
Н.Н. и др. / Под ред.
Я.Д.Ширмана. – М.: ЗАО
«МАКВИС», 1998. – 828 с.
59

60.

Дополнительные учебники
Теория передачи сигналов:
Учебник для вузов /
А.Г.Зюко, Д.Д.Кловский,
М.В.Назаров, Л.М.Финк. –
2-е изд., перераб. и доп. М.: Радио и связь, 1986. –
304 с. – Тираж 22000 экз. –
Цена 1 рубль
60

61.

Дополнительные учебники
Беллами Дж.
Цифровая
телефония:
Пер.с
англ./Под ред.
А.Н.Берлина,
Ю.Н.Чернышо
ва. – М.: ЭкоТрендз, 2004. –
640 с.
61

62.

Дополнительные учебники
Прокис Джон. Цифровая связь/Пер.с
англ. под ред. Д.Д. Кловского.-М.: Радио
и связь, 2000. - 800 с.
Скляр
Бернард.
Цифровая
связь.
Теоретические основы и практическое
применение. Изд. 2-е, испр.: Пер. с англ. –
М.: Издательский дом «Вильямс», 2003. –
2016. – 1104 с.
62

63.

Примеры периодических изданий
63

64.

Журнал Электросвязь
64

65.

Журнал Электросвязь: содержание
65

66.

Военно-научная работа (ВНР) на 62 кафедре
•Разработана ВНР курсантом 5-го курса
Полубенцевым
•Основные результаты указанной ВНР
опубликованы в рецензируемом издании – ВАКжурнале «Современные наукоёмкие технологии»
№1 2022 г.
66

67.

ВНР на 62 кафедре
Гурский С.М., Полубенцев В.А. Информационная
безопасность в информационнотелекоммуникационной сети «интернет» //
Современные наукоемкие технологии. – 2022. – №
1. – С. 25-31;
URL: https://toptechnologies.ru/ru/article/view?id=39005 (дата
обращения: 04.02.2022). – DOI 10.17513/snt.39005.
67

68.

ВНР на 62 кафедре
68

69.

ВНР на 62 кафедре
69

70.

ВНР на 62 кафедре
70

71.

ВНР на 62 кафедре
71

72.

Структура ЦСПИ
72

73.

Структура ЦСПИ
Назначение
структурных
элементов ЦСПИ
подробно описано в
книге Бернарда
Скляра
73

74.

Структура ЦСПИ
Книга посвящена свободно распространяемому
пакету Octave. Читатель держит в руках первое
описание пакета на русском языке. Описан
встроенный язык пакета, подробно рассмотрены
графические возможности пакета.
Подробно рассмотрено решение различных
инженерных и математических задач. Особое
внимание уделено операциям с матрицами,
решению нелинейных уравнений и систем,
дифференцированию и интегрированию,
решению дифференциальных уравнений,
оптимизационным задачам и обработке
экспериментальных данных (интерполяции и
аппроксимации). Наряду со встроенным языком
пакета описана среда QtOctave
73

75.

https://www.altlinux.org/Books:Octave
GNU Octave - это свободный интерпретирующий язык для проведения
математических вычислений. По возможностям и качеству реализации
интерпретатора язык Octave можно сравнивать с проприетарной программой
MATLAB, причём синтаксис обоих языков очень схож.
Существуют версии языка для различных дистрибутивов GNU Linux (ALT Linux,
Debian, Ubuntu, Mandriva и др.) и для ОС Windows. На наш взгляд, GNU
Octave больше ориентирован на работу в Linux. Работа в ОС Windows возможна, но
пользователю Windows надо быть готовым работать с простым текстовым
редактором и командной строкой.
Когда авторы начинали знакомиться с GNU Octave, основной проблемой было
отсутствие хорошего русскоязычного введения в этот язык. Наша книга является
попыткой восполнить этот пробел. Поэтому большое внимание было уделено самому
языку (глава 3), операциям с матрицами (глава 5) и графическим возможностям
пакета (глава 4).
73

76.

http://opds.spbsut.ru/data/_uploaded/books/octave_book.pdf
Наш многолетний опыт преподавания информационных дисциплин в Донецком
национальном техническом университете говорит нам о том, что студенту и
инженеру наряду с описанием функций, предназначенных для решения той или иной
задачи, не лишним будет напомнить и математическую постановку решаемой задачи,
а зачастую и численные методы решения задачи. Именно поэтому в ряде глав
приведены не только описания функций, но и описаны численные методы решения
задач.
Что касается графических оболочек, таких как qtOctave, Xoctave и Kalculus, нами
принято решение кратко описать наиболее стабильную из них, qtOctave, а основное
внимание в книге уделить собственно языку. Мы считаем, что GNU Octave - это в
первую очередь мощный интерпретирующий язык. Зная его, пользователь сможет
работать с любой графической оболочкой.
Авторы выражают благодарность компании ALT Linux за многолетнее
сотрудничество и возможность издать очередную книгу.
Авторы заинтересованы в общении с читателями. Мы ждём ваши замечания и
отзывы по адресам [email protected] и [email protected].
73

77.

http://opds.spbsut.ru/data/_uploaded/books/octave_book.pdf
https://kmu.itmo.ru/
Конгресс молодых учёных
Университета ИТМО
(https://kmu.itmo.ru/)
Конгресс молодых учёных
Университета ИТМО - научная
конференция для школьников,
студентов, аспирантов и молодых
учёных. КМУ ИТМО
73

78.

Лекция № 3. Преобразование аналоговых
сообщений в цифровую форму
Чтение лекции
завершено!
Спасибо за внимание!
Желаю вам успехов в
изучении
дисциплины
«Радиотехнические
системы»!
74
English     Русский Rules