Лекция 4
Кодирование
Кодирование текста
Кодирование кириллицы
Сжатие текстовой информации
Кодирование изображений
Кодирование цвета
Цветовые модели
Сжатие изображений
Кодирование звука
Дискретизация звука
Параметры дискретизации
Синтезированный звук
Сжатие звука
Кодирование видеосигнала
Сжатие видеоинформации
8.32M
Category: informaticsinformatics

Кодирование информации. Текст. Изображение. Звук

1. Лекция 4

Кодирование информации.
Текст. Изображение. Звук.
1

2. Кодирование

представление сигнала в определенной форме.
Восстановление исходного вида сигнала из кода называется
декодированием.
Исходный алфавит - отображаемый набор знаков. Кодовый
алфавит – набор знаков, который используется для
отображения.
В вычислительной технике используется цифровое (двоичное)
кодирование.
Сжатие – кодирование с целью уменьшения объема
сообщения
Степень избыточности зависит от типа данных.
2

3.

Виды кодирования:
Кодирование по образцу – каждый знак дискретного
сигнала представляется знаком или набором знаков того
алфавита, в котором выполняется кодирование.
Шифрование (криптографическое кодирование) для
защиты информации от несанкционированного доступа.
Оптимальное кодирование – для устранения
избыточности данных путем снижения среднего числа
символов кодового алфавита, предназначенных для
представления одного исходного символа.
Помехоустойчивое кодирование - для обнаружения и
исправления ошибок при передаче данных.
3

4. Кодирование текста

Код ASCII
(American Standard Code for Information Interchange стандартный код информационного обмена США)
8 бит
Базовая таблица
0 - 127
Управляющие
символы
0 - 31
Символы
латинского алфавита,
знаки пунктуации,
цифры,
математические
символы
32 - 127
4
Расширенная
таблица
128-255

5.

Базовая таблица ASCII Первые 32 кода базовой таблицы, начиная с
нулевого, отданы производителям аппаратных средств (компьютеров,
печатающих устройств). Это так называемые управляющие коды,
которым не соответствуют никакие символы языков. Ими можно
управлять выводом данных.
5

6.

С 32 по 127 размещены коды символов латинского алфавита, знаков
препинания, цифр, арифметических действий и специальных
символов.
6

7.

Расширенная таблица относится к символам с номерами от 128
до 255. Здесь расположены национальные системы
кодирования. Отсутствие единого стандарта в этой области
привело к множественности одновременно действующих
кодировок. В настоящее время наиболее часто можно встретить
следующие кодовые страницы для русских букв :
Альтернативная кодировка, она же IBM СР866 — в системах
DOS;
Windows-1251, она же Microsoft code page 1251 (CP1251), в
системах Windows;
Семейство кодовых страниц KOI8 — в системах на основе
UNIX (и Linux)
7

8.

Альтернативная кодировка
– кодовая страница, где все
специфические европейские
символы во второй половине
заменены на кириллицу,
оставляя псевдографические
символы нетронутыми.
Следовательно, это не портит
вид программ, использующих
для работы текстовые окна, а
также обеспечивает
использование в них
символов кириллицы.
Альтернативная кодировка
всё ещё жива и чрезвычайно
популярна в среде DOS и
OS/2. Кроме того, в этой
кодировке записываются
имена в файловой системе
FAT (и короткие имена в
VFAT). CP866 до сих пор
используется в консоли
русифицированных систем
семейства Windows NT.
8

9.

Кодировка Windows-1251 ––
кодировка, являющаяся стандартной 8битной кодировкой для всех русских
версий Microsoft Windows. Пользуется
довольно большой популярностью.
Windows-1251 выгодно отличается от
других 8-битных кириллических
кодировок (таких как CP866, KOI8-R и
ISO-8859-5) наличием практически всех
символов, использующихся в русской
типографике для обычного текста
(отсутствует только значок ударения);
она также содержит все символы для
близких к русскому языку языков:
украинского, белорусского, сербского и
болгарского. Имеет два недостатка:
строчная буква я имеет код 255 в
десятичной системе. Она является
виновницей ряда неожиданных
проблем в программах использующих
этот код как служебный ; • отсутствуют
символы псевдографики
9

10.

Кодировка KOI8 (русская) ––
кодовая страница, разработанная
для кодирования букв кириллических
алфавитов. Разработчики КОИ-8
поместили символы русского
алфавита в таблице таким образом,
что позиции кириллических символов
соответствуют их фонетическим
аналогам в английском алфавите в
базовой таблице. Это означает, что
если в тексте, написанном в КОИ-8,
убирать восьмой бит каждого
символа (отнять 128), то получается
читабельный текст, хотя он и написан
латинскими символами. Например,
слова “Русский Текст” превратились
бы в “rUSSKIJ tEKST”. Как побочное
следствие, символы кириллицы
оказались расположены не в
алфавитном порядке. Существует
несколько вариантов кодировки КОИ8 для различных кириллических
алфавитов. Русский алфавит
описывается в кодировке KOI8- R,
украинский –– в KOI8-U. KOI8-R стал
фактически стандартом для русской
кириллицы в юникс-подобных
операционных системах и
электронной почте.
10

11. Кодирование кириллицы

Windows 1251 (Microsoft) –
OC Windows;
КОИ-8Р (Код Обмена
Информацией) - OC Linux;
Macintosh Cyrillic – ОС
MacOS;
CP-866 (DOS) – OC DOS и
OS/2;
ISO-8859 – попытка
стандартизации всех
кириллических языков.
Unicode – стандарт 16 битовой
кодировки, введен
Microsoft в 1997 г.
216 = 65536, что позволяет
закодировать символы
всех национальных
языков планеты.
11

12. Сжатие текстовой информации

Оптимальное кодирование – устранение избыточности
путем снижения общего количества символов алфавита,
предназначенного для представления исходного
сообщения.
Статистические методы (арифметическое кодирование
и метод Хаффмена): предварительное построение
таблицы кодирования, в которой чем выше частота
появления символа в тексте, тем короче код символа.
Словарные методы (LZ – методы): нахождение
повторяющихся последовательностей (слов) в
сообщении и замена всех повторений ссылкой на первое
вхождение.
12

13. Кодирование изображений

Компьютерное изображение
Растровое – множество точек – пикселей
(picture cell)
Векторное – множество графических
примитивов (линий, простых фигур) векторов
Фрактальное – множество уравнений,
задающих линии и поверхности
13

14.

Графическая информация
может быть представлена в
аналоговой и дискретной форме
живописное полотно
цифровая фотография

15.

Примером аналогового
представления
информации может
служить живописное
полотно,
цвет которого изменяется
непрерывно

16.

Дискретное изображение состоит
из отдельных точек
лазерный принтер
струйный принтер

17.

Преобразование изображения из аналоговой
(непрерывной) в цифровую (дискретную) форму
называется
пространственной дискретизацией
Аналоговая
форма
сканирование
Дискретная
форма

18.

В процессе пространственной дискретизации
изображение разбивается на отдельные маленькие
фрагменты, точки - пиксели

19.

Пиксель – минимальный участок изображения, для
которого независимым образом можно задать цвет.
В результате пространственной дискретизации графическая
информация представляется в виде растрового изображения.

20.

Разрешающая способность растрового изображения
определяется количеством точек по горизонтали и
вертикали на единицу длины изображения.

21.

Чем меньше размер точки, тем больше разрешающая
способность, а значит, выше качество изображения.
Величина разрешающей способности выражается в dpi
(dot per inch – точек на дюйм), т.е. количество точек в полоске
изображения длиной один дюйм (1 дюйм=2,54 см.)

22.

Количество информации, которое используется для
кодирования цвета точки изображения, называется
глубиной цвета.
В процессе дискретизации используются различные
палитры цветов (наборы цветов, которые могут
принять точки изображения).
Количество цветов N в палитре и количество
информации I, необходимое для кодирования цвета
каждой точки, могут быть вычислены по формуле:
I
N=2

23.

Пример:
Для кодирования черно-белого изображения (без
градации серого) используются всего два цвета –
черный и белый. По формуле N=2 I можно вычислить,
какое количество информации необходимо, чтобы
закодировать цвет каждой точки:
2=2
I
2=2
1
I = 1 бит
Для кодирования одной точки черно-белого изображения
достаточно 1 бита.

24.

Глубина цвета и количество цветов в палитре
Глубина цвета, I (битов)
Количество цветов в палитре, N
8
8
2 = 256
16
2 = 65 536
24
16
24
2 = 16 777 216
Зная глубину цвета, можно вычислить количество цветов в палитре.

25.

Задачи:
1. Растровый графический файл содержит черно-белое изображение с
16 градациями серого цвета размером 10х10 пикселей. Каков
информационный объем этого файла?
4
Решение: 16 = 2 ; 10*10*4 = 400 бит
2. 256-цветный рисунок содержит 120 байт информации. Из скольких
точек он состоит?
Решение:
8
120 байт = 120*8 бит; 265 = 2 (8 бит – 1 точка).
120*8/8 = 120

26.

Качество растровых изображений, полученных
в результате сканирования, зависит от разрешающей способности
сканера.
Оптическое разрешение –
количество светочувствительных
элементов на одном дюйме полоски
например, 1200 dpi
Аппаратное разрешение –
количество «микрошагов»
светочувствительной полоски на
1 дюйм изображения
например, 2400 dpi

27.

Растровые изображения на экране монитора
Качество изображения на экране монитора зависит от величины
пространственного разрешения и глубины цвета.
определяется как
произведение количества
строк изображения на
количество точек в строке
характеризует количество
цветов, которое могут
принимать точки
изображения
(измеряется в битах)

28.

Формирование растрового изображения на экране
монитора
Видеопамять
1 2 3 4 …………………………………..
800
2
….……
….
3
600
Всего
480 000 точек
Номер
точки
Двоичный код
цвета точки
1
01010101
2
10101010
…..
800
11110000
…..
480 000
11111111

29.

Белый свет может быть
разложен при помощи
природных явлений или
оптических приборов на
различные цвета спектра:
- красный
- оранжевый
- желтый
- зеленый
- голубой
- синий
- фиолетовый

30.

31.

Палитра цветов в системе цветопередачи RGB
В системе цветопередачи RGB палитра цветов
формируется путём сложения красного,
зеленого и синего цветов.

32.

Цвет палитры Color можно определить с помощью
формулы:
Color = R + G + В
При этом надо учитывать глубину цвета — количество
битов, отводимое в компьютере для кодирования цвета.
Для глубины цвета 24 бита (8 бит на каждый цвет):
0 ≤ R ≤ 255, 0 ≤ G ≤ 255, 0 ≤ B ≤ 255

33.

Формирование цветов
в системе цветопередачи RGB
Цвет
Формирование цвета
Черный
Black = 0 + 0 + 0
Белый
While = Rmax+ Gmax+ Bmax
Красный
Red = Rmax+ 0 +0
Зеленый
Green = 0 + Gmax+ 0
Синий
Blue = 0 + 0 + Bmax
Голубой
Cyan = 0+ Gmax+ Bmax
Пурпурный
Magenta = Rmax+ 0 + Bmax
Желтый
Yellow = Rmax+ Gmax+ 0
Цвета в палитре RGB формируются путём сложения базовых
цветов, каждый из которых может иметь различную
интенсивность.

34.

Система цветопередачи RGB применяется в мониторах
компьютеров, в телевизорах и других излучающих свет
технических устройствах.

35.

Палитра цветов в системе цветопередачи CMYK
В системе цветопередачи CMYK палитра цветов
формируется путём наложения голубой, пурпурной,
жёлтой и черной красок.

36.

Формирование цветов
в системе цветопередачи СMYK
Цвет
Формирование цвета
Черный
Black = C + M + Y = W – G – B – R = K
Белый
While = (C = 0, M = 0, Y = 0)
Красный
Red = Y + M = W – G – B = R
Зеленый
Green = Y + C = W – R – B = G
Синий
Blue = M + C = W – R – G = B
Голубой
Cyan = C = W – R = G + B
Пурпурный
Magenta = M = W – G = R + B
Желтый
Yellow = Y = W – B = R + G
Цвета в палитре CMYK формируются путем вычитания
из белого цвета определенных цветов.

37.

Цвет палитры Color можно определить с помощью
формулы:
Color = С + M + Y
Интенсивность каждой краски задается в
процентах:
0% ≤ С ≤ 100%, 0% ≤ М ≤ 100%, 0% ≤ Y ≤ 100%
Смешение трех красок – голубой, желтой и пурпурной – должно приводить
к полному поглощению света, и мы должны увидеть черный цвет. Однако
на практике вместо черного цвета получается грязно-бурый цвет. Поэтому
в цветовую модель добавляют еще один, истинно черный цвет – blaК.
Расширенная палитра получила название CMYK.

38.

Система цветопередачи CMYK применяется
в полиграфии.

39.

Задачи:
1. Рассчитайте объём памяти, необходимый для кодирования
рисунка, построенного при графическом разрешении
монитора
800х600 с палитрой 32 цвета.
Решение:
800*600*5 бит = 2400000 бит : 8 : 1024 = 293 Кбайт
2. Какой объем видеопамяти необходим для хранения четырех
страниц изображения при условии, что разрешающая
способность дисплея 640х480 точек, а глубина цвета 32?
Решение:
640*480*5*4 = 6144000 бит : 8 : 1024 = 750 Кбайт

40. Кодирование цвета

Бинарный:
1 бит – 2 цвета
Монохромные
Цветовые
режимы
Полутоновый:
8 бит – 256 оттенков
Полноцветный
(True Color):
24 бита - 16 777 216 цветов
Цветные
Полноцветный
(High Color):
16 бит - 65536 цветов
Индексный:
8бит – 256 цветов
40

41. Цветовые модели

RGB
аддитивная
модель
CMYK
цветоразностная модель
Red – красный
Cyan (голубой)
= белый – красный
Green – зеленый
Magenta (пурпурный) = белый – зеленый
Blue – синий
Yellow (желтый)
= белый – синий
BlacK (черный)
Яркость каждого цвета кодируется двоичным числом.
Например, в режиме True Color
от 0 (нет цвета), до 11111111 (максимальная яркость цвета).
HSB
Hue - оттенок, Saturation – насыщенность, Brightness – яркость
41

42. Сжатие изображений

Без сжатия – формат BMP (Bit MaP)
Сжатие без потерь – формат PCX (PCeXchange)
групповое кодирование:
AAAAABBBCCCCCCCC ⇒ 5A3B8C
Сжатие с потерями – формат JPEG
(Joint Photographic Experts Group)
Основано на свойстве человеческого глаза хуже
различать оттенки точек, чем яркость. Поэтому,
яркость точки записывается всегда, а оттенок –
в зависимости от качества кодирования – для
каждой второй или каждой четвертой точки.
42

43. Кодирование звука

Аналоговый
электрический
сигнал
Микрофон
АЦП
Звуковой
сигнал
Цифровая
запись звука
Акустическая
система
ЦАП
Аналоговый
электрический
сигнал
43

44.

Звук
44
Громкость в децибелах
Нижний предел
чувствительности
человеческого уха
0
Шорох листьев
10
Разговор
60
Гудок автомобиля
90
Реактивный двигатель
120
Болевой порог
140

45. Дискретизация звука

2N
шаг
квантования
45

46. Параметры дискретизации

Частота дискретизации - количество измерений
амплитуды аналогового сигнала в секунду.
Разрядность определяет точность изменения амплитуды
аналогового сигнала и выражается количеством
двоичных разрядов, используемых для представления
одного значения амплитуды.
Если используется разрядность N, то можно достичь
точности изменения амплитуды аналогового сигнала до
1/2N от динамического диапазона цифрового устройства.
Стандарт DVD- Audio:
частота – 96 кГц,
разрядность – 24 бита.
46

47. Синтезированный звук

генерируется из цифровых данных.
MIDI (Musical Instrument Digital Interface)
встроенный банк данных звуков (имитация
звучания музыкальных инструментов);
вход синтезатора – партитура произведения в
виде последовательности кодов;
выход синтезатора – близкое к реальному
оркестру звучание.
47

48. Сжатие звука

без сжатия – формат audioCD
720 МБ ~ 74 минуты музыки.
сжатие без потерь – форматы FLAC, WavPack –
сжатие 20-30% за счет разбиения на блоки,
записи вместо 2 каналов стерео одного канала и
разности.
сжатие с потерями – форматы mp3, WAV, AAC –
основаны на свойствах человеческого уха: есть
частотные «провалы», в которых человек не
слышит наличия или отсутствия определенных
частотных сочетаний. Сжатие в 10-15 раз.
48

49. Кодирование видеосигнала

Видеосигнал – поток статических изображений,
воспринимаемый человеком как движущееся
изображение.
Если формат кадра 512 Х 512 пикселей, то
1 секунда видео (25 кадров) качеством
True Color (24 бита) без сжатия занимает
объем памяти:
512 х 512 пикселей
х 24 бит/пиксель
х 25 кадр/сек
= 19.660.800 байт
49

50. Сжатие видеоинформации

сжатие кадра - отдельные кадры представляют в
формате JPEG (формат motionJPEG);
прореживание – кадры записываются через один;
вычитание – кадр сравнивается с предыдущим и
записываются только отличающиеся пиксели;
вычитание по блокам – изображение разбивается на
блоки и вычитание выполняется по блокам.
Результат: 1 час фильма без сжатия ~ 70 ГБ
в сжатом виде ~ 1-2 ГБ
Формат MPEG, AVI
50
English     Русский Rules