5.80M
Category: informaticsinformatics

Представление данных. Кодирование текста, графики, звук и видео

1.

кодирование текста,
графики, звука и видео

2.

Данные и
информация

3.

Информация
Информация от латинского informatio – сведения, разъяснения, изложение
Однозначно определить, что же такое информация, так же невозможно, как
невозможно сделать это для таких понятий как «время», «энергия», «вещество»

4.

Данные
Непрерывное движение и взаимодействие физических объектов
сопровождается появлением сигналов
Взаимодействие сигналов с физическими телами может изменять свойства тел
Изменения, которые можно измерять или регистрировать, образуют данные
Данные – зарегистрированные сигналы

5.

Данные и информация
Данные несут в себе информацию о событиях, поскольку они отражают
сигналы, возникшие в результате этих событий
Для человека информация – содержание полученных им сообщений. При
получении информации уменьшается неопределенность знания
? данные = информация?

6.

Носитель информации
Информация нематериальна,
не имеет формы, размеров и
массы. Для существования и
распространения она должна
быть связана с каким-либо
материальным объектом –
носителем информации

7.

Информационные процессы
Действия, выполняемые
с информацией, называются
информационными
процессами
Информационные
процессы
получение
создание
сбор
поиск
обработка
накопление
хранение
распространение
использование

8.

Представление
данных
аналоговое и цифровое

9.

Представление информации в живой природе и технике
осуществляется в различных формах
Одной из форм представления и обмена информацией
являются языки.
Формальные языки - это языки, придуманные и
разработанные человеком для определенных целей. В
отличие от естественных языков формальные языки состоят
из специальных знаков и записываются с помощью строгих
правил синтаксиса и грамматики
Представление
информации

10.

Аналоговый и дискретный сигналы
Большинство сигналов,
которые несут в себе
информацию, представляют
собой физические величины,
изменяющиеся во времени
Сигналы
электромагнитные волны
изменение электрического напряжения
звуковая волна
колебания земной кары
передача данных по каналу связи
и др.

11.

Аналоговый и дискретный сигналы
Аналоговый сигнал описывается
функцией времени и непрерывным
множеством возможных значений
Дискретный сигнал является
прерывистым

12.

Цифровой сигнал
В компьютере информация представлена в цифровом виде
Цифровой сигнал – сигнал, который можно представить в виде
последовательности числовых значений, записанных с помощью цифр
Для получения цифрового представления объекта его подвергают
дискретизации
Полученные данные являются числовой моделью объекта

13.

Оцифровка
(англ. digitization) - описание объекта,
изображения или аудио-видеосигнала
(в аналоговом виде) в виде набора
дискретных цифровых замеров (выборок)
этого сигнала/объекта, при помощи той или
иной аппаратуры, т. е. перевод его
в цифровой вид, пригодный для записи
на электронные носители

14.

Оцифровка
Полученный в результате оцифровки массив данных («цифровое представление»
оригинального объекта) может использоваться компьютером для дальнейшей
обработки, передачи по цифровым каналам, сохранению на цифровой носитель
Перед передачей или сохранением цифровое представление, как правило,
подвергается фильтрации и кодированию для уменьшения объема

15.

Кодирование
текстовых данных

16.

Кодирование – это переход от исходного представления
информации удобного для восприятия человеком к
представлению удобному для хранения, передачи и обработки
информации с использованием вычислительной техники
Кодирование и
декодирование
Обратный процесс называется декодированием

17.

Представление информации в алфавитной
(текстовой) форме — самый распространенный
способ со времен изобретения письменности

18.

Компьютер можно обрабатывать информацию
только в числовой форме, представленной в
виде десятичного кода.
Для записи текста в память компьютера
используют двоичный код – алфавит,
состоящий из двух символов: 0 и 1
Совокупность всех символов компьютерного
алфавита и советующих им двоичных кодов
записывается в виде кодовой таблицы
символов

19.

С помощью кодовых таблиц выполняется
кодирование и декодирование.
Часто для удобства в кодовых таблицах
вместо двоичного кода записывают
10-чный или 16-ричный

20.

Кодовая таблица ASCII
1 символ
1 байт
American Standard Code for Information Interchange
8 битов
28 =256 символов
Коды символов
от 00000000 до
11111111
Стандартная часть
Латинские буквы,
цифры, пробел, знаки
препинания,
специальные символы

21.

Кодовая таблица ASCII
Альтернативная
часть
Кодирование
национальных
алфавитов и
псевдографики
От 10000000
До 11111111

22.

Таблицы кодировки русскоязычных символов
Двоичный
код
Десятичный код КОИ8 СР125 СР86 ISO
1
6
11000010
194
б
В
-
Т
Кодирование буквы «Л» в разных 8-разрядных кодовых
таблицах:
Название таблицы
Windows-1251
КОИ-8
CP855
CP866
Код
11001011
11101100
11010001
10001011
Десятичное значение
203
236
209
139

23.

Кодировка Unicode
1 символ
2 байта
UCS -Universal Character Set
16 бит
216 = 65536 символов
Коды символов
от 0000000000000000 до 1111111111111111
Алфавиты мира, множество математических,
музыкальных, химических символов и многое
другое.
Существует кодировка и UCS - 4, где для
кодирования используют 4 байта, то есть можно
кодировать более 4 млрд. символов. Эту кодировку
поддерживает Microsoft Office

24.

Стандартные
Служебные
Таблица символов
Код 041B16 = 0000 0100 0001 1011

25.

Кодировка UTF-8
Unicode Transformation Format, 8-bit
Использует переменное количество байт (от 1 до 4) для кодирования
Латинские буквы, цифры и наиболее распространённые знаки
препинания кодируются 1 байтом, и коды этих символов
соответствуют их кодам в ASCII
Кириллические символы кодируются 2 байтами

26.

Определить
информационный
объем
следующего
предложения,
если его
закодировали с
помощью кодовой
таблицы ASCII
Happy New Year!
В кодировке ASCII каждый символ кодируется 1
байтом
Нужно подсчитать количество символов в
предложении и умножить на 1
В предложении 15 символов
Информационный объем:
15 ∙ 1 = 15 байт

27.

Определить
информационный
объем
следующего
предложения,
если его
закодировали с
помощью кодовой
таблицы Unicode
Программирование
— вторая
грамотность.
В кодировке Unicode каждый символ кодируется 2
байтами
Нужно подсчитать количество символов в
предложении и умножить на 2
В предложении 38 символов
Информационный объем:
38 ∙ 2 = 76 байт

28.

Кодирование
графических данных

29.

Представление графики
Для создания и сохранения графических объектов в
компьютере используется два вида представления
изображений:
Растровое - это совокупность точек (пикселей). Координаты каждой
точки и ее свойства цвет, яркость выражаются с помощью двоичных
чисел.
Векторное - представляется совокупностью математических
значений свойств объектов изображения.

30.

Растровая графика
Растровое графическое изображение состоит из мельчайших точек,
составляющих определенный узор – растр
После разбиения рисунка на точки, начиная с левого угла, двигаясь по строкам
слева направо, можно кодировать цвет каждой точки
Одну такую точку будем называть пикселем
(происхождение этого слова связано с
английской аббревиатурой "picture element" –
элемент рисунка)

31.

Векторное изображение
Векторное изображение - это графический объект,
состоящий графических примитивов, которые описаны с
помощью числовых значений или математических формул
Информация о векторном изображении кодируется как
обычная буквенно-цифровая и обрабатывается
специальными программами

32.

Фрактальное изображение
Фрактальная графика основывается на математических
вычислениях, как и векторная. Но в отличии от векторной ее
базовым элементом является сама математическая формула
Это приводит к тому, что в памяти компьютера не хранится
никаких объектов и изображение строится только по
уравнениям

33.

Черно-белые изображения
Для черно-белых иллюстраций, если не
использовать полутона, пиксель будет
принимать одно из двух состояний:
светится (белый)
не светится (черный)
Информация о цвете пикселя является кодом
пикселя, и для его кодирования достаточно
одного бита памяти:
0 - черный, 1 - белый

34.

Черно-белые
изображения
Если же рассматриваются
иллюстрации в виде
комбинации точек с 256
градациями серого цвета, то
достаточно восьмиразрядного
двоичного числа для того чтобы
закодировать яркость любой
точки

35.

Трехкомпонентная теория цвета
Любому цвету можно однозначным образом поставить в соответствие точку
трехмерного пространства
Точки пространства, которые соответствуют цветам, воспринимаемым
человеческим глазом, образуют в пространстве некоторое выпуклое тело
Абсолютно черному цвету соответствует точка (0, 0, 0)

36.

Цветовые модели – RGB (red, green, blue)

37.

N –количество цветов в изображении,
I – информационный объем пикселя

38.

Картинка 10х10 пикселей составлена с помощью палитры из
10 8 цветов. Сколько будет весить такая картинка в
компьютере?
10 ∙ 10 = 100
100 ∙ 3 = 300

39.

Для хранения
изображения
размером 128 128
точек выделено 4
Кбайт памяти.
Определить какое
максимальное
число цветов в
палитре.
Найдем количество пикселей в
изображении:
128 ∙ 128 = 27 ∙ 27 = 214 пикселей
Для хранения изображение выделено 4
Кбайт. Переведем в биты:
4 Кбайт = 4 ∙ 210 байт = 212 байт = 215 бит
Информационный объем одного пикселя
равен:
215
= 2 бит
14
2
С помощью 2 бит можно закодировать:
22 = 4 цвета

40.

Кодирование звука

41.

Представление звука
Звук представляет собой периодическую волну. Каждая звуковая волна
показывает силу и высоту звука
Двоичное кодирование звуковой информации в компьютере заключается в том,
чтобы звуковой волне поставить в соответствие последовательность из нулей и
единиц

42.

Представление
звука

43.

Представление
звука
было до
оцифровки
после
сглаживания
без сглаживания
При уменьшении T
(временной интервал
дискретизации)
качество улучшается, но
увеличивается размер файла
T
t

44.

Количество информации, которое необходимо
для кодирования дискретных уровней громкости
Глубина кодирования звука
Процесс временной
дискретизации
заключается в
регистрации
параметров звука
через определённые
очень короткие
промежутки времени,
в пределах которых
сигнал считается
неизменным. Частоту
измерения сигнала
называют частотой
дискретизации.
Частота дискретизации
Количество измерений громкости звука за одну секунду

45.

Количество информации, которое необходимо
для кодирования дискретных уровней громкости
Глубина кодирования звука
Глубина кодирования
звука связана с
количеством уровней
квантования по
формуле:
N = 2i
где N – количество
уровней разбиения
амплитуды сигнала,
i – число бит (глубина
кодирования),
отводимых для
кодирования уровней
амплитуды сигнала
Частота дискретизации
Количество измерений громкости звука за одну секунду

46.

Представление звука
Для качественного кодирования звука при цифровой звукозаписи используется
частота дискретизации 44100 Гц и 48000 Гц
Это означает, что за каждую секунду звукозаписи в цифровом виде записывается
более 44000 единиц информации, последовательность которых моделирует звук
длительностью в одну секунду

47.

Формула для
расчета
информационног
о объема
звукового файла
Для расчета информационного объема
звукового файла используется
следующая формула:
English     Русский Rules