97.56K
Category: informaticsinformatics

Кодирование текстовой информации

1.

Кодирование
текстовой
информации

2.

Сколько же бит необходимо
для кодирования символов?
Посчитаем примерное достаточное количество
символов для алфавита компьютера и по формуле
вычислим необходимое количество бит.
33 русских прописных буквы
33 русских строчных букв
26 английских строчных букв
26 прописных английских букв
10 цифр + знаки препинания
скобки и знаки математических операций
специальные символы (@, #, $, %, &, *)
знаки псевдографики
≈ 256 символов

3.

ASCII (American Standard
Code for Information
Interchange).
Первые 33 кода (с 0 по 33) этой таблице
соответствует не символам, а операциям
(ввод пробела, перевод строки и т.д.)
Коды с 33 по 127 являются
интернациональными и соответствуют
символам латинского алфавита, цифрам,
знакам арифметических операций и знакам
препинания.
Коды с 128 по 255 являются национальными.

4.

В разных национальных кодировках одному и тому
же коду соответствуют различные символы.
Существует 5 кодировочных таблиц для русских
букв ( Windows , MS - DOS , Mac , ISO , КОИ – 8).
Поэтому тексты созданные в одной кодировке не
будут правильно отображаться в другой

5.

К - количество символов в сообщении;
N - мощность алфавита (количество
символов в алфавите);
I - информационный вес сообщения;
i - информационный вес одного символа.

6.

Задача 1
Считая, что каждый символ кодируется одним
байтом, определите, чему равен
информационный объём следующего
высказывания Жан-Жака Руссо:
Тысячи путей ведут к заблуждению, к истине –
только один.
1) 92 бита 2) 220 бит 3) 456 бит 4) 512 бит

7.

Определим количество символов, включая
пробелы и знаки препинания - 57. Так как каждый
символ кодируется одним байтом, то
информационный объем равен 57* 1 байт = 57
байт=57* 8 бит = 456 бит.
Ответ : 3) 456
бит

8.

Задача 2
Два текста содержат одинаковое количество
символов. Первый текст составлен в алфавите
мощностью 16 символов. Второй текст в алфавите
мощностью 256 символов. Во сколько раз
количество информации во втором тексте больше,
чем в первом?
1) 12 2) 2 3) 24 4) 4

9.

Дано:
N1 = 16 символов
N2 = 256 символов
К1 = К2 = К
Найти: I2/I1.
Решение:
Необходимые формулы: I = i * K; N = 2i
i1 = 4 бита;
i2 = 8 бит;
I2/I1 = 8 * К / 4 * К = 8 / 4 = 2.
Ответ: 2) 2

10.

формула:
I = K*i ,
где I – количество информации в текстовом
сообщении (информационный объем текста) ,
K – количество символов в текстовом сообщении,
i – информационный вес одного символа
исходя из формулы: N = 2i ,
где N – мощность алфавита,
i – информационный вес одного символа
находим, что мощность 1 алфавита = 16 = 24
мощность второго = 256=28
соответственно, количество инф в первом случае
K*4, а во втором, К*8. Итого, количество
информации во втором тексте больше в 2 раза.

11.

Автоматическое устройство
осуществило перекодировку
информационного сообщения на
русском языке, первоначально
записанного в 16-битном коде Unicode, в
8-битную кодировку КОИ-8. При этом
информационное сообщение
уменьшилось на 800 бит. Какова длина
сообщения в символах?
1) 50 2) 100 3) 400 4) 800

12.

Изменение кодировки с 16 бит на 8 бит,
равно 16 - 8 = 8 бит .Следовательно
информационный объем каждого
символа сообщения уменьшился на 8
бит. Так как объем информационного
сообщения уменьшился на 800 бит,
следовательно количество символов в
сообщение равно 800/8=100.
Ответ: Длина сообщения - 100 символов.

13.

Автоматическое устройство осуществило
перекодировку информационного
сообщения длиной 48 символов,
первоначально записанного в 7–битном
коде ASCII, в 16–битную кодировку Unicode.
При этом информационное сообщение
увеличилось на
1) 48 байт 2) 96 байт 3) 54 байт 4) 432 байт

14.

Изменение кодировки с 7 бит на 16 бит, равно
16 - 7 = 9 бит. Следовательно информационный
объем каждого символа сообщения
увеличился на 9 бит.Так как длина сообщения
равна 48 символов, информационное
сообщение увеличилось на 48 * 9 = 432 бита. В
предложенных ответах данного ответа нет,
следовательно переведем биты в байты - 432/8
= 54 байта.
Ответ: Информационное сообщение
увеличилось на 54 байта.

15.

Автоматическое устройство осуществило
перекодировку информационного
сообщения на русском языке, первоначально
записанного в 16–битном коде Unicode, в 8–
битную кодировку Windows–1251, при этом
информационный объем сообщения
составил 60 байт.
Определите информационный объем
сообщения до перекодировки.
1) 60 бит 2) 120 бит 3) 960 бит 4) 60 байт

16.

По условиям задачи информационный объем
сообщения после кодировки составил 60 байт =
480 бит, следовательно количество символов в
сообщении = 480/8 = 60. До перекодировки
сообщение кодировалось 16-битным кодом,
следовательно информационный объем
сообщения до перекодировки = 60 * 16 = 960
бит.
Ответ: информационный объем сообщения до
перекодировки 960 бит.

17.

Автоматическое устройство осуществило
перекодировку информационного сообщения,
первоначально записанного в 7-битном коде
ASCII, в 16-битную кодировку Unicode. При этом
информационное сообщение увеличилось на
108 бит.
Какова длина сообщения в символах?
1) 12
2) 27 3) 6
4) 62

18.

Изменение кодировки с 7 бит на 16 бит,
равно 16 - 7 = 9 бит. Следовательно
информационный объем каждого
символа сообщения увеличился на 9 бит.
По условиям задачи информационный
объем сообщения после кодировки
составил 108 бит, следовательно
количество символов сообщения = 108/9
= 12.
Ответ: длина сообщения 12 символов.
English     Русский Rules