Similar presentations:
10ux-5c_КодированиеДанных
1. Кодирование информации
1Кодирование
информации
• Кодирование текстов
• Кодирование графической
информации
• Кодирование звуковой и
видеоинформации
К.Ю. Поляков, Е.А. Ерёмин, 2025
http://kpolyakov.spb.ru
2. Зачем кодировать информацию?
Кодирование информации, 10 класс2
Зачем кодировать информацию?
Кодирование — это представление
информации в форме, удобной для её
хранения, передачи и обработки.
В компьютерах используется двоичный код:
Lorem ipsum dolor
sit amet,
consectetur
adipisicing elit, sed
do eiusmod tempor
incididunt ut labore
et dolore magna
aliqua
данные (код)
10101001010
передача
данные (код)
кодирование
11111100010
передача
обработка
К.Ю. Поляков, Е.А. Ерёмин, 2025
хранение
http://kpolyakov.spb.ru
3. Кодирование информации
3Кодирование
информации
Кодирование текстов
К.Ю. Поляков, Е.А. Ерёмин, 2025
http://kpolyakov.spb.ru
4. Кодирование символов
Кодирование информации, 10 класс4
Кодирование символов
Система Брайля:
1 0
0 0
0 0
100000
А
0 1
1 1
0 1
011101
1 1
1 1
0 0
111100
В
1 0
1 0
0 0
Б
101000
Г
?
Общий подход:
Откуда формула?
• нужно использовать N символов
• выберем число битов k на символ: 2k N
• сопоставим каждому символу код – число от 0 до 2k – 1
• переведем коды в двоичную систему
К.Ю. Поляков, Е.А. Ерёмин, 2025
http://kpolyakov.spb.ru
5. Кодирование символов
Кодирование информации, 10 класс5
Кодирование символов
Текстовый файл
• на экране (символы)
• в памяти – коды
10000012 10000102 10000112 10001002
65
66
67
68
! В файле хранятся не изображения символов, а
их числовые коды!
Файлы со шрифтами: *.fon, *.ttf, *.otf
К.Ю. Поляков, Е.А. Ерёмин, 2025
http://kpolyakov.spb.ru
6. Кодировка ASCII (7-битная)
Кодирование информации, 10 класс6
Кодировка ASCII (7-битная)
ASCII = American Standard Code for Information Interchange
Коды 0-127:
0-31 управляющие символы:
7 – звонок, 10 – новая строка,
13 – возврат каретки, 27 – Esc.
32 пробел
знаки препинания: . , : ; ! ?
специальные знаки: + - * / () {} []
48-57 цифры 0..9
65-90 заглавные латинские буквы A-Z
97-122 строчные латинские буквы a-z
? Где русские буквы?
К.Ю. Поляков, Е.А. Ерёмин, 2025
http://kpolyakov.spb.ru
7. 8-битные кодировки
Кодирование информации, 10 класс7
8-битные кодировки
Кодовые страницы (расширения ASCII):
0
127
1
таблица ASCII
128
254
255
национальный алфавит
Для русского языка:
CP-866
для MS DOS
CP-1251
для Windows (Интернет)
КОI8-R
для UNIX (Интернет)
MacCyrillic для компьютеров Apple
Проблема:
Windows-1251
Привет, Вася!
рТЙЧЕФ, чБУС!
К.Ю. Поляков, Е.А. Ерёмин, 2025
KOI8-R
оПХБЕР, бЮЯЪ!
Привет, Вася!
http://kpolyakov.spb.ru
8. 8-битные кодировки
Кодирование информации, 10 класс8
8-битные кодировки
1 байт на символ – файлы небольшого
размера!
просто обрабатывать в программах
нельзя использовать символы разных
кодовых страниц одновременно (русские
и французские буквы, и т.п.)
неясно, в какой кодировке текст
(перебор вариантов!)
для каждой кодировки нужен свой
шрифт (изображения символов)
К.Ю. Поляков, Е.А. Ерёмин, 2025
http://kpolyakov.spb.ru
9. Стандарт UNICODE
Кодирование информации, 10 класс9
Стандарт UNICODE
1 112 064 знаков, используются 155 000 (2024)
Windows: UTF-16
16 битов на распространённые символы,
32 бита на редко встречающиеся
Linux: UTF-8
8 битов на символ для ASCII,
от 16 до 48 бита на остальные
совместимость с ASCII
более экономична, чем UTF-16, если
много символов ASCII
! 2024 г. – 98,5% сайтов использовали UTF-8!
К.Ю. Поляков, Е.А. Ерёмин, 2025
http://kpolyakov.spb.ru
10. Кодировка UTF-8
Кодирование информации, 10 класс10
Кодировка UTF-8
8 битов
символы ASCII: 0-9 A-Z a-z ()[].,;:*!@#$%^&*
16 битов
русский алфавит: A-Я а-я
греческий алфавит: - -
24 бита
знак рубля:
шрифт Брайля: ⢗ ⡵ ⡻
японские иероглифы: だ ぶ ガ ボ ヺ 㑹 㑽 㒸 㒻
арабский алфавит:
32 бита
символы и эмодзи:
informatics