Similar presentations:
Представление текстовой информации в ПК. Кодовые таблицы. Расчет количественных параметров текстовой информации
1. Готовимся к уроку
МКУрок 18-20
Готовимся к уроку
10-А класс
2. Самостоятельная работа
МКСамостоятельная работа
Вариант 1
Заполните таблицу, в каждой строке которой одно и то же число должно
быть записано в системах счисления с основаниями 2, 8, 10 и 16.
Основание 2
Основание 8
Основание 10
Основание 16
111111
111
256
АА
Вариант 2
Заполните таблицу, в каждой строке которой одно и то же число должно
быть записано в системах счисления с основаниями 2, 8, 10 и 16.
Основание 2
Основание 8
Основание 10
Основание 16
101101
153
190
5С
Вариант 3
Заполните таблицу, в каждой строке которой одно и то же число должно
быть записано в системах счисления с основаниями 2, 8, 10 и 16.
Основание 2
Основание 8
Основание 10
Основание 16
1100011
325
241
АС
Вариант 4
Заполните таблицу, в каждой строке которой одно и то же число должно
быть записано в системах счисления с основаниями 2, 8, 10 и 16.
Основание 2
Основание 8
Основание 10
Основание 16
1110011
201
241
8D
3. Домашнее задание
МКДомашнее задание
Презентация к уроку,
§ 6, стр. 43-49,
вопросы 1-3, стр. 51 (устно)
4. Поиграем в «Верю - не верю»
МКПоиграем в «Верю - не верю»
1. 1= байт 10 бит?
2. Существует 3 подхода к измерению информации
3. Сообщение из 20 букв 8 символьного алфавита
содержит 60 бит информации
4. За минимальную единицу измерения информации
принят 1 бит
5. Сообщение о том, что занятия состоятся в одной
из 16 аудиторий несет 4 бит информации
6. Информационный объем одного символа русского
алфавита равен 5 бит
7. 1 Кбайт составляет 1000 байт
8. 1 Кбайт составляет 1024 байт
9. Одна буква алфавита из 256 символов несет 10
бит информации.
5. Поиграем в «Верю - не верю»
МКПоиграем в «Верю - не верю»
10. Группа школьников пришла в бассейн, в котором 4
дорожки для плавания. Тренер сообщил, что
группа будет плавать по дорожке номер 3.
Школьники из этого сообщения получили 12 бит
информации.
11. В корзине лежит 8 шаров. Все шары разного
цвета. Сообщение о том, что из корзины достали
красный шар несет 4 бит информации
12. Алфавит племени Юмбу содержит всего 8 букв.
Одна буква этого алфавита несет объем
информации, равный 3 бит
13. 1 байт не равен 8 бит
14. 1 Гб (Гигабайт) равен ...1024 Кб
6. Поиграем в «Верю - не верю»
МКПоиграем в «Верю - не верю»
15. Буквой N при алфавитном подходе обозначается
информационный вес символа
16. Буквой i при алфавитном подходе обозначается
информационный вес символа
17. Мощность английского алфавита составляет 20
18. Единицы измерения указаны в порядке
возрастания: Мегабайт, килобайт, гигабайт, байт.
19. Игральный кубик с шестью гранями может упасть
на любую из них. Значит, неопределенность знания
о результате бросания кубика равна 36
20. “Информация — это снятая неопределенность” –
это определение понятия “информация” Клода
Шеннона
7. Поиграем в «Верю - не верю»
МКПоиграем в «Верю - не верю»
21. Сообщение несет больше информации, если в нем
содержатся новые и понятные сведения. Такое
сообщение называется неинформативным.
22. Количество информации не зависит от
информативности.
23. Чем меньше вероятность события, тем больше
информации несет сообщение о его появлении.
24. В двоичном коде один двоичный разряд несет одну
единицу информации, которая называется 1 бит
25. Если некоторое сообщение является информативным, то оно увеличивает неопределенность знаний.
26. N = 2 i это неверная запись формулы для
вычисления объема информации
8. Представление текстовой информации в ПК. Кодовые таблицы. Расчет количественных параметров текстовой информации.
МКУрок 13-15
Тематический модуль 4. «Представление чисел в компьютере»
Представление текстовой
информации в ПК. Кодовые таблицы.
Расчет количественных параметров
текстовой информации.
10-А класс
текстовая информация
• кодирование
• кодовые таблицы
9. Компьютерное представление текстовой информации
МККомпьютерное представление
текстовой информации
Для компьютерного представления текстовой информации
достаточно:
…
…
Определить алфавит
(множество всех
символов)
…
64
01000000
65
01000001
66
01000010
67
01000011
68
01000100
Присвоить каждому
символу алфавита
порядковый номер
Перевести номер
символа в двоичную
систему счисления
10.
МК11. Кодовые таблицы
МККодовые таблицы
Кодовая таблица (таблица кодировки) –
внутреннее представление символов в ПК
(таблица
соответствия
каждого
символа
своему порядковому номеру).
Таблицы кодировки:
ASCII, KOИ-8,
Windows-1251, СР866, Mac, UNICODЕ, …
ISO,
12. Кодировка ASCII
МККодировка ASCII
American Standard Code for Information Interchange –
американский стандартный код для обмена информацией,
разработанный в 1960-х годах в США.
00 0 1 0 02 0 30 04 0 5
6
7Изображаемые
8
9 A B
символы
C D
E
F
(буквы
цифры,
0 NUL SOH STX ETX EOT ENQ ACK
BEL латинского
BS HT алфавита,
LF VT FF
CR знаки
SO SI
1
препинания и арифметических операций,
скобки
некоторые
специальные
символы)
DLE
DC40 NAK SYN
ETBиCAN
EM SUB
ESC FS GS
RS US
0 0DC1
1 DC2
0 0 DC3
0 0
2
!
3
0
4
@
5
“
#
1Первые
2
3
AA
B
C
$
%
&
‘
(
)
324символа
5
6 и
7 128-й
8
9–
управляющие
D
E
F
G
H
* 0 + 0 0, 1 -1 1 . 1 /1
:
;
<
=
>
?
I
J
K
L
M
N
O
P
(при выводе текста они
не отображаются графически)
Q
W X
0 1 R0 0S 0 T0 0U 1 V
Y
Z
[
\
]
^
_
6
`
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
7
p
q
r
s
t
u
v
w
x
y
z
{
|
}
~
DEL
0 1 1 1 1 1 1 0
13. Расширение кодировки ASCII
МКРасширение кодировки ASCII
00 0 1 0 02 0 30 04 0 5
6
7
8
9 A B
C D
E
F
0 NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
кода
127)
1 DLE DC1 DC2 DC3 DC4 NAK Стандартная
SYN ETB CAN EM часть
SUB ESC
FS (0
GS… RS
US
2
!
“
#
$ % &
‘
(
)
*
+
,
.
/
3
0
1
2
3
4
5
6
7
8
9
:
;
<
=
>
?
4 @ A B
C D
E
F
G H
I
J
K
L M N O
5
P Q R
S
T U V W X
Y
Z
[
\
]
^
_
6
`
a
b
c
d
e
f
g
h
i
j
k
l
m n
o
7
p1 0 q 0 0r 0 s0 0t 0 u
v w x
y
z
{Windows-1251
| КОИ-8
}
~ DEL
† ┤
‡ ┬
€ ‰
‹1 Њ
Ќ1 1▌
Ћ1 ▐
Џ1
8 Ђ
─
│Ѓ
┌‚
┐ѓ
└„ …
┘ ├
┴ Љ
┼ 0▀
▄
1 1█
ђ ▒‘
”
•∙
–√ —
њ
ќ²
ћ∙
џ
9 ░
⌠“
≈
≤ ™
≥ љ ⌡›
■
°
÷
▓’
Ў ╒
ў
¤ ╔
Ґ ╕
¦ ╖
Ё ©
Є ╚
« ╛
¬ ╜ ╝
® ╞Ї
A ═ ║
ёЈ
§ ╗
╓
╘ ╙
ґ
µ ╤
¶ ╥∙
ё №
є ╩
» ╪ј
Ѕ ╬
ѕ ©
ї
B ╟
°
± ╡І
Ёі
╠
╢
╣
╦
╧ ╨
╫
А Б
В
Д
Зг
И
Й
К
Н О
C ю
а
б
цГ
д
еЕ Ж
ф
х
и
й Л
к М
л м
н П
о
С
Т
Ус Ф
Ху ж
Э Ю
Я
D Р
п
я
р
т
ь Щ
ы Ъ
з Ы
ш Ьэ щ
ч
ъ
Расширение
ASCII
(Ц128Чв… Ш
255)
а
б
в
д
еЕ Ф
ж
зГ
и
й Й
к
л м
н Н
о О
п
E Ю
А
Б
Цг
Д
Х И
К
Л М
р
ф
цалфавита,
ч ш
щ ъ
ы Э
ь Щ
э ю
я
F
П
Яс (буквы
Рт
Сунационального
Т
Ух Ж
В
Ь Ы
З Ш
Ч Ъ
символы национальной валюты и т.п.)
1 1 1 1 1 1 1 1
14. Расширение кодировки ASCII
МКРасширение кодировки ASCII
0
1
2
0 NUL SOH STX
1 DLE DC1 DC2
2
!
“
3
0
1
2
4 @ A B
5
P Q R
6
`
a
b
7
p
q
r
8 Ђ─ Ѓ │ ‚ ┌
9 ђ░ ‘ ▒ ’ ▓
A
═ Ў║ ў╒
B ° ╟ ±╠ І ╡
C Аю Б а В б
D Рп Ся Тр
E аЮ б А в Б
F рП сЯ т Р
3
ETX
DC3
#
3
C
S
c
s
ѓ ┐
“⌠
Ј ё
і Ё
Гц
Ус
гЦ
уС
4
5
EOT ENQ
DC4 NAK
$ %
4
5
D
E
T U
d
e
t
u
„ └ …┘
”■ • ∙
¤╓ Ґ╔
ґ ╢ µ╣
Дд Е е
Фт Ху
дД е Е
фТ хУ
6
7
8
9 A
ACK BEL BS HT LF
SYN ETB CAN EM SUB
&
‘
(
)
*
6
7
8
9
:
F
G H
I
J
V W X
Y
Z
f
g
h
i
j
Windows-1251
v w x
y
z
† ├ ‡ ┤ € ┬ ‰┴ Љ ┼
≤ ™≥ љ
– √ —≈
¦ ╕ § ╖ Ё ╗ ©╘ Є ╙
¶ ╤ ∙ ╥ ё ╦ №╧ є ╨
Жф З г И х Й и К й
Ц ж Ч в Ш ь Щы Ъ з
жФ з Г и Х й И к Й
ц Ж ч В ш Ь щЫ ъ З
B
VT
ESC
+
;
K
[
k
{
‹▀
› ⌡
«╚
»╩
Лк
Ыш
лК
ыШ
C D
E
FF CR SO
FS GS RS
,
.
<
=
>
L M N
\
]
^
l
m n
| КОИ-8
}
~
Њ▄ Ќ █ Ћ ▌
њ° ќ ² ћ ∙
¬╛ ╜ ®╝
ј ╪ Ѕ╫ ѕ╬
Мл Нм О н
Ь э Эщ Юч
м Л нМ о Н
ь Э эЩ юЧ
F
SI
US
/
?
O
_
o
DEL
Џ▐
џ÷
Ї╞
ї©
По
Яъ
пО
яЪ
15.
МКЗАДАНИЕ 2.1.Декодируйте
ЗАДАНИЕ
Закодируйтеследующий
с
текст 69 таблицы
88 67 69ASCII
76
помощью
слово
Windows (десятичным и двоичным кодом)
EXCEL
87 105 110 100 111 119 115
07.11.2018
15
16. Обратите внимание!
МКОбратите внимание!
!
Цифры кодируются по стандарту ASCII в двух случаях – при
вводе-выводе и когда они встречаются в тексте. Если цифры
участвуют
в
вычислениях,
то
осуществляется
их
преобразование в другой двоичный код.
Возьмем число 57.
При использовании в тексте каждая цифра будет представлена
своим кодом в соответствии с таблицей ASCII. В двоичной системе
это – 00110101 00110111.
При использовании в вычислениях код этого числа будет получен
по правилам перевода в двоичную систему и получим – 00111001.
17.
МКМеждународный стандарт UNICODЕ
( универсальная система кодирования
создана в конце 90-ых годов )
• 1 символ кодируется: 2 байт=16 бит,
где 1-ый байт указывает на признак языка, 2-ой –
кодирует символ
• Кодовое пространство - 216 = 65536 символов
• Включает в себя все существующие алфавиты
мира, множество математических,
музыкальных, химических и прочих символов.
18. Стандарт Unicode
МКСтандарт Unicode
!
Unicode — это «уникальный код для любого символа,
независимо от платформы, независимо от программы,
независимо от языка» (www.unicode.org).
Стандарт Unicode был разработан в 1991
году и описывает алфавиты всех известных, в том числе и «мертвых», языков. Для
языков, имеющих несколько алфавитов
или вариантов написания (японского и
индийского), закодированы все варианты.
В кодировку Unicode внесены все математические и иные научные символьные
обозначения и даже некоторые придуманные языки (язык эльфов из трилогии
Дж. Р. Р. Толкина «Властелин колец»).
19. Клавиатуры некоторых стран мира
МККлавиатуры некоторых стран мира
РУССКАЯ
АМЕРИКАНСКАЯ
АРАБСКАЯ
АРМЯНСКАЯ
ЯПОНСКАЯ
20. Кодировки стандарта Unicode
МККодировки стандарта Unicode
Для представления символов в памяти компьютера в
стандарте Unicode имеется несколько кодировок.
Кодировка
UTF-16
Кодировка
UTF-8
Часто используемые
символы:
2 байта (16 бит)
Символы, входящие
в таблицу ASCII:
1 байт (8 бит)
Редко используемые
символы:
4 байта (32 бит)
Символы, не входящие
в таблицу ASCII:
2-4 байта (16-32 бит)
Кодировки Unicode позволяют включать в один
документ символы самых разных языков, но их
использование ведёт к увеличению размеров
текстовых файлов.
!
21.
МКДругие кодировки
KOИ-8 —код обмена информацией
Windows -1251 — кодировка символов
русского алфавита
1 символ кодируется 1байт=8 бит
07.11.2018
Склярова И.А, учитель информатики МОУ СОШ №8 г.Миллерово
21
22. Информационный объем сообщения
МКИнформационный объем сообщения
!
Информационным объёмом текстового сообщения называется количество бит (байт, килобайт,
мегабайт и т. д.), необходимых для записи этого
сообщения путём заранее оговоренного способа
двоичного кодирования.
Количество символов
в сообщении
ASCII, КОИ-8,
Windows-1251, …
1 символ = 1 байт
Unicode
1 символ = 2 байта
23. Решение задач (по материалам ЕГЭ)
МКРешение задач
(по материалам ЕГЭ)
Задача 1
Определите объем информации сообщения в байтах,
закодированного с помощью таблицы ASCII:
Санкт-Петербург — интеллектуальная и культурная
столица нашей Родины
Решение:
I=K*i , К-количество симв., i –инф.объем 1 символа
К=68 символов, i=1 байт
I=68 симв*1 байт=68 байт
Ответ: 68 байт.
24. Решение задач (по материалам ЕГЭ)
МКРешение задач
(по материалам ЕГЭ)
Задача 2
Каждая страница текста состоит из 32 строк по 64
символа в каждой. Определить максимальное
количество страниц такого текста, записанного в
кодировке Unicode на USB Flash drive емкостью 512 МБ.
Решение:
I=K*i ,
К=32*64=25*26=211=2048 символов на странице, i=2 байт
I=211*21=212=4096 байт
Емкость Flash 512 Мб
=512*1024*1024=29*210*210=536870912=229 байт
Max количество страниц 536870912:4096=229/212 =217
=210*27=1024*128=131 072
Ответ: 131 072 страницы.
25. Решаем задачи
МКРешаем задачи
В Советском энциклопедическом словаре
(1983 года издания) 1600 страниц. На одной
странице размещается в среднем 100 строк по
140 символов (включая пробелы) в каждой.
Найдите объем (в Мбайтах) текстовой
информации в словаре, если при записи
используется кодировка «один символ — один
байт».
Дано:
Решение:
I=K*i = 25*26* 25*22* 35*22*23
i=1 байт
К=1600×100×140 I=21875*213бит. =21875*210 байт
I-?
=21875 Кбайт
=21,36 Мбайт
Ответ: Сообщение содержит 21,36 Мбайт
информации.
26. Вопросы и задания
МК?
Вопросы и задания
Задание 1. Представьте в кодировке ASCII текст
Happy New Year!
а) шестнадцатеричным кодом
48 61 70 70 79 20 4E 65 77 20 59 65 61 72 21
б) десятичным кодом
72 97 112 112 121 32 78 101 119 32 89 101 97 114 33
0
1
2
0 NUL SOH STX
1 DLE DC1 DC2
2
!
“
3
0
1
2
4 @ A
B
5
P Q R
6
`
a
b
7
p
q
r
3
ETX
DC3
#
3
C
S
c
s
4
EOT
DC4
$
4
D
T
d
t
5
ENQ
NAK
%
5
E
U
e
u
6
ACK
SYN
&
6
F
V
f
v
7
8
9 A B
C
BEL BS HT LF VT FF
ETB CAN EM SUB ESC FS
‘
(
)
*
+
,
7
8
9
:
;
<
G H
I
J
K
L
W X
Y
Z
[
\
g
h
i
j
k
l
w x
y
z
{
|
D
E
F
CR SO SI
GS RS US
.
/
=
>
?
M N O
]
^
_
m n
o
}
~ DEL
ОТВЕТ
27. Подходы к расположению русских букв в различных кодировках
МКПодходы к расположению русских
букв в различных кодировках
?
Задание 2. Сравните подходы к расположению русских букв
в кодировках Windows-1251 и КОИ-8.
…
4
5
6
7
0
1
2
@ю
P п
` Ю
pП
П
A а
Qя
a А
q Я
B б
R р
b Б
rr РР
3
C
S
c
s
ц
с
Ц
С
4
5
6
7
Dд
T т
dД
tt ТТ
E е
Uу
ee Е
u У
F ф
Vж
f Ф
vЖ
G г
Wв
g Г
wВ
…
C
D
E
F
8
H
X
h
x
х
ь
Х
Ь
9
I и
Y ы
ii ИИ
y Ы
A
J
Z
j
z
й
з
Й
З
B
K к
[ ш
k К
{ Ш
Windows-1251
Аю
Рп
аЮ
рП
Ба
Ся
бА
сЯ
В
Т
в
т
б
р
Б
Р
Гц
Ус
гЦ
уС
Дд
Фт
дД
фТ
Е
Х
е
х
е
у
Е
У
Жф
Цж
жФ
цЖ
З
Ч
з
ч
г
в
Г
В
Их
Шь
иХ
шЬ
Йи
Щы
йИ
щЫ
ПОДСКАЗКА - 1
Кй
Ъз
кЙ
ъЗ
C
L
\
l
|
D
л
э
Л
Э
Mм
] щ
mМ
} Щ
E
F
Nн Oо
^ ч _ ъ
nН oО
~ Ч Ъ
КОИ-8
Лк
Ыш
лК
ыШ
Мл
Ьэ
мЛ
ьЭ
Нм
Эщ
нМ
эЩ
Он
Юч
оН
юЧ
ПОДСКАЗКА - 2
По
Яъ
пО
яЪ
28. Вопросы и задания
МКВопросы и задания
?
Задание 3. В 15-м издании энциклопедии Britannica 32 тома,
в каждом из которых порядка 1000 страниц. На одной
странице размещается в среднем 70 строк по 120 символов
(включая пробелы) в каждой. Найдите объем текстовой
информации в энциклопедии, если при записи используется
кодировка Unicode
Дано:
32·1000·70·120·2
i = 2 байта
I = K·i I =
Мб ≈ 513 Мб
1024·1024
K = 32·1000·70·120
I-?
Ответ: 513 Мбайт
29. Сжатие информации
МКСжатие информации
Сжатием информации в памяти компьютера называют такое её
преобразование, которое ведёт к сокращению объёма
занимаемой памяти при сохранении закодированного
содержания.
Одним из наиболее распространенных способов сжатия
текстовой информации является алгоритм Хаффмана.
С помощью этого алгоритма строится двоичное дерево,
которое позволяет однозначно декодировать двоичный код,
состоящий из символьный кодов различной длины.
Двоичным называется дерево, из каждой вершины которого
выходят две ветви. На рисунке приведён пример такого
дерева, построенный для алфавита английского языка с
учётом частоты встречаемости его букв.
30. Сжатие информации
МКСжатие информации
Задание 1 Закодируйте с помощью алгоритма
Хаффмана слово PASSWORD.
01010000 01000001 01010010 01010011 01010111
01001111 01010010 01000100
50 41 53 53 57 4F 52 44
Задание 2 Декодируйте с помощью
алгоритма Хаффмана сообщение
87 105 110 100 111 119 115
Windows
31.
МКТехника безопасности
!
32. Компьютерный практикум
МККомпьютерный практикум
Практическая работа №4
«Представление текстов.
Сжатие информации»
!