Similar presentations:
Предмет и задачи информатики. Свойства информации. Кодирование и измерение информации (Лекция 1)
1. Лекция 1
Предмет и задачиинформатики. Свойства
информации. Кодирование и
измерение информации
Разработала Фаерштейн
Л.В.
2.
СОДЕРЖАНИЕ1. Предмет и задачи информатики
2. Определение информации
3. Свойства информации
4. Кодирование и измерение
информации
Выход
2
3. Предмет и задачи информатики
ПРЕДМЕТ И ЗАДАЧИ ИНФОРМАТИКИОпределение
Информатика – комплексная
инженерная дисциплина для
проектирования, создания и
применения систем обработки
информации в разных областях
социальной практики.
3
4. Предмет и задачи информатики
ПРЕДМЕТ И ЗАДАЧИ ИНФОРМАТИКИДелится на две группы:
1) безмашинная (рутинная)
2) машинная (с использованием
ЭВМ)
Объектом изучения является
информация.
4
5. Существует три определения информации
СУЩЕСТВУЕТ ТРИ ОПРЕДЕЛЕНИЯ ИНФОРМАЦИИ1. с содержательной точки
зрения – сведения, уменьшающие
неопределённость
2. с формальной точки зрения –
это набор символов (сигналов)
3. с юридической точки зрения –
сведения о людях, событиях,
процессах или явлениях
независимо от формы их
представления
5
6. Определение информации (продолжение)
ОПРЕДЕЛЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Определение
3
взято
из
федерального закона № 149-ФЗ от
2008г.
«Об
информации,
информатизации
и
защите
информации», который изучается
самостоятельно.
6
7. Определение информации (окончание)
ОПРЕДЕЛЕНИЕ ИНФОРМАЦИИ (ОКОНЧАНИЕ)Понятие информации появилось
тогда, когда невозможно стало
описать материальные объекты
на языке материальных моделей.
Информатика, таким образом,
изучает информационные модели
объектов
и
информационные
связи между объектами.
7
8. Свойства информации
СВОЙСТВА ИНФОРМАЦИИ1.Объективность
и
субъективность
(относительные понятия; чем
большей
обработке
подвергается информация, тем
более она субъективна, так как
методы обработки считаются
субъективными).
Свойство
учитывается
в
8
9. Свойства информации
СВОЙСТВА ИНФОРМАЦИИ2. Полнота (от количества
информации зависит
количество методов для ее
обработки)
3. Достоверность (зависит от
уровня информационного шума
и требует либо бльшего числа
данных либо более сложных
методов обработки)
9
10. Свойства информации (окончание)
СВОЙСТВА ИНФОРМАЦИИ (ОКОНЧАНИЕ)Адекватность (степень
соответствия реальному
состоянию событий)
5. Доступность (мера
возможности получения
информации)
6. Актуальность (степень
соответствия информации
текущему моменту времени).
4.
10
11. Кодирование и измерение информации
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИКодирование
–
это
совокупность
правил
для
обозначения
элементов
исходного множества набором условных
символов.
Включает
в
себя:
1)
алфавит
(конечное
множество
символов, используемых для кодирования)
2)
Количество
символов
алфавита
(мощность)
11
12. кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Примеры.
1. Мощность русского алфавита
составляет 56 символов. В алфавит
входят:
- буквы от А до Я
- цифры от 0 до 9
- знаки препинания (. , ; : ! ? № «» … )
- служебные символы (%, ‘, знаки
операций, скобки () и др.)
12
13. кодирование и измерение информации продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)2. Особое место занимает
двоичный алфавит, мощность
его равна двум и в состав
входит всего два знака: 0 и 1.
Определение. Величина,
способная принимать только
два значения 0 или 1,
называется битом.
13
14. кодирование и измерение информации продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)Бит является стандартной
минимальной единицей
количества информации и
минимальной (не адресуемой)
единицей памяти ЭВМ.
Неадресуемость означает, что к
конкретному биту в памяти ЭВМ
нельзя обратиться по номеру
этого бита.
14
15. кодирование и измерение информации продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)Любое число или символ в ЭВМ
представлены в двоичном алфавите,
который содержит только две цифры – 0 и
1.
Число 10 – это переход уже в следующий
разряд, где 1 означает количество двоек, 0
– количество единиц, т.е. .
Как перевести число из десятичной
(арабской) системы счисления в двоичную?
Существует два способа такого перевода.
15
16. кодирование и измерение информации продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)Самым простым является способ
деления в «столбик», остатки от
деления записываются справа
20:2|0
10:2|0
5:2 |1
2:2 |0
1
Последнее частное и все остатки
записываются снизу вверх
16
17. кодирование и измерение информации продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)Проверка. Разложив двоичное
число по степеням числа 2
(система двоичная!), начиная с
правого разряда, где число 2 в
степени 0, получим
17
18. кодирование и измерение информации продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)Подобным способом можно
перевести число из арабской системы
в любую другую с любым основанием.
Часто используются системы
троичная (состоит из цифр 0, 1, 2 –
основание 3), восьмеричная (состоит
из цифр от 0 до 7 – основание 8) и
шестнадцатеричная (состоит из
цифр от 0 до 9 и букв A, B, C, D, E, F –
основание 16).
18
19. кодирование и измерение информации продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)Таблица соответствия
десятичных цифр 16-теричным:
1610терична
тичная
я
0-9
10
11
12
0-9
A
B
C
10тичная
13
14
15
16
16терична
я
D
E
F
10
19
20. кодирование и измерение информации продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)Способ перевода такой же – в
«столбик», остатки (числа от 0 до
15) записываются справа.
2186:16|10 (А)
136:16|8
8
Записываем снизу вверх,
начиная с частного: 88A
20
21. кодирование и измерение информации продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)Проверка.
21
22. кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Измерение информации
осуществляется тремя методами
по разным формулам:
1) объёмным
2) вероятностным
3) алгоритмическим, который не
рассматриваем.
22
23. измерение информации
ИЗМЕРЕНИЕ ИНФОРМАЦИИМетод 1. Для определения
количества информации H (в битах) в
объемном методе используется
формула Хартли
H K log 2 N
(1)
N- число знаков (символов) в
алфавите, которым закодировано
сообщение
K – длина сообщения в символах
23
24. измерение информации
ИЗМЕРЕНИЕ ИНФОРМАЦИИРассмотрим
сначала
объем
информации
для
числовых
сообщений.
Число может быть представлено
в разных системах счисления –
двоичной,
десятичной,
четверичной, восьмеричной и т.д.
24
25. Кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Пусть
для примера любое
сообщение имеет длину 1 цифру
(символ), а алфавиты (т.е. системы
счисления) разные.
Если N=2, 1 (бит)
Если N=4, 2 (бита)
Если N=8, 3 (бита)
Если N=10, 3,32 (бита)
25
26. Кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Т.е.
количество
информации,
которое содержит одна цифра в
арабской (десятичной) системе
счисления составляет 3,32 бита.
26
27. Кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)А
теперь пусть сообщение
представлено
в
русском
алфавите, мощность которого 56
символов.
Определим
объем
информации, который содержится
в названии нашего города Пермь.
Длина сообщения
27
28. Кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Тогда объём информации
5,8 (бита)
(т.е. один символ русского
алфавита содержит информацию
в 5,8 бит)
28
29. Кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Китайский алфавит имеет около
2000 символов плюс цифры,
служебные знаки типа %, скобки,
знаки
операций
и
др.
(22
символа).
Сколько информации содержит
1 символ китайского алфавита)?
29
30. Кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Также за единицу измерения
принимается
количество
информации,
полученное
в
результате
опыта,
в
котором
возможны только два различных
исхода,
например,
бросание
монеты.
Эта
единица
также
называется бит и является вторым
его определением.
30
31. Кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Формула (1) считает информацию в
битах. Но бит – маленькая величина
(как копейка). Для измерения
используются также байты (8 бит) и
кратные им единицы.
1 байт = 8 бит
1 кбайт = 1024 байт
1 Мбайт = 1024 кбайт
1 Гбайт = 1024 Мбайт
1 Тбайт = 1024 Гбайт
31
32. Кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Метод 2. Для измерения количества
информации существует вероятностный
метод.
Метод
использует
разную
вероятность появления символов в
одном и том же алфавите (русском,
английском и др.). Вероятностью
появления
цифр
и
служебных
символов в обычном (не научном)
тексте пренебрегают, т.к. она мала.
32
33. Кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Так, в русском алфавите
чаще всего встречаются буквы
«о, п, а, е, н», у них самая
большая
вероятность
появления в тексте.
Самая
маленькая
вероятность – у буквы «ъ».
33
34. Кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Количество
информации
по
методу 2 считается по формуле
Шеннона (2)
(2)
N – количество одинаковых
символов в сообщении
- вероятность появления символа в
алфавите (частота встречаемости)
34
35. Кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Пример 2. Найти количество
информации в сообщении Пермь
по методу 2.
Воспользуемся
справкой
вероятности появления букв и
составим такую таблицу
35
36. измерение информации (продолжение)
ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)букв Количе Вероятн
а
ство N
ость
п
1
0,082
3,608
3,608
е
1
0,082
3,608
3,608
р
1
0,1
3,322
3,322
м
1
0,07
3,837
3,837
ь
1
0,0018
9,118
9,118
всего
23,493 (бит)
36
37. Кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Т.к. сообщение (текст) небольшой, оно
содержит мало информации, около 6 байт
(.
Объём информации в методе 2 зависит:
1) от длины сообщения (текста)
2) от частоты использования букв
«о, п, е, а, н», т.к. эти буквы чаще всего
встречаются в русскоязычных текстах
Метод 2 более точный.
37
38. Кодирование и измерение информации (продолжение)
КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)Для измерения памяти ЭВМ (и
для доступа к памяти) биты не
используются, а используется т. н.
машинное слово
1 слово = 2 байта
1 двойное слово = 4 байта
1 расширенное слово = 8 байт
38
39.
Задача.Какое сообщение
информативнее
(содержит
больше информации) – K1 длиной
600 символов, закодированное
алфавитом мощностью 8 знаков,
или K2 длиной 900 символов,
закодированное
алфавитом
мощностью 4 знака?
39
40.
Решение. Раз ничего не известноо вероятности появления символов
ни в одном, ни в другом алфавите,
значит, объём информации находим
по методу Хартли (1).
H K log 2 N , где N мощность
алфавита, K длина сообщения
Один символ алфавита мощностью 8
знаков по формуле Хартли содержит
такое количество информации:
40
41.
log 2 8 3 (бита)Один символ алфавита мощностью 4
знака содержит
log 2 4 2(бита)
600 символов 3 бита 1800 (бит)
900 символов 2 бита 1800 (бит)
Вывод: оба сообщения содержат
одинаковое количество
информации.
41
42. Список литературы
СПИСОК ЛИТЕРАТУРЫ1.В.А. Острейковский. Информатика. –
М.:Высш.шк. – 2003, 2008
2.В.З. Аладьев и др. Основы
информатики. Учебное пособие. М.:Филинъ – 2005, 2010
42