Similar presentations:
Кодирование текстовой информации
1. Кодирование текстовой информации
Урок учителя информатики ГБОУГимназии №295 Фрунзенского
района Санкт-Петербурга
2. Двоичное кодирование в компьютере
Вся информация, которую обрабатывает компьютердолжна быть представлена двоичным кодом с помощью
двух цифр: 0 и 1. Эти два символа принято называть
двоичными цифрами или битами.
С помощью двух цифр 0 и 1 можно закодировать любое
сообщение. Это явилось причиной того, что в
компьютере обязательно должно быть организованно
два важных процесса: кодирование и декодирование.
Кодирование – преобразование входной информации в
форму, воспринимаемую компьютером, т.е. двоичный
код.
Привет!
1001011
Декодирование – преобразование данных из двоичного
кода в форму, понятную человеку.
3. Почему двоичное кодирование
С точки зрения технической реализации использование двоичнойсистемы счисления для кодирования информации оказалось
намного более простым, чем применение других способов.
Действительно, удобно кодировать информацию в виде
последовательности нулей и единиц, если представить эти
значения как два возможных устойчивых состояния
электронного элемента:
0 – отсутствие электрического сигнала;
1 – наличие электрического сигнала.
Эти состояния легко различать. Недостаток двоичного
кодирования – длинные коды. Но в технике легче иметь дело
с большим количеством простых элементов, чем с небольшим
числом сложных.
4. Двоичное кодирование текстовой информации
Начиная с 60-х годов, компьютеры всебольше стали использовать для
обработки текстовой информации и в
настоящее время большая часть ПК в
мире занято обработкой именно текстовой
информации.
Традиционно для кодирования одного
символа используется количество
информации = 1 байту (1 байт = 8 битов).
5. 1 символ – 1 байт (8 бит)
Для кодирования одного символатребуется один байт информации.
Учитывая, что каждый бит принимает
значение 1 или 0, получаем, что с
помощью 1 байта можно закодировать 256
различных символов.
28=256
6. Двоичное кодирование текстовой информации
Кодирование заключается в том, чтокаждому символу ставиться в
соответствие уникальный двоичный код от
00000000 до 11111111 (или десятичный
код от 0 до 255).
Важно, что присвоение символу конкретного
кода – это вопрос соглашения, которое
фиксируется кодовой таблицей.
7. Таблица кодировки
Таблица, в которой всем символамкомпьютерного алфавита поставлены в
соответствие порядковые номера (коды),
называется таблицей кодировки.
Для разных типов ЭВМ используются
различные кодировки. С распространением
IBM PC международным стандартом стала
таблица кодировки ASCII (American Standart
Code for Information Interchange) –
Американский стандартный код для
информационного обмена.
8. Таблица кодировки ASCII
Стандартной в этой таблице является только первая половина,т.е. символы с номерами от 0 (00000000) до 127 (0111111).
Сюда входят буква латинского алфавита, цифры, знаки
препинания, скобки и некоторые другие символы.
Остальные 128 кодов используются в разных вариантах. В
русских кодировках размещаются символы русского
алфавита.
В настоящее время существует 5 разных кодовых таблиц для
русских букв (КОИ8, СР1251, СР866, Mac, ISO).
В настоящее время получил широкое распространение новый
международный стандарт Unicode, который отводит на
каждый символ два байта. С его помощью можно
закодировать 65536 (216= 65536 ) различных символов.
9.
10.
Таблицарасширенного
кода ASCII
Кодировка
Windows-1251
(CP1251)
11. Информационный объем текста
Сегодня очень многие люди для подготовки писем,документов, статей, книг и пр. используют
компьютерные текстовые редакторы. Компьютерные
редакторы, в основном, работают с алфавитом
размером 256 символов.
В этом случае легко подсчитать объем информации в
тексте. Если 1 символ алфавита несет 1 байт
информации, то надо просто сосчитать количество
символов; полученное число даст информационный
объем текста в байтах.
Пусть небольшая книжка, сделанная с помощью
компьютера, содержит 150 страниц; на каждой странице
— 40 строк, в каждой строке — 60 символов. Значит
страница содержит 40x60=2400 байт информации.
Объем всей информации в книге: 2400 х 150 = 360 000