Кодирование текстовой информации
ASII
UNICODE
Пять кодировок русского языка
СР 1251
CP 866
ISO
177.00K
Category: informaticsinformatics

Кодирование текстовой информации

1. Кодирование текстовой информации

2. ASII

• Таблица, в которой всем
символам компьютерного
алфавита поставлены в
соответствие порядковые
номера, называется
таблицей кодировки
• 1 сим.=8 бит=1 байт.
• 2^8=256
• N=2^i

3. UNICODE

• 1 сим.= 16 бит=2 байт
• 2^16=65536
• N= 2 ^I

4. Пять кодировок русского языка

• KOИ 8
• Windows CP 1251
• MS DOS CP 866
• Mac
• ISO

5.

КОИ - 8
Хронологически одним из первых стандартов кодирования русских
букв на компьютерах был КОИ8 ("Код обмена информацией, 8битный"). Эта кодировка применялась еще в 70-ые годы на
компьютерах серии ЕС ЭВМ.

6. СР 1251

Наиболее распространенной в настоящее время
является кодировка Microsoft Windows, обозначаемая
сокращением CP1251 ("CP" означает "Code Page",
"кодовая страница").

7. CP 866

• От начала 90-ых годов, времени господства
операционной системы MS DOS, остается
кодировка CP866.

8.

MAC
Компьютеры фирмы Apple, работающие под управлением
операционной системы Mac OS, используют свою собственную кодировку
МАС.

9. ISO

Кроме того, Международная организация по
стандартизации (International Standards Organization,
ISO) утвердила в качестве стандарта для русского
языка еще одну кодировку под названием ISO 8859-5

10.

Последовательности десятичных кодов слова
«ЭВМ» в различных кодировках составляем
на основе кодировочных таблиц:
КОИ8- Р : 252 247 237
СР1251: 221 194 204
СР866: 157 130 140
Мас: 157 130 140
ISO: 205 178 188
Для преобразования русскоязычных текстовых
документов из одной кодировки в другую
используются специальные программы –
конверторы, встроенные в приложения.
English     Русский Rules