942.00K
Category: informaticsinformatics

Единицы представления, измерения, хранения данных

1.

2.3 Единицы представления,
измерения, хранения данных

2.

Единицы представления данных
Существует множество систем представления данных, основанных на
различных системах счисления.
Одна из них, принятая в информатике и вычислительной технике –
двоичный код. Наименьшей единицей такого представления является бит –
двоичный разряд.
Совокупность двоичных разрядов, выражающих числовые или иные
данные, образует некий битовый рисунок.
Практика показывает, что с битовым представлением удобнее работать,
если этот рисунок имеет регулярную форму. В настоящее время в качестве
таких форм используются группы из восьми битов, которые называются
байтами.

3.

Десятичное число
Двоичное число
Байт
1
2
3
4

7
1
10
11
100

111
0000 0001
0000 0010
0000 0011
0000 0100

0000 0111

255

11111111

1111 1111

4.

Понятие о байте как о группе взаимосвязанных битов появилось вместе
с первыми образцами электронной вычислительной техники.
Долгое время оно было машиннозависимым, то есть для разных
вычислительных машин длина байта была разной. Только в конце 60-х годов
понятие байта стало универсальным и машиннонезависимым.
Во многих случаях целесообразно использовать не восьмиразрядное
кодирование, а 16-разрядное, 24-разрядное, 32-разрядное и более.
Группа из 16 взаимосвязанных битов (двух взаимосвязанных байтов) в
информатике называется словом. Соответственно, группы из четырех
взаимосвязанных байтов (32 разряда) называются удвоенным словом, а
группы из восьми байтов (64 разряда) – учетверенным словом. Пока, на
сегодняшний день, такой системы обозначения достаточно.

5.

Единицы измерения данных
Существует много различных систем и единиц измерения данных.
Каждая научная дисциплина и каждая область человеческой деятельности
может использовать свои, наиболее удобные или традиционно устоявшиеся
единицы.
В информатике для измерения данных используют тот факт, что разные
типы данных имеют универсальное двоичное представление, и потому
вводят свои единицы данных, основанные на нем.
Наименьшей единицей измерения является байт. Поскольку одним
байтом, как правило, кодируется один символ текстовой информации, то для
текстовых документов размер в байтах соответствует лексическому объему
в символах.
Более крупная единица измерения – килобайт (Кбайт). Для
вычислительной техники, работающей с двоичными числами, более удобно
представление чисел в виде степени двойки, 1Кбайт равен 210 байт (1024
байт). В килобайтах измеряют сравнительно небольшие объемы данных.
Условно можно считать, что одна страница неформатированного
машинописного текста составляет около 2 Кбайт.

6.

Более крупные единицы измерения данных:
Название
байт
килобайт
мегабайт
гигабайт
терабайт
петабайт
эксабайт
зеттабайт
йоттабайт
Символ
Б
КБ
МБ
ГБ
ТБ
ПБ
ЭБ
ЗБ
ЙБ
Степень
20
210
220
230
240
250
260
270
280

7.

Единицы хранения данных
При хранении данных решаются две проблемы: как сохранить данные в
наиболее компактном виде и как обеспечить к ним удобный и быстрый
доступ (если доступ не обеспечен, то это не хранение).
Для обеспечения доступа необходимо, чтобы данные имели
упорядоченную структуру, а при этом, образуются адресные данные. Без
них нельзя получить доступ к нужным элементам данных, входящих в
структуру.
В качестве единицы хранения данных принят объект переменной
длины, называемый файлом.
Файл – это последовательность произвольного числа байтов,
обладающая уникальным именем.
Обычно в отдельном файле хранят данные, относящиеся к одному типу.
В этом случае тип данных определяет тип файла. В зависимости от типа
файла ему присваивается расширение соответствующего типа. Расширение
помогает определить к какому типу файлов относится данный файл.
Стандартно расширение имеет три буквы и записывается после имени
файла через точку.

8.

Проще всего представить себе файл в виде безразмерного
канцелярского досье, в которое можно по желанию добавлять содержимое
или извлекать его оттуда. Поскольку в определении файла нет ограничений
на размер, можно представить себе файл, имеющий 0 байтов (пустой
файл), и файл, имеющий любое число байтов.
Имя файла фактически несет в себе адресные данные, без которых
данные, хранящиеся в файле, не станут информацией из-за отсутствия
метода доступа к ним.
Кроме функций, связанных с адресацией, имя файла может хранить и
сведения о типе данных, заключенных в нем. Для автоматических средств
работы с данными это важно, поскольку по имени файла они могут
автоматически выбрать наиболее адекватный метод для извлечения
информации из него.

9.

Примеры расширения файлов:
$$$
Временный рабочий файл
ASM
Файл исходного кода ассемблера
BAK
Старая версия ранее записанного файла
BAS
Файл исходного текста на языке Basic
BAT
Файл командный
CPP
Файл исходного текста на языке C++
DOC
Файл данных в ASCII кодах или текстовый файл
EXE
Файл исполняемый
EXL
Файл табличного процессора Excel
OBJ
Файл объектный, созданный компилятором
PAS
Файл исходного текста на языке Pascal
SYS
Файл системный или драйверный файл
TXT
Файл текстовый
RTF
Файл текстовый форматированный
English     Русский Rules