107.23K
Category: informaticsinformatics

Единицы информации

1.

ЕДИНИЦЫ
ИНФОРМАЦИИ
Классификация и основные свойства единиц
информации

2.

Структура сообщения
■ Синтаксис (формат) сообщения – совокупность
правил, которым должны соответствовать
структура информационных сообщений,
передаваемых в виде совокупности знаков для
того, чтобы приемник мог воспринять ее и
обработать;
■ Семантика сообщения – содержание, которое
изменяет знания приемника данных.

3.

Форматы данных
– фиксированный (жесткий) формат данных –
выделяются единицы информации, причем
для каждой из единиц устанавливается имя и
область допустимых значений;
– свободный формат данных – способ
форматирования документов, при котором не
выделяются специфические единицы данных.

4.

Пример:
Студенту Иванову С.А. назначена стипендия в размере
900руб. С 02.02.2008 по 01.07.2008г.
Форматированный вариант:
Фамилия И.О.
Иванов С.А.
Состояние стипендии
назначена
Размер стипендии
900 руб
С
02.02.2008г.
По
01.07.2008г.

5.

Основные единицы информации
■ Атрибуты (реквизиты)
■ Составные единицы информации (СЕИ)

6.

Атрибуты
– информационное отображение
отдельного свойства некоторого объекта,
процесса или явления

7.

Атрибут
характеризуется именем и значением.
Имя атрибута – условное обозначение в процессе
обработки данных.
Значение атрибута – величина, характеризующая
свойство объекта в конкретных обстоятельствах.
Все допустимые значения атрибута
образуют
множество, называемое доменом данного атрибута.

8.

Атрибут
с именем X представляет собой пару
где z – элемент множества Z (домена
значений).
(X, z),
Определение атрибута в информационной
системе предполагает указание его имени и
списка значений.

9.

Атрибут
В языке Transact SQL объявление переменных
включает в себя описание типа и задание имени
переменных:
@counter char(5);
присвоение значения может быть выполнено при
объявлении переменной:
Set counter=3.12;
или в процессе работы программного модуля.

10.

Атрибут
Если в домене есть необходимость
перечислить обозначения объектов из
некоторого класса, то разрабатывается
классификатор, содержащий условные
обозначения (коды) отдельных объектов и
классов, к которым эти объекты отнесены.

11.

Система кодирования
– это совокупность правил кодового обозначения
объектов.
Кодирование применяется для замены названия
объекта на условное значение (код) в целях
обеспечения удобной и эффективной обработки
информации.

12.

Код характеризуется:
длиной – числом позиций в коде;
структурой – порядком расположения в
коде символов, используемых для
обозначения классификационного
признака.
Процедура присвоения объекту кодового
обозначения называется кодированием.

13.

Виды систем кодирования
Классификационная
Последовательная
Параллельная
Регистрационная
Порядковая
Серийнопорядковая

14.

Задание
Скорректируйте представление
информации на приведенных ниже слайдах
с точки зрения лучшей подачи информации

15.

Классификационная система
■ Последовательное кодирование используется для
иерархической классификационной структуры. Суть
метода заключается в следующем: сначала
записывается код старшей группировки первого
уровня, затем код группировки второго уровня, затем
код группировки третьего уровня и т.д. В результате
получается кодовая комбинация, каждый разряд
которой содержит информацию о специфике
выделенной
группы
на
каждом
уровне
иерархической структуры.
■ Параллельное
кодирование
используется
для
фасетной системы классификации. Суть метода
заключается в следующем: все фасеты кодируются
независимо друг от друга; для значений каждого
фасета выделяется определенное количество
разрядов кода. Параллельная система кодирования
обладает теми же достоинствами и недостатками, что
и фасетная система классификации.

16.

Регистрационное кодирование используется для однозначной
идентификации объектов и не требует их предварительной
классификации. Различают порядковую и серийно-порядковую системы.
Порядковая система кодирования предполагает последовательную
нумерацию объектов числами натурального ряда. Этот порядок может
быть случайным или определяться после предварительного
упорядочения объектов, например по алфавиту. Этот метод применяется
в том случае, когда количество объектов невелико, например
кодирование названий факультетов университета, кодирование
студентов в учебной группе.
Серийно-порядковый
метод
кодирования
—предусматривает
предварительное выделение групп объектов, которые составляют
серию, а затем в каждой серии производится порядковая нумерация
объектов. Каждая серия также будет иметь порядковую нумерацию..
Примером может служить присвоение порядковых номеров
определенной группе товаров. Так, консервы рыбные получают индекс
Р (рыбная промышленность), а затем определенный порядковый номер,
например, 85 — лосось дальневосточный натуральный — горбуша.

17.

Классификационная система. Пример образования кода
последовательным методом кодирования по
классификационной части ОКП (К-ОКП)
35 – продукция кабельная
35 8 – кабели, провода, шнуры
межотраслевого и отраслевого
назначения.
35 82 – провода монтажные
35 82 1 – с медной жилой
35 82 12 – с поливинилхлоридной изоляцией

18.

Классификационная система. Пример параллельного
кодирования
■ 1-й (старший) разряд выделен для фасета “факультет”
и имеет следующие значения: 1 – ИиФ; 2 – ПиЭБ;
■ 2-й разряд выделен для фасета “форма обучения” и
имеет следующие значения: 1 – очная; 2 – заочная;
■ 3-й разряд выделен для фасета “специальность” и
имеет следующие значения: 1 – ФиК; 2 – ПИвЭ; 3 –
БУАиА;4-ГМУ;
■ Раскодируйте:
■ 124

19.

Регистрационная система

Если кодом объекта служит его порядковый номер. Такая система кодирования называется
порядковой.

Когда используется несколько классификационных признаков, возможно, взаимно
подчиненных по классам, подклассам, удобно использовать разрядную систему
кодирования.

Рассмотрим различные системы кодирования на примере значений атрибута Код студента.

Порядковый код – это просто номер студента в списке всех студентов

Предположим, что нужно разделять студентов-дневников и студентов заочников.

1) При порядковом коде выделим номера с 1 до 5000 для студентов-дневников, с 5001 до
6000 – для заочников.

2) При разрядном кодировании первый знак кода будет принимать 2 значения: 1 –
дневники, 2 – заочники. Следующие 4 разряда отводятся для номера студента по порядку.

2.2) В разрядном кодировании можно учесть больше признаков.

1 12 230 11

Оставим первый разряд для формы обучения (дневное-заочное), во втором разряде
укажем год поступления или номер курса (1-2 знака), в третьем – код направления в
четвертом – 2 знака на номер студента по направлению.

20.

Сравнение методов
Метод
Порядковый
Достоинства
Простота присвоения кодов
Экономичность использования 9999
кодов, принятых в классификаторах
Серийно-порядковый
Упорядочение объектов по сериям, в
результате чего появляется
дополнительная информация
Последовательный
При малой значности кода большая
информационная емкость
Параллельный
Хорошая приспособленность для
машинной обработки, гибкость кода
облегчает введение необходимых
изменений в фасету
Недостатки
Отсутствие дополнительной
информации об объектах
Невозможность выделения
общности и разницы между
объектами
Требуется дополнительное
распределение множества по
объектам по определенным
признакам
Жесткость кода из-за строгого
фиксирования последовательно
кодируемых признаков,
сложность изменения в коде с
целью введения новых признаков
Недостаточная связь между
отдельными группировками

21.

Составные единицы информации

Составной единицей информации (СЕИ) называется набор
из атрибутов и других СЕИ.

База данных также может быть рассмотрена как
составная единица информации.

22.

Составные единицы информации

Множество атрибутов объединяются в одну СЕИ по
следующим принципам:
– соответствующие атрибуты описывают один и тот же
процесс;
– значения атрибутов, входящих в СЕИ, возникают
одновременно, связаны логическими или
арифметическими соотношениями

23.

Составные единицы информации

Характеристики СЕИ являются:
– Имя – условное обозначение в процессах обработки
информации
– Структура – вхождение одних единиц информации в
состав других единиц информации
– Значения – набор значений атрибутов и СЕИ,
входящих в состав рассматриваемой единицы
информации

24.

Составные единицы информации

Одна из задач СЕИ в информационных системах –
описание структуры экономических документов

Документ – материальный носитель информации,
содержащий оформленные в установленном порядке
сообщения и имеющий юридическую силу.

25.

Составные единицы информации

Описание структуры СЕИ

Для описания структуры независимо от языка
программирования используется обозначение:

ИМЯ СЕИ(ИМЯ АТРИБУТА, …)

26.

Прих(2).(Дата,Пост,Склад,Табл(3).(Ннм,
К-во_док,К-во_пр, Цена,Сумма)
дата
пост
склад
07.09.04
3476
02
Прих
Ннм
К-во_док
К-во_пр
цена
сумма
49712
72426
26114
12
8
5
10
8
5
6
8
5
60.00
64.00
25.00

27.

Составные единицы информации
Определение структуры в Transact SQL
Create table Family
(
FIO char(30);
Job char(30)
)
Элементы структуры называются полями.
Поля могут быть любого основного типа, массивами, указателем,
объединением или структурой. Для обращения к полю
используется операция выбора («точка» для переменной и -> для
указателя):
Family.FIO=‘Иванов С.А’;

28.

Составные единицы информации

Определение значения СЕИ можно дать на основе
значений единиц, входящих в состав СЕИ.

Значения СЕИ, входящих в другую СЕИ, определяется
рекурсивно, однако необходимо учитывать размерность
СЕИ.

Одно значение СЕИ при хранении в памяти ЭВМ
называется записью.

29.

Экономические показатели

При анализе экономических документов ставится задача
разделения документа на элементарные осмысленные
фрагменты – показатели

Показатель представляет собой полное описание
количественного параметра, характеризующего
некоторый объект или процесс

Как единица информации показатель является
разновидностью СЕИ. Схематично структура показателя
представляется выражением:
П(P1,P2,…,Pk,Q)
P1,…,Pk – атрибуты-признаки, Q – атрибут-основание

30.

Показатели
■ Реквизит-признак представляет собой
информационное отображение качественного
свойства некоторого объекта
■ Реквизит-основание является отображением
количественного свойство объекта или процесса.
■ При хранении экономических показателей один
файл (таблица) отводится под группу показателей
с одинаковым составом реквизитов признаков.

31.

Описание экономического
процесса
■ Выделяют семь классов признаков описывающих
экономический процесс:







Признаки формальной характеристики – формальный способ
вычисления соответствующего показателя;
Признаки характеристики процесса – характеристики
состояний в которых находится описываемый объект (наличие,
выпуск, реализация и т.п.)
Признаки объекта – указывают характеризуемый показателем
объект (продукция, сырье, персонал и т.п.);
Признаки единицы измерения;
Признаки субъекта – организации, предприятия;
Признаки времени;
Признаки функции управления – принадлежность показателя к
определенной функции управления

32.

Критерий качества создания базы
данных

Минимальная избыточность хранимой информации,
выражаемая принципом: каждое сообщение хранится в БД один
раз. Соблюдение данного принципа дает следующие
преимущества:




Сокращается объем памяти ЭВМ, для хранения БД;
Сокращается трудоемкость ввода данных и упрощаются проблемы
контроля достоверности информации;
Упрощаются алгоритмы корректировки данных;
Использование экономических показателей позволяет построить
структуру БД с минимальной избыточностью, если сначала
расчленить все сведения в ЭИС на показатели, а потом
объединить атрибуты родственных показателей по принципу:

в один файл включается группа показателей с одинаковым
составом атрибутов-признаков.
English     Русский Rules