671.17K
Category: informaticsinformatics

Теоретические основы информационных процессов и систем

1.

Дисциплина: Теоретические
основы информационных
процессов и систем
Преподаватель: канд. техн. наук, доцент
Кромина Людмила Александровна

2.

Из истории науки
В 1948 году вышла в свет работа Клода Шеннона «Математическая теория связи», в
которой развивались идеи помехоустойчивого кодирования при передаче сообщений по
каналам с шумами. Этот труд лег в основу нового научного направления, получившего
название «Теория информации». В рамках теории информации был получен ряд
значительных результатов, связанных с различными вопросами кодирования передаваемых
сообщений. Это результаты «в области алгебраической теории кодирования, построения
различных оптимальных кодов, в области декодирования избыточных кодов, получения
границ вероятности ошибки и различных информационных пределов избыточности».
Многие из них были успешно использованы на практике, например, при решении задачи
выбора комплекса технических средств и обеспечения его оптимального функционирования.
Однако с развитием вычислительной техники – появлением персональных ЭВМ и их
сетей – наиболее актуальными оказались проблемы не оптимального кодирования, а
оптимального поиска и хранения данных в искусственной памяти, а также другие вопросы,
связанные с обработкой данных. Поэтому в 80–е годы прошлого столетия на основе
классической теории информации сформировалась новая наука с более широкой предметной
областью – теоретическая информатика, включившая теорию информации как один из
разделов. Курс «ТОИП» охватывает некоторые основные направления развития
теоретической информатики.

3.

Предметная область теоретической
информатики
Теоретическая информатика – это наука о типовых информационных
процессах и их наиболее общих закономерностях. Она обобщает результаты
других наук с точки зрения их значимости для обработки данных, базируясь
на философских законах и категориях. Предметная область теоретической
информатики не имеет строго очерченных границ и мнения различных
исследователей о том, что к ней следует относить, расходятся.
Согласно некоторым, наиболее общим представлениям в теоретической информатике
можно выделить следующие основные направления:
1. Хранение данных (организация баз данных и знаний, моделирование данных и т.п.).
2. Поиск данных (виды поиска, их эффективность, помехоустойчивость поиска и т.п.).
3. Передача данных (кодирование сообщений, помехоустойчивость кодирования и другие
вопросы теории информации).
4. Преобразование данных (конечные и бесконечные автоматы, формальные языки и
грамматики, рекурсивные функции, алгоритмы, нечеткие множества, нейронные сети и т.п.).
Изучаемый курс включает материал, относящийся ко второму и третьему из указанных
направлений.
Цели и задачи курса: овладеть набором теоретических сведений, используемых при
проектировании алгоритмов обработки данных.

4.

КОДИРОВАНИЕ СООБЩЕНИЙ
С категорией «информация» тесно связано понятие информационного
процесса (ИП). Под ИП понимается:
1) Процесс движения данных. При движении данных осуществляется
не только их передача, но и преобразование из одной формы в другую
(рис.1.1):
Рис.1.1
Движение
данных
в АИС
Заполнение бланка
Бланк
(формуляр)
Ввод документа в ЭВМ
База данных
Вывод на экран или
принтер
Электронный
документ
Заполненный
документ
Немашинные носители
Машинные носители
2) Процесс обработки данных. Обработка данных – это всевозможные действия,
производимые над данными. Процессы обработки данных связаны с процессами их движения – в
процессе обработки происходит преобразование данных из одной формы в другую. Например, на
рис. 1.1 показана взаимосвязь процесса движения данных с тремя процессами обработки;
3) Система информационных процессов (т.е. совокупность взаимосвязанных ИП).

5.

КОДИРОВАНИЕ СООБЩЕНИЙ
Передача и кодирование данных в АИС
Передача данных в АИС от источника к приемнику осуществляется при
помощи технических устройств по каналу или линии связи (см. рис. 1.2).
Рис.1.2
Передача данных в АИС
ИСТОЧНИК
ПОМЕХИ (ШУМЫ)
ПРИЕМНИК
Канал связи
Отправитель
сообщения
Устройство
кодирования
информации
Устройство
декодирования
информации
Получатель
сообщения

6.

КОДИРОВАНИЕ СООБЩЕНИЙ
Различные виды кодирования в АИС поясняются на рисунке 1.3:
Рис.1.3
Виды кодирования в АИС
Кодирование в удобной для оператора форме
Помехоустойчивое
кодирование
Кодирование для
сопряжения с ЭВМ
Система передачи
данных (сеть)
ПЭВМ 1
База
данных
ПЭВМ 2
Экономное
кодирование для
сокращения базы
База
данных

7.

КОДИРОВАНИЕ СООБЩЕНИЙ
При кодировании сообщений по некоторой системе кодирования каждому
знаку алфавита ставится в соответствие определенный код – один знак из
алфавита системы кодирования или последовательность таких знаков,
называемая также кодовым словом. При кодировании сообщений в
вычислительной технике используется обычно двоичная система кодирования
с алфавитом {0,1}, из знаков которого составляются различные кодовые слова.
Во многих системах кодирования генерируемые кодовые слова имеют
одинаковую длину (так называемые равномерные коды). Например, коды,
используемые в ЭВМ, представляют собой последовательности байтов –
наборов из восьми двоичных знаков. Последовательность из двух байтов
называется полусловом, из четырех байтов – словом, а из восьми байтов –
двойным словом.
Выбор систем кодирования для осуществления кодирования конкретных типов
сообщений определяется многими факторами, к числу которых относятся:
– удобство получения исходных сообщений из источника;
– быстрота передачи сообщений через канал связи;
– объем памяти, необходимой для хранения сообщений;
– удобство обработки данных;
– удобство декодирования сообщений приемником и т.п.

8.

КОДИРОВАНИЕ СООБЩЕНИЙ
Сжатие данных как информационный процесс
Закодированные сообщения передаются по каналам связи, хранятся в
запоминающих устройствах (ЗУ), обрабатываются процессором. Объемы
данных, циркулирующих в АИС, велики, и поэтому во многих случаях важно
обеспечить такое их кодирование, которое характеризуется минимальной
длиной получающихся сообщений. Это проблема сжатия данных. Ее
эффективное решение обеспечивает увеличение скорости передачи данных и
уменьшение требуемой памяти ЗУ. В конечном итоге это ведет к повышению
эффективности обработки данных.
Известны два основных принципа сжатия данных:
1) сжатие, основанное на анализе содержания данных;
2) сжатие, основанное на анализе статистических свойств кодируемых сообщений.
Второй принцип, в отличие от первого, носит универсальный характер и может
использоваться всегда, когда при передаче сообщений выделяются вероятностные
закономерности.
Рассмотрим оба этих принципа.
English     Русский Rules