Similar presentations:
Модель текстового документа
1. Модель текстового документа
2. Особенности
• Информационные технологии отождествляют стехнологиями работы с документом.
• Так ли это?
2
3. Типы текстовых файлов
• Плоские (.txt)• Размеченные (коммуникативный формат .rtf
«обогащенный формат текста», внутренний
.doc,
•И
• Др.
Представление информации разное.
Разные программные средства.
3
4.
• Текстовый файл представляет из себя последовательностьсимволов
• Символы обычно сгруппированы в строки.
• Строки разделяются разделителями строк.
4
5. Типичные файлы данных
56.
Бинарная разметка6
7. Символьная разметка
78. ASCII
• Аббревиатура от American Standard Code for InformationInterchange - Стандартный американский код обмена
информацией. ASCII - это код для представления символов
английского алфавита в виде чисел, каждой букве
сопоставлено число от 0 до 127. В большинстве
компьютеров код ASCII используется для представления
текста, что позволяет передавать данные от одного
компьютера на другой.
• Текстовый файл, запомненный в формате ASCII, иногда
называют ASCII-файлом. Текстовые редакторы и текстовые
процессоры обычно могут сохранять данные в формате
ASCII.
8
9. Макет документа
• Логическая (содержание)• Логическая структура – составные
элементы
• Физическая (макет) –
• описание документа в физических
единицах: страница, полоса, колонка,
колонтитул и др.
9
10.
1011.
1112.
1213.
1314.
• Модель документа Microsoft Wordhttp://www.monographies.ru/ru/book/section?id=3330
• Автоматическая классификация текстовых документов с
использованием нейросетевых алгоритмов и
семантического анализа
http://www.inteltec.ru/publish/articles/textan/RCDL2003.sh
tml
• Может это бред, а может …
• http://ивановам.рф/informatika_09/informatika_materialy
_zanytii_09_07.html
14
15.
• Максимов Н. В.• Современные информационные технологии: Учебное
пособие / Н.В. Максимов, Т.Л. Партыка, И.И. Попов. - М.:
Форум, 2008. - 512 с.: ил.; 60x90 1/16. (переплет) ISBN 9785-91134-239-5
• про модель текстового документа
стр 45
15