Similar presentations:
Язык разметки XML
1. Язык разметки XML
2. Вопросы
1.2.
3.
4.
5.
6.
История появления языков разметки
Перечислить и объяснить недостатки HTML
Архитектура документов XML
Перечислить преимущества XML
Синтаксический анализатор
Компоненты документа XML
Символьные данные
Комментарии
Инструкции обработки
Примитивы
Общие примитивы
Объявления DOCTYPE
Ссылки на примитивы
3. История средств разметки
Документы записываются спомощью бумаги и ручки
Наборщики
форматируют документы
Средства, используемые
наборщиками для
форматирования документа
4. Язык разметки
Язык разметки определяет правила, которыепомогают добавить смысловое значение к
содержимому и структуре документов
Языки классифицируются, как:
Stylistic Markup (Стилистическая разметка) – Определяет
представление документа
Structure Markup (Структурная разметка) – Определяет
структуру документа
Semantic Markup (Семантическая или Смысловая
разметка) – Определяет содержимое документа
5. SGML
Система форматирования документов была названаGeneralized Markup Language (GML) – Язык разметки
общего назначения
Язык GML тщательно разрабатывался и
дорабатывался и в конечном итоге стал известен, как
Standard Generalized Markup Language (SGML) –
Стандартный язык разметки
SGML считается родоначальником всех языков
разметки
6. Возможности языка SGML
Описывает язык разметки, позволяющий авторамсоздавать собственные тэги, связанные с
содержанием
Необходим файл, который должен содержать все
правила этого языка для его интерпретации
Язык разметки, производный от SGML, называется
приложением SGML
7. HTML
HTML – это самый известный язык разметки,являющийся производным от SGML
Он был создан для разметки технической
документации, с тем, чтобы документы могли бы
передаваться между различными платформами в
научном сообществе
Сейчас он используется и многими другими
пользователями, которые заинтересованы в
визуальном представлении своих документов
8. Недостатки HTML
Фиксированный набор тэговТехнология представления не связана с содержанием
«Плоская» разметка
Излишнее количество служебных данных
HTML не является международным языком
Невозможен обмен данными
Не имеет надёжного механизма связывания
HTML не обеспечивает повторное использование
9. Примеры кода HTML и XML
<UL>Код HTML
<LI> TOM CRUISE
<UL>
<LI> CLIENT ID : 100
<LI> COMPANY : XYZ Corp.
<LI> Email : [email protected]
<LI> Phone : 3336767
<LI> Street Adress : 25th St.
<LI> City : Toronto
<LI> State : Toronto
<LI> Zip : 20056
</UL>
</UL>
Код XML
<Details>
<CONTACT>
<PERSON_NAME>TOM
CRUISE
</PERSON_NAME>
<ID>
100
</ID>
<COMPANY>
XYZ
Corp.
</COMPANY>
<Email>
[email protected]</Email>
<Phone>
3336767
</Phone>
<Street>
25th
St.
</Street>
<City>
Toronto
</City>
<State>
Toronto
</State>
<ZIP>
20056
</ZIP>
</CONTACT>
</Details>
10. XML
XML – это аббревиатура от Extensible MarkupLanguage (XML) – расширяемый язык разметки
Устраняет все недостатки, присущие HTML
Позволяет пользователю определить собственный
набор тэгов, а также даёт возможность понять их и
другим пользователям
Гораздо более гибкий язык, чем HTML
Наследует свойства языка SGML и объединяет их с
положительными свойствами HTML
Является более компактной версией SGML
11. XML
XML – это метаязык, который описывает другиеязыки
Данные, содержащиеся в файле XML, могут быть
выведены различными способами
Данные также могут быть переданы в другие
приложения для дальнейшей обработки
Таблицы стилей (Style sheets) помогают
преобразовать структурированные данные в
различные HTML-представления для вывода данных
в различных браузерах
12. Архитектура XML
XML поддерживает трёхзвенную архитектуру дляобработки и манипулирования данными
Может быть сгенерирован из существующих баз
данных с использованием масштабируемой
трёхзвенной модели
Тэги XML представляют логическую структуру
данных, которая может быть интерпретирована и
использована различными способами в
многочисленных приложениях
Среднее звено используется для доступа к
многочисленным базам данных и трансляции данных
в формат XML
13. XML архитектура
Настольныйкомпьютер
Вид 2
Вид 1
Вывод
Несколько видов,
созданных из
данных,
основанных на
XML
XML
Среднее звено
Web-сервер
Доступ к БД,
бизнес-правила
интеграции
Хранение
База данных
Мэйнфрейма
Доставка и обработка
данных
Обмен данными в формате
XML через HTTP
Интеграция данных
XML создаётся или
генерируется
14. XML – универсальный формат данных
HTML – это один язык разметки, а XML являетсясемейством языков разметки
Любой тип данных может быть с лёгкостью
определён в XML
XML популярен, благодаря широкому спектру
областей его применения, а также потому, что он
прост в использовании
XML имеет структурированный формат данных,
который позволяет хранить сложные (составные)
данные
15. Преимущества XML
Трёхзвенная архитектура обеспечиваетлёгкость масштабирования и улучшенную
безопасность
Преимущества XML классифицируются
следующим образом:
Преимущества в области бизнеса
Технологические преимущества
16. Преимущества в области бизнеса
Совместное использование информацииXML в составе одного приложения
Позволяет отраслям бизнеса определять собственные форматы
данных в XML, с лёгкостью создавать средства для чтения этих
данных, для записи данных и для преобразования данных
между XML и другими форматами
Весьма мощный и гибкий язык для описания сложных свойств
реального мира
Расширяемость – даёт приложению возможность дальнейшего
роста и разработки без каких-либо радикальных изменений
Доставка содержания
Способность поддерживать различных пользователей и
информационные каналы (механизмы доставки информации)
для построения более эффективных приложений
17. Технологические преимущества
Разделение данных ипредставления
Семантическая
информация
Технологические
преимущества
Повторное
использование
данных
Расширяемость
18. Реальное использование языка XML
EDI документы электронныеSABRE (сфера международного туризма)
Chemical Markup Language
(химический язык разметки)
19. Структура документа XML
Документ XML состоит из наборов «примитивов»(«entities»), идентифицируемых по неповторяющимся,
уникальным именам
Все документы начинаются с примитива «корневой»
(root) или «документ» (document)
Примитивы – это псевдонимы для более сложных
функций
Документы логически состоят из объявлений,
элементов, комментариев, символьных ссылок и
инструкций обработки
20. Правильно сформированные и корректные документы
Спецификация XML 1.0 определяет синтаксис XMLДокумент считается правильно сформированным, если он
удовлетворяет минимальному набору требований,
определённых пользователем
Требования гарантируют, что используются правильные
языковые конструкции, что они используются по назначению,
именно так, как определено спецификацией языка XML.
Корректный документ – это правильно сформированный
документ, который к тому же полностью соответствует
правилам, определённым в DTD
DTD определяет правила, по которым XML выполняет
разметку в документе, и должен неукоснительно их соблюдать.
21. Синтаксические анализаторы
Синтаксические анализаторы помогаюткомпьютеру интерпретировать файл XML
Существуют два типа синтаксических
анализаторов:
Синтаксический анализатор без проверки
корректности
Синтаксический анализатор с проверкой
корректности
22. Синтаксические анализаторы
XMLфайл
Синтаксический
анализатор загружает XML
и другие связанные файлы
для проверки: является ли
документ XML правильно
сформированным и
корректным
Прочие
связанные
файлы (такие,
как DTD файл)
Дерево
данных
23. Данные и разметка
Документ XMLДанные
Текст, который описывает данные – Разметка
<NAME>ЛЦПбп-17-1</NAME>
Тэги <NAME> и </NAME> - это разметка
‘ЛЦПбп-17-1’ – это символьные данные
24. Создание документа XML
Этапы, которые вы должны пройти длясоздания документа XML
Составление декларации XML
Создание корневого элемента
Создание кода XML
Проверка документа
25. Составление декларации XML
Помогает браузеру и читателю документа обработать документСинтаксис
<?xml version=“1.0”?>
Декларация XML не является обязательной
Версия XML 1.0 принята по умолчанию
Сообщает синтаксическому анализатору и другим приложениям о
способе, которым должны быть обработаны данные в файле
<?xml version=“1.0” standalone=“no” encoding=“UTP-8”?>
Атрибуты “standalone” и “encoding” не являются обязательными, только
номер версии обязателен
‘Standalone’ определяет, используется ли внешняя декларация или не
используется
‘Encoding’ определяет кодировку символов, используемую автором
26. Создание корневого элемента
Может существовать только один корневойэлемент
Он описывает функцию документа
Каждый документ XML обязательно должен
содержать корневой элемент
<?xml version=“1.0” standalone=“no” encoding=“UTP-8”?>
<BOOK>
</BOOK>
27. Создание кода XML
Это процесс создания собственных элементов иатрибутов в соответствии с требованиями нашего
приложения
Элементы – это базовые единицы содержимого XML
Тэги сообщают пользовательскому агенту, что
нужно сделать с содержимым, заключённым между
начальным и конечным тэгами
Открывающий Содержание Закрывающий
тэг
тэг
Части
элемента
<TITLE>
Группа ЛЦПбп
Элемент
</TITLE>
28. Комментарии
Специальная информация, которая приводится вдокументе для того, чтобы в будущем читатель мог
с нею ознакомиться, и которая должна
игнорироваться процессором, называется
комментариями
Синтаксис
<!-- Здесь записать комментарии -->
Пример
<!-- эти строки не показывать
<NAME>KATE WINSLET</NAME>
<NAME>NICOLE KIDMAN</NAME>
<NAME>ARNOLD</NAME>
-->
<NAME>TOM CRUISE</NAME>
Приведённый пример должен
вывести только имя TOM
CRUISE, а другие имена
воспринимаются, как
комментарии
29. Инструкции обработки
Обработка информации является частьюинформации, значимой для приложения,
использующего документ XML.
Эти инструкции передаются непосредственно в
приложение с помощью синтаксического
анализатора.
Декларация XML – это также агент обработки
<?xml:stylesheet type=“text/xsl”?>
Имя приложения
Информационная инструкция
30. Символьные данные
Текст между начальным и конечным тэгамиопределяется, как "символьные данные"
(‘character data’)
Символьные данные могут быть любыми
допустимыми символами (Unicode)
Символьные данные делятся на:
PCDATA
CDATA
31. PCDATA
Это означает parsed character data (обрабатываемыесимвольные данные)
PCDATA – это текст, который будет обрабатываться
синтаксическим анализатором
Тэги в этом тексте будут восприняты, как разметка,
а примитивы будут развёрнуты.
Имя примитива
<
>
&
"
'
Символ
<
>
&
"
'
Предопределённые
примитивы
32. CDATA
Это означает character data (символьные данные)Не обрабатываются синтаксическим анализатором
CDATA используются для обеспечения удобства
включения больших блоков специальных символов.
Строку символов ‘]]>’ нельзя использовать внутри
блока CDATA, так как она сигнализирует об
окончании блока CDATA.
Пример
<SAMPLE>
<![CDATA[<DOCUMENT>
<NAME>TOM CRUISE</NAME>
<EMAIL>[email protected]</EMAIL>
</DOCUMENT>]]>
</SAMPLE>
33. Примитивы
Примитивы (Entities) используются в документе, чтобысократить трудозатраты в тех случаях, когда необходимо
многократно вводить большие фрагменты текста в
документ.
Существуют две категории примитивов:
Общие примитивы (General entities)
Синтаксис
<!ENTITY ADDRESS "text that is to be represented by an entity">
Параметризованные примитивы (Parameter entities)
Синтаксис
<!ENTITY % ADDRESS "text that is to be represented by an entity">
34. Примеры использования примитивов
Параметризованные примитивы: Объявление примитива:< CLIENT = "&APTECH;"
<!ENTITY full_address
PRODUCT =
" My Address 12
"&PRODUCT_ID;"
Tenth Ave. Suite 12
QUANTITY = "15">
Paris, France">
Объявление примитива
Синтаксис
%PARAMETER_ENTITY_NAME;
Пример
%address;
Объявление примитива
Синтаксис
&ENTITY_NAME;
Пример
&address;
35. Декларации DOCTYPE
Декларация <!DOCTYPE [..]> следует задекларацией XML в документе XML
Синтаксис
<?xml version="1.0"?>
<!DOCTYPE myDoc [
...здесь объявляются примитивы....
<myDoc>
...тело документа....
</myDoc>
Пример
<!DOCTYPE CUSTOMERS [
<!ENTITY firstFloor "15 Downing St Floor 1">
<!ENTITY secondFloor "15 Downing St Floor 2">
<!ENTITY thirdFloor "15 Downing St Floor 3">
]>
36. Атрибуты
Атрибут даёт информацию об элементеАтрибуты включаются в стартовый тэг
элемента
Атрибут состоит из имени атрибута и
значения атрибута
Пример
<TV count="8">SONY</TV>
<LAPTOP count="10">IBM</LAPTOP>
37. Выводы
Язык разметки определяет набор правил, которые добавляютсмысловую нагрузку к содержанию и структуре документов.
XML – это расширяемый язык, то есть мы можем определить
собственный набор тэгов, и дать возможность другим
сторонам (людям или программам) знать и понимать эти тэги.
Это делает XML гораздо более гибким языком, чем HTML.
XML наследует свойства языка SGML и объединяет их с
положительными свойствами HTML. XML может быть
сгенерирован из существующих баз данных с использованием
масштабируемой трёхзвенной модели. Основанные на XML
данные не содержат информации о том, каким образом
должны выводиться данные.
Документ XML состоит из наборов "примитивов" (“entities”),
идентифицируемых по неповторяющимся, уникальным
именам.
Правильно сформированный документ – это такой документ,
который соответствует основным правилам XML.
Синтаксический анализатор помогают компьютеру
интерпретировать файл XML.
38. Выводы
Шаги, предполагаемые при создании документа XML:Составление декларации XML
Создание корневого элемента
Создание кода XML
Проверка документа
Символьные данные разделяются на PCDATA и CDATA.
Примитивы (Entities) используются в документе, чтобы
сократить трудозатраты в тех случаях, когда необходимо
многократно вводить большие фрагменты текста в документ.
Существуют две категории примитивов:
Общие примитивы
Параметризованные примитивы
Декларация <!DOCTYPE [..]> следует за декларацией XML в
документе XML.
Атрибут даёт информацию об элементе.