Новости

Язык XML

Работа добавлена:






Язык XML на http://mirrorref.ru

Тема 2. ЯзыкXML

Лекция 2. Введение

План

1. История развитияXML

2. Сравнение языковHTMLиXML

3. Цели и задачиXML

4. Спектр технологийXML (X-технологий)

5. Стандарты платформыXML

6. Примеры практического использованияXML

1. История развитияXML

На первых порах Интернет-технологии развивались достаточно хаотично. Для их упорядочения и стандартизации был организован консорциумW3C(www.w3.org), в задачи которого входит формирование политики развития и стандартизации технологий, а также политики формированияновой платформыWWW (Web2), в основе которой лежит язык XML и его окружение: группа моделей и стандартов, основанных на нем.

Вместе с исследованиями в области ИИ и представления знаний они формируют новую концепциюWeb, называемую Семантический Веб (SemanticWeb).

Язык XML (Extensible Markup Language, расширяемый язык разметки) был разработан рабочей группой XML Working Group консорциума W3C.

Язык XML - этометаязык (язык разметки), являющийся подмножеством стандарта SGML (Standard Generalized Markup Language Стандартного обобщенного языка разметки [ISO 8879]).

Временем рождения XML можно считать 1996 год, в конце которого появился черновой вариант спецификации языка, или 1998, когда эта спецификация была утверждена.

2. Сравнение языковHTMLиXML

ЯзыкиHTMLиXML имеют много общего, но разработаны с разнымицелями. Во-первых, оба языка произошли от SGML и являются мета-языками. В обоих в качестве метаданных используются так называемыетеги -специальные наборы символов, служащие для специфического выделения или пометки некоторых частей документа.

Как и SGML, XML предназначен дляпорождения разнообразных конкретных языков разметки путем определенияконкретных наборов тегов. Эти определяемые с помощью XML языки являются, таким образом, его конкретизациями.

В отличие от XML, язык HTML —конкретный (не расширяемый) язык. Функциональность тегов разметки в нем фиксирована.

Для совместимости этих языков был разработан язык XHTML (extensible HTML, расширяемый HTML), являющийся результатом применения правил синтаксиса XML к стандарту HTML.

Последняя версия спецификацииXML находиться по адресуhttp://www.w3c.org/TR/rec-xml.

Не заменяя HTML, XML в настоящее время используется в сочетании с ним, расширяя возможности Web-страниц для:

  • виртуального представления документов любого типа;
  • сортировки, фильтрации, упорядочения, поиска и манипулирования информацией иными способами;
  • представления информации в структурированном виде.

Рис. 2.1

Как заявляют сами разработчики, XML был создан для взаимодействия с HTML и совместного с ним использования.

3. Цели и задачиXML

При разработке языка XML ставились следующие задачи:

  1. XML должен быть пригоден для непосредственного использования в Интернет.

XML был разработан главным образом для хранения и распространения информации в Web

  1. XML должен иметь широкий круг применения.

Хотя основным его назначением является распространение информации в Web через серверы и программы-браузеры, XML также разработан для использования его другими программами. Например, XML применяется для обмена информацией между финансовыми программами, для распространения и обновления программных продуктов, а также написания голосовых сценариев при доставке информации по телефону.

  1. XML должен быть совместим с SGML.

XML является специализированной ветвью SGML. Преимущество здесь заключается в простоте адаптации программных средств SGML для работы с HTML.

  1. Обработчики документов XML должны быть просты в написании.

Для практического использования XML необходимо, чтобы было достаточно просто писать браузеры и другие программы, обрабатывающие XML-документы. На деле основной причиной выделения XML из SGML была доступность написания программ для обработки XML-документов.

  1. Количество необязательных свойств в XML должно быть сведено к минимуму.

Минимальное число дополнительных функций в XML упрощает написание программ для обработки XML-документов. Изобилие дополнительных подключаемых функций в SGML стало основной причиной, обусловившей его практическую непригодность для представления Web-документов. Дополнительные функции SGML требуют переопределения символов-разделителей для тегов (обычно <and>) и пропуск конечного тега с целью обнаружения процессором конца элемента. При строгом написании программы обработки SGML-документов необходимо учитывать возможность появления всех дополнительных функций, даже если они редко встречаются.

  1. XML документы должны быть удобны для чтения и достаточно понятны.

XML призван статьlingua franca (универсальным языком) для обмена информацией среди пользователей и программ по всему миру. В соответствии с этой концепцией пользователи, а также специализированные программы, должны иметь возможность создавать и прочитывать XML-документы. Доступность и прозрачность для пользователя выделяют XML из большинства других форматов, применяемых при построении баз данных и текстовых документов.

Пользователь может легко прочесть XML-документ, поскольку он описан простым текстом и имеет логичную иерархическую структуру в виде дерева. Вы можете упростить XML-документы, назначив информативные имена для элементов, атрибутов и объектов, а также добавив полезные комментарии.

  1. Подготовка XML документа должна осуществляться быстро.

XML станет общепринятым стандартом лишь в том случае, если программисты и пользователи примут его. Следует создать этот стандарт до того, как общество примет альтернативные стандарты, которые все быстрее создаются компаниями-разработчиками программного обеспечения.

  1. Процедура построения XML документа должна быть формальной и точной.

Спецификация XML написана на формальном языке, используемом для представления компьютерных языков, с нотацией, известной как расширенная форма Бэкуса-Наура (Extended Backus-Naur Form (EBNF)). Этот формальный язык, хотя и достаточно сложен для восприятия, лишен двусмысленности и существенно облегчает написание XML-документов, а в особенности программ для их обработки.

  1. Процедура создания XML документов должна быть проста.

При практическом использовании XML как языка разметки для Web-документов упрощается не только написание обрабатывающих программ, но и процесс создания самих XML-документов.

  1. Краткость при разметке XML документа имеет минимальное значение.

В соответствии с пунктом 6 (XML-документ должен быть ясным и понятным для пользователя), XML-разметка не должна быть излишне сжатой, чтобы не вступать в противоречие с указанной целью.

4. Спектр технологийXML (X-технологий)

Помимо самого языкаXMLсуществует и постоянно развиваются другие языки, основанные на нем, которые формируют спектр технологийXML, образуют платформуWeb-2илежат в основе Semantic WEB.

Основные языки:

XSL -расширяемый язык стилевых таблиц (extensible Stylesheet Language,XSL)состоит из двух частей: языка для трансформации XML-документов и из XML-словаря, определяющего семантику форматирования. Использование стилевых таблиц (XSL) позволяет обеспечить независимое от конкретного устройства вывода отображение XML- документов.

XSLT -(XSL Transformations) язык разработан как часть XSL и определяет стилизацию XML-документа, задействуя XSLT для объяснения того, как документ трансформируется в другой XML-документ на основе словаря форматирования. Кроме того, XSLT может использоваться независимо от XSL. Однако XSLT не является единым комплексным языком трансформации XML-документов. Он, скорее, предназначен для тех видов трансформаций, которые необходимы, когда XSLT используется как часть XSL.

XPath  -главной задачей XPath является адресация частей XML-документа. Для этой цели XPath представляет XML-документ как некоторое дерево узлов различного типа. Поэтому помимо адресации в XPath обеспечиваются минимальные возможности по обработке данных различных типов. Третьей задачей XPath можно назвать динамическое генерирование контента, если этот контент не может быть создан до первого обращения к документу.

XSL Formatting Objects(Formatting Objects — форматирующие объекты) — это набор классов, в терминах которых отражена семантика форматирования. Они представляют собой узлы дерева, полученного в результате XSL-трансформации. Классы форматирующих объектов определяют такие полиграфические термины, как страница, параграф и т. п. Лучший контроль над представлением этих объектов обеспечивается множеством свойств форматирования. Это такие свойства, как отступы, тени, промежутки между словами и буквами и т. п. В XSL классы свойств и объектов форматирования обеспечивают словарь для отражения цели представления.

XHTML -Расширяемый HTML (extensible HTML, XHTML) является результатом применения правил синтаксиса XML к стандарту HTML. Расширяемость XHTML заключается в возможности определения таких конструкций, как элементы, атрибуты, сущности и т. п. с помощью подключения определения типа документа (Document Type Definition, DTD).

RDF –инструментарий для описаний ресурсов (Resource Description Framework, RDF) — это набор инструментов для работы с метаданными. Он обеспечивает единую, стандартизированную среду управления внутренним (без вмешательства человека) взаимодействием приложений, которые обмениваются в Web информацией, понимаемой машинами. RDF делает ударение на легкость автоматизированной обработки Web-ресурсов. Метаданные RDF могут быть использованы в самых разных областях работы приложений. В общем, RDF обеспечивает основу для элементарных инструментов авторизации, поиска и редактирования данных, создания электронных библиотек и т.д.Именно он сейчас лежит в основе формирования семантическогоWeb.

XML Schema –языкиспользуется для объявления элементов и атрибутоввXML-документе с целью его структуризации. Кроме того, этот язык предоставляет расширяемые возможности для определения типов данныхэлементов и атрибутов.

Xbase (XML Base) -представляет собой аналог элемента BASE из языка HTML. Он описывает механизм предоставления сервисов базовых URL (Uniform Resource Locator, универсальное местоположение ресурса) для XLink.

XLink -расширяемый язык связывания (XML Linking Language, XLink) определяет конструкции, которые могут быть вставлены в XML-документы для описания связей между объектами. Он использует синтаксис языка XML для создания структур, которые могут служить как для описания простых однонаправленных гиперссылок, определяемых в HTML, так и для более сложных связей.

XPointer -расширяемый язык указателей (XML Pointer Language, XPointer) — язык, разработанный для совместного использования с XLink. XPointer определяет конструкции, которые поддерживают адресацию во внутренних структурах XML-документов. В частности, он предназначен для специфических ссылок на элементы, символьные строки и другие части XML-документов.

Xlnclude -расширяемый язык встраивания (XML Include Language, Xlnclude) предназначен для объединения блоков информации в формате XML (XML infosets) в единый составной информационный блок. Спецификация документов XML (или информационных блоков), которые должны быть объединены, а также процесс объединения описываются с помощью дружественного языку XML синтаксиса (элементов, атрибутов, ссылок на URI).

XQL -расширяемый язык запросов (XML Query Language, XQL) — это нотация для адресации и фильтрации элементов и текста в XML-документах. XQL является естественным расширением синтаксиса XSL. Он обеспечивает выразительную и простую нотацию для указания (pointing) на специфические узлы, а также для поиска узлов со специальными, частными характеристиками. Этот язык, базируясь на возможностях XSL, обеспечивает идентификацию классов узлов путем добавления булевой логики, фильтров, индексации в коллекциях узлов и т. д.

XML является не только полезным инструментом для описания документов, но и служит основой для построения приложений и расширений, которые могут оказаться востребованными по мере развития Internet.

5. Стандарты платформы XML

В отличие от действующей версии Веб, в которой все основные функции управления информационными ресурсами системы базируются на едином языке HTML, создатели платформы XML избрали иной путь. Выделены «фундаментальные» стандарты, составляющие концептуальную, синтаксическую и архитектурную (в аспекте архитектуры данных) основу платформы. Эти функции выполняют стандарты XML, XML Information Set и Namespaces in XML. Их средствами определяется комплекс других стандартов, каждый из которых выполняет собственные специфические функции. И этот комплекс открыт для его пополнения новыми стандартами в случае необходимости. Именно такаямодульность организации платформы обеспечивает ееоткрытый характер, возможности введения новых стандартов, не затрагивая уже существующих. Полная функциональность этой платформы определяется целым комплексом взаимосвязанных стандартов, часть из которых уже принята W3C, другие находятся в стадии разработки.

Базовые стандартыXML

Namespaces in XML

Стандарт задания пространства имен. Позволяет определять множество допустимых в XML-документе тегов разметки и их атрибутов. С ними можно ассоциировать некоторую семантику, определяемую по умолчанию либо явно - с помощью средств, выходящих за рамки стандарта. Стандарт является основой создания других стандартов платформы XML.

W3C Recommendation, 7 April 2004.

Стандарт DOM определяет язык, который рассматривается его разработчиками как интерфейс прикладного программирования (API) для данных XML и HTML. Он обеспечивает не только объектное представление документов XML и HTML, но также и полный набор возможностей манипулирования данными (вставку, обновление и удаление компонентов документов). В качестве языка API спецификация DOM используется в ряде XML-ориентированных СУБД.

Действующая в настоящее время версия стандарта “Document Object Model (DOM) Level 3” представлена двумя документами. Она определяет независимый от платформы и от языков программирования интерфейс, обеспечивающий возможность динамического доступа программ и скриптов к контенту и структуре документов и их обновление.

Document Object Model (DOM) Level 3 Load and Save Specification, W3C Recommendation, 7 April 2004.

XML Schema

Стандарт спецификаций схемы документов.

XPointer и XLink

Стандарты языка указателей и языка гиперссылок позволяют идентифицировать фрагменты XML-документов и определять гиперссылки на XML-документы и их фрагменты, а также некоторые свойства гиперссылок.

RDF

Стандарт среды определения ресурсов (RDF) дает возможность описыватьсемантику XML-документов с различной степенью формализованности.

CSS, XSL

Стандарты каскадных таблиц стилей (CSS) и расширяемого языка таблиц стилей (XSL) позволяют управлять представлением XML-документов на стороне клиента.

Стандарт XSLT

Стандарт XSLT, представляющий собой специальную часть XSL, описывает необходимые трансформации XML-документов.

XML-QL

стандарт языка запросов ресурсов XML

XML-Signature

стандарт электронной подписи для XML-документов.

Стандарт объектной модели DOM для XML- и HTML-документов определяет функции интерфейса прикладного программирования для их обработки.

XHTML 1.0.

Этот стандарт поддерживает средствами XML функциональность текущей версии языка HTML (HTML 4.01).

Дополнительные стандарты

XML Information Set

(Infoset), определяет абстрактное описание данных, составляющих XML-документ

XPath

Определяет понятие фрагмента XML-документа, используемое в языках XPointer и XSLT.

XML Inclusions (XInclude)

Представляет модель и синтаксис для описания слияния XML-документов.

Canonical XML

предлагается метод, позволяющий устанавливать эквивалентность двух XML-документов с различным синтаксическим представлением

6. Примеры практического примененияXML

Хотя концепция XML весьма интересна, может возникнуть вопрос его практического применения. Ниже приведены некоторые примеры приложений, как действующих, так и перспективных.

Ссылка. Более полный список текущих и перспективных XML-приложений, включая их подробное описание, вы можете найти на Web-странице Oasis SGML/XML (http://www.oasis-open.org/cover/xml.html#applications).

  • Работа с базами данных. Подобно традиционным базам данных XML может быть использован для присвоения метки каждому полю информации внутри каждой записи базы данных. (Например, можно пометить каждое имя, адрес и номер телефона внутри записей списка адресов.) После этого вы сможете отображать данные различными способами и организовывать поиск, сортировку, фильтрацию и иную обработку данных.
  • Структурирование документов. Иерархическая структура XML-документов идеально подходит для разметки структуры таких документов, как романы, научные труды, пьесы. Например, вы можете использовать XML для разметки пьесы на акты, сцены, размечать действующих лиц, сюжетные линии, декорации и т. д. XML-разметка дает возможность программам отображать или распечатывать документ в необходимом формате; находить, извлекать или манипулировать информацией в документе; генерировать оглавления, резюме и аннотации; обрабатывать информацию иными способами.
  • Работа с векторной графикой (VML – Vector Markup Language).
  • Мультимедиапрезентации (SMIL – Synchronized Multimedia Integration Language, HTML + TIME – HTML Timed Interactive Multimedia Extensions).
  • Описание каналов. Каналы представляют собой Web-страницы, которые автоматически рассылаются подписчикам. (CDF – Channel Definition Format).
  • Описание программных пакетов и их взаимосвязей. Такие описания обеспечивают распространение и обновление программных продуктов в сети. (OSD – Open Software Description).
  • Взаимодействие приложений через Web с использованием XML-сообщений. Эти сообщения являются независимыми от операционных систем, объектных моделей и компьютерных языков. (SOAP – Simple Object Access Protocol).
  • Отправка электронных бизнес-карт через e-mail.
  • Обмен финансовой информацией. Обмен информацией в открытом и понятном формате осуществляется между финансовыми программами (такими как Quicken и Microsoft Money) и финансовыми институтами (банками, общественными фондами). (OFX – Open Financial Exchange).
  • Создание, управление и использование сложных цифровых форм для коммерческих Internet-транзакций. Подобные формы могут включать оцифрованные подписи, которые делают их признанными юридически. (XFDL – Extensible Forms Description Language).
  • Обмен запросами по приему на работу и резюме (HRMML – Human Resource Management Markup Language).
  • Форматирование математических формул и научной информации в Web. (MathML – Mathematical Markup Language).
  • Описание молекулярных структур (CML – Chemical Markup Language).
  • Кодирование и отображение информации о ДНК, РНК и цепочках (BSML – Bioinformatic Sequence Markup Language).
  • Кодирование генеалогических данных (GeDML – Genealogical Data Markup Language).
  • Обмен астрономическими данными (AML – Astronomical Markup Language).
  • Создание музыкальных партитур (MusicML –Music Markup Language).
  • Работа с голосовыми сценариями для доставки информации по телефону. Голосовые сценарии могут быть использованы, например, для генерирования голосовых сообщений, справок о наличии товаров и прогнозов погоды (VoxML).
  • Обработка и доставка информации курьерскими службами. Служба Federal Express, например, уже использует XML для этих целей.
  • Представление рекламы в прессе в цифровом формате (Ad Markup).
  • Заполнение юридических документов и электронный обмен юридической информацией (XCL – XML Court Interface).
  • Кодированиепрогнозовпогоды (OMF – Weather Observation Markup Format).
  • Обмен страховой информацией.
  • Обмен новостями и информацией с использованием открытых Web-стандартов (XMLNews).
  • OpenGis® Geography Markup Language (GML) Encoding SpecificationГеографический язык разметки

Язык XML на http://mirrorref.ru


Похожие рефераты, которые будут Вам интерестны.

1. Реферат Берегите наш язык, наш прекрасный, русский язык урок мозговой штурм

2. Реферат Формирование понятия «иностранный язык», «английский язык», в частности, развитие речевых коммуникативных навыков, памяти и внимания

3. Реферат Язык как предмет языкознания. Язык и речь

4. Реферат Латынь. Латинский язык. Архаическая латынь (Древнелатинский язык)

5. Реферат Русский язык – национальный язык великого русского народа. Место русского языка среди славянских языков. Русские писатели о богатстве и выразительности великого русского языка

6. Реферат ЯЗЫК КУЛЬТУРЫ

7. Реферат Язык и культура

8. Реферат Русский язык

9. Реферат Язык культуры

10. Реферат Русский язык шпаргалка