XML-схемы определяют элементы ваших XML-файлов.
Простой элемент — это элемент XML, содержащий только текст. Он не может содержать никаких других элементов или атрибутов.
- Что такое простой элемент?
- Определение простого элемента
- Пример
- Значения по умолчанию и фиксированные значения для простых элементов
- Что такое XML-схема?
- Пример XSD
- XML-схемы поддерживают типы данных
- XML-схемы используют синтаксис XML
- XML-схемы Безопасная передача данных
- Хорошо сформированного недостаточно
- Определение простого элемента
- Значения по умолчанию и фиксированные значения
- 1 Introduction
- 1 Purpose
- 3 Documentation Conventions and Terminology
- 2 Концептуальная основа
- 2 Абстрактная модель данных XML-схемы
- 1 Компонент определения типа
- 2 компонента декларации
- 3 ограничения и правила проверки
- 4 Соответствие
- 5 имен и символьных пространств
- 6 Разметка, связанная со схемой, в Документы проходят проверку
- 1 хси
Что такое простой элемент?
Простой элемент — это элемент XML, который может содержать только текст. Он не может содержать никаких других элементов или атрибутов.
Однако ограничение «только текст» вводит в заблуждение. Текст может быть разного типа. Это может быть один из типов, включенных в
определение XML-схемы (логическое значение, строка, дата и т. д.) или это может быть собственный тип, который вы можете определить самостоятельно.
Вы также можете добавить ограничения (фасеты) к типу данных, чтобы ограничить его содержимое, или потребовать, чтобы данные соответствовали определенному шаблону.
Определение простого элемента
Синтаксис определения простого элемента:
, где xxx — имя элемента, а yyy — тип данных элемента.
XML-схема имеет множество встроенных типов данных. Большинство
распространенные типы:
Пример
Вот некоторые элементы XML:
А вот соответствующие простые определения элементов:
Значения по умолчанию и фиксированные значения для простых элементов
Простые элементы могут иметь значение по умолчанию ИЛИ указанное фиксированное значение.
Значение по умолчанию автоматически присваивается элементу, если не указано другое значение.
Элементу также автоматически присваивается фиксированное значение, и указать другое значение невозможно.
Что такое XML-схема?
Схема XML описывает структуру XML-документа.
Язык схемы XML также называется определением схемы XML (XSD).
Пример XSD
В мире XML ежедневно используются сотни стандартизированных форматов XML.
Многие из этих стандартов XML определяются XML-схемами.
XML Schema — это основанная на XML (и более мощная) альтернатива DTD.
XML-схемы поддерживают типы данных
Одной из самых сильных сторон XML-схем является поддержка типов данных.
XML-схемы используют синтаксис XML
Еще одним преимуществом XML-схем является то, что они написаны на XML.
XML-схемы расширяемы, поскольку они написаны на XML.
С помощью расширяемого определения схемы вы можете:
XML-схемы Безопасная передача данных
При отправке данных от отправителя к получателю важно, чтобы обе части
имеют одинаковые «ожидания» относительно содержания.
С помощью XML-схем отправитель может описывать данные таким образом, чтобы получатель
пойму.
Такая дата: «11.03.2004» в некоторых странах интерпретируется как 3 ноября.
и в других странах как 11 марта.
Однако элемент XML с типом данных
вот так:
обеспечивает взаимное понимание содержимого, поскольку тип данных XML «дата»
требуется формат «ГГГГ-ММ-ДД».
Хорошо сформированного недостаточно
Правильно сформированный XML-документ — это документ, соответствующий синтаксису XML.
правила, например:
Даже если документы правильно составлены, они все равно могут содержать ошибки, и эти ошибки могут иметь серьезные последствия.
Схема XML определяет элементы XML документа.
Простой элемент — это элемент XML, содержащий только текст. Простой элемент не может сохранять другие элементы или атрибуты.
Тем не менее, ограничение «только текст» достаточно обманчиво. Текст может быть самого разного типа. Это может быть один из типов, включенных в определение схемы XML (логическое значение, строка, дата и т. д.), либо это может быть пользовательский тип, текущий для вас.
Кроме того, вы сами можете добавить ограничения (аспекты) по типу данных, чтобы ограничивать контент, либо вы можете указать требование, чтобы имя данных включало модели.
Определение простого элемента
Чтобы определить простой элемент, используется следующий синтаксис:
где xxx — имя элемента, а yyy — тип данных элемента.
XML-схемы содержат множество встроенных типов данных. Наиболее часто используемыми являются следующие типы:
Возьмем некоторые элементы XML:
А вот как будут выглядеть определения этих элементов в схеме XML:
Значения по умолчанию и фиксированные значения
Простые элементы могут иметь значения по умолчанию ИЛИ фиксированные значения.
Значение по умолчанию присваивается элементу автоматически, если не определено какое-либо другое значение.
В следующем примере «red» — значение по умолчанию:
Фиксированное значение также присваивается элементу автоматически, но при этом вы не можете определить никакого другого значения.
В следующем примере «red» — фиксированное значение:
1 Introduction
This document sets out the structural part (XML Schema: Structures) of the XML Schema definition language.
Chapter 2 presents a Conceptual Framework (§2) for XML Schemas, including
an introduction to the nature of XML Schemas and an introduction
to the XML Schema abstract data model, along with
other terminology used throughout this document.
Chapter 3, Schema Component Details (§3), specifies the precise
semantics of each component of the abstract model, the representation of each
component in XML, with reference to a DTD and XML Schema
for an XML Schema document type, along with a detailed mapping between the elements and
attribute vocabulary of this representation and the components and properties
of the abstract model.
Chapter 4 presents Schemas and Namespaces: Access and Composition (§4), including the
connection between documents and schemas, the import, inclusion and redefinition of declarations and definitions and
the foundations of schema-validity assessment.
Chapter 5 discusses Schemas and Schema-validity Assessment (§5), including the
overall approach to schema-validity assessment of documents, and responsibilities of schema-aware
processors.
The normative appendices include a Schema for Schemas (normative) (§A) for the XML representation of schemas and
References (normative) (§B).
The non-normative appendices include the DTD for Schemas (non-normative) (§G) and a Glossary (non-normative) (§F).
1 Purpose
The purpose of XML Schema: Structures is to define the nature of XML schemas
and their component parts,
provide an inventory of XML markup
constructs with which to represent schemas, and define the
application of schemas to XML documents.
The purpose of an XML Schema: Structures schema is to define and describe a class of
XML documents by using schema components to constrain and document the meaning,
usage and relationships of their constituent parts: datatypes, elements and
their content and attributes and their values. Schemas may also provide for the specification of additional
document information, such as normalization and defaulting of attribute
and element values. Schemas have
facilities for self-documentation. Thus, XML Schema: Structures can be used to define, describe and catalogue XML
vocabularies for classes of XML documents.
Any application that consumes well-formed XML can use the XML Schema: Structures
formalism to express syntactic, structural and value constraints applicable to
its document instances. The XML Schema: Structures formalism allows a useful level of
constraint checking to be described and implemented for a wide spectrum of XML
applications. However, the language defined by this specification does not attempt to provide
all the facilities that might be needed by any
application. Some applications may require constraint capabilities not
expressible in this language, and so may need to perform their own additional
validations.
3 Documentation Conventions and Terminology
The section introduces the highlighting and typography as used in
this document to present technical material.
Non-normative examples are set off in boxes and accompanied by a brief
explanation:
And an explanation of the example.
The allowed content of the information item is
shown as a grammar fragment, using the Kleene operators ?,
* and +. Each element name therein is a hyperlink to
its own illustration.
Note: The illustrations are derived automatically from the Schema for Schemas (normative) (§A). In the case of apparent conflict, the Schema for Schemas (normative) (§A) takes precedence, as it, together with the Schema Representation Constraints, provide the normative statement of
the form of XML representations.
Note: General comments directed to all readers.
Conforming documents and XML Schema-aware processors are permitted to but need not behave as described.
Conforming documents and XML Schema-aware processors are required to behave as described; otherwise they are in error.
2 Концептуальная основа
Оценка валидности схемы имеет два аспекта:
1 Определение валидности локальной схемы, т.е.
удовлетворяет ли элемент или элемент информации атрибута
ограничения, воплощенные в соответствующих
компоненты XML-схемы;
2 Синтезирование общего результата проверки для элемента,
объединение локальной достоверности схемы с результатами достоверности схемы
оценки его потомков, если таковые имеются, и
добавление соответствующих дополнений в информационный набор для записи этого результата.
2 Абстрактная модель данных XML-схемы
Наконец, «вспомогательные» компоненты обеспечивают небольшие части
другие компоненты; они не являются независимыми от контекста:
1 Компонент определения типа
Абстрактная модель предоставляет два вида компонента определения типа: простой
и сложный.
Определения типов образуют иерархию с одним корнем. В подразделах ниже сначала описываются характеристики этого
иерархии, а затем познакомьтесь с простыми и сложными определениями типов.
1 Иерархия определения типов
Простое определение типа — это набор ограничений на строки и информацию о значениях, которые они кодируют, применимых к нормализованному значению атрибута.
информационный элемент или информационный элемент элемента без дочерних элементов.
Неформально это относится к значениям атрибутов и текстовому содержимому элементов.
Отображение лексического пространства в пространство значений есть
не указано для элементов, определение типа которых является
простое определение ур-типа.
Соответственно, эта спецификация не ограничивает поведение процессоров в
области, в которых задействовано это сопоставление, например, проверка таких элементов на соответствие
перечисления, создание атрибутов по умолчанию или элементов, объявленный тип которых
определение – это
простое определение типа ur, проверка
ограничения идентичности, включающие такие элементы.
Примечание. Рабочая группа рассчитывает вернуться в эту область в будущем.
версию этой спецификации.
Простые типы могут
также определить, чьими членами являются списки элементов
сами ограничены каким-либо другим простым определением типа или чьи
членство — это объединение членств некоторого другого простого типа.
определения. Такие определения простых типов списков и объединений также являются ограничениями простого ur-типа.
определение.
3 Определение сложного типа
Каждое определение сложного типа, кроме
определение ур-типа либо
А
сложный тип, который расширяет другой, делает это за счет дополнительной модели контента
частицы в конце модели контента другого определения,
или путем наличия дополнительных объявлений атрибутов, или и того, и другого.
Примечание. Эта спецификация допускает только добавление, но не другие виды
расширения. Это решение
упрощает обработку приложения, необходимую для преобразования экземпляров из производных в
базовый тип. Будущие версии могут допускать больше видов расширений, требующих больше
сложные преобразования для эффекта приведения.
Подробную информацию об определениях сложных типов см. в разделе Определения сложных типов (§3.4).
2 компонента декларации
Существует три типа компонента объявления: элемент, атрибут и
обозначения. Каждый из них описан в разделе ниже. Также включено обсуждение
групп замены элементов, что является функцией, предоставляемой вместе с
объявления элементов.
2-элементная группа замены
В XML 1.0 имя и содержимое элемента должны точно соответствовать типу элемента, указанному в соответствующей модели содержимого.
Все такие члены должны иметь определения типов, совпадающие с определениями типов.
определение типа головы или
его ограничения или расширения.
Поэтому, хотя названия элементов могут сильно различаться по мере появления новых
определены пространства имен и члены группы подстановки,
содержимое элементов-членов строго ограничено в зависимости от типа
определение руководителя группы замещения.
Обратите внимание, что группы замещения элементов не представлены как отдельные компоненты. Они есть
указанные в значениях свойств для объявлений элементов (см. Объявления элементов (раздел 3.3)).
3 ограничения и правила проверки
Предыдущий раздел был посвящен проверке, т.е.
ограничения на информационные элементы, которые предоставляют компоненты схемы. Фактически
однако эта спецификация предоставляет четыре различных типа нормативных утверждений о схеме.
компоненты, их представления в XML и их вклад в
проверка информационных элементов:
Ограничение компонента схемы
Набор информации о схеме
Вклад
Последний из них, набор информации о схеме.
вклады не так новы, как может показаться на первый взгляд. XML 1.0
проверка дополняет набор информации XML 1.0 аналогичным образом,
например, по
предоставление значений атрибутам, отсутствующим в экземплярах, и неявным образом
использование информации о типе для нормализации или доступа.
(В качестве примера последнего случая рассмотрим
влияние NMTOKENS на пробелы атрибутов и семантику
ID и IDREF.) Путем включения схемы
Вклад информационного набора, эта спецификация делает явными некоторые функции
что XML 1.0 остался неявным.
4 Соответствие
Эта спецификация описывает три уровня соответствия для процессоров с поддержкой схемы. Первое — это
требуется от всех процессоров. Поддержка двух других будет зависеть от среды приложения.
для чего предназначен процессор.
Примечание. путем разделения требований соответствия, касающихся конкретного синтаксиса схемы XML.
документов, эта спецификация допускает процессоры
которые используют схемы, хранящиеся в оптимизированном двоичном формате
представления, динамически создаваемые схемы, представленные как структуры данных языка программирования, или реализации, в которых конкретные схемы компилируются в исполняемый код.
например, C или Java. Можно сказать, что такие процессоры минимально соответствуют, но не обязательно, XML-представлению схем.
Примечание. Хотя данная спецификация предоставляет только эти три стандартных уровня соответствия, она
Ожидается, что в будущем могут быть приняты и другие конвенции. Например, Всемирный
Веб-консорциум рассматривает соглашения по упаковке в Интернете различных
ресурсы, относящиеся к отдельным документам и пространствам имен. Должны ли такие
разработки приводят к новым соглашениям для представления схем или доступа к ним в Интернете,
В это время могут быть установлены и названы новые уровни соответствия. Нет необходимости изменять
или переиздать эту спецификацию, чтобы определить такие дополнительные уровни соответствия.
См. «Схемы и пространства имен: доступ и композиция» (§4) для более подробного объяснения
механизмы, поддерживающие эти уровни соответствия.
5 имен и символьных пространств
Как обсуждалось в разделе «Абстрактная модель данных XML-схемы» (раздел 2.2), большинство схем
компоненты (могут) иметь имена.
Если бы все такие имена были присвоены из одного «пула», то
например, было бы невозможно иметь простое определение типа и элемент
декларация с именем
«заголовок» в заданном целевом пространстве имен.
Атрибут и элемент локальной области действия
объявления являются особыми по отношению к пространствам символов.
Каждое определение сложного типа определяет свой собственный локальный атрибут и символ объявления элемента.
пространства, где эти пространства символов отличаются друг от друга и от любого другого
символьные пространства. Так, например, два определения сложного типа, имеющие
одно и то же целевое пространство имен может содержать
объявление локального атрибута для неполного имени «приоритет» или содержать объявление локального элемента
для имени «адрес», без конфликта или необходимой связи между
два.
6 Разметка, связанная со схемой, в
Документы проходят проверку
XML-представление компонентов схемы использует словарь
идентифицируется по имени пространства имен http://www.w3.org/2001/XMLSchema. Для краткости текст и примеры в данной спецификации используют префикс
xs: обозначать это пространство имен; на практике,
можно использовать любой префикс.
Схема XML: Структуры также определяют несколько атрибутов для непосредственного использования в любых документах XML. Эти атрибуты находятся в другом пространстве имен,
который имеет имя пространства имен http://www.w3.org/2001/XMLSchema-instance.
Для краткости текст и примеры в данной спецификации используют префикс
xsi: обозначать последнее пространство имен; на практике,
можно использовать любой префикс. Все процессоры схемы имеют соответствующий атрибут
объявления для этих встроенных атрибутов см. в разделе «Объявление атрибута для атрибута type» (§3.2.7),
Объявление атрибута для атрибута ‘nil’ (§3.2.7), Объявление атрибута для атрибута ‘schemaLocation’ (§3.2.7) и Объявление атрибута для атрибута ‘noNamespaceSchemaLocation’ (§3.2.7).
1 хси
Определение простого типа (§2.2.1.2) или определение сложного типа (§2.2.1.3), используемые при проверке элемента, обычно
определяется путем ссылки на соответствующие компоненты схемы.
Однако элемент информации элемента в экземпляре может
явно укажите его тип, используя атрибут xsi:type.
Значением этого атрибута является QName; см. Интерпретацию QName (§3.15.3) для
средства, с помощью которых QName
связанный с определением типа.