XML - Extensible Markup Language
Definição conceitual do XML
 

Estrutura do documento

Um documento XML é uma árvore rotulada onde um nó externo consiste de:
· dados de caracteres (uma sequência de texto)
· instruções de processamento (anotações para os processadores), tipicamente no cabeçalho do documento
· um comentário (nunca com semântica acompanhando)
· uma declaração de entidade (simples macros)
· nós DTD (Document Type Declaration)

Um nó interno é um elemento, o qual é rotulado com:
· um nome ou
· um conjunto de atributos, cada qual consistindo de um nome e um valor.
Normalmente, comentários, declarações de entidades e informações DTD não são explicitamente representadas na árvore.

Estrutura de uma árvore XML.

Geralmente, a árvore tem um nó raiz especial acima do elemento raiz.

 

Uma visão prática das tags

Um documento XML é um texto (em formato Unicode) com tags de marcação (markup tags) e outras informações.
As markup tags denotam a seguinte estrutura:

...<bla attr="val" ...>...</bla>...
     |    |               | |
     |    |               | uma tag finalizadora de elemento
     |    |               o contexto do elemento
     |    um atributo com nome attr e valor val, com valores delimitados por ' ou "

uma tag inicializadora de elemento com nome bla

Notação para elementos vazios: ...<bla attr="val".../>...

Os documentos XML são sensíveis à letras maiúsculas e minúsculas.
Um documento XML é bem formatado quando segue algumas regras básicas. Tais regras são mais simples do que para documentos HTML e permitem que os dados sejam lidos e expostos sem nenhuma descrição externa ou conhecimento do sentido dos dados XML.

Documentos bem estruturados:
· tem casamentos das tags de início e fim
· as tags de elemento tem que ser apropriadamente posicionadas
Os elementos não podem se sobrepor. Um exemplo de sobreposição é o seguinte: 

<title>Descrição dos diveros modelos de carros<sub> da marca Ford 
</title> Alexandre Manso</sub>

E, corrigindo o erro:

<title>Descrição dos diversos modelos de carros <sub> da marca Ford</sub>
 <author> Alexandre Manso</author> </title>

Caracteres especiais podem ser digitados usando referências de carcteres Unicode. Exemplo:

 &#38; = &.

Seções CDATA são formas alternativas de se usar dados de caracteres, como:

<![CDATA[<greeting>Hello, world!</greeting>]]>

Informações adicionais:

<!-- comment -->

um comentário que será ignorado por todos os processadores.

<?target data...?>

uma instrução para um processador; target identifica o processador para o qual ela foi direcionada e data é a string contendo a instrução.

<!ENTITY name value>

declara uma entidade com um nome e um valor; expandida usando a referência entity: &name (entidades externas e referências de entidades de parâmetros são ignorados aqui).

<!ELEMENT ...>, <!ATTLIST ...>, ...

informações DTD (melhores alternativas são: DSD, XML Schema, que serão explicados posteriormente)

 

 Seção anterior
 Próxima seção
 Volta para a página inicial