Estructura document XML

Una de les consideracions que s'ha de tenir en compte quan es parla de "Documents XML" és que no cal que aquests resideixen en un suport d'emmagatzematge físic en forma de fitxers , sinó que poden ser generats de forma dinàmica a través d'un llenguatge de programació com Java, PHP,... Si el document s'ha de reutilitzar en posteriorietat es podrà emmagatzemar en el sistema d'on podrà ser llegit.

A nivell d'estructura d'un document XML es poden diferenciar tres grans parts:

1.- Declaració document XML 2.- Declaració de tipus de document 3.- Contingut document XML

Declaració de document XML

La declaració de document XML és opcional , tot i que es recomana la seva inclusió. La declaració de document XML indica al sistema que el contingut està en format XML. El format mínim que cal especificar és:


<?xml version="1.0" ?>

NOTA: La cadena de caràcters "<?xml" ha de constar al principi de tot del fitxer XML: no pot haver-hi cap caràcter abans (ni salts de línia, ni espais en blanc...).

De la declaració cal tenir en compte que no hi ha un espai entre "<?xml". Al tancament de la declaració "?>" tampoc cal incloure cap espai. Declaracions del tipus "< ?xml" , "<? xml", "? >" són incorrectes. Com que XML és case-sensitive la declaració "<?Xml" o "<?XML", o qualsevol altra variant que combini majúscules i minúscules són també errònies.

Joc de caràcters

El joc de caràcters ens determina quines lletres i símbols podem incloure en el nostre document. En consideració al nostre alfabet hauríem de seleccionar un joc de caràcters del grup "ISO". El problema d'aquest joc de caràcters és que hi ha alguns processadors XML (programes que operen sobre XML) que no el reconeixen. El estàndard XML només reconeix dos jocs de caràcters: UTF-8 (que és el normalment utilitzem: 1 byte per a emmagatzemar cada un dels símbols) i UTF-16 (utilitzat per alfabets asiàtics: 2 bytes per a cada símbol)

Per a especificar el joc de caràcters (informació opcional) utilitzem l'atribut "encoding". La declaració d'un document XML que especifica l'utilització de UTF-8 seria:


<?xml version="1.0" encoding="UTF-8" ?>

Declaració de tipus de document

Una vegada especificada la declaració de document XML, de forma opcional, es pot especificar el tipus de document. El tipus de document ens determina quins són els elements vàlids i com s'han d'utilitzar. La declaració de tipus de document ens permet validar que un document XML sigui vàlid. En la Unitat formativa 2 veurem exemples de tipus de document, la seva inclusió i la validació.

Contingut del document XML

En el contingut XML s'especifica tota la informació pròpia a emmagatzemar, processar... que conforme el document XML. El contingut pot estar format per diferents elements: etiquetes, atributs, comentaris, ....

results matching ""

    No results matching ""