Introducció
El llenguatge XML (Extensible Markup Language) té la seva base en el llenguatge SGML ( Standard Generalized Markup Language ). La idea és que XML sigui una simplificació del llenguatge SGML que possibiliti el seu processament (parseig) mitjançant programes o aplicacions simples. Cal tenir en compte que SGML és un llenguatge molt complex no apte per a l'intercanvi d'informació entre sistemes.
Paral·lelament al desenvolupament del llenguatge SGML es va desenvolupar un altre llenguatge de marques: el llenguatge HTML (Hypertext Markup Language). HTML és un llenguatge pensat per a la publicació de continguts en el web i la seva interconnexió.
El llenguatge HTML ha evolucionat al llarg del temps fins a la versió 5, que és la versió vigent avui en dia. De la versió 2 fins a la versió 4 es varen anar aplicant progressivament les diferents normes definides per SGML. En el desenvolupament de la versió 5 d'HTML es fa un replanteig i es considera que no és necessari complir amb la normativa SGML i s'especifiquen una sèrie de regles pròpies.
El llenguatge HTML no es preocupa de com estructurar la informació, sinó de la seva presentació. Sí que hi ha una estructura del document, però aquesta pot ser la mateixa per a definir un producte o una persona. Aquest fet fa que els documents HTML no siguin aptes per a l'intercanvi d'informació entre sistemes informàtics: tractar la informació de forma automatitzada en un document HTML és molt complicat, ja que no hi ha una estructura que permeti analtizar la pròpia informació.
Per a permetre el tractament automàtic de la informació apareix el llenguatge XHTML. Aquest llenguatge està pensat per a publicar documents en el web donant una estructura lògica a la informació, de forma que pugui ser processada per un programa informàtic (parser). Actualment es disposa de 2 versions del llenguatge XHTML.