Introduction à XML
Donnée, information et connaissance ne sont pas des termes équivalents, même si savoir utiliser Google peut faire croire le contraire. Un «bon» transfert de «bonnes» informations suppose des informations structurées, vérifiées, controlées...
Il existe plusieurs façons de structurer des informations avant de les sauvegarder dans un fichier-texte. La structure d'arbre au sens informatique du terme, avec la racine de l'arbre en haut (!), est sans doute l'une des plus générales et la plus adaptée au Web, même si la structure de tableau avec des lignes et des colonnes est l'une des plus répandues, notamment parce qu'elle englobe les tables des bases de données.
Pour distinguer les caractères de structure des caractères propres à l'information, on utilise souvent des marqueurs. Ce peut être par exemple < et > ou { et } ou encore [ et ] car il faut dans la plupart des systèmes indiquer le début de la structure et sa fin.
On donne en général des noms aux structures et aux sous-structures et pour vérifier si un document est correct on fournit ce qu'on nomme la grammaire du document, ce qui se résume souvent à indiquer le nom des éléments et comment on les groupe, regroupe ou comment on les emboite. Une grammaire de documents (ou "type" de document) peut éventuellement contenir des informations de cardinalité (tant de sous-structures en tout, ou au moins une sous-structure...) et de typage (nombre entier, chaine de caractères...).
Nous présenterons ici principalement la structuration via XML mais d'autres formats sont possibles, dont Yaml et Json.
XML fournit deux types principaux de grammaires nommées DTD et XSD et dispose avec les transformations XSL de nombreuses possibilités pour transformer des fichiers XML en d'autres fichiers XML ou en fichiers textes, en fichiers HTML ou même PDF...
Pour aller plus loin consulter le début de notre tuteur XML et l'introduction à XML de Fabien TORRE.
Retour à la page principale de (gH)