SELFHTML/Aides à la navigation Paramètres internationaux |
Jeux de caractères (famille iso-8859 et autres) |
|
Les jeux de caractères ISO-8859 |
|
La famille iso-8559 a été développée par l' European Computer Manufacturer's Association (ECMA). Il s'agit d'une collection de jeux de caractères pour les écritures alphabétiques. En font partie les écritures latines sur lesquelles sont fondées la plupart des langues de l'Europe de l'ouest et d'Amérique ou aussi les écritures cyrilliques.
Tous les jeux de caractères de cette famille se basent sur une représentation d'un octet par signe. Ce qui veut dire que tous les jeux de caractères comprennent 256 caractères possibles. Pour tous les jeux de caractères, les 128 premiers signes (les signes entre 0 et 127) sont identiques à ceux du jeu de caractères ASCII. Ce qui a l'avantage que les lettres latines courantes majuscules et minuscules, les chiffres arables et les signes spéciaux courants comme la ponctuation et les signes commerciaux soient toujours disponibles dans tous ces jeux de caractères.
Ci-dessus est représenté le jeu de caractères ASCII. Les signes de ce jeu de caractères pouvant être représentés ont des valeurs comprises entre 32 et 127. La valeur 32 est l'espace. Tous les jeux de caractères iso-8559 contiennent ce jeu de caractères.
Vous trouvez la valeur d'un signe en additionnant les valeurs du titre de colonne et du titre de ligne pour le signe concerné. Un K majuscule a par exemple dans ce tableau une valeur de ligne de 70 et une valeur de colonne 5. Ce qui donne la valeur 75 pour ce signe. Les valeurs des caractères peuvent jouer un rôle pour l'utilisation de jeux de caractères et d'unicodes en HTML. Au cas où ce n'est pas de la valeur décimale mais de la valeur hexadécimale d'un caractère dont vous avez besoin, vous pouvez utiliser le Traducteur décimal/hexadécimal.
Comme pour le jeu de caractères ASCII qui voit ses 32 premiers caractères (valeurs des signes de 0 à 31) réservés pour des caractères de contrôle les jeux de caractères étendus de la famille iso font aussi l'économie d'une plage de signes. Il s'agit des 32 premiers signes au delà du domaine ASCII, donc des valeurs de caractères de 128 à 159. Les tableaux des différents jeux de caractères plus bas représentent pour cette raison les valeurs de signes restantes de 160 à 255. Le signe avec la valeur 160 représentent dans tous ces jeux de caractères un espace imposé.
Beaucoup des jeux de caractères de la famille iso-8559 se chevauchent. C'est intentionnel. Les jeux de caractères sont si optimisés que le plus grand nombre possible d'écritures sont couvertes avec un jeu de caractères chacune. Les caractères qui existent dans plusieurs jeux de caractères de la famille iso-8859, ont en règle générale toujours la même valeur, c'est à dire qu'ils se trouvent toujours au même endroit dans les différents jeux de caractères.
Six des jeux de caractères iso-8859 se réfèrent à des écritures qui pour l'essentiel sont fondées sur l'écriture latine. Ces jeux de caractères sont nommés pour cette raison Latin-1 à Latin-6.
Les tableaux suivants montrent les différents jeux de caractères de la famille iso-8859. Comment vous pouvez mettre en service ces jeux de caractères en HTML est expliqué dans la partie mention de jeu de caractères comme mention Meta. Les noms représentés en bleu sont les désignations respectives que vous pouvez mentionner en HTML.
Ce jeu de caractères contient les signes spécifiques pour les langues de l'Europe de l'ouest et d'Amérique. Il convient aux langues suivantes: albanais, danois, allemand, anglais, finlandais, français, galicien, irlandais, islandais, italien, catalan, néerlandais, norvégien, portugais, suédois et espagnol. Il n'y manque que des signes distincts comme le "ij" néerlandais ou les guillemets basses allemandes.
Ce jeu de caractères contient les signes spécifiques pour la plupart des langues de l'Europe centrale et slaves. Il convient aux langues suivantes: croate, polonais, roumain, slovaque, slovène, tchèque et hongrois.
Ce jeu de caractères convient aux langues: Espéranto, galicien, maltais et turc.
Ce jeu de caractères contient quelques uns des signes des langues suivantes: estonien, letton et lituanien. Comparez aussi ce jeu de caractères avec iso 8559-10, qui est très semblable.
Ce jeu de caractères contient des signes cyrilliques. Il couvre largement les langues suivantes: bulgare, macédonien, russe, serbe et ukrainien.
Ce jeu de caractères contient des signes de l'écriture arabe. La représentation des signes dans le tableau ci-après est pourtant "abstraite", étant donné que les signes varient dans la pratique de l'écriture selon qu'ils sont placés au début, au milieu ou à la fin d'un mot ou seuls. L'arabe se caractérise en outre par la direction de l'écriture (de droite à gauche).
Ce jeu de caractères contient les signes de l'écriture grecque moderne.
Ce jeu de caractères contient les signes de l'écriture hébraïque. Comme pour l'écriture arabe la direction de l'écriture est ici de droite à gauche.
Ce jeu de caractères est conçu spécialement pour le turc. Il est basé sur le jeu de caractères iso 8859-1, mais contient à la place des signes spéciaux islandais les signes turcs.
Ce jeu de caractères contient des signes spéciaux pour les langues suivantes: Groenlandais (Inuit) et lapon (Sami).
Il y a quantité d'autres jeux de caractères en partie déjà plus anciens qui définissent des conventions pour différentes écritures ou familles d'écritures, souvent spécifiques au pays. À l'adresse Internet suivante sont réunis les noms de ces jeux de caractères:
http://www.iana.org/assignments/character-sets
Les noms de jeux de caractères qui y sont énumérés dans la liste derrière name:
ou alias:
peuvent être mentionnés en HTML quand vous voulez imposer un certain jeu de caractères (Il faut employer de préférence les noms qui figurent dans la liste avec la mention preferred MIME name
). Cela est possible pour tout le document par exemple avec la mention du jeu de caractères par défaut.
Le système unicode | |
Ordinateur et langage écrit | |
SELFHTML/Aides à la navigation Paramètres internationaux |
© 2001 Stefan Münz / © 2003 Traduction Serge François, 13405@free.fr
selfhtml@fr.selfhtml.org