Les encodages

Au commencement était l'ASCII. Et l'ASCII planait sur les eaux. Et ce fût l'ASCII nautique.

Un ordinateur stocke des "0" ou des "1". Du moins du point de vue de l'informaticien. Le physicien n'a pas le même. L'être humain aimerait bien associer ses suites de "0" ou de "1" avec des caractères, tels que "a", "b", "-".

L'ASCII, inventé en 1961, permet de faire cela, par exemple "A" sera représenté par "1000001". L'inconvénient de l'ASCII, c'est que le A veut dire américain. Par conséquent, on peut écrire de l'américain, de l'anglais, et de l'australien avec.

Donc on a inventé de nouvelles normes telles que "Latin-1" qui permet d'écrire un certain nombre de langues européennes. Latin-1 s'appelle aussi ISO 8859-1, et a pour faux-frères ISO-8859-1, Windows 1252, MacRoman et ISO 8859-15. Il y aussi des normes pour le chinois, le japonais etc.

Jusqu'au jour où l'idée d'avoir un codage universel, permettant de coder n'importe quel caractère terrestre, et un peu de marge pour les autres, se concrétisa. La norme Unicode était là. Parce que le monde est trop beau pour être simple, Unicode reconnaît plusieurs manières de coder; l'une d'entre elles est UTF-8, qui a l'avantage d'être compatible avec l'ASCII.

Recode

Recode est un programme permettant de changer l'encodage d'un fichier. Par exemple recode utf8..latin1 exemple permet de transformer (en place) le fichier "exemple" encodé au départ en latin1 en un fichier encodé en UTF-8 à l'arrivée. Une autre utilisation intéressante est recode utf8..LaTeX exemple

Valid XHTML 1.0 Strict