Kevin KoflerLe 14/10/2008 à 17:57

Brunni (./719) :
Sous Windows je désactive toujours le support unicode / multi-byte dans mes progs parce que j'aime trop faire des trucs genre:
char *maChaine;
while (*maChaine++) ...;Et ça merde avec l'unicode parce que "char" reste 8 bits.

C'est parce qu'ils ne gèrent que l'UTF-16 et pas l'UTF-8.

S'ils changeaient leur charset "ANSI" (qui n'est pas vraiment ANSI, mais passons sur ce point) par défaut en UTF-8 (au lieu de CP1252 et co.), tout marcherait et même les anciens logiciels utilisaieraient automatiquement Unicode. Et les logiciels non bogués doivent déjà gérer les encodages 8 bits à longeur variable, c'est déjà utilisé dans les locaux asiatiques.

Lionel Debroux (./722) :
* les programmeurs ne font pas attention à Unicode, que ce soit dans nombre d'applications, ou même les filesystems eux-mêmes (les FAT, manifestement, d'après des transferts que j'ai faits);

FAT utilise un encodage DOS pour les noms de fichiers 8.3 et UTF-16 pour les noms longs. Si le système est intelligent, il écrira toujours un nom long si le nom n'est pas représentable dans l'encodage DOS.

Tu voudras les options: utf8,codepage=850 dans ton mount et le noyau Linux s'occupera des conversions vers l'UTF-8.

* les utilisateurs font parfois des bêtises (j'ai déjà fait des transferts avec NTFS depuis *nix, et j'ai eu des problèmes avec les accents - ça peut être une application, ça peut être Windows qui n'a pas écrit de l'UTF-8 dans la partition, mais ça peut aussi être PEBKAC de ma part, par exemple ne pas avoir monté la partition avec le bon charset)

NTFS est entièrement UTF-16. Il faut utiliser l'option utf8 dans tes mounts et une fois de plus la conversion UTF-16<->UTF-8 est effectuée.

Les meilleures distributions patchent le noyau pour mettre l'UTF-8 par défaut.