flankerLe 27/09/2012 à 10:33

Je viens de découvrir que les systèmes de fichiers linuxiens acceptaient n'importe quelle chaîne d'octets comme nom… Sans préciser le moindre encodage

C'est vrai, dans les années 70 on ne connaissait que l'ASCII, et ils n'ont pas pensé à regarder ce qui s'est fat autour d'eux entretemps.

Accessoirement, chez Unicode, ils ont eu la bonne idée de représenter le même caractère sous différentes formes (genre le é qui peut être écrit indifféremment comme « è » ou comme « e + ` »).

Conséquence intéressante : si deux programmes différents utilisent le même fichier « èèèèèèèè.txt », on n'a aucun moyen de savoir si sous Linux ils vont lire le même fichier (potentiellement, ça correspond à 256 fichiers différents), contrairement à OS X ou Windows (qui utilisent de l'Unicode, comme tout OS qui se respecte).
(http://nedbatchelder.com/blog/201106/filenames_with_accents.html)