Les séquences de longueur excessive en UTF-8 sont interdites, mais pas les décompositions de caractères précomposés.
en 2012, ne pas savoir gérer les accents dans les noms de fichiers, c'est quand même franchement la loose…
<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)
<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant
linus te dira que c'est inutile, assorti de différents arguments techniques probablement valables.
Le problème vient de Linux, pas d'Unicode (même si Unicode est *très* loin d'être parfait). Windows et OS X arrivent très bien à gérer les noms accentués.
<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)
<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant
donc en gros on peut normaliser de plusieurs manières qui s'affichent pareil, et linux ne renormalise pas selon la méthode officielle?
Voilà ^^
Linux ne fait *rien*. Tu pourrais lui refourguer un nom de fichier latin-1 ou utf-32, il s'en fout. Simplement, il s'attend à ce que tu lui fournisses de l'UTF-8.
Manque de pot, l'UTF-8 spécifie plusieurs manières de normaliser, et pour le coup, rien n'est dit sur la normalisation attendue.
Quant aux autres OS, ils te garantissent au moins que quelque soit ta façon de normaliser, ça sera le même fichier. Par exemple, avec ma ligne de Python, je n'ai bien qu'un seul fichier sur OS X.
<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)
<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant
Dans ce cas, c'est complètement débile, ça veut dire que tu peux utiliser n'importe quel encodage, et que l'application n'a aucun moyen de savoir quel encodage a été utilisé...
<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)
<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant
D'un autre côté, le problème à la racine semble quand même être unicode, l'implémentation de la libc ou du noyau serait probablement correcte si unicode était plus propre qu'actuellement. En tout cas, moi j'ai pas de souci d'accents, j'en mets pas. Je suis un vrai geek. #killer_argument#
vince Le 25/11/2012 à 11:10 justement, au lieu de mal supporter les fichiers unicode, ils feraient mieux de les refuser (ou même de convertir manumilitari en ascii les noms de fichiers)
Oui mais ce serait pas une méthode STANDARD §§§§
Je pense qu'ils ont déjà dû avoir cette discussion en interne… Et qu'un ayatollah du standard a menacé de retenir sa respiration si jamais on s'en écartait.
Ouep, ça doit sûrement rentrer en ligne de compte. Le boulot est monumental derrière.
faut pas déconner non plus.
YN -> je comprends que ça t'aies fait super chier, mais c'est quand même pas de la faute de Ubuntu, de Linux ou du Filesystem si tel ou tel programme n'est pas packagé pour ta distro. Du temps de MSDOS/Win<98, on avait toujours une disquette de boot sous la main (tu sais, "format /s a:"). Maintenant, c'est un liveCD ou un clé USB formatée comme il faut, c'est comme ça.
Comme déjà dit, l'encodage est le boulot de l'userspace, pas du noyau. La convention dit que le nom du fichier est censé être en NFC (plus précisément: que le nom des fichiers dans un locale UTF-8 est censé être en UTF-8 NFC – si tu utilises un des locales préhistoriques non-UTF-8, alors l'encodage des noms de fichiers est celui du locale), si tu utilises autre chose, PEBKAC.