Linux? - Page 104

3090

Le 25/11/2012 à 15:46

flanker (./3068) :
Quant aux autres OS, ils te garantissent au moins que quelque soit ta façon de normaliser, ça sera le même fichier. Par exemple, avec ma ligne de Python, je n'ai bien qu'un seul fichier sur OS X.

Et ce n'est pas normal. Tu as utilisé 2 noms différents, ce sont 2 fichiers différents. Le noyau n'a pas à normaliser quoi que ce soit. Ce serait d'ailleurs impossible sous GNU/Linux parce qu'un nom de fichier du noyau Linux est une séquence d'octets, rien ne dit que c'est de l'UTF-8. (D'ailleurs, si tu utilises par exemple un locale Latin1, les noms de fichiers seront normalement en Latin1, du moins si tes applications fonctionnent correctement. Mais les locales non-UTF-8 sont dépréciés.)

flanker (./3071) :
Dans ce cas, c'est complètement débile, ça veut dire que tu peux utiliser n'importe quel encodage, et que l'application n'a aucun moyen de savoir quel encodage a été utilisé...

L'encodage est censé être celui du locale (et pour l'UTF-8, en NFC), si l'application qui écrit le fichier ne respecte pas ça, ce n'est pas la faute de celle qui le lit si elle ne le trouve pas.

squalyl (./3083) :
a mon avis le choix de char* ou wchar_t* pour les chaines est une décision à prendre à la base. Imagine si ils doivent faire ce changement partout dans le noyau où des chaines sont utilisées

C'est pourri, les wchar; l'UTF-8 est la bonne solution (compatible ASCII, ne gaspille pas de place si on ne met que de l'ASCII, et les mêmes routines peuvent être utilisées pour l'UTF-8 et pour tous les encodages obsolètes en 8 bits, sans devoir passer par des conversions potentiellement à perte).

flanker (./3087) :
Et c'est un truc qui aurait pu être pris en compte dès le début ; que je sache, les accents existaient déjà en 1991

Mais pas l'Unicode! Il y avait plein d'encodages différents selon le locale, et donc la solution la plus simple et la plus logique a été retenue: on accepte une séquence d'octets quelconque et c'est à l'userspace d'utiliser le bon locale.

Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

3091

Le 25/11/2012 à 15:48

Yoshi Noir (./3085) :
Folco (./3082) :
Sauf qu'il y a toutes les chances pour qu'il y ait d'autres (bonnes) raisons derrière, à moins que dévelopeur open source == abruti pour toi. Je te conseille de postuler chez Disney.

Parfois, oui…

Par exemple, j'ai réinstallé mon Windows 7 et comme il fallait s'y attendre, le système a (mal) réécrit le secteur de boot et a rendu mon Ubuntu 11.04 inaccessible.

Solution : lancer boot-repair. Sauf que le gus qui avait codé ça n'a mis ce paquet à disposition que pour les versions LTS
Et au lieu d'installer un bête paquet de 2 Mo, je me suis retrouvé à télécharger un ISO de 320 Mo, à aller ensuite dans un Leclerc pour acheter des CD vierges, faute de clé USB disponible, et ENFIN graver le CD. Grosse perte de temps qui aurait pu être évitée si les binaires étaient seulement disponibles avec ma version d'Ubuntu

1. Un paquetage pour la version LTS précédente s'installe souvent sans problème sur la version non-LTS actuelle. As-tu essayé?
2. boot-repair ne sert à rien, il suffit de lancer grub(2)-install pour réinstaller le bootloader. RTFM.

Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

3092

Le 25/11/2012 à 15:56

Kevin Kofler (./3090) :
Mais pas l'Unicode! Il y avait plein d'encodages différents selon le locale, et donc la solution la plus simple et la plus logique a été retenue: on accepte une séquence d'octets quelconque et c'est à l'userspace d'utiliser le bon locale.

C'est pas idiot, au moins c'est permissif, et ça évite ceux qui gueulent parce qu'ils peuvent pas appeler leur fichier comme ils veulent.

3093

Le 25/11/2012 à 16:14

Ben écoute, si tu trouves que les comportement soulignés par Flanker sont des features et non des bugs, on doit vraiment pas avoir la même façon de voir les choses...

— Zeroblog —

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

3094

Le 25/11/2012 à 16:15

J'ai l'impression qu'encore une fois, il y a des pour et des contres à cette question...

3095

Le 25/11/2012 à 16:18

Bah oui, il y a toujours du pour et du contre. Même pour le nostub, tu peux trouver du pour

(tiens, le point Godwin des TI-68 K

)

— Zeroblog —

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

3096

Le 25/11/2012 à 16:19

Pour moi, c'est clairement un fonctionnement voulu, et le plus logique vu les contraintes. Et le problème est pratiquement réglé de nos jours: toutes les distributions grand public utilisent des locales UTF-8 par défaut, donc les noms de fichiers sont en UTF-8, et par convention en NFC, ce que presque toutes les applications produisent naturellement (certaines ne gèrent même pas les caractères composants).

Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

3097

Le 25/11/2012 à 16:26Edité par RHJPP le 25/11/2012 à 16:28

Kevin Kofler (./3090) :
Le noyau n'a pas à normaliser quoi que ce soit.

Pourquoi n'aurait-il pas à le faire ? Ce n'est pas une propriété intrinsèque d'un noyau ça. Si on avait voulu que ce soit à lui de faire cette normalisation, il aurait simplement fallu le décider. Et ça n'a pas été fait...

Pour régler les problèmes d'homonymie des fichiers, on pourrait imaginer que c'est au pilote du système de fichier de faire la normalisation. Celui-ci offrirait un service de stockage de fichier qui te retrouverait tes fichiers tant que tu utilises un nom valide, et pas forcément exactement la séquence d'octets qui a été utilisée lors de la création du fichier.

3098

Le 25/11/2012 à 16:27

Folco (./3092) :
C'est pas idiot, au moins c'est permissif, et ça évite ceux qui gueulent parce qu'ils peuvent pas appeler leur fichier comme ils veulent.

Euh... quels sont les caractères interdits en UTF-8/NFKC ?

Accessoirement, ça pourrait très bien être quelque chose de forcé par partition, lors du formatage.

Je ne vois pas pourquoi ça serait forcément en userspace, et en quoi c'est pratique d'avoir deux fichiers distincts avec le même nom. Et non, ce n'est pas un PEBKAC dans la mesure où l'utilisateur n'a aucun moyen de savoir quel encodage a été utilisé par l'application…

<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant

3099

Le 25/11/2012 à 16:27

RHJPP (./3097) :
Pour régler les problèmes homonymie des fichiers, on pourrait imaginer que c'est au pilote du système de fichier de faire la normalisation. Celui-ci offrirait un service de stockage de fichier qui te retrouverait tes fichiers tant que tu utilises un nom valide, et pas forcément exactement la séquence d'octets qui a été utilisée lors de la création du fichier.

Ça pourrait être une solution tout à fait viable, en effet.

<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant

3100

Le 25/11/2012 à 16:34

SU-27 -> je parlais d'avant unicode justement. Comment être sûr qu'un nom de fichier valide qqpart le soit ailleurs, à part en le considérant comme une simple suite d'octets ?

3101

Le 25/11/2012 à 16:36

Folco (./3100) :
SU-27 -> je parlais d'avant unicode justement. Comment être sûr qu'un nom de fichier valide qqpart le soit ailleurs, à part en le considérant comme une simple suite d'octets ?

Bin tu spécifies l'encodage au niveau partition, tout simplement

On y arrivait bien pour les contenus de fichiers ^^

<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant

3102

Le 25/11/2012 à 16:39

Non, le contenu des fichiers n'a pas d'encodage spécifié non plus. (Les shell scripts, fichiers de configuration etc. doivent être dans un encodage compatible ASCII, mais quels caractères non-ASCII sont permis dans les commentaires n'est spécifié nulle part.) L'interprétation dépend du locale et/ou du réglage choisi par l'utilisateur dans son éditeur de texte.

Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

3103

Le 25/11/2012 à 16:41

PS: À noter que l'UTF-16 n'est pas compatible ASCII, c'est bien pour ça que le monde *nix utilise l'UTF-8 presque partout.

Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

3104

Le 25/11/2012 à 16:43

flanker (./3101) :
Bin tu spécifies l'encodage au niveau partition, tout simplement

Ca revient à déléguer le boulot au filesystem comme le dit RHJPP en fait ?

3105

Le 25/11/2012 à 16:45

Folco (./3104) :
flanker (./3101) :
Bin tu spécifies l'encodage au niveau partition, tout simplement

Ca revient à déléguer le boulot au filesystem comme le dit RHJPP en fait ?

Bah ouais, ça parait cohérent en plus

Webmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca

3106

Le 25/11/2012 à 16:57

Folco (./3104) :
flanker (./3101) :
Bin tu spécifies l'encodage au niveau partition, tout simplement

Ca revient à déléguer le boulot au filesystem comme le dit RHJPP en fait ?

Bah où serait le problème ? J'estime simplement qu'en 2012, on n'a pas à avoir deux fichiers différents avec un nom identique. Après, que ce soit fait au niveau noyau ou au niveau FS, je m'en moque ^^

Kevin Kofler (./3096) :
Pour moi, c'est clairement un fonctionnement voulu, et le plus logique vu les contraintes. Et le problème est pratiquement réglé de nos jours: toutes les distributions grand public utilisent des locales UTF-8 par défaut, donc les noms de fichiers sont en UTF-8, et par convention en NFC, ce que presque toutes les applications produisent naturellement (certaines ne gèrent même pas les caractères composants).

Quelle bonne idée ! Et comme les locales dépendent de chaque utilisateur, tu peux te retrouver avec des encodages différents ! de mieux en mieux

<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant

3107

Le 25/11/2012 à 17:04

c'est sûr, dans ce cas faut gérer un cas particulier : les stockages amovibles... tu files une clé usb à un pote, il se passe quoi si vous avez pas les mêmes locales ?

Webmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca

3108

Le 25/11/2012 à 17:08

Ou même deux utilisateurs sur le même ordi ^^

<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant

3109

Le 25/11/2012 à 17:09

Utiliser l'encodage local, c'est ce que faisait DOS (et par extension : FAT12/16/32), et c'est bien pour ça qu'ils ont arrêté par la suite

(c'est un peu comme le format de date/heure : Windows et Linux utilisent l'UTC en interne et convertissent en heure locale, pas l'inverse)

— Zeroblog —

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

3110

Le 25/11/2012 à 17:27

Folco (./3088) :
Maintenant, c'est un liveCD ou un clé USB formatée comme il faut, c'est comme ça.

Bah justement, j'avais déjà un Live CD, mais il n'a servi à rien

Kevin Kofler (./3091) :
1. Un paquetage pour la version LTS précédente s'installe souvent sans problème sur la version non-LTS actuelle. As-tu essayé?

C'est le premier truc que j'ai essayé…

Kevin Kofler (./3091) :
2. boot-repair ne sert à rien, il suffit de lancer grub(2)-install pour réinstaller le bootloader. RTFM.

Justement, ceux qui ont RTFM se sont retrouvés avec un joli message « Impossible de trouver le paquet boot-repair » alors qu'ils n'ont fait que suivre la recette. Je n'ai trouvé l'explication qu'en naviguant au hasard dans Launchpad.
Cela dit, avec des gens aussi aimables comme toi, Linux donne envie.

3111

Le 25/11/2012 à 18:06

T'avais essayé ça : http://doc.ubuntu-fr.org/boot-repair ?

3112

Le 25/11/2012 à 18:13

flanker (./3106) :
Kevin Kofler (./3096) :
Pour moi, c'est clairement un fonctionnement voulu, et le plus logique vu les contraintes. Et le problème est pratiquement réglé de nos jours: toutes les distributions grand public utilisent des locales UTF-8 par défaut, donc les noms de fichiers sont en UTF-8, et par convention en NFC, ce que presque toutes les applications produisent naturellement (certaines ne gèrent même pas les caractères composants).
Quelle bonne idée ! Et comme les locales dépendent de chaque utilisateur, tu peux te retrouver avec des encodages différents ! de mieux en mieux

vince (./3107) :
c'est sûr, dans ce cas faut gérer un cas particulier : les stockages amovibles... tu files une clé usb à un pote, il se passe quoi si vous avez pas les mêmes locales ?

Ce problème est bien une des raisons pour lesquelles les locales non-UTF-8 sont dépréciés!

Zerosquare (./3109) :
(c'est un peu comme le format de date/heure : Windows et Linux utilisent l'UTC en interne et convertissent en heure locale, pas l'inverse)

GNU/Linux fait ça (comme tout *nix qui se respecte), mais l'autre non, il attend une heure BIOS en heure locale!

Yoshi Noir (./3110) :
Justement, ceux qui ont RTFM se sont retrouvés avec un joli message « Impossible de trouver le paquet boot-repair » alors qu'ils n'ont fait que suivre la recette. Je n'ai trouvé l'explication qu'en naviguant au hasard dans Launchpad.

Tu n'as pas RT bon FM alors. Le paquetage boot-repair est spécifique à Ubuntu et ne sert strictement à rien, tu peux utiliser directement grub(2)-install comme sur n'importe quelle autre distribution.

Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

3113

Le 25/11/2012 à 18:19Edité par Kevin Kofler le 25/11/2012 à 18:20

https://help.ubuntu.com/community/RecoveringUbuntuAfterInstallingWindows#The_terminal_way
Voilà la méthode normale. C'est une ligne à rentrer dans la ligne de commande. Normalement:
sudo grub-install /dev/sda
(mais ça peut être sdb, sdc etc. dans certaines configurations, cf. le lien pour savoir).

Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

3114

Le 25/11/2012 à 18:19

Kevin Kofler (./3113) :
GNU/Linux fait ça (comme tout *nix qui se respecte), mais l'autre non, il attend une heure BIOS en heure locale!

L'heure BIOS en UTC n'est pas activée par défaut pour des raisons de compatibilité, mais on peut le faire. Et quoi qu'il en soit, les fonctions de l'API utilisent l'heure UTC dans tous les cas, sauf si on demande explicitement l'heure locale.

— Zeroblog —

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

3115

Le 25/11/2012 à 18:21

Pour des raisons d'incompatibilité avec un GNU/Linux en dual boot plutôt.

Je ne vois vraiment pas en quoi cette connerie est compatible avec quoi que ce soit.

Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

3116

Le 25/11/2012 à 18:24

Folco (./3111) :
T'avais essayé ça : http://doc.ubuntu-fr.org/boot-repair ?

yep

3117

Le 25/11/2012 à 18:28

Kevin Kofler (./3112) :
flanker (./3106) :
Kevin Kofler (./3096) :
Pour moi, c'est clairement un fonctionnement voulu, et le plus logique vu les contraintes. Et le problème est pratiquement réglé de nos jours: toutes les distributions grand public utilisent des locales UTF-8 par défaut, donc les noms de fichiers sont en UTF-8, et par convention en NFC, ce que presque toutes les applications produisent naturellement (certaines ne gèrent même pas les caractères composants).
Quelle bonne idée ! Et comme les locales dépendent de chaque utilisateur, tu peux te retrouver avec des encodages différents ! de mieux en mieux
vince (./3107) :
c'est sûr, dans ce cas faut gérer un cas particulier : les stockages amovibles... tu files une clé usb à un pote, il se passe quoi si vous avez pas les mêmes locales ?

Ce problème est bien une des raisons pour lesquelles les locales non-UTF-8 sont dépréciés!

Vous avez le choix, mais ne prenez que celui qu'on vous dit de prendre !

Et faut être cohérent. Si de toute façon il faut prendre de l'UTF-8, où est le problème de l'imposer ?

<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant

3118

Le 25/11/2012 à 18:31

Kevin Kofler (./3116) :
: Pour des raisons d'incompatibilité avec un GNU/Linux en dual boot plutôt.

Oui oui, ils ont fait ça juste pour embêter ton Linux chéri

Je te signale que les anciens OS Microsoft utilisaient l'heure du BIOS comme heure locale, qu'il y a des gens qui font du dual-boot entre les deux, et qu'il est légèrement logique qu'ils privilégient la compatibilité avec leurs produits plutôt qu'avec un concurrent direct s'ils doivent faire un choix...

— Zeroblog —

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

3119

Le 25/11/2012 à 18:45

Yoshi Noir (./3116) :
Folco (./3111) :
T'avais essayé ça : http://doc.ubuntu-fr.org/boot-repair ?
yep

Cf. ./3113.

Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

3120

Le 25/11/2012 à 18:53

flanker (./3117) :
Vous avez le choix, mais ne prenez que celui qu'on vous dit de prendre !

L'idée des encodages spécifiques au locale date de quand Unicode n'existait pas encore! Quand l'UTF-8 a été introduit, c'était justement pour résoudre ce problème, et donc forcément les encodages legacy sont devenus désuets et dépréciés. Si tu veux prendre un choix obsolète, c'est ton problème.

Et faut être cohérent. Si de toute façon il faut prendre de l'UTF-8, où est le problème de l'imposer ?

Comment faire pour lire les fichiers qui ont été crées avant, avec un locale obsolète? convmv ou la méthode manuelle (mv "nom de fichier accentu"?.txt "nom de fichier accentué.txt") pour réparer ça ne fonctionnent que parce que le noyau permet toujours les noms de fichiers mal encodés.

Zerosquare (./3118) :
Je te signale que les anciens OS Microsoft utilisaient l'heure du BIOS comme heure locale, qu'il y a des gens qui font du dual-boot entre les deux, et qu'il est légèrement logique qu'ils privilégient la compatibilité avec leurs produits plutôt qu'avec un concurrent direct s'ils doivent faire un choix...

Le dual-boot entre 2 versions du même OS est totalement idiot et inutile. (D'ailleurs, Fedora ne le supporte pas officiellement, tout le support du dual-boot est fait pour dual-booter avec autre chose que GNU/Linux, et le partitionnement automatique efface par défaut toutes les partitions GNU/Linux, partant du principe que tu veux faire une réinstallation ad novo si tu utilises l'installeur sur un système qui a déjà GNU/Linux.)

Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité