30

GoldenCrystal (./29) :
C'est pas du tout contraire au standard Unicode.

Si. Lis la spec. Le BOM n'est prévu que pour l'UTF-16 et l'UTF-32. Il n'a aucun sens en UTF-8 où il n'est pas question d'ordre des octets.
C'est juste déconseillé

"Déconseillé" dans le sens où c'est non-standard (cf. ci-dessus) et donc forcément les outils conformes au standard ne comprennent pas.
principalement à cause de tous les outils de merde obsolètes codés par des linuxiens, qui ne gèrent pas le BOM...

Au contraire, le BOM UTF-8 existe principalement à cause de tous les outils de merde obsolètes codés par des fenêtriens, qui utilisent un charset obsolète par défaut…
La seule justification valide contre le BOM c'est que contrairement à l'UTF-16, l'endianness ne joue pas dans l'UTF-8...

Effectivement, c'est bien pour ça que ce n'est pas prévu par le standard!
Mais ça sert quand même comme identificateur de flux,

Mais cet "identificateur de flux" n'est pas dans le standard, c'est une extension non-standardisée et crée donc beaucoup plus de problèmes qu'il ne résout.
et c'est bien plus pratique que de scanner un fichier texte à la recherche de caractères spéciaux.

Scanner les fichiers texte est un hack de compatibilité que certains outils comme Kate implémentent, mais qui ne devrait pas être nécessaire. Il suffit de partir du principe que tous les textes sont en UTF-8 en 2013! (Sinon, tu n'as qu'à utiliser iconv manuellement pour convertir tes fichiers obsolètes.)
avatar
Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

31

Kevin Kofler (./30) :
Si. Lis la spec. Le BOM n'est prévu que pour l'UTF-16 et l'UTF-32. Il n'a aucun sens en UTF-8 où il n'est pas question d'ordre des octets.

http://tools.ietf.org/html/rfc3629#section-6

The UCS character U+FEFF "ZERO WIDTH NO-BREAK SPACE" is also known informally as "BYTE ORDER MARK" [...]. A receiver of such a serialized stream may then use the initial character as a hint that the stream consists of UCS characters and also to recognize which UCS encoding is involved and, with encodings having a multi-octet encoding unit, as a way to recognize the serialization order of the octets. UTF-8 having a single-octet encoding unit, this last function is useless [...]

Lis la spec.
avatar
All right. Keep doing whatever it is you think you're doing.
------------------------------------------
Besoin d'aide sur le site ? Essayez par ici :)

32

Effectivement, je viens de vérifier, les standards UTF-8 et Unicode déconseillent l'emploi du BOM en UTF-8 (parce que ça crée plus de problèmes d'interopérabilité que ça ne résout), mais le tolèrent malheureusement. Le standard Unicode dit que c'est "neither required nor recommended".
avatar
Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

33

Kevin Kofler (./29) :
Kate ne rajoute pas de BOMs en UTF-8!

Désolé te contredire mais j'ai observé exactement l'inverse. Il ajoute des bom par défaut et il faut les désactiver explicitement dans ses options.

34

Cette option existe, mais est désactivée par défaut. Mais si Kate charge un document déjà pollué par un BOM, elle s'adapte et garde ce BOM. Ou sinon, l'option a peut-être été changée par ta distribution. (Mais dans ce cas, ta distribution sux!)
avatar
Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

35

le document n'avait pas de bom, car il marchait sous php
après l'édition sous kate il ne marchait plus

j'ai vraiment la flemme de chercher dans le changelog, mais je serais pas étonné d'y trouver des choses. a moins que ce soit une config changée par debian, mais j'en doute;

36

En tout cas, l'option est décochée ici (Fedora) et je ne me rappelle pas l'avoir décochée moi-même. Et la lecture du code source semble aussi confirmer ce que je dis.
avatar
Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

37

38

(Par contre, le bug existe - existait ? - bien sous nano)
avatar