1977Fermer1979
ZerosquareLe 15/10/2023 à 21:56
Là aussi, je pense que c'était inévitable :

- si Unicode avait choisi d'unifier les caractères qui sont graphiquement identiques, comment régler le problème de ceux qui existent dans plusieurs alphabets différents (latin, grec et/ou cyrillique) ? On les place d'office dans l'alphabet latin, et on laisse des trous dans les autres alphabets ? Outre le fait que ce soit politiquement discutable*, ça veut dire que les langues non latines se retrouvent avec un alphabet non-contigu (pénible à gérer, et un enfer pour la rétrocompatibilité, qui était l'un des objectifs d'Unicode), et ça casse aussi les mécanismes qui ont besoin de connaître l'alphabet d'origine des caractères.

- et une fois qu'on a éliminé les caractères graphiquement identiques, que faire de ceux qui sont sémantiquement et graphiquement différents, mais visuellement très proches ? Par exemple, l'eszett allemand (ß) et le bêta grec (β). Ou pire encore, le i sans point (I/ı) et celui avec point (İ/i), qui sont des caractères différents en turc et quelques autres langues.

* c'est un aspect à ne pas négliger pour une organisation internationale comme Unicode : quand ils ont décidé d'unifier les caractères communs au chinois, japonais et coréen, ça a fait grincer des dents les pays concernés.