./2 > En effet, ces répétitions ne cadrent pas avec l’hypothèse d’une substitution, mais sont-elles pour autant plus probables avec une permutation (conclusion de mon point 3) ?
Si encore en était face à une fonction de hashage (donc non réversible) du genre « permuter les lettres pour mettre tous les A au début, puis tous les B, etc. », ça expliquerait ces répétitions, mais on a ici un codage réversible, donc c’est pas ça.
Comme toi, ces répétitions me laissent perplexe.
./3 > Ce que tu as fait, c’est en gros le
test de Kasiski 
.
Dans l’hypothèse d’un chiffrement poly-alphabétique (Vigenère), ça suggère donc un clé de taille 8 ou 16.
Cependant, ça ne marche pas pour les plus longs mots répétés que j’ai indiqués : écart de 548=2^2×137 caractères pour le « mot » de 19 lettres, écart de 739 (premier) pour celui de 18 lettres, mais sans doute est-ce une erreur de ma part de me limiter à ces mots répétés.
En outre, l’
indice de coïncidence(1) « par colonne » (point 1) ne montre aucun pic à 8 et ses multiples alors que je suis monté à 100 (j’ai indiqué 50 en
./1, de mémoire, mais en fait c’était 100, vive Java

).
Pour comparaison, j’ai résolu une autre énigme
(2) du même jeu en même pas quelques minutes grâce aux variations de l’IC moyen quand on découpe le texte en N colonnes.
Cependant, cela veut uniquement dire que ce n’est pas une substitution poly-alphabétique de taille 8 ou 16, ça n’exclut pas que cette taille ait une importance particulière et peut-être ton observation va-t-elle dans le sens de la solution.
En effet, ma conclusion pour le moment est que ça semble être une simple permutation de lettres : peut-être faut-il regrouper les lettres par groupes de 8 (ou 16) et permuter chaque ensemble selon le même schéma (passer par exemple de 12345678 à 63481527 : toi qui as bossé sur le DES, tu vois ce que je veux dire

), ce qui conserve donc les répétitions du texte en clair espacées de 8×N (ou 16×N) caractères.
squalyl (./3) :
que dit la proportion voyelles consonnes?
Voici comment se répartissent les 1203 lettres (lettre@nombre d’occurence, c’est mon script Java qui affiche ça comme ça

) pour le texte complet : [E@149, A@121, T@111, I@95, O@85, L@76, H@72, R@67, S@67, N@66, D@62, M@28, W@28, F@26, Y@25, B@24, V@23, C@20, G@18, U@17, P@13, J@4, K@4] (je te laisse faire les sommes voyelles et consonnes, je ne sais pas comment tu traites le Y

).
Comme je l’écrivais en
./1, ça ressemble plus à l’ordre (approximatif) anglais qu’à l’ordre français : sur-fréquence de H, W et Y, sous-fréquence de C, U et P, et les fréquences du S et du R me semblent un peu faibles pour du français (je ne sais plus ce qu’il en est de ces lettres en anglais).
Même chose pour chacune des 8 colonnes :
Occurences[0/8]: [I@21, T@17, A@15, E@11, S@10, L@9, N@9, R@9, D@8, O@7, H@6, V@5, G@4, M@4, F@3, Y@3, B@2, C@2, J@2, W@2, P@1, U@1, K@0, Q@0, X@0, Z@0]
Occurences[1/8]: [A@20, I@15, S@13, T@13, O@12, D@11, E@11, H@11, N@10, R@6, L@5, Y@5, W@4, F@3, C@2, G@2, P@2, U@2, V@2, B@1, Q@1, J@0, K@0, M@0, X@0, Z@0]
Occurences[2/8]: [E@19, T@14, O@13, A@12, H@11, L@11, R@11, N@9, I@8, W@8, S@7, D@5, M@5, C@4, B@3, F@3, U@3, Y@2, G@1, K@1, P@1, J@0, Q@0, V@0, X@0, Z@0]
Occurences[3/8]: [E@20, A@14, H@13, T@13, L@11, O@10, N@9, D@8, I@8, S@8, V@7, M@5, R@5, Y@4, W@3, B@2, F@2, G@2, J@2, U@2, C@1, P@1, K@0, Q@0, X@0, Z@0]
Occurences[4/8]: [E@23, A@15, I@14, D@13, T@12, L@11, O@9, R@7, F@6, H@6, B@4, C@4, N@4, S@4, W@4, G@2, K@2, P@2, U@2, V@2, Y@2, M@1, X@1, J@0, Q@0, Z@0]
Occurences[5/8]: [E@24, A@15, S@12, R@10, H@9, I@9, L@9, O@9, N@7, M@6, T@6, D@5, B@4, U@4, V@4, Y@4, C@3, G@3, W@3, F@2, P@2, J@0, K@0, Q@0, X@0, Z@0]
Occurences[6/8]: [E@20, A@15, O@13, L@12, R@12, T@12, I@11, D@9, H@8, N@8, M@6, S@5, F@4, Y@4, B@3, U@2, V@2, W@2, C@1, G@1, J@0, K@0, P@0, Q@0, X@0, Z@0]
Occurences[7/8]: [T@24, E@21, A@15, O@12, N@10, I@9, H@8, L@8, S@8, R@7, B@5, P@4, C@3, D@3, F@3, G@3, W@2, K@1, M@1, U@1, V@1, Y@1, J@0, Q@0, X@0, Z@0]
Indice[8]: 1.76508748536972
On a à peu de choses près le même ordre : rien à voir, donc, avec ce que donne une cryptanalyse d’un chiffre de Vigenère
(2).
À mes yeux, ça confirme que ce n’est pas une substitution quelconque, mais ça n’aide pas vraiment à savoir ce que c’est

…
Mais je me répète, essayez de voir ça avec des yeux neufs, j’espère que ma vision cryptanalyste brute (qui ne donne pas la solution ici) ne vous influence pas trop.
C’est d’ailleurs pour ça que je n’avais pas mis en
./1 de liens vers le test de Kasiski ou l’IC, pour que vous ne partiez pas bille en tête dans la même direction que moi

.
Godzil (./4) :
La clef pourrais etre un systeme a masque jetable
Non, pas un masque jetable : c’est un jeu qui a pour vocation d’être trouvé par les joueurs (et au moins 4 personnes ont déjà trouvé).
Or, avec un masque jetable, seul le destinataire peut le décoder, ce qui n’est pas le but ici.
Godzil (./4) :
La clef pourrais etre […] un simple cesar avec une clef a plusieurs lettres.
Ça s’appelle le
chiffre de Vigenère 
.
Mais l’étude de l’IC ne montre rien de ce genre.
Godzil (./4) :
Le fait que tout les caracteres sont en caps n'est surement pas la pour rien. Que sais tu du texte a trouver? doit-il y avoir des espaces ? tout les caracteres sont en caps ? etc..
Le texte en clair est un texte d’un auteur connu (dans le jeu en question, les autres textes étaient de Che Guevara, De Gaulle, Sun Tzu et Machiavel), pas forcément en français (le texte du Che était l’original, en espagnol), il y a des espaces et de la ponctuation qui ont été virés purement et simplement, le texte original n’est pas tout en capitales mais a été transformé ainsi pour que le codage se fasse sur un alphabet de 26 caractères au lieu de 52 (tous les exemples de cryptanalyse sont d’ailleurs en
all caps, pour simplifier l’étude de cas).
(1) À noter que j’ai utilisé la
version anglaise de l’IC, 26 fois plus grand que l’indice de la page française, indice que j’ai qualifié de « normalisé » car valant toujours ~1 pour un texte aléatoire quelle que soit la taille de l’alphabet considéré.
(2) Si vous voulez, je mettrai cet autre texte à décoder dans les [jeux]

, en vous laissant chercher quelques temps avant d’indiquer comment l’IC et les fréquences de lettres permettent de le décoder les doigts dans le nez.
Ça vous intéresse ?