Nouvelle petite vidéo amusante faite par le linguiste belge Koen Gheuens, démolissant 99% des "solutions" du MV (de type substitution simple des caractères) par l'entropie conditionnelle.
C'est en anglais mais les sous-titres traduits automatiquement des sous-titres anglais (sélectionner : Sous-titres Anglais et Traduire automatiquement) sont de bonne qualité sauf "Voynichese", qui n'est pas traduit. "Voynichien" n'est pas reconnu par les dictionnaires.
J'avais fait un petit programme JavaScript qui calcule les entropies d'ordre 0, 1, 2.
L'entropie des caractères représente la quantité d'information maximale théorique (en bits/caractère) contenue dans un texte selon ce qu'on en sait :
h0 : le nombre de caractères différents est connu,
h1 : la probabilité des caractères est connue,
h2 : la probabilité conditionelle des caractères, sachant le caractère précédent, est connue.