Natürliche Sprachen wie
und auch künstliche Sprachen wieDamit ist die Kryptoanalyse aufgrund der Häufigkeiten im wesentlichen automatisierbar. Solche Programme gibt es im WWW z. B. hier und hier und in der ACA Crypto Dropbox.
Übungsaufgabe: Zähle einige Texte mit Hilfe der WWW-Formulare für Einzelbuchstaben und für Bigramme aus.
Das einfachste mathematische Modell für die statistische Geheimtextanalyse ist eine Wahrscheinlichkeitsverteilung auf dem zugrundeliegenden (endlichen) Alphabet mit atomaren Wahrscheinlichkeiten p(s) für alle Buchstaben s. Wir gehen also so vor, als ob Klartexte Ströme von unabhängigen zufälligen Buchstaben wären.
In zweiter Näherung würde man dann berücksichtigen, dass jeder Buchstabe von seinem Vorgänger gemäß der typischen Bigramm-Verteilung abhängt.
Natürlich gibt es auch weitere Feinheiten, die man berücksichtigen kann, z. B. dass der häufigste Anfangsbuchstabe eines Textes im Deutschen das D ist.
Die statistische Geheimtextanalyse