Kryptologie: Statistische Geheimtextanalyse

Kryptologie

Statistische Geheimtextanalyse

a7Hzq .#5r< kÜ\as TâÆK$ ûj(Ö2 ñw%h: Úk{4R f~`z8 ¤˜Æ+Ô „&¢Dø

Natürliche Sprachen wie

und auch künstliche Sprachen wie

MS-DOS-EXE, ...,
Pascal, ...,
MS-Word, ...

haben typische Zeichenhäufigkeiten, die

ungleichmäßig verteilt,
charakteristisch für die Sprache sind.

Bei einer Textlänge von etwa 500 bis 1000 Zeichen ist bei natürlichen Sprachen die Abweichung von den typischen Häufigkeiten in der Regel sehr gering.

Damit ist die Kryptoanalyse aufgrund der Häufigkeiten im wesentlichen automatisierbar. Solche Programme gibt es im WWW z. B. hier und hier und in der ACA Crypto Dropbox.

Übungsaufgabe: Zähle einige Texte mit Hilfe der WWW-Formulare für Einzelbuchstaben und für Bigramme aus.

Das einfachste mathematische Modell für die statistische Geheimtextanalyse ist eine Wahrscheinlichkeitsverteilung auf dem zugrundeliegenden (endlichen) Alphabet mit atomaren Wahrscheinlichkeiten p(s) für alle Buchstaben s. Wir gehen also so vor, als ob Klartexte Ströme von unabhängigen zufälligen Buchstaben wären.

In zweiter Näherung würde man dann berücksichtigen, dass jeder Buchstabe von seinem Vorgänger gemäß der typischen Bigramm-Verteilung abhängt.

Natürlich gibt es auch weitere Feinheiten, die man berücksichtigen kann, z. B. dass der häufigste Anfangsbuchstabe eines Textes im Deutschen das D ist.

Die statistische Geheimtextanalyse

ist die bekannteste (wenn auch nicht effizienteste) Methode der klassischen Kryptoanalyse,
dient aber auch in der modernen Kryptoanalyse z. B. dazu, bei einer automatisierten Exhaustion den richtigen Klartext zu erkennen.

Sie führt oft nicht zu einer vollständigen Lösung, aber zu einer Gewichtung nach Wahrscheinlichkeit der Möglichkeiten bei einer Exhaustion, so dass der Aufwand der Exhaustion entscheidend verringert wird.

Autor: Klaus Pommerening, 18. Oktober 1999; letzte Änderung: 14. Mai 2014.