Kryptologie: Statistische Geheimtextanalyse

Kryptologie

Statistische Geheimtextanalyse

a7Hzq .#5r< kÜ\as TâÆK$ ûj(Ö2 ñw%h: Úk{4R f~`z8 ¤˜Æ+Ô „&¢Dø

Natürliche Sprachen wie

und auch künstliche Sprachen wie

MS-DOS-EXE, ...,
Pascal, ...,
MS-Word, ...

haben typische Zeichenhäufigkeiten, die

ungleichmäßig verteilt,
charakteristisch für die Sprache sind.

Bei einer Textlänge von etwa 500 bis 1000 Zeichen ist bei natürlichen Sprachen die Abweichung von den typischen Häufigkeiten in der Regel sehr gering.

Damit ist die Kryptoanalyse aufgrund der Häufigkeiten im wesentlichen automatisierbar.

Das einfachste mathematische Modell für die statistische Geheimtextanalyse ist eine Wahrscheinlichkeitsverteilung auf dem zugrundeliegenden (endlichen) Alphabet mit atomaren Wahrscheinlichkeiten p(s) für alle Buchstaben s. Wir gehen also so vor, als ob Klartexte Ströme von unabhängigen zufälligen Buchstaben wären.

In zweiter Näherung würde man dann berücksichtigen, daß jeder Buchstabe von seinem Vorgänger gemäß der typischen Bigramm-Verteilung abhängt.

Natürlich gibt es auch weitere Feinheiten, die man berücksichtigen kann, z. B. daß der häufigste Anfangsbuchstabe eines Textes im Deutschen das D ist.

Die statistische Geheimtextanalyse

ist die Hauptmethode der klassischen Kryptoanalyse,
dient aber auch in der modernen Kryptoanalyse z. B. dazu, bei einer automatisierten Exhaustion den richtigen Klartext zu erkennen.

Sie führt oft nicht zu einer vollständigen Lösung, aber zu einer Gewichtung nach Wahrscheinlichkeit der Möglichkeiten bei einer Exhaustion, so daß der Aufwand der Exhaustion entscheidend verringert wird.

Autor: Klaus Pommerening, 18. Oktober 1999; letzte Änderung: 23. Juni2001.

E-Mail an Pommerening@imsd.uni-mainz.de.