|
Kryptologie
Statistische Geheimtextanalyse |
a7Hzq .#5r< kÜ\as TâÆK$ ûj(Ö2 ñw%h:
Úk{4R f~`z8 ¤˜Æ+Ô „&¢Dø |
|
Natürliche Sprachen wie
und auch künstliche Sprachen wie
- MS-DOS-EXE, ...,
- Pascal, ...,
- MS-Word, ...
haben typische Zeichenhäufigkeiten, die
- ungleichmäßig verteilt,
- charakteristisch für die Sprache sind.
Bei einer Textlänge von etwa 500 bis 1000 Zeichen ist bei
natürlichen Sprachen die Abweichung von den typischen Häufigkeiten
in der Regel sehr gering.
Damit ist die Kryptoanalyse aufgrund der Häufigkeiten im wesentlichen
automatisierbar.
Das einfachste mathematische Modell für die statistische
Geheimtextanalyse ist eine Wahrscheinlichkeitsverteilung auf dem
zugrundeliegenden (endlichen) Alphabet mit atomaren Wahrscheinlichkeiten
p(s) für alle Buchstaben s. Wir gehen also so
vor, als ob Klartexte Ströme von unabhängigen zufälligen
Buchstaben wären.
In zweiter Näherung würde man dann berücksichtigen,
daß jeder Buchstabe von seinem Vorgänger gemäß der
typischen Bigramm-Verteilung abhängt.
Natürlich gibt es auch weitere Feinheiten, die man berücksichtigen
kann, z. B. daß der häufigste Anfangsbuchstabe eines Textes
im Deutschen das D ist.
Die statistische Geheimtextanalyse
- ist die Hauptmethode der klassischen Kryptoanalyse,
- dient aber auch in der modernen Kryptoanalyse z. B. dazu, bei einer
automatisierten Exhaustion den richtigen Klartext zu erkennen.
Sie führt oft nicht zu einer vollständigen Lösung, aber zu
einer Gewichtung nach Wahrscheinlichkeit der Möglichkeiten bei einer
Exhaustion, so daß der Aufwand der Exhaustion entscheidend verringert
wird.
Autor: Klaus Pommerening, 18. Oktober 1999;
letzte Änderung: 23. Juni2001.
E-Mail an
Pommerening@imsd.uni-mainz.de.