KryptologieZeichenhäufigkeiten in künstlichen Sprachen |
|
Byte | Häufigkeit |
---|---|
00 | ca. 8% |
8B E8 | ca. 3% |
06 FF 20 74 | ca. 1.8% |
04 50 02 75 01 | ca. 1.4% |
03 46 65 B8 | ca. 1.4% |
Die Schwankungen sind ziemlich groß.
Die Häufigkeit der Bytes 65 (Buchstabe e) und 20 (Leerzeichen) hängt von dem Anteil eingebetteter Textteile ab.
Die Kryptoanalyse mit statistischen Methoden ist dadurch schwieriger als bei natürlichem Text.
Mustererkennungsmethoden sind unverzichtbar.
Zeichen | Häufigkeit | |
---|---|---|
Leerzeichen | ca. 25% | Autor, der viele Trennzeilen verwendet! |
- (Bindestrich) | ca. 6% | |
e LF CR | ca. 3.5% | |
R N ; : E n | ca. 2-2.5% | ebenfalls sehr vom Autor abhängig |
O a T , I l | ca. 1.5-2% | |
u = ' ( ) D S | ca. 1.2-1.4% |
Die Häufigkeiten hängen sehr stark vom Stil des Programmierers ab. Im Beispiel:
Besonderheiten:
Die Kryptoanalyse mit statistischen Methoden ist schwieriger als bei natürlichem Text.
Mustererkennungsmethoden sind unverzichtbar.
Byte | Häufigkeit |
---|---|
00 | ca. 7-70% |
01 | ca. 0.8-17% |
20 = Leerzeichen | ca. 0.8-12% |
65 = e | ca. 1-10% |
FF | ca. 1-10% |
Beobachtungen:
Klartext | ... | a1 ... as | ... | 0 ... 0 | ... |
---|---|---|---|---|---|
Schlüssel | ... | k1 ... ks | ... | k1 ... ks | ... |
Geheimtext | ... | c1 ... cs | ... | c1' ... cs' | ... |
mit ci = ai + ki, ci' = 0 + ki für i = 1, ..., s.
Also ist ci + ci' = ai + ki + ki = ai - ein Klartextblock enthüllt -
und ki = ci' - der Schlüssel enthüllt.
Sollte bei der Addition zweier Geheimtextblöcke ein Nullblock herauskommen, ist die Wahrscheinlichkeit groß, dass beide Klartextblöcke nur aus Nullen bestanden. Auch dann ist der Schlüssel enthüllt.
[Bei allgemeinen Verschiebechiffren funktioniert das genauso, man muss nur an den entsprechenden Stellen die inverse Gruppenoperation anwenden.]