![]() |
KryptologieDer Koinzidenzindex einer stochastischen Sprache |
|
Für eine stochastische Sprache M ⊆ Σ* mit Buchstabenhäufigkeiten ps heißt
κM := κMM = ∑s∈Σ ps2
der Koinzidenzindex von M (nach FRIEDMAN).
Deutung: Für unabhängige Texte a, b ∈ M gleicher Länge ist
κ(a,b) ≈ κM
Beispiele. 1.) κΣ* = 1/n. Im Spezialfall n = 26 ist κΣ* ≈ 0.0385.
2.) Aus den bekannten Häufigkeitstabellen folgen empirisch die bereits angekündigten WerteDa ∑s∈Σ ps = 1, gilt 1/n ≤ κM ≤ 1, und zwar
Das folgt aus
1.) Bei polyalphabetischer Substitution ist die Wiederverwendung des gleichen Schlüssels mit hoher Wahrscheinlichkeit erkennbar (egal, ob periodisch oder nicht):
Für verschiedene polyalphabetische Substitutionen f, g ist zu erwarten, dass
κ(f(a),g(b)) ≈ 1/n für a, b ∈ Σr.
Jetzt ist auch geklärt, dass bei gleicher Substitution
κ(f(a),f(b)) = κ(a,b) ≈ κM für a, b ∈ M.
2.) Sei c ein Geheimtext aus einer polyalphabetischen Verschlüsselung eines Textes a ∈ M der Periode l. Welche Werte sind für κq(c) zu erwarten?
c = | c0 | … | cq-1 | || | cq | … | cr-1 |
c(q) = | cr-q | … | cr-1 | || | c0 | … | cr-q-1 |
erwartete Koinzidenzen: | q×κM, | falls | l|r-q, | || | (r-q)×κM, | falls | l|q, |
q×κΣ* | sonst, | || | (r-q)×κΣ* | sonst. |
Daraus ergeben sich folgende erwartete Werte für den Autokoinzidenzindex:
1. Fall, l|r:
2. Fall, l kein Teiler von r:
Insbesondere gilt für q << r:
κq(c) ≈ { | κM,
wenn l|q, κΣ* sonst. |
Damit ist auch das im Beispiel beobachtete Autokoinzidenzspektrum erklärt, und die typischen Autokoinzidenzspektren sehen so aus.