[JoGu]

Kryptologie

Die Autokoinzidenzindizes eines Textes

a7Hzq .#5r<
kÜ\as TâÆK$
ûj(Ö2 ñw%h:
Úk{4R f~`z8
¤˜Æ+Ô „&¢Dø

Definition

Für die Kryptoanalyse periodischer polyalphabetischer Chiffren ist die folgende Konstruktion besonders interessant:

Sei a(q) bzw. a(-q) der um q Stellen zyklisch nach rechts bzw. links verschobene Text, also

a= a0   a1    a2 ... aq-1aq aq+1 ... ar-1
a(q)= ar-qar-q+1ar-q+2 ... ar-1 a0  a1 ... ar-q-1
a(-q)= aq  aq+1   aq+2 ... a2q-1a2qa2q+1 ... aq-1

Klar ist κ(a,a(q)) = κ(a,a(-q)).

Definition. Für einen Text a ∈ Σ* und eine natürliche Zahl qN heißt

κq(a) := κ(a,a(q))
der q-te Autokoinzidenzindex von a.

Achtung: In der Literatur ist diese Bezeichnung nicht üblich. Eine übliche Bezeichnung gibt es für diese Größe nicht.

Beispiele.


Eigenschaften

Der q-te Autokoinzidenzindex definiert eine Abbildung

κq : Σ*Q.

Die konstante Abbildung κ0 ist natürlich uninteressant.

Klar ist κq(a) = κr-q(a) für a ∈ Σr und 0 < q < r.


Anwendung

Betrachten wir nun einen periodisch polyalphabetisch verschlüsselten Text. Bei der Bestimmung von κq(a) wird im allgemeinen die Verschiebung q kein Vielfaches der Periode l sein. Bei der Zählung der Koinzidenzen treffen also Buchstaben zusammen, die im wesentlichen unabhängig voneinander monoalphabetisch verschlüsselt sind. Wir werden also nach I.3.1 ein Ergebnis κq(f(a)) ≈ 1/n erwarten.

Ist allerdings l|q, so haben wir die Situation

σ0a0    σ1a1 ... σ0aq  σ1aq+1 ...
σ0a0   σ1a1 ...

wo also die untereinander stehenden Zeichen mit der gleichen monoalphabetischen Substitution verschlüsselt sind und somit genau dann übereinstimmen, wenn sie im Klartext übereinstimmten. Wir erwarten jetzt also, dass κq(f(a)) in der Nähe der für die Sprache typischen Zeichenkoinzidenz liegt.

Genauer ist also für eine polyalphabetische Verschlüsselung f der Periode l folgendes zu erwarten:

  1. Ist l kein Teiler von q und r-q, so ist κq(f(a)) ≈ 1/n.
  2. Ist aber l Teiler von q und q klein gegenüber r, so ist κq(f(a)) ≈ κq(a) ungefähr die typische Zeichenkoinzidenz.

Das ist die zweite Anwendung der Koinzidenzbestimmung: Erkennung der Periode einer polyalphabetischen Substitution an den Autokoinzidenzindizes. Im Vergleich zur Parallelstellenanalyse berücksichtigt ein Autokoinzidenzindex auch Wiederholungen der Länge 1 im Abstand q; d. h., die Information, die die Periode im Geheimtext hinterlässt, wird wesentlich besser ausgenützt als bei der Parallestellensuche nach KASISKI. (»Statt nur einem oberflächlichen Foto wird ein Röntgenbild angefertigt.«) Man kann hoffen, dass sich die Periode einer polyalphabetischen Chiffre deutlich verrät.

Um eine Vorstellung von der Bedeutung dieser noch vagen Aussagen zu erhalten, rechnen wir als nächstes ein Beispiel durch; das dazu benützte Perl-Programm steht hier [online-Aufruf].


Autor: Klaus Pommerening, 23. Februar 2000; letzte Änderung: 23. November 2004.