[JoGu]

Kryptologie

Edgar Allan Poe: »Der Goldkäfer« (The Gold Bug)

a7Hzq .#5r<
kÜ\as TâÆK$
ûj(Ö2 ñw%h:
Úk{4R f~`z8
¤˜Æ+Ô „&¢Dø

Das Kryptogramm

   53##+305))6*;4826)4#.)4#);806*;48+8$
   60))85;1#(;:#*8+83(88)5*+;46(;88*96*
   ?;8)*#(;485);5*+2:*#(;4956*2(5*-4)8$
   8*;4069285);)6+8)4##;1(#9;48081;8:8#
   1;48+85;4)485+528806*81(#9;48;(88;4(
   #?34;48)4#;161;:188;#?;

Folgende Zeichen wurden hier abweichend vom Original gebraucht:
+statt
#statt
$statt

Hinweise: Der Text stammt vom Piraten Captain Kidd, der ihn mit dem Bild eines Zickleins unterzeichnet hatte. Daher kann der Rätsellöser annehmen, dass der Klartext ein englischer Text, aber mit Seemannsausdrücken gespickt und auch sonst ziemlich geheimnisvoll ist. Ferner ist eine monoalphabetische Chiffre recht wahrscheinlich - sie entspricht dem intellektuellen Niveau des Urhebers.

Dass die Geheimschrift aus »seltsamen« Zeichen besteht, verwirrt höchstens den Laien; dem Fachmann ist es - wie wir gleich sehen werden - völlig egal.


Der Beginn der Lösung

[Übersetzung: K. P.]

»Im gegenwärtigen Fall - wie eigentlich immer, wenn es um Geheimschrift geht, - gilt die erste Frage der Sprache des Geheimtextes; denn die Methoden zur Lösung hängen, besonders was die einfacheren Chiffren angeht, von den Eigenheiten des jeweiligen Idioms ab und variieren mit ihm. Im allgemeinen bleibt dem, der die Lösung versucht, nichts anderes übrig, als (geleitet von Wahrscheinlichkeitsüberlegungen) alle ihm bekannten Sprachen auszuprobieren, bis er die richtige gefunden hat. Aber bei der Chiffre, die hier vor uns liegt, wird alle Schwierigkeit durch die Signatur beseitigt. Das Wortspiel >Kidd< ist in keiner anderen Sprache als in Englisch verständlich. Ohne diese Erwägung hätte ich meine Vesuche mit Spanisch und Französisch begonnen als den Sprachen, in denen ein Geheimnis dieser Art von einem Piraten der Spanischen Meere wohl am ehesten niedergeschrieben worden wäre. Aber wie die Dinge hier lagen, nahm ich an, es handle sich bei dem Kryptogramm um Englisch.

»Sie bemerken, dass es keine Unterteilung in Wörter gibt. Wären da Zwischenräume, so wäre die Aufgabe vergleichsweise leicht gewesen. In einem solchen Fall hätte ich mit Vergleich und Analyse der kürzeren Wörter begonnen, und, wäre ein einbuchstabiges Wort vorgekommen, wie es höchst wahrscheinlich ist (a oder I zum Beispiel), hätte ich die Lösung als gesichert angesehen. Da es aber keine Unterteilung gibt, war mein erster Schritt, die häufigsten Zeichen zu ermitteln, und ebenso die am wenigsten häufigen. Ich zählte alle und stellte diese Tabelle auf:

Das Zeichen 8kommt33mal vor.
; 26mal.
4 19mal.
# ) 16mal.
* 13mal.
5 12mal.
( 6 11mal.
+ 1 8mal.
0 6mal.
9 2 5mal.
: ? 3 3mal.
- . 1mal.

»Nun, der Buchstabe, der im Englischen am häufigsten auftritt, ist e. Danach ist die Reihenfolge so: a o i d h n r s t u y c f g l m w b k p q x z. Das e allerdings dominiert in so bemerkenswertem Ausmaß, dass man kaum je einen einzigen Satz, egal welcher Länge, sieht, in dem es nicht der vorherrschende Buchstabe ist.

»Damit haben wir nun gleich zu Beginn den Grundstein zu etwas mehr als bloßem Raten. Es ist klar, wie man die Tabelle im allgemeinen verwenden kann - doch bei dieser besonderen Geheimschrift nehmen wir sie nur ganz am Rande zur Hilfe. Da unser vorherrschendes Zeichen 8 ist, nehmen wir als Ausgangspunkt an, dass dies das e des natürlichen Alphabets ist. Um diese Annahme zu überprüfen, sehen wir nach, ob die 8 oft paarweise auftritt - denn e kommt im Englischen sehr häufig doppelt vor - in solchen Wörtern wie beispielsweise >meet<, >fleet<, >speed<, >seen<, >been<, >agree< usw. Im vorliegenden Falle sehen wir es nicht weniger als fünf Male doppelt, obwohl das Kryptogramm nur kurz ist.

»Nehmen wir also 8 als e an. Nun ist von allen Wörtern unserer Sprache >the< das häufigste; sehen wir also einmal nach, ob es nicht Wiederholungen irgendwelcher drei Zeichen in der gleichen Anordnung gibt, wovon das letzte 8 ist. Wenn wir eine solche Zeichengruppe mehrfach entdecken, dann dürfte sie höchstwahrscheinlich das Wort >the< bedeuten. Beim Durchsehen finden wir nicht weniger als sieben solcher Gruppen aus den Zeichen ;48. Daher können wir annehmen, dass das Semikolon dem t entspricht, die 4 dem h und die 8 dem e - dieses bestätigt sich also. Damit ist ein großer Schritt getan.

Da wir nun schon ein einzelnes Wort bestimmt haben, sind wir in der Lage, einen überaus wichtigen Punkt zu klären; nämlich einige Anfänge und Enden anderer Wörter. Betrachten wir zum Beispiel das vorletzte Auftreten der Kombination ;48 - nicht weit vom Ende des Geheimtextes. Wir wissen, dass das unmittelbar folgende Semikolon der Beginn eines Wortes ist, und von den sechs Zeichen, die auf dieses >the< folgen, kennen wir bereits nicht weniger als fünf. Ersetzen wir also diese Zeichen durch die Buchstaben, die ihnen nach unseren bisherigen Erkenntnissen entsprechen, wobei wir eine Lücke für das unbekannte lassen -

t eeth.

Hier sehen wir uns sofort in der Lage, das >th< wegzulassen, da es nicht Teil des Wortes sein kann, das mit dem ersten t beginnt; denn wenn wir das gesamte Alphabet nach einem Buchstaben durchsuchen, der in die Lücke passt, erkennen wir, dass man kein Wort bilden kann, zu dem dieses th gehören kann. Damit können wir uns auf

t ee

beschränken, und wenn wir noch einmal - falls überhaupt nötig - das Alphabet durchgehen, kommen wir zu dem Wort >tree< als einzig möglicher Lesart. Damit gewinnen wir einen weiteren Buchstaben, r, dargestellt durch (, womit die Wörter >the tree< nebeneinander stehen.

Gehen wir ein kurzes Stück nach diesen Wörtern weiter, so sehen wir wieder die Kombination ;48 und nehmen sie als Abgrenzung dessen, was unmittelbar davor steht. Wir haben also dieses Arrangement:

the tree ;4(#?34 the,

oder, wenn wir die bereits bekannten natürlichen Buchstaben einsetzen, etwas, was sich so liest:

the tree thr#?3h the.

Wenn wir nun an Stelle der unbekannten Buchstaben Lücken lassen oder Punkte setzen, lesen wir dies:

the tree thr...h the,

worin das Wort >through< sofort ins Auge springt. Diese Entdeckung bringt uns drei neue Buchstaben, o, u und g, die durch #, ? und 3 dargestellt werden.

Sehen wir jetzt den Geheimtext sorgfältig nach Kombinationen bekannter Zeichen durch, so finden wir, nicht sehr weit vom Beginn, diese Anordnung:

83(88 oder egree,

was ganz klar das Ende des Wortes >degree< ist und uns einen weiteren Buchstaben gibt, d, dargestellt durch +.

Vier Zeichen nach dem Wort >degree< erblicken wir die Kombination

;46(;88*.

Setzen wir die bekannten Buchstaben ein und stellen die unbekannten wie zuvor als Punkte dar, so lesen wir:

th.rtee.,

ein Arrangement, welches unmittelbar das Wort >thirteen< suggeriert und uns zwei neue Buchstaben liefert, i und n, dargestellt durch 6 und *.

[...]«


Hiermit ist die Entzifferung noch nicht zu Ende, aber den Rest kann der Leser getrost als Übungsaufgabe erledigen.

Das bisher Entzifferte sieht so aus:

5 good 305)) in the 2i)ho.)ho)te0 in the de$
i0))e5t1ort: one degree )5nd thirteen 9in
ute) north e5)t5nd2: north 95in2r5n-h)e$
enth0i92e5)t)ide)hoot1ro9the0e1te:eo
1 the de5th)he5d52ee0ine1ro9 the tree
through the )hot1i1t:1eetout

Autor: Klaus Pommerening, 29. September 1999; letzte Änderung: 26. Oktober 2004.