Deterministischer Abgleich

Mögliche Ergebnisse: »gleich« (=), »ungefähr« (»), »ungleich« (¹). Die Relation »ungefähr« schließt die Relation »gleich« ein.

Verglichen werden auf mehreren hierarchischen Stufen Eingabevariablen, gekennzeichnet durch den Index 1, mit gespeicherten Variablen, gekennzeichnet durch den Index 0.

Abgeglichen werden Personen. Eine Person besteht aus:

Person Pflichtdaten
Nachname Teil I
Teil II
Teil III
PCode I
PCode II
Altname Teil I
Teil II
Teil III
PCode I
PCode II
Vorname Teil I
Teil II
Teil III
PCode I
PCode II
Geburtsdatum Geburtstag
Geburtsmonat
Geburtsjahr
Zusatzdaten
Ort (GKZ)
Staat
Geschlecht

Alle diese Daten werden beim Abgleich durch chiffrierte Kontrollnummern repräsentiert. Das spielt für die folgende Beschreibung aber keine Rolle.

Vergleich von Namen

Ein Name kann hierbei sein: Nachname, Altname, Vorname.

Auf der vierten Hierarchiestufe (Teil I bis PCode II) bedeutet Gleichheit die exakte Übereinstimmung. »Ungefähr« bedeutet das gleiche wie »gleich«.

Dritte Hierarchiestufe: Der Name N[1] ist genau dann gleich dem Namen N[0] (N[1] = N[0]), wenn mindestens eine der folgenden drei Bedingungen erfüllt ist (durch ODER verbunden):

  1. Die Teile I stimmen überein und
    die Teile II stimmen überein oder einer von beiden ist leer.
    Formal:
    N-I[1] = N-I[0] UND
    {N-II[1] = Æ ODER N-II[0] = Æ ODER N-II[1] = N-II[0]}
    Als gleich werden also die Muster angesehen.

  2. Die Bestandteile sind vertauscht (wobei der zweite leer sein kann) - 1. Fall, formal:
    N-I[1] = N-II[0] UND
    {N-II[1] = Æ ODER N-II[1] = N-I[0]}
    Als gleich werden also die Muster angesehen.

  3. Die Bestandteile sind vertauscht (wobei der zweite leer sein kann) - 2. Fall, formal:
    N-II[1] = N-I[0] UND
    {N-II[0] = Æ ODER N-II[0] = N-I[1]}
    Als gleich werden also die Muster angesehen.

Der Name N[1] ist genau dann ungefähr gleich dem Namen N[0] (N[1] » N[0]), wenn eine der folgenden zwei Bedingungen erfüllt ist (durch ODER verbunden):

  1. N-PCI[1] = N-PCI[0] (phonetischer Code I stimmt überein)
  2. N-PCII[1] = N-PCII[0] (phonetischer Code II stimmt überein)

Vergleich von Geburtsdaten

Es wird nur die exakte Übereinstimmung gewertet, ein gesondertes »ungefähr« gibt es nicht. Das Geburtsjahr wird modulo 100 ausgewertet.

Vergleich von Zusatzdaten

Es wird nur die exakte Übereinstimmung gewertet, ein gesondertes »ungefähr« gibt es nicht.

Abgleich von sicheren Datensätzen

Es handelt sich um den Fall, wo beide Datensätze als »sicher« gekennzeichnet sind, formal:

sicher[0] = WAHR UND sicher[1] = WAHR
Als gleich werden die Personen 1 und 0 angesehen, wenn die Nachnamen, Vornamen und Geburtsdaten übereinstimmen, wobei bei den Nachnamen eine dazwischenliegende Namensänderung akzeptiert wird. Formal:

Person[1] = Person[0] genau dann, wenn folgende drei Bedingungen erfüllt sind (durch UND verbunden):

  1. Nachname[1] = Nachname[0] ODER Altname[1] = Nachname[0]
  2. Vorname[1] = Vorname[0]
  3. Geburtsdatum[1] = Geburtsdatum[0]

Ein gesondertes »ungefähr« gibt es in diesem Fall nicht.

Nebeneffekt: In Fall der dazwischen liegenden Namensänderung sind die gespeicherten Variablen Nachname und Altname durch die neuen zu ersetzen.

Abgleich von unsicheren Datensätzen

Es handelt sich um den Fall, wo mindestens einer der beiden Datensätze nicht als »sicher« gekennzeichnet ist, formal:

sicher[0] = FALSCH ODER sicher[1] = FALSCH
Als gleich werden die Personen 1 und 0 angesehen, wenn die Nachnamen und Vornamen wenigstens ungefähr übereinstimmen und zusätzlich alle übrigen Daten (einschließlich Geburtsdatum, Ort, Staat, Geschlecht) exakt übereinstimmen, wobei auch hier bei den Nachnamen eine dazwischenliegende Namensänderung akzeptiert wird. Formal:

Person[1] = Person[0] genau dann, wenn folgende sechs Bedingungen erfüllt sind (durch UND verbunden):

  1. Nachname[1] » Nachname[0] ODER Altname[1] » Nachname[0]
  2. Vorname[1] » Vorname[0]
  3. Geburtsdatum[1] = Geburtsdatum[0]
  4. Ort[1] = Ort[0] ¹ Æ
  5. Staat[1] = Staat[0] ¹ Æ
  6. Geschlecht[1] = Geschlecht[0] ¹ Æ

Nebeneffekt: Falls sicher[1] = WAHR, müssen in diesem Fall die gespeicherten Daten mit eventuell abweichenden neuen Daten überschrieben werden.

Als ungefähr gleich werden die Personen 1 und 0 angesehen, wenn die Bedingungen 1 bis 3 erfüllt sind.

Nebeneffekt: Im Fall, dass die Personen ungefähr gleich, aber nicht gleich sind, wird eine Warnung an den Daten eingebenden Nutzer erzeugt.