StageAidZielstellung: Im Folgenden wird der Versuch unternommen, Grundlagen der zweikanalstereophonen Aufnahme- sowie Wiedergabesituation und deren Einfluß auf die subjektive Wahrnehmung von Audio-Wiedergabequalität darzustellen, sowohl mit dem Ziel allgemeinen Verständnisses, als auch Hinweise für die Auswahl und Aufstellung von Abhöreinrichtungen sowie zur Anpassung der Akustik des Wiedergaberaumes unter dem Aspekt guter Wiedergabequalität zu liefern.
Der Artikel wendet sich an interessierte Laien, die ein Grundlagenverständnis von Schallaufzeichnung und Reproduktion anstreben. Herzlich eingeladen sind auch all jene, deren stereophones Weltbild durch z.B. regelmäßiges Studium der Audiopresse Schaden erlitten hat und nun ohne Grundlagenkenntnisse einem Ideal nachjagen, welches sie selbst nicht genau kennen.
Eines sei noch vorangeschickt: Jeder sollte versuchen, sich bewußt zu machen, daß im Bereich der Musikreproduktion zwei gänzlich unterschiedliche Sphären aufeinandertreffen. Auf der einen Seite der künstlerisch-musikalische Bereich, auf der anderen Seite die Sphäre von Naturwissenschaft und Technik. Musikreproduktionsgeräte gehören ausschließlich der technischen Sphäre an, man sollte daher gelernt haben, zwischen Physik einerseits und musikalischer Emotion andererseits strikt zu trennen.
1. Subjektive Beurteilung von Wiedergabequalität
Was sind die wesentlichen Parameter zur subjektiven Bewertung von Wiedergabequalität? Aus der Liste subjektiver Parameter (vgl. z.B. "Taschenbuch Akustik") seien hier die wohl wesentlichsten herausgegriffen:
Ein weiterer wichtiger Subjektiver Parameter, die Transparenz, stellt sich meist automatisch bei hoher Klangfarbenneutralität ein.
1.1 Phantomschallquellen und virtuelle Schallquellen, Definition:
Kommt der Hörereignisort als Folge von wenigstens zwei Lokalisationsreizen zustande, so ist die fiktive Schallquelle eine Phantomschallquelle. (G. Theile)
Zwei Lokalisationsreize liegen beispielsweise bei zweikanaliger Lautsprecherwiedergabe vor, da das Signal eines jeden der Kanäle zu beiden Ohren gelangt (Übersprechen zwischen den Kanälen).
Bei der kopfbezogenen Stereophonie (KH-Wiedergabe) kommt es nicht zu diesem Übersprechen zwischen den Kanälen, man spricht in diesem Falle von "virtuellen Schallquellen":
Kommt der Hörereignisort aufgrund nur eines Lokalisationsreizes zustande, so ist die fiktive Schallquelle eine virtuelle Schallquelle. (G. Theile)
Bei Lautsprecherstereophonie haben wir es also mit Phantomschallquellen zu tun, deren empfundene Ausdehnung je nach deren Eigenschaften von Realschallquellen beträchtlich abweichen kann bzw. muß. Man veranschauliche sich dazu, daß wir beim natürlichen Hören durch die Geometrie unseres Kopfes auf natürliche Weise Pegel- und Laufzeitdifferenzen (individuell) "erzeugen", während Phantomschallquellen durch Pegel- und/oder Laufzeitdifferenzen zwischen zwei Realschallquellen (den beiden LS) erzeugt werden.
Generell gilt: Je kleiner und schärfer die Phantomschallquellen abgebildet werden, desto hochwertiger sind die Wiedergabebedingungen. Dies ist eine sichere Möglichkeit, subjektiv die Abbildungsqualität zu beurteilen.
Schwieriger zu beurteilen ist dagegen eine korrekte Breiten- und Tiefenstaffelung, also jene Eigenschaften, die wesentlich die räumliche Abbildung ausmachen. Hier gibt es nicht ohne weiteres sichere Anhaltspunkte für Richtigkeit der Wiedergabe. Diese wird eher umgekehrt durch geeignete Abhörbedingungen definiert, "natürlicher", "echter" oder "originaler" Raumeindruck ist kein geeignetes Beschreibungsmerkmal stereophoner Wiedergabe, da diese prinzipbedingt hierzu nicht in der Lage ist.
2. Erzeugung von Phantomschallquellen: Grundsätzliche Möglichkeiten:
Phantomschallquellen können durch (Phasen-) Laufzeit- und/oder Pegeldifferenzen auf der Stereobasis ausgelenkt werden. Dies kann durch Hauptmikrofone, durch Hauptmikrofone mit zusätzlich durch Pegeldifferenzen zugemischten Stützmikrofonen (die auch zeitverzögert eingesetzt werden können, damit das Signal am Hauptmikrofon die erste Wellenfront abgibt), nur durch das Zusammenmischen von Einzelmikrofonen ("Multimikrofonie") oder rein synthetisch am Computer (elektronische Musik) geschehen. Letzteres bietet die meisten Möglichkeiten, während die Verwendung eines Hauptmikrofonsystems mit grundsätzlichen Einschränkungen behaftet ist.
Am Beispiel der Verwendung von zwei Mikrofonen werden im Folgenden grundlegende Stereophonieverfahren erläutert:
2.1. Laufzeitstereophonie
Die Auslenkung der Phantomschallquelle erfolgt ausschließlich mittels Laufzeitdifferenzen zwischen den beiden Kanälen, der Pegel der Kanäle ist dabei identisch. Um eine Phantomschallquelle ganz auf einen Kanal (d.h. 30°) auszulenken, werden etwa 1,2ms Interchannellaufzeit benötigt, dies entspricht bei der Schallgeschwindigkeit 343m/s bei 20°C einem Mikrofonabstand (einer Mikrofonbasis) von 41 cm (= 0,0012s*343m/s)., dies wird als sog. "klein A/B" Aufstellung bezeichnet. Dabei ist zu berücksichtigen, daß die 1,2ms Laufzeitdifferenz nur bei 90° seitlich von der Mikrofonanordnung plazierten Schallquellen auftreten.
Befinden sich die Mikrofone nicht genau über, sondern etwas vor dem Klangkörper, dann muß der Mikrofonabstand entsprechend vergrößert werden.
Klangcharakteristik: Da Druckempfänger (Mikrofone mit Kugelcharakteristik) eingesetzt werden können, ergibt sich eine auch bei tiefen Frequenzen neutrale Wiedergabe, wie sie durch Gradientenempfänger (z.B. Mikrofone mit Nierencharakteristik) nicht erreicht werden kann, deren Amplitudenfrequenzgang zu tiefen Frequenzen hin abfällt.
Die Phantomschallquellen werden in der Mitte scharf lokalisierbar abgebildet (geringe Laufzeitdifferenzen, direkt in der Stereomitte keine Laufzeitdifferenz). Bei größeren Winkeln, also je weiter die Phantomschallquellen auf einen Kanal ausgelenkt werden, kommt es aufgrund der Laufzeitdifferenzen zu größerer Ausdehnung, die Phantomschallquellen sind unscharf, verwaschen oder werden gar als "phasig" wahrgenommen. Die Tatsache, daß ein großer Anteil der Frequenzen bei Laufzeitverfahren nicht in Phase ist, sorgt für das häufig als "angenehm einhüllend" beschriebene Klangbild.
Das Verfahren liefert insgesamt einen angenehmen Raumeindruck (was keinesfalls mit "natürlich" oder "richtig" gleichzusetzen ist), weist jedoch bezüglich Lokalisierbarkeit die genannten Einschränkungen auf.
2.2. Intensitätsstereophonie:
Die Auslenkung der Phantomschallquellen erfolgt durch (idealerweise) frequenzneutrale Pegeldifferenzen. Diese können z.B. durch zwei gegeneinder um ca. 110° abgewinkelte Mikrofone mit Nierencharakteristik ("X/Y"), oder durch ein Kugelmikrofon und ein quer über der Kugel angebrachtes Mikrofon mit Achtercharakteristik mit nachgeschalteter Matrix erfolgen ("M/S" von "Mitte/Seite"). Dabei werden die Kanäle R und L dann durch Addition bzw. Subtraktion des einen Signals vom anderen erzeugt. Gegenüber X/Y ergibt sich ein Vorteil durch den Einsatz eines Druckempfängers, wodurch tiefe Frequenzen getreuer übertragen werden können. Ansonsten sind beide Verfahren (ungefähr) äquivalent.
Klangcharakteristik: Hier muß zwischen X/Y und M/S differenziert werden. Die Lokalisationskurve des X/Y-Verfahrens verläuft umgekehrt zu derjenigen bei Laufzeitverfahren. Die beste Lokalisierbarkeit ergibt sich bei maximaler Auslenkung (d.h. Auslenkung um 30° auf einen der Kanäle), während die Lokalisierbarkeit in der Stereomitte etwas schlechter ist. Zudem sind die Signale bei voller Auslenkung unverfärbt, während in der Stereomitte aufgrund der frequenzabhängigen Richtcharakteristik der Mikrofone Verfärbungen auftreten.
Bei M/S dagegen liegt der umgekehrte Fall vor, auch sofern als M-Mikrofon eine Kugel Verwendung findet (Anmerkung: das M-Mikrofon muß nicht zwangsläufig eine Kugel sein): Die Mittenschallquellen werden präzise und nahezu unverfärbt abgebildet, die Seiten dagegen leicht unpräzise und verfärbt, da auch Kugelmikrofone bei seitlicher Beschallung keinen geradlinigen Amplitudenfrequenzgang aufweisen. Weiterhin bietet M/S gegenüber X/Y subjektiv den Eindruck einer ausgeprägteren Tiefenstaffelung.
Gegenüber Laufzeitverfahren ist die Lokalisierbarkeit bei Intensitätsstereophonie generell deutlich besser, bei allerdings vergleichsweise geringer Raumwirkung.
2.3 Äquivalenzverfahren
Hier werden sowohl Pegel- als auch Laufzeitdifferenzen genutzt, typische Vertreter sind ORTF (quasi eine X/Y-Anordnung mit 17cm Basisbreite) oder das Kugelflächenmikrofon (KFM), bei dem zwei Druckempfänger gegenüberliegend in einer ca. 20cm großen Kugel eingelassen sind.
Äquivalenzverfahren vereinen die Vorteile bzw. auch Nachteile von reinen Intensitäts- bzw. Laufzeitverfahren.
In Abbildung 1 sind diese Zusammenhänge nochmals gemeinsam dargestellt. Der Realschallquelle wurde willkürlich der Wert 1 als Maßstab für Lokalisierbarkeit zugewiesen. D L steht für durch Pegeldifferenzen ausgelenkte Phantomschallquellen (Intensitätsstereophonie), D t für durch Laufzeitdifferenzen ausgelenkte Phantomschallquellen (Laufzeitstereophonie, X/Y). D L + D t steht für sowohl durch Pegel-, als auch durch Laufzeitdifferenzen ausgelenkte Phantomschallquellen (Äquivalenzverfahren).
Abb. 1: Lokalisationskurven der grundlegenden Stereophonieverfahren

Quelle: E. Sengpiel (HdK Berlin): Vorlesungs-Unterlagen unter http://www.sengpielaudio.co.uk/
3. Zusammenhänge zwischen subjektiv wahrgenommener Wiedergabequalität und dem Schallfeld am Abhörplatz
Es ist die Wechselwirkung zwischen Abhörreinrichtung und Wiedergaberaum, welche die Wiedergabequalität im mit weitem Abstand höchsten Maße beeinflußt. Der einzige Weg zu richtiger Wiedergabe ist die Einrichtung eines geeigneten Schallfeldes am Abhörplatz.
3.1 Zusammensetzung des Schallfeldes am Abhörplatz
Das Schallfeld am Abhörplatz besteht potentiell aus folgenden Anteilen:
- Direktschall (vom LS direkt an den Hörplatz gelangender Schall)
- Erste diskrete schallstarke Reflexionen (an einer Raumbegrenzungsfläche reflektierter Schall)
- Diffusschall (an mehreren Begrenzungsflächen immer wieder reflektiertes Nachhallfeld)
Abb. 2: Typische Raumimpulsantwort (ETC)

Quelle: Glenn Ballou: "Handbook for Sound Engineers", Howard W. Sams & Co.
Nach dem Direktschall folgt zuerst die erste diskrete Reflexion, die je nach Wandbeschaffenheit (frequenzabhängiger Absorptionsgrad) fast den gleichen Pegel besitzen kann, wie der Direktschall. Die Zeit zwischen dem Direktschall und dem Eintreffen der ersten diskreten Reflexion wird als "initial time delay gap" ITG oder auch als "Anfangszeitlücke" bezeichnet. Betrachten wir der Einfachheit halber nur einen LS vor einer Wand, dann wird bei 1m Wandabstand die erste Reflexion etwa 6ms (Schallgeschwindigkeit 343m/s bei 20°C; Vor- und Rücklauf beachten) nach Direktschall eintreffen.
Da diese Reflexionen wiederum an Begrenzungsflächen reflektiert werden (usw. usw.), wobei jedesmal etwas Schallenergie durch Absorption verloren geht, gehen sie bald in ein dekorreliertes Nachhallfeld mit zeitlich abnehmender Intensität über.
Häufig findet man Angaben der Nachhallzeit t60 eines Raumes in Abhängigkeit von der Frequenz. Diese meint den Zeitraum der vergeht, bis der Schallpegel um 60dB gegenüber dem Ursprungswert abgesunken ist (entsprechend einem Millionstel des Ausgangswertes).
3.2 Was soll eine gute Abhörsituation leisten?
Ein gute Abhörsituation bietet dem Hörer bezüglich der beiden grundlegenden subjektiven Wiedergabeeigenschaften Lokalisationsschärfe und Klangfarbenneutralität denselben optimalen Eindruck wie unter Freifeldbedingungen, die z.B. in einem reflexionsarmen (= "schalltoten") Raum vorherrschen. Reflexionsarme Räume eignen sich allerdings keinesfalls zum Musikhören, da die Differenz zwischen optischer Wahrnehmung (Innenraum) und akustischer Wahrnehmung (Freifeld) nicht zusammenpassen und starkes Unbehagen bis hin zu einem sehr unangenehmen Druck auf den Ohren beim Hörer hervorrufen.
All jenen, die nicht die Möglichkeit haben, versuchsweise im reflexionsarmen Raum zu hören, sei an dieser Stelle ein kleines Experiment empfohlen, um den Einfluß des Wiedergaberaumes auf die Wiedergabequalität zu erleben: Man bringe seine LS nach draußen und höre dort. Dies ist die einfachste Möglichkeit, ungefähr unter Freifeldbedingungen zu hören.
Da Freifeldbedingungen nicht nomaler Hörerfahrung –z.B. in Konzerten- entsprechen, kann ein Abhörraum zudem etwas Diffusschall aus dem hinteren Raumbereich zum Hörplatz gelangen lassen, um Mängel zweikanalstereophoner Wiedergabe bezüglich Ambiance und Raumeinbindung auszugleichen, die sich ansonsten nur (und besser) durch mehrkanalige Wiedergabe abstellen lassen.
3.3 Grundvoraussetzungen für eine neutrale Abhörsituation
Abb. 3: Entstehung von Kammfiltereffekten durch Interferenzen zwischen Direktschall und Reflexion

Die zeitliche Auflösung unseres Gehörs bezüglich der Differenzierung zwischen Direktschall und Reflexion beträgt etwa 4ms, d.h. Reflexionen innerhalb dieses Zeitraums werden dem Direktschall zugeordnet. Sind Reflexionen um 40ms oder mehr verzögert, nehmen wir sie bei ausreichendem Pegel nicht als Indirektschall, sondern als Echo wahr. Interchannel-Laufzeiten (das sind Laufzeitdifferenzen, die zwischen beiden Sterokanälen auftreten) können vom Gehör übrigens weit feiner aufgelöst werden, bis hin zu etwa 40 Mikrosekunden oder sogar darunter.
Zu b (Reflexionen):
Werden hohe Klangfarbenneutralität und Lokalisationsschärfe der Wiedergabe gewünscht, ist eine Unterdrückung der diskreten Reflexionen bis 15ms nach Direktschall um mindestens 10, besser 20dB erforderlich. Ursächlich für die negativen Einflüsse in Bezug auf Lokalisierbarkeit ist die Tatsache, daß diskrete Reflexionen neben den beiden LS weitere Realschallquellen darstellen. Wir hatten oben gesehen, daß Phantomschallquellen –durch zwei Lokalisationsreize erzeugt- weniger gut lokalisierbar sind, als eine Realschallquelle. Die Lokalisierbarkeit nimmt bei steigender Zahl an Lokalisationsreizen (diskrete Reflexionen) noch weiter ab.
Insbesondere in normal großen Wohnräumen ist hinreichende Unterdrückung von Reflektiertschall eine recht harte und nicht leicht umsetzbare Forderung. 15ms entsprechen bei einer Schallgeschwindigkeit von 343m/s ungefähr einer Laufstrecke von 5m. Ohne Diffusoren und Absorber wird man daher in der Regel nicht auskommen können. Die einfachste und praktikabelste Lösung ist zunächst den Wandabstand von LS und Hörplatz zu maximieren, insbesondere sollten die LS von seitlichen Begrenzungsflächen ferngehalten und auf den Hörplatz ausgerichtet sein, um den Pegel von Reflexionen an Begrenzungsflächen von vorneherein gering gegenüber dem Direktschall zu halten.
Zu a: Bedingungen für eine lineare Betriebsschallpegelkurve:
a.1 Der vom LS ausgesendete Direktschall ist unverfärbt, d.h. ein lineares Freifeldübertragungsmaß (Amplitudenfrequenzgang unter 0° und unter reflexionsfreien Bedingungen) ist Grundvorraussetzung.
a.2 Die frühen diskreten Reflexionen werden unterdrückt (Vermeidung von Interferenzen, sog. "Kammfiltereffekten")
a.3 Das diffuse Schallfeld (dekorrelierte Phase, aus allen Raumrichtungen eintreffend) ist unverfärbt (linearerAmplitudenfrequenzgang), dafür ist wiederum erforderlich:
a.3.1 Der Amplitudenfrequenzgang des vom LS insgesamt in alle Raumrichtungen (!) ausgesendeten Schalles (Diffusfeldübertragungsmaß) ist linear
a.3.2 Die Nachhallzeit des Raumes ist frequenzunabhängig konstant.
Zu a.3.1: Die Bedeutung des Bündelungsmaßes und des Bündelungsmaßverlaufes
Theoretisch geeignet für unverfärbte Wiedergabe erscheint demnach lautsprecherseitig auf den ersten Blick der ideale Kugelstrahler. Dieser weist über den gesamten Übertragungsbereich ein gleichmäßiges Diffusfeldübertragungsmaß auf, bei linearem Freifeldübertragungsmaß bedeutet dies ein Bündelungsmaß von 0 dB, entsprechend einem Richtfaktor von 1.
Erläuterung: Das Bündelungsmaß für eine Frequenz stellt den gemittelten Pegel des in alle Raumrichtungen ausgesendeten Schalles normiert auf den Pegel unter 0° (also direkt auf Achse) dar. Liegt die insgesamt in alle Raumrichtungen ausgesendete und gemittelte Schallenergie bei einer Frequenz z.B. 10dB unterhalb jener bei 0°, so verfügt der LS bei dieser Frequenz über ein Bündelungsmaß von 10dB.
Der Bündelungsmaßverlauf ( = "directivity index" = Bündelungsmaß über die Frequenz aufgetragen) sollte idealerweise möglichst linear sein.
Unter anderen Aspekten (Kurzzeitreflexionen, Pegel des Diffusfeldes) zeigt sich, daß ideale Kugelstrahler nur in extrem stark bedämpften Räumen sinnvoll betrieben werden können. Bevor in den Fünfzigern daher der Kugelstrahler endgültig zu den Akten gelegt wurde, waren die letzten Exemplare dieser Gattung in ihrer Empfindlichkeit umschaltbar gestaltet.
Eine bessere Alternative ist ein Direktstrahler, der ebenfalls ein unverfärbtes Diffusfeld erzeugt, jedoch eine Richtwirkung aufweist. Ein solcher LS muß eine lineare Freifeldübertragungskurve und ein über die Frequenzen gleichmäßiges Bündelungsmaß größer 0dB aufweisen.
Derartige LS finden sich meines Wissens vorwiegend im Bereich der Tonstudiotechnik. Es gibt Modelle, die z.B. zwischen 250Hz und 10kHz ein gleichmäßiges Bündelungsmaß von ca. 10dB aufweisen, dies entspricht einem Richtfaktor von 3, d.h. gegenüber einem idealen Kugelstrahler wird –bei gleichem Pegel im direkten Schallfeld- insgesamt nur etwa 1/3 der Schallenergie in den Raum abgegeben. Ein solcher LS führt im Vergleich zum Kugelstrahler leicht einsehbar zu weniger negativen Raumeinflüssen bei dennoch weitestgehend unverfärbtem Diffusfeld.
Bei sehr tiefen Frequenzen ist Bündelung aufgrund des begrenzten Membran- und Gehäusedurchmessers nicht mehr möglich, einzig durch Wandeinbau ist hier noch ein Richtfaktor von 2 zu erreichen. Generell gilt, daß ein LS mit ausgeprägter und dennoch gleichmäßiger Richtcharakteristik nicht klein sein kann, da zur Bündelung tiefer Frequenzen große Chassis benötigt werden. Als Faustregel: Ein Chassis beginnt ungefähr bei Frequenzen, deren Wellenlänge dem Umfang des Chassis entspricht, zu bündeln. Beispiel: Ein 16´´ (40cm) Chassis (Umfang 1,25m) bündelt ab 270Hz aufwärts. Art (z.B. Schallführungen) und Größe des Gehäuses können hier allerdings noch einen zusätzlichen Einfluß ausüben. Zur Veranschaulichung sind zwei Bündelungsmaßverläufe dargestellt, einerseits des Kleinregielautsprechers ME Geithain RL 906 (130mm Tiefmitteltöner, 25mm Hochtonkalotte, Trennfrequenz 3 kHz) und andererseits des Hauptregielautsprechers RL 901 (400mm Tieftöner, 125mm
Abb. 4: Bündelungsmaßverlauf des Kleinregielautsprechers ME Geithain RL 906

Abb. 5: Bündelungsmaßverlauf des Hauptregielautsprechers ME Geithain RL 901 (Herstellerangaben)

Zu a.3.2: Frequenzunabhängige Nachhallzeit
Einen Raum auf eine völlig frequenzunabhängige Nachhallzeit zu trimmen, erfordert recht hohen Aufwand. Die anzustrebende Nachhallzeit hängt auch von der Raumgröße ab. Je größer der Raum, desto länger darf die Nachhallzeit sein. Das entspricht dem natürlichen Empfinden, da große Räume aufgrund größerer reflektierender Flächen gegenüber kleinen Räumen mit Wandmaterial gleichen durchschnittlichen Absorptionsgrades verlängerte Nachhallzeiten aufweisen.
Der Toleranzbereich gemäß DIN/EBU liegt zwischen 0,3 und 0,5 Sekunden, wobei nach persönlichem Geschmack des Autors eine Orientierung an der unteren Toleranzgrenze sinnvoll ist.
Sofern der Raum nicht auch im Mittel- und Hochtonbereich unterdämpft ist (dazu führen große Flächenanteile aus schallharten Materialien, wie Putz, Glas, Fliesen etc), ist es besonders lohnend, das Hauptproblem des "akustisch kleinen Raumes", wie er bei der Heimwiedergabe vorliegt, anzugehen: Die zu tiefen Frequenzen hin stark ansteigenden Nachhallzeiten und die örtlich inhomogene Schalldruckverteilung aufgrund der Anregung von Eigenfrequenzen des Raumes, welches zu dem typischen Dröhnen bei Wiedergabe im Wohnraum führt. Diese manifestiert sich in einer meist um 10 bis 20dB ansteigenden Betriebsschallpegelkurve bei tiefen Frequenzen.
Abb. 6: typischer Verlauf der Nachhallzeit in Abhängigkeit von der Frequenz bei einem "akustisch kleinen" Raum (unterhalb 125 Hz ist die Übertragunsfunktion abgebildet, aus der einzelne Werte für die Nachhallzeit errechnet wurden).

Quelle: J. Fuchs, Rundfunktechnische Mitteilungen 36 (1992), H..1., S.1
Das Modell der geometrischen Akustik ist im Bereich der Eigentöne nicht mehr gültig. Als Faustformel für die Grenzfrequenz des Überganges von der geometrischen Akustik zur Denkweise in Eigenfrequenzen ("Raummoden, Eigentöne") gilt:
fg = 125* (180 m3/Raumvolumen in m3)1/3
Es ist hier zu beachten, daß unterhalb dieser Grenzfrequenz die Bestimmung der Nachhallzeit in Terzbändern nicht mehr sinnvoll ist, stattdessen muß die Übertragungsfunktion des Raumes für jede Frequenz einzeln bestimmt werden, dergestalt, daß sich ein LS in einer Raumecke befindet, der Empfänger in einer anderen Ecke. Zur Minderung der störend langen Nachhallzeit gelangt man ausschließlich durch Absorption, d.h. den Einsatz von Plattenschwingern, Membranabsorbern oder Helmholtzresonatoren, wobei letztere aufgrund ihrer schmalbandigen Wirkung nur zur Bedämpfung einzelner Frequenzen geeignet sind. Alle genannte Absorber sind im Druckmaximum wirksam, können also direkt auf eine Wand aufgebracht werden. Verbundplattenresonatoren (eine Kombination aus o.g. Absorbern, siehe Link zu Hunecke) weisen bei tiefen Frequenzen einen recht breiten Absorptionsbereich auf. Einige Links:
http://www.soundlab-speakers.com
http://www.sweetwater.com/products/rpg
http://www.gotham.ch/palette/raumopt.htm
http://www.acousticalsolution.com/Desc-RPG.htm
Poröse Absorber (z.B. Schaumstoff) sind dagegen weniger zur Absorption tiefer Frequenzen geeignet, da sie im Druckmaximum unwirksam, dagegen im Schnellemaxium wirksam sind, wo sie die Bewegung der Luftmoleküle abbremsen. Zur Veranschaulichung: Wenn eine Frequenz von 63 Hz bedämpft werden soll, ist dafür ein Wandabstand des porösen Absorbers von 1,33m erforderlich. Dies möchten wohl nur wenige in ihrem Wohnraum realisiert sehen.
Liegt hingegen eine Unterdämpfung des Mittel- oder Hochtonbereichs vor, können poröse Absorber aufgrund der in diesem Frequenzbereich kurzen Wellenlängen sehr gut eingesetzt werden.
Weiterhin sollte eine Baßquelle nicht im Druckmaximum der Eigentöne aufgestellt werden, da hier deren Anregung maximal erfolgt. Ein Druckmaximum jeder Eigenfrequenz befindet sich direkt an der Raumbegrenzungsfläche (Wand). Günstig ist dagegen eine Aufstellung im Schnellemaximum (l /4 vom Druckmaxiumum entfernt), da es hier nicht zur Anregung der Eigentöne kommt. Die Anregung kann man gut erleben, wenn man die LS direkt an eine Wand oder gar in einer Ecke plaziert und äquivalent den Hörplatz an ein solches Druckmaximum verlegt.
Leider finden sich viele Heim-LS mit Tiefton-Chassis, Baßreflexkanälen, Transmissionlineöffnungen und ähnlichen Baßquellen direkt in Fußbodennähe (also im Druckmaxiumum bestimmter Eigenfrequenzen). Diese regen konstruktiv beabsichtigt den Raum an (!) . Vom Kauf eines solchen LS sollte man daher absehen, denn er wird im Wohnraum einen dröhnigen Baßbrei produzieren. Dieser wird allerdings von vielen Kunden aufgrund falscher Hörgewohnheiten als "satt und voll" empfunden und besserer Vermarktbarkeit wegen in Consumerkisten eingebaut. Das Gehör gewöhnt sich an (fast) alles.
Zusammenfassung: Ein beliebiger LS in einem normalen Wohnraum aufgestellt führt -vorsichtig formuliert- nicht automatisch zu einer guten Wiedergabesituation. Ein Wiedergaberaum, der eine perfekt frequenzunabhängige Nachhallzeit und zudem eine Unterdrückung der ersten diskreten Reflexionen ermöglicht, ohne dabei überdämpft zu wirken, wird andererseits leider sowohl preislich, als auch optisch den heimischen Rahmen sprengen.
Beim normalen Heim-Hifi wird zudem leider von Seiten der LS-Hersteller häufig auf ein "gutes Rundstrahlverhalten" geachtet, da dies einerseits die bei vielen Kunden offenbar beliebte Pseudoräumlichkeit durch diskrete Reflexionen an Begrenzungsflächen generiert, andererseits für einen ausgeglichenen Amplitudenfrequenzgang auch an ungünstigen Hörpositionen weit außerhalb der Achse sorgt.
Man achte auf die Unzahl von LS mit einer um 2kHz ohne Schallführung angekoppelten Hochtonkalotte. Von der geringen Belastbarkeit und daraus zwangsläufig folgenden Verzerrungsprodukten bei höheren Pegeln ganz zu schweigen.
Kleine Zweiwegelautsprecher mit schmalen Schallwänden klingen –außerhalb des Hallradius im Diffusfeld abgehört, also z.B. bei über 3m Hörabstand in einem durchschnittlichen Wohnzimmer- nicht aufgrund der häufig beschworenen Phasenkohärenz "so schön räumlich" (Innere Phasendrehungen sind weitgehend unhörbar und wirken sich kaum auf die Lokalisierbarkeit und Raumabbildung aus, nur sprunghafte Änderungen der akustischen Phase sind hörbar) sondern weil sie durch ein geringes Bündelungsmaß zu ausgeprägten diskreten Reflexionen an fast allen Begrenzungsflächen führen. Diese letztlich fehlerhafte "Pseudoräumlichkeit" führt zu Einschränkungen bezüglich der Lokalisationsschärfe von Phantomschallquellen, die sich ausdehnen und ineinander verschwimmen. LS mit geringem Bündelungsmaß eignen sich im Wohnraum daher strenggenommen nur als Nahfeldlautsprecher.
An dieser Stelle muß konstatiert werden, daß zwischen Studiobedingungen (Abhörraum mit weitgehend frequenzunabhängiger -zudem kurzer- Nachhallzeit, Unterdrückung der Kurzzeitreflexionen, Hören im direkten Schallfeld) eine Differenz herrscht, die möglicherweise zu der Unzufriedenheit vieler Freaks bezüglich vermeintlich schlechter Aufnahmen führt, auch wenn natürlich von Seite der Produzenten auf Kompatibilität ihrer Produktionen bezüglich schlechter Abhörbedingungen geachtet wird.
Prinzipiell erscheint daher eine Vereinheitlichung der Abhörbedingungen wünschenswert. Dies bedeutet, daß ein engagierter Musikliebhaber auch im Heim im direkten Schallfeld, also möglichst innerhalb oder zumindest nicht allzuweit außerhalb des Hallradius hören sollte. Dies führt zu deutlich gesteigerter Transparenz der Wiedergabe und stark verbesserter Lokalisierbarkeit von Phantomschallquellen.
3.3 Direktes Schallfeld, Diffusfeld, Hallradius
Bewegt man sich unter Freifeldbedingungen (d.h. unter Bedingungen, wo es nicht zu Reflexionen an Begrenzungsflächen kommt, wie. z.B. im reflexionsarmen = "schalltoten" Raum oder hoch an einem Kran in der Luft hängend) von einer punktförmigen Schallquelle hinweg, so nimmt die Schallintensität mit zunehmender Entfernung quadratisch ab (vgl. Oberfläche einer Kugel). Eine Schallquelle im Wohnraum generiert jedoch aufgrund der Nachhallzeit des Raumes zusätzlich ein sog. "diffuses Schallfeld", von dem jetzt vorausgesetzt wird (Vereinfachung), daß im statistischen Mittel in jedem Raumpunkt aus allen Raumrichtungen sekundlich gleich viel Energie eintrifft.
Dieses diffuse Schallfeld ist also unabhängig von der Entfernung des Zuhörers von der Schallquelle immer gleich laut, während die Intensität des Direktschalls mit zunehmender Entfernung des Hörers vom LS abnimmt.
Der Abstand, bei dem der Pegel des Direktschalles eines Schallsenders unter Freifeldbedingungen dem Pegel des Diffusfeldes im Raum entspricht, wird Hallradius genannt. Am Hallradius sind Direktschall und Diffusschall daher genau gleich laut. Da die Nachhallzeit in Wohnräumen stark frequenzabhängig ist, ergibt sich für jede Frequenz ein eigener Hallradius.
Für eine Kugelschallquelle (völlig ungerichtete Abstrahlung) errechnet sich der Hallradius zu
rH = 0,057 *(V/T)1/2.
V = Raumvolumen in Kubikmeter
T = Nachhallzeit des Raumes, definiert als die Zeit, in der die Energiedichte auf ein Millionstel des Anfangswertes, der Schalldruckpegel also um 60dB abgefallen ist (daher auch die Bezeichnung T60).
Wie der Ausdruck erkennen lässt, steigt der Hallradius bei Vergrößerung des Raumvolumens an, verringert sich aber mit zunehmender Nachhallzeit.
Bei gerichteter Schallabstrahlung ist der Hallradius um die Wurzel des Richtfaktors G der Schallquelle größer.
G = 4 p *r * I max/I
Imax ist die Maximalintensität, I die mittlere Strahlungsintensiät ins Kugelvolumen. D.h., stärker bündelnde Lautsprecher führen im gleichen Raum zu größeren Hallradien.
Zur Bestimmung der Nachhallzeit benötigt man den mittleren Absorptionsgrad des Wandmaterials und die Wandfläche. Unter Normalbedingungen gilt die vereinfachte Sabinesche Nachhallformel (exakt gültig wäre die Eyringsche Nachhallformel):
T = (0,163 s/m) * (Raumvolumen/(Wandfläche*Absorptionsgrad))
Typische Absorptionsgrade bei 1000Hz (nur zu Demonstrationszwecken, nicht zur Eigenberechnung):
Putz : 0,03
Teppich: 0,15
Schwerer Vorhang, mit Abstand zur Wand, gefaltet: 0,89
Mineralfaserplatte: 0,84
Holz: 0,09
Generell gilt, daß wohnraumübliche Materialien bei tiefen Frequenzen fast nicht, bei hohen jedoch recht deutlich absorbieren. In weiten Frequenzbereichen liegt der Hallradius in durchschnittlichen Wohnzimmern und für dynamische Hifi-Kleinlautsprecher mit geringem Bündelungsmaß -d.h. typischen Richtfaktoren von ca. 2- häufig unter 2m.
4. Einfluß der Lautsprecher auf die Wiedergabequalität
Da neben der Wechselwirkung zwischen LS und Wiedergaberaum der LS an sich den größten Einfluß auf die Wiedergabequalität besitzt, hier einige Parameter, die eingehalten werden sollten (vgl. technischer Bericht Nr. B115/90d des Instituts für Rundfunktechnik):
Dieses ersetzt leider nicht gänzlich den Hörtest. Allerdings sind LS, welche diese Parameter nicht einhalten von vorneherein nicht für hochwertige Wiedergabe geeignet, es handelt sich also um triviale Ausschlußkriterien.
5. Hören im direkten Schallfeld: Möglichkeiten der praktischen Umsetzung im Wohnraum:
Das Hören im direkten Schallfeld, d.h. innerhalb des Hallradius ist nicht ohne weiteres im Wohnzimmer realisierbar. Daher werden jetzt einige mehr oder weniger aufwendige Möglichkeiten geschildert, dies einzurichten.
5.1 Optimierung des Wohnraumes. Einrichtung eines Hörstudios im Heim. Dies ist fraglos der beste Weg zu hoher Wiedergabequalität.
Vorteile:
Nachteile:
Sofern keine optimale Konfiguration des Wohnraumes möglich ist, bieten sich einige Kompromißlösungen an. Es gilt grundsätzlich:
Je länger die Nachhallzeit des Raumes und je geringer das Bündelungsmaß des LS, desto geringer ist der Hallradius und desto kürzer sollte darum der Hörabstand gewählt werden. Auch der Umkehrschluß ist gültig: Je höher das Bündelungsmaß des LS und je kürzer die Nachhallzeit des Raumes, desto größer ist der Hallradius, womit sich die Möglichkeit größerer Hörabstände ergibt. Hieraus ergeben sich die unter 4.2 und 4.3 dargestellten Grenzfälle:
5.2 "Nahfeldabhören" (gleichseitiges Stereodreieck bis maximal 2m Kantenlänge, LS exakt auf den Hörplatz ausgerichtet, wobei auf maximalen Abstand von LS und Abhörplatz von Begrenzungsflächen zu achten ist). Es sei angemerkt, daß unter Studiobedingungen 2m Hörabstand nicht mehr als "Nahfeld" zu bezeichnen sind.
Vorteile:
Nachteile:
5.3 Verwendung ausgeprägt bündelnder Lautsprecher, wie z.B. Hörnern, Flächenstrahlern oder Lautsprechern mit Waveguides (z.B. Genelec 1037B, siehe http://www.genelec.com)/). Waveguides sind auf gleichmäßiges Abstrahlverhalten optimierte Hörner. Solcherlei Schallwandler bieten sich insbesondere für akustisch problematische (=unterdämpfte) Räume oder bei durch Einrichtung oder sonstige Faktoren vorgegebenen großen Abhörabständen an.
Vorteile:
Nachteile:
5.4 "digitale Raumkorrektur" (funktioniert leider nicht)
Dieses Verfahren zur Verbesserung der Wohnraumakustik (!) findet in letzter Zeit vermehrt Beachtung. Was ist damit gemeint? Vermittels eines Equalizers wird der Amplitudenfrequenzgang des LS angepaßt, bis sich am Hörplatz eine lineare Betriebsschallpegelkurve (aus Direkt- und Diffusschall zusammengesetzte Gesamtintensität am Hörplatz, s.o.) ergibt. Aus dem oben Geschriebenen wird der geneigte Leser aber leicht erkennen, das dieses Verfahren nicht funktionieren kann.
Man benötigt zwangsläufig eine lineare Freifeldübertragungskurve ("Frequenzgang" unter 0°), da sonst der Direktschall als verfärbt empfunden wird (Das Gehör kann zwischen Direktschall und Diffusschall differenzieren, s.o.). Ganz abgesehen davon ist mit solchen Systemen weder etwas gegen die besonders störenden diskreten Reflexionen noch gegen verlängerte Nachhallzeiten im Baß und die Anregung der Eigenfrequenzen auszurichten.
Einzig das zu tiefen Frequenzen abnehmende Bündelungsmaß jeden Lautsprechers kann mittels Entzerrung etwas kompensiert werden.
Wenn man beim Händler in dessen meist akustisch optimierten und großen Vorführraum eine "beeindruckende" Vorführung dieser Technologie erlebt hat, dann handelt es sich wohl meist um eine "LS-Korrektur" und nicht um eine "Raumkorrektur", woraus nur die mangelnde Neutralität vieler Hifi-LS deutlich wird.