Hörphysiologie und Psychoakustik

Aufgrund der sehr positiven Resonanz und häufiger Nachfragen zum Thema meines Fachvortrags stelle ich die gesammelten Informationen auf diesem Wege jedem Interessenten zur Verfügung. Zum besseren Verständnis sind die zum Vortrag gehörenden Folien als jpeg-Bilder beigefügt und können auf Wunsch geladen werden. Zusätzlich sind Hörbeispiele als MP3-Files hier herunterladbar. Die MP3s haben eine Größe zwischen 70kB und 500kB.

Wahrnehmungsgrenzen

Im Vergleich zum Auge wird dem Ohr viel weniger Aufmerksamkeit zugewendet, als es ihm eigentlich zustehen sollte. Die Leistungsmerkmale des Hörorgans können sich mit denen des Auges durchaus messen und übersteigen auf ihrem Wahrnehmungsgebiet sogar teilweise die des Sehorgans.

Das Auge ist fähig, Licht von ca. 700nm bis ca. 350nm Wellenlänge wahrzunehmen. Dies entspricht einer Oktave des elektromagnetischen Spektrums. Ein gesunder jugendlicher Mensch hört hingegen Töne von ca. 16 Hz bis 16.000 Hz. Dies entspricht ungefähr 10 Oktaven. Auch die vergleichende Wahrnehmung ist beim Ohr besser als beim Auge ausgeprägt. Farbunterschiede und Schattierungen müssen schon relativ deutlich sein damit wir sie vergleichen können. Im Dämmerlicht geht die Fähigkeit, Farbnuancen unterscheiden zu können, deutlich zurück. Letztendlich werden im Dunkeln nicht mehr erkennbare Farben durch die Lern- und Anpassungsfähigkeit des Gehirns ergänzt.

Das Ohr hingegen ist fähig, auch sehr kleine Tonunterschiede zu differenzieren. Geübte Testpersonen können bei Frequenzen zwischen 500 und 5000 Hz noch einen Tonunterschied wahrnehmen wenn zwei aufeinanderfolgende Töne nur um 10 Cent verstimmt sind.

Anmerkung: Cent (Abk.: C)= logarithmisches Maß für Tonintervalle, 100 C = 1 Halbtonschritt, Oktave= 12 Halbtonschritte = 1200 C ; Bsp.: Intervall vom Ton c (128 Hz) zu cis (135,6 Hz) = 100 C, Frequenzdifferenz = 7,6 Hz; Intervall vom Ton d (143,7 Hz) zu dis (152,2 Hz) = 100 C, Frequenzdifferenz = 8,5 Hz.

Ähnlich erstaunlich ist die Hörschwelle des Ohres. Sie beträgt 0,000 000 000 001 W/m2. Deffinitionsgemäß sind das 0 dB SPL (Dezibel = 1/10 Bel, nach A.G. Bell, SPL= Sound Pressure Level = Schalldruck, entspricht ungefähr der empfundenen Lautheit). Empfindlicher darf unser Gehörsinn nicht sein, da wir sonst ständig unseren eigenen Pulsschlag hören könnten. Die Schmerzgrenze beträgt 120 dB SPL. Dies entspricht ca. 1 W/m2 . Die größte wahrnehmbare Lautstärke beträgt 150 dB SPL, das entspricht 4 W/m2. Die Eckwerte stehen im Verhältnis von 1: 2,5 x 10^-13. Pegel von 150 dB SPL führen unter sehr hoher Wahrscheinlichkeit auch bei kurzer Andauer und insbesondere bei kurzen Impulsen zu bleibenden Hörschäden.

Hörbeispiel 01 – Wahrnehmungsgrenzen des Gehörs, Tonreihe von 16Hz bis 20kHz

Das Ohr ersetzt in gewissen Situationen das Auge. Trotzdem der Mensch nur über zwei Ohren verfügt, ist es ihm möglich, Geräusche nicht nur links und rechts wahrzunehmen, sondern auch vor, hinter, über und unter dem Kopf zu orten. Testpersonen sind fähig, blind zielgenau auf eine in Reichweite sich befindende Schallquelle zu zeigen. Insgesamt wirken folgende Faktoren bei der Ortung mit: Lautstärkeunterschied, Zeitdifferenz des Eintreffens und Frequenzspektrum eines Signals am linken und am rechten Ohr.

Ein von rechts kommendes Signal benötigt für die Strecke von ca. 15 cm zwischen rechtem und linkem Ohr ca. 450 µs. Der eintreffende Schall ist bei diesem Beispiel am rechten Ohr lauter als am linken. Weiterhin klingt das Signal links etwas dumpfer als rechts, da einige hochfrequenten Klanganteile auf dem Weg zum Ohr verloren gehen, oder je nach Lautstärke durch Knochenleitung (s.u.) der tieferen Frequenzen überlagert werden. Für die Filterung des Schalls nimmt die Ohrmuschel eine entscheidende Rolle ein. Sie filtert ständig verschiedene Frequenzen aus. Da sich die Ohrmuschel von Person zu Person unterscheidet gibt es individuelle Unterschiede bei der Klangwahrnehmung. Bei Handanlegen an das Ohr und Verformung der Ohrmuscheln kann sehr einfach die Veränderung des Höreindrucks wahrgenommen werden.

Signale die hinter dem Hörer entstehen, können aufgrund der Gehörgangsabschirmung der Ohrmuscheln ebenfalls nur dumpf wahrgenommen werden. Bekannte Geräusche können somit mittels Lernprozeß des Gehirns sehr effektiv 3-dimensional geortet werden, indem eintreffende Reize innerhalb von 0,3 Sekunden ausgewertet und verarbeitet werden. Im Auswertungsprozeß werden in der Regel 95 % aller eintreffenden Geräusche nicht an unser Bewußtsein weitergeleitet. Nur für wichtig eingestufte Informationen werden uns bewußt. Beispielsweise erregt in einer sich unterhaltenden Menschengruppe der gesprochenen eigene Name sofort die Aufmerksamkeit des Hörers und er wendet sich automatisch der aussprechenden Person zu, er könnte ja sonst etwas verpassen.

Anatomie und Funktion

Es gibt zwei Wege, die der Schall zu unseren Hörorganen nehmen kann: Luftleitung und Knochenleitung. Luftleitung erfolgt durch den äußeren Gehörgang über das Trommelfell, Hammer, Amboß, Steigbügel bis zur Cochlea (Schnecke). Frequenzübertragung erfolgt bei dieser Variante von 16 bis 20000 Hz. Knochenleitung erfolgt entlang des gesamten Gehörorgans über Reizung der einzelnen Elemente (äußerer Gehörgang, Trommelfell, Hammer, Amboß, Steigbügel, gesamte Cochlea) durch Vibrationen des Schädelknochens. Übertragen werden hier Frequenzen <= 2000 Hz. Knochenleitung ist weitaus uneffizienter als Luftleitung. Niederfrequente Signale ab ca. 300 Hz abwärts können aufgrund der Knochenleitung nur schwer geortet werden, da eintreffender Schall auch den jeweils kürzesten Weg durch den Schädelknochen nehmen kann. Der Umweg um den Kopf herum und damit auch die Lauftzeitdifferenz entfällt.

Das Mittelohr ist durch die Eustachische Röhre oder Ohrtrompete mit dem Rachenraum verbunden. Sie dient zum Druckausgleich des Raumes hinter dem Trommelfell mit der Umgebung. Sie öffnet sich kurz bei jedem Schluckvorgang. Ein aufgrund einer Druckdifferenz eingewölbtes Trommelfell kann nicht ideal schwingen und überträgt schlechter den Schall.

Hammer, Amboß und Steigbügel dienen zur mechanisch perfekten Übertragung der Luftschwingungen in die flüssigkeitsgefüllte Cochlea. Weiterhin stellen sie einen Apparat zur Verstärkung akustischer Reize dar. Sie übertragen Schwingungen vom Trommelfell auf das ovale Fenster der Cochlea, dessen Fläche nur ca. 1/25 der Fläche des Trommelfells entspricht. Die kleinsten Knochen im Vertebraten sind jeweils in ihrem Schwerpunkt aufgehängt und sind daher sinnvoller Weise nicht durch Körperbewegungen reizbar.

Nach neueren Erkenntnissen sind diese Ohrknöchelchen mit Muskeln versehen. Der Musculus tensor tympani kann über den Hammer einen Zug auf das Trommelfell ausüben und dieses dadurch spannen. Am Steigbügel setzt der Musculus stapedius an. Nur zuletzt genannter Muskel ist aktiv in einen Schutzmechanismus des Mittelohrs eingebunden. Bei zu lauten Geräuschen spannt sich der Musculus stapedius an und und verkanntet bei zu lauten Schallereignissen die Steigbügelplatte im ovalen Fenster. die Knöchelchen können nicht mehr frei schwingen, was eine Schallweiterleitung an das Innenohr erschwert. Das wiederum führt zu einer Entlastung des Innenohrs. Auch wenn nur an einem Ohr eine Überlastung vorliegt ist der sogenannte Stapediusreflex an beiden Ohren zu messen. Dieser Reflex setz bei einem Schallpegel von 70-95dB mit einer Verzögerung von ca. 50ms ein (Stapediusreflexschwelle).

Zum Innenohr: In der Cochlea gibt es drei Kanäle, in denen der Schall weitergeleitet wird, die Scala vestibuli, Scala media und die Scala tympani (Paukengang). Der Schall tritt vom ovalen Fenster aus erst in die Scala vestibuli ein.

Schall erzeugt eine laufende Schallwelle (Wanderwelle), die sich durch die Perilymphflüssigkeit der Scala vestibuli durch die gesamte Schneckenlänge fortpflanzt und über das Helicotrema in die Scala tympani eintritt. In ihr läuft die Schallwelle die Schneckenwindungen vollständig zurück bis zum membranbedeckten runden Fenster. Diese Membran dient zum Druckausgleich und stellt die Schwingfähigkeit der Cochlea sicher. Bei bestimmten Frequenzspektrum reizen Signale schon am Anfang der Scala vestibuli die Scala media, die durch die Reissnersche Membran von der Scala vestibuli getrennt ist. Die Schwingung wird von der Endolymphflüssigkeit der Scala media auf die Basilarmembran übertragen. Auf der Basilarmembran aufliegend befindet sich das Cortische Organ mit ca. 15.000 Haarsinneszellen , die die Rezeptoren für Schwingungen darstellen. Durch Schwingungen der Basilarmembran werden die Haarsinneszellen gegen die Tectorialmembran verschoben, wodurch die einzelnen Härchen gereizt werden.

Das Membranpotential der Haarsinneszellen ändert sich bei Bewegung, spannungsgesteuerte Ca2+- Kanäle öffnen sich, der Ioneneinstrom setzt Neurotransmitter frei. Der Reiz wird an Neurone des 8. Gehirnnervs (Cochleanerv) weitergegeben und an das Gehirn weitergeleitet.

Nach neusten Erkenntnissen nehmen die Haarsinneszellen Reize nicht nur passiv wahr, sondern erzeugen durch Streckung und Stauchung eine Beeinflussung der Wahrnehmung. Dabei muss man zwischen den äußeren Harsinneszellen mit v-förmig angeordneten Zellhärchen, den sogenannten „Motorzellen“, und den inneren Haarsinneszellen mit linear angeordneten Harsinneszellen, den eigentlichen Rezeptoren, unterscheiden.

Codierung und neuronale Übertragung von Reizen

Der im Ohr eintreffende Schall wird über die Cochlea und deren spezifischen Bau einer Frequenzanalyse unterzogen. Dies wurde bereits weiter oben angedeutet. Die Eigenschaften der Gewebe und der typische Bau des Hörorgans und einige weitere Details führen zu diesem Phänomen. Unter anderem sind folgende Details von Bedeutung:

In der Nähe des ovalen Fensters ist die Basillarmembran relativ schmal und reagiert somit sehr empfindlich auf hohe Frequenzen. In Richtung des Helicotremas wird diese Membran immer breiter und hat eine höhere Eigenmasse. Aufgrund der damit verbundenen Trägheit, ist hier im hinteren Bereich der Cochlea (also zur Mitte der Schnecke hin) die Membran nicht mehr durch hohe Frequenzen reizbar. Physikalisch kann man dies als eine Art Frequenzfilter betrachten. Der äußere Bau der Schnecke führt ebenfalls dazu, dass eine von tiefen Frequenzen erzeugte Wanderwelle sich am besten in der Nähe des Helicotremas ausbreiten kann. Hier weist der tieffrequente Schall eine hohe Amplitude auf, wohingegen die tieffrequente Wanderwelle im vorderen Teil der Cochlea, nahe des ovalen Fensters nur sehr geringe Ausbreitung findet.
Hochfrequente Schallwellen können sich in der Nähe des ovalen Fensters besser ausbreiten.

Durch hohe Frequenzen wird das Cortische Organ folglich nur in der Nähe des ovalen Fensters gereizt, tiefe Frequenzen reizen hingegen eher weiter entfernt liegende Regionen des Cortischen Organs im Inneren der Schnecke. Die Stelle der Basilarmembran, die eine maximale Amplitude der Wanderwelle aufweist, ist eine Funktion der Tonfrequenz (G. von Bekesy, 1960).
Es gibt demnach für jede Frequenz einen Bereich an der Basilarmembran (und damit am anliegenden Cortischen Organ) der jeweils am weitesten durch die Schwingungen ausgelenkt wird.

Die ca. 15.000 Haarsinneszellen im cortischen Organ nehmen, wie bereits angedeutet keines Falls nur passiv den Schall wahr, sondern beinflussen aktiv die Reizaufnahme. Wichtig ist es, dass man zwischen inneren und äußeren Haarzellen unterscheidet. Die einreihig, linear angeordneten inneren Haarzellen sind vornehmlich mit afferenten (reizableitenden) Nervenbahnen innerviert. Sie sind tatsächlich fast ausschließlich für die Reizaufnahme zuständig. Die dreireihig, v-förmig angeordneten äußeren Haarsinneszellen haben ihre Hauptaufgabe in der Beeinflussung der Inneren Haarsinneszellen.

Zur Steuerung der Beeinflussung sind die äußeren Haarsinneszellen mit efferenten (zuleitenden) Nervenbahnen versehen, wobei immer mehrere Sinneszellen mit einem Neuron verschaltet sind. Besagte efferente Neurone haben auch Kontakt zu den (afferenten) ableitenden Neuronen der inneren Haarsinneszellen. Schallbeeinflussung kann hier direkt neuronal codiert werden.

Die aktive, physikalische Schallbeeinflussung der äußeren Haarsinneszellen zeigt sich beispielsweise in einer dem anliegenden Reiz korrespondierenden hochfrequenten Stauchung und Streckung der Zellen. Sie erzeugen so selbständig Töne, welche tatsächlich mit Spezialmikrofonen im Innenohr gemessen werden können. Die genaue Funktion dieses Verhaltens ist noch nicht bis ins Detail geklärt.
Neueste Untersuchungen ergeben aber, dass die Stauchungen und Streckungen eine Amplitudenvergrößerung der Wanderwellen an der entsprechenden Stelle des Corischen Organs hervorrufen. Dabei werden dann die inneren Haarsinneszellen stärker gereizt. Dies führt dann zwangsläufig zu einer Anhebung der Lautstärke wahrgenommener Geräusche führen. Es ist daher zu schlussfolgern, dass auf diese Weise eine weitere Empfindlichkeitssteigerung des Hörorgans erreicht wird.

Ebenso bemerkenswert sind die Eigenschaften der afferenten Nervenfasern der inneren Haarsinneszellen, welche die eintreffenden Reize an das Gehirn weiterleiten. Sie nehmen (auch abhängig von ihrer Position in der Cochlea) Reize frequenzselektiv wahr, d.h. dass sie nicht durch jede Tonhöhe gleichermaßen reizbar sind.

Zusammenfassend kann man hierbei feststellen, dass genannte Phänomene offensichtlich zu einer stärkeren Wahrnehmungs-Kontrastierung der stattfindenden Frequenzanalyse führen. Betrachtet man die ortsabhängige Amplitude von Wanderwellen spezifischer Frequenzen, so fällt auf, dass sie einer Gaußschen Glockenkurve ähneln. Dies Glockenkurve weist für hohe Frequenzen bereits eine sehr hohe Fokussierung auf. Tiefere Frequenzen erzeugen allerdings eine Glockenkurve, die sehr langgestreckt ist und deren Ausbreitung reziprok (umgekehrt) proportional zur Frequenz steigt. Hier macht also eine Kontrastierung der einzelnen Frequenzbänder durchaus Sinn.

Für die Codierung der Lautstärke hat sich ebenfalls ein geniales Prinzip in der Entwicklung der Säugetier-Hörorgane durchgesetzt. Wie überall im Organismus können Reizstärken nur über die Häufigkeit von weitergeleiteten Aktionspotentialen übertragen werden.
Gibt man beispielsweise einen sehr leisen hohen Piepton auf das Ohr, so werden Haarsinneszellen nahe des ovalen Fensters durch moderate Neurotransmitterausschüttung die anliegenden Afferenzen (ableitenden Neurone) so reizen, dass diese nur wenige Aktionspotentiale erzeugen und weiterleiten. Starke hochfrequente Beschallung führt zu einer höheren Aktionspotentialfeuerrate. Anscheinend reicht dieses Prinzip nicht aus, um den Dynamikumfang (zum Begriff Dynamik siehe unten) unseres Gehörsinns mit nur jeweils einem ableitenden Neuron pro Haarsinneszelle adäquat abzubilden. Daher sind die inneren Haarsinneszellen mit jeweils 20 bis 40 Neuronen innerviert. Diese afferenten Fasern besitzen alle eine spezifische Dynamikkurve. Einige Fasern reagieren schon auf sehr geringe Lautstärken mit einer hohen Aktionspotentialfeuerrate, andere Neurone verhalten sich zu diesem Zeitpunkt noch still. Erhöht man die Lautstärke des besagten Pieptones, fangen immer mehr Neurone an, Aktionspotentiale in schnellerer Abfolge abzugeben. Der Bereich in dem ein Neuron auf Lautstärkeänderungen direkt durch Änderung der Aktionspotentialabfolge reagiert, nennt sich Dynamikbereich.

Die Dynamikbereiche der einzelen afferenten Fasern überschneiden sich so, dass sie fähig sind, die am Anfang dieses Textes erwähnten Lautstärkeunterschiede derart differenziert an das Gehirn weiterzuleiten.

Psychoakustik

Gehört wird im Kopf. Ein Klangereignis wird zahlreichen Datenkompressionsverfahren beim Hören unterzogen. Dabei fallen einige Details bei der Wahrnehmung unter den Tisch, was vom rein biologischen Blick aus gesehen nicht weiter beachtenswert ist. Jedoch ist Schall heute für den Homo sapiens sapiens nicht einfach mehr nur ein Knacken im Geäst oder ein Donner im Himmel, sondern auch mit Blick auf Musik und Filmeffekte ein kultureller und psychologischer Faktor.

Es ist heute nicht (oder nur mit sehr großem technischen und finanziellem Aufwand) möglich, Musik so aufzunehmen, dass die Aufnahme dem akustischen Leistungsvermögen unseres Ohres gerecht wird. Insbesondere im klassischen Musikbereich stellte dies die Toningenieure vor eine sehr heikle Aufgabe. Viele klassische Werke nutzen die Lautstärkewahrnehmungsfähigkeit des Menschen bis an seine Grenzen aus. Ein sehr leises Pianissimo possible ist an der unteren Hörgrenze, ein bombastischer Schlußakkord im Fortissimo possible mit Pauken und Trompeten kann eine Lautstärke von bis zu 140 dB erreichen. Die Differenz vom leisesten bis zum lautesten Ton in einem Musikstück umschreibt der Begriff Dynamik.
Im vorliegenden Beispiel liegt also eine Dynamik von 140 dB vor. Aber selbst die hochgelobte CD kann vom Grundrauschen bis zum lautesten Ton nur 96 dB Dynamik vorweisen (mit technischen Finessen eventuell 118 dB). Nimmt man nun das Musikstück so auf, dass der lauteste Ton von 140 dB auf 96 dB abgesenkt wird, so werden die leiseren Töne ebenfalls in der Lautstärke abgesenkt. Ein Ton von ursprünglich 10 dB Lautstärke ist nun unterhalb von 0 dB und damit nicht mehr hörbar und geht im Grundrauschen der CD unter. Wären die leisen Töne richtig eingepegelt, so würden die lauten Passagen unangenehm verzerren.
Ein Kompressor behebt das Problem, indem er in Sekundenbruchteilen ins laufende Musikgeschehen eingreift und laute Passagen etwas leiser einpegelt und leise Passagen dafür etwas verstärkt.
Das Ergebnis ist ein Dynamikverlust der Musik , der aber bei geschicktem Einsatz des Gerätes nur schwer wahrnehmbar ist. Jetzt kann das Stück auf CD aufgenommen werden ohne dass Töne nicht mehr hörbar sind. Hier ist der maßvolle Einsatz von Kompression eine sinnvolle Anwendung.

Es stellte sich hierbei heraus, dass sich das Lautstärkeempfinden einer Person nicht nur an der realen Lautstärke eines Signals orientiert, sondern auch an der Länge des Signals. Ein kurzes Knacken mit einer bestimmten Amplitude wird als leiser empfunden als ein anhaltender Ton gleicher Lautstärke. Ein Musikstück mit geringer Dynamik hat bei Maximalaussteuerung auf einer CD eine größere Durchschnittslautstärke als ein Musikstück mit größerer Dynamik. Somit wird das erste Musikstück als lauter empfunden. Man hat hierbei beispielsweise herausgefunden, dass Radiosender mit lauterer Musikübertragung eher die Aufmerksamkeit des im Äther suchenden Hörers bekommen, als solche mit leiser Übertragung. Nun ist aber die übertragbare Amplitude eines Signals nicht beliebig steigerbar, sondern unterliegt auch den technischen Grenzen die beim Radio und Fernsehen nicht mehr als 80 dB erlauben. Durch den Einsatz von Kompressoren wird also die Durchschnittslautstärke angehoben um damit dem Hörer zu suggerieren, dass die Musik wirklich lauter wäre. Dynamiklose Musik oder Sprache ist leichter verständlich als dynamikreiche Varianten. Der Hörer muß sich nicht anstrengen sondern nimmt ohne Mühe alle Informationen auf, die ihm angeboten werden. Auffällig ist daher, dass Werbung im Fernsehen immer sehr stark komprimiert wird und sich in der Lautstärkeempfindung vom vorhergehenden Film abhebt (gute Beispiele sind private Sender wie RTL, Sat.1, Pro7 usw.; Vox komprimiert auffällig stark; die Öffentlich- Rechtlichen, voran die dritten Programme, komprimieren nur wenig). Auch bei CD- Aufnahmen beherrscht schon seit einiger Zeit das Streben nach Verkaufsquoten die Szene.

Hörbeispiel 04.mp3 – Gitarre ohne Kompressor

Hörbeispiel 05.mp3 – Gitarre mit Kompressor

 

Ein weiteres Beispiel der Psychoakustik ergibt sich dadurch, dass ein leises Geräusch, welches von einem lauten auf gleichem Frequenzspektum überlagert wird, nicht mehr wahrgenommen werden kann. Grundrauschen ist bei Aufnahmen ein großes Problem. Rauschen vor und nach einem gespieltem Ton ist wahrnehmbar, nicht aber das Rauschen unter dem Ton. In unserem Gehirn wird das Rauschen aber ergänzt und wir hören somit das Störgeräusch auch unter dem Nutzsignal. Man kann einen Verstärker so bauen, dass er leise Signale ab einer bestimmten Lautstärke abschwächt und laute Signale so beläßt wie sie sind. Wird dieser Schwellwert (engl. „threshold“) so gewählt, dass das Störgeräusch ihn unterschreitet und das Nutzsignal ihn überschreitet, werden automatisch Störgeräusche ausgeblendet. Das Nutzsignal (der gespielte Ton) ist hörbar, nachfolgendes Rauschen wird stark abgeschwächt.

Diese Art von Verstärker nennt man Gate (englisch für Tor). Wird ein Geräusch nicht schlagartig bei Unterschreiten eines Grenzwertes ausgeblendet, sondern allmählich immer stärker abgeschwächt so spricht man von einem Expander. Ein Expander stellt das Gegenstück zu einem Kompressor dar und erhöht somit die Dynamik von gegebenem Musikmaterial. Perfektioniert wird diese Art der Rauschunterdrückung durch ein dynamisches Filter. Dieses Filter arbeitet ähnlich wie ein Expander/Gate, wirkt aber nicht auf die Gesamtlautstärke sondern auf die Lautstärke einzelner Frequenzen. Überschreitet auf einem Frequenzband die Amplitude des Signals einen Schwellwert, so wird diese Frequenz freigegeben und verstärkt, wenn nicht, wird das Frequenzband stark abgeschwächt.

In der Praxis hat es sich als sinnvoll erwiesen, dieses Filter ab 1000 Hz aufwärts arbeiten zu lassen, da Rauschen sich zwischen 1000 und 20000 Hz störend bemerkbar macht. Wird beispielsweise ein Klavierton gespielt mit hörbaren Obertönen bis 8000 Hz, so öffnet das Filter ein Frequenzband von 16 bis 8000 Hz solange bis die Lautstärke der oberen Frequenzen den Schwellwert unterschreitet. Die obere Filtereckfrequenz folgt den Eckfrequenzen des Klaviertones. Die Fachleute werdens erkannt haben, es handelt sich hierbei um ein dynamisches Tiefpassfilter, ein „LPF“ mit variabler Cutoff- Frequenz.

Wird ein Streicherton gespielt, mit Frequenzanteilen bis 16000 Hz, so öffnet das Filter ein Frequenzband von 16 bis 16000 Hz bis der verklingende Ton den Schwellwert unterschreitet. Eine Kombination aus Expander und dynamischem Filter nennt sich sinnvoller Weise Denoiser und erbringt bei richtigem Einsatz atemberaubende Ergebnisse. Viele der sehr alten Aufnahmen von Orchestermusik oder Jazz- Musik würde sich heute ein technikverwöhnter Hörer in der Originalversion aufgrund des störenden Rauschens nicht mehr anhören. Auch die damals hochwertigen Bandmaschinen entsprechen nicht mehr heutigen Standards und so stellen selbst die Originale, sollten sie noch erhalten geblieben sein, keine adäquate Alternative zu den alten Schellackplatten dar.

Seit einigen Jahren werden allerdings geschickt mit Denoisern entrauschte Aufnahmen dem Hörer quasi als neu auf CD präsentiert und können durch ebenso geschicktes Marketing ein weiteres Mal verkauft werden. Im Klassikbereich stellen solche Orchesteraufnahmen für 5 DM und weniger eine gute und günstige Alternative zu teureren Neuaufnahmen dar.

Das folgende Hörbeispiel enthält von mir gesprochenen Text. Anfangs ist eine verrauschte Aufnahme zu hören wohingegen gegen Ende das immer noch vorhandene Rauschen durch einen Denoiser unhörbar gemacht wird.

Hörbeispiel 03.mp3 – Denoiser

Akustische Täuschungen

Man muß nicht unbedingt einen großen technischen Aufwand betreiben, um den Gehörsinn zu betrügen. Einige Bespiele sind auch ganz natürliche Phänomene. Fehlt z. B. einem Klang der Grundton, so erkennt das Gehirn anhand der Obertöne automatisch den Grundton und wir hören diesen virtuell im Klang mit. Hat ein Klang also beispielsweise Obertöne, die die 4-fache, 5-fache, 6-fache, 7-fache und 8-fache Frequenz des Grundtons ausmachen, so errechnet das Gehirn den kleinsten gemeinsamen Nenner (nämlich 1) und ergänzt diesen im Höreindruck. Dieses Phänomen ist auch als Residuumeffekt bekannt.

Hörbeispiel 08.mp3 – Residuum-Effekt, virtuelle Töne

Im Hörbeispiel wird zuerst der 6. Oberton gespielt, danach der 5. Oberton und danach beide zusammen. Jeder weitere Oberton wird zuerst mit einer kleinen Melodie vorgestellt und danach wird die gleiche Melodie mit dem entstehenden Gesamt-Sound gespielt. Interessant ist hierbei, dass spätestens nach dem Zusammenspiel von 3 Obertönen sich der Höreindruck der Grundtonhöhe ändert. Aber: Es ist mit Ausnahme des letzten Melodiedurchgangs kein Grundton hörbar! (Vergleiche auch mit dem Bild 8 ). Fazit: Das menschliche Gehirn ergänzt den Grundton aus den zu hörenden Obertönen. (Ist nur ein Oberton hörbar, so bildet er selbst den Grundton, wie beim zu hörenden 6. Oberton am Anfang.)

Ein weitere bekannte akustische Täuschung basiert auf der Nichtliniarität des Hörvorganges. Ähnlich wie bei Hifi- Anlagen entstehen im Gehörgang zunehmend Verzerrungen bei starker Belastung. Bei zwei eintreffenden Tönen unterschiedlicher Frequenz ergeben sich Kombinationstöne mit Frequenzen, die nach folgender Formel ausrechenbar sind: f= n* f1+ m* f2 , (n, m = 1,2,3,4,…). Die Variablen n und m stellen jeweils einen der Obertöne des jeweiligen Tones dar, f ist die Frequenz des Grundtones. Anmerkung:.Der Violinist G. Tartini machte schon vor mehr als 100 Jahren (erfolglos) auf die Benutzung der Kombinationstöne beim Stimmen seiner Geige aufmerksam. Es enstehen folglich um so mehr Kombinationstöne je mehr Obertöne die beiden Klänge haben. Deutlich zu hören sind die kubischen Differenztöne (2 * f1 – f2 und 2 * f2 – f1 ).

Hörbeispiel 09.mp3 – Kombinationstöne, 1. Sinuston 1kHz

Hörbeispiel 10.mp3 – Kombinationstöne, 2. Sinuston 1-2kHz slide

Hörbeispiel 11.mp3 – Kombinationstöne, 1.+2.Sinus, mono

Hörbeispiel 12.mp3 – Kombinationstöne, 1.+2.Sinus, stereo

Das Hörbeispiel 11 veranschaulicht sehr deutlich, dass Verstärkeranlagen tatsächlich Kombinationstöne erzeugen. Bei Hörbeispiel 12 hingegen sind die einzelnen Sinustöne auf zwei Stereo-Kanäle getrennt und können sich somit in der Stereoanlage nicht beeinflussen. Hört man dieses Hörbeispiel mit einem Kopfhörer, so fällt nichts auf. Hört man dies hingegen mit einem Lautsprecherpaar in höherer Lautstärke , so treten die gleichen Effekte im menschlichen Gehörgang auf, wie bei Hörbeispiel 11. Zu hören sind im wesentlichen die kubischen Differenztöne.

Als sehr anschauliches Beispiel aus der Praxis kann hier bei Kurz- und Mittelwellenempfang das hörbare Überlagern zweier Trägerfrequenzen zwischen den Sendefrequenzen dienen. Hier sind zeitweilig nicht nur zwei, sondern mehrere Töne wahrnehmbar. Diese Töne entstehen teilweise im Radio selbst und zum Teil auch erst im menschlichen Ohr. Im wesentlichen beruht dieser Effekt auf der Überlagerung zweier Trägersignale, die beide weit über dem menschlichen Gehörsinn bei beispielsweise 300 bis 500 kHz liegen. Die enstehenden Differenztöne sind allerdings im hörbaren Bereich und erzeugen das charakteristische Pfeifen.

Hörbeispiel 13.mp3 – Kombinationstöne, aus der Praxis: Mittelwellenrauschen

Ein interessantes Anwendungsbeispiel für Psychoakustik ist die MPEG- Datenreduktion für Audiomaterial. Unter Kenntnis der „unhörbaren“ Bestandteile in einer Musikaufnahme kann mittels spezieller Algorhythmen eine digitale Aufnahme eines Musikstückes analysiert und massiv im Datenaufkommen reduziert werden. Hatte eine Originalaufnahme mit 5 min Länge noch 50 Megabyte, so können diese im Zuge der Datenkomprimierung fast unhörbar bis auf 5 Megabyte und weniger reduziert werden. Inzwischen gibt es noch leistungsfähigere Kompressionsalgoritmen. Dazu zählt unter anderem das Format Ogg Vorbis.

Gefahren und Hörverlust

Das Hörfeld des menschlichen Gehörs erstreckt sich von 16 Hz bis 20000 Hz. Sehr tiefe und hohe Frequenzen sind erst mit höherer Lautstärke wahrnehmbar Frequenzen zwischen 200 Hz und 8000 Hz sind gut wahrnehmbar und für solche zwischen 2000 Hz und 5000 Hz ist das menschliche Ohr besonders empfindlich. Zwischen 2 kHz und 5 kHz ist das Ohr daher auch gegenüber Schädigung sehr empfindlich.
Ein kumulativ erworbener, lärmbedingter Hörschaden äußert sich immer in einer Unempfindlichkeit gegenüber diesen Frequenzen. Sprache und Musik nutzen hauptsächlich diesen Bereich des Hörfeldes und so ist es eine nicht unerhebliche Behinderung, wenn ein Mensch diese Frequenzen nicht mehr wahrnehmen kann. Ein lärmbedingt geschädigtes Gehör kann nicht etwa diese Frequenzen nur einfach leiser wahrnehmen, was mit einer Absenkung der Mitten und Höhen bei einem Equalizer an einer Stereoanlage vergleichbar wäre. Es ist hingegen so, dass Töne, die unter der Wahrnehmungsschwelle liegen, nicht gehört werden. Liegen die Töne über der Wahrnehmungsschwelle, so erkennt sie der geschädigte Hörer auch mit etwa der gleichen Lautstärke wie ein gesunder Hörer. Das führt dazu, dass beispielsweise ein Ton mit 2kHz mit 80 dB(a) Lautstärke nicht zu hören ist, bei 90 dB(a) hingegen hört der Proband den Ton nicht nur leise sondern mit voller Lautstärke (also nahezu 90dB(a)). Daher verhält sich manch älterer Mensch auch recht sonderbar in Gesprächen:“Hä?? Wie bitte? Hä? Ich hör Dich nicht!“ und dann plötzlich wenn man lauter redet :“Nun schrei doch nicht so! Bin doch nicht schwerhörig!“

Im Gesetz ist für Arbeitsplätze mit Lärmbelastung eine maximale Einwirkungszeit pro Woche festgehalten, bei deren Überschreiten das Tragen eines Gehörschutzes Pflicht ist. So darf eine Lautstärke von 118 dB nur eine Minute pro Woche auf einen ungeschützten Hörer einwirken. Bei einem Rockkonzert oder in Discos setzen sich die Zuschauer einer bezahlten (!) Beschallung von 120 dB eine Stunde und länger aus. (Selbst Selbstverstümmelung ist heute nicht mehr kostenlos…)

Tatsache ist, dass das Empfinden von Lautstärke hier sehr subjektiv ist. Das menschliche Gehirn ist ein Meister der Anpassung, das geht sogar so weit, dass Streß unter bestimmten Bedingungen als angenehm empfunden werden kann. Ein Indianer aus dem brasilianischen Regenwald würde beim Betreten einer Disco wohl eher an die Hölle als an Vergnügen denken. Vertreter der heutigen MTV- erzogenen Generation empfinden dagegen den Urwald über längere Dauer sicher als ‚totenlangweilig‘ weil beim Betrachten nicht spätestens alle halbe Sekunde ein Bildwechsel an ihr Auge oder ein überragender Soundeffekt an ihr Ohr dringt. Ein weiteres Beispiel: Wachen wir morgens mit dem leisen beständigen Plätschern eines Baches im Ohr auf, so empfinden wir das sehr wahrscheinlich als meditative Ruhe, hämmert aber am Sonntag Morgen in größerer Entfernung einer mit einem Preßlufthammer, so würden wir den Übeltäter eher auf Unterlassung verklagen, auch wenn der Schall durch die Dämmung der Thermopen-Glasscheiben leiser wäre als der plätschernde Bach. Unsere Lieblingsmusik können wir in ohrenbetäubender Lautstärke hören und empfinden dabei Genuß, Musik aber, die wir nicht mögen, drehen wir unwillkürlich leiser.

Es gibt im Ohr keine Warnmechanismen vor Überlastung, wie etwa beim Auge. Niemand könnte mit geöffneten Augen in die Sonne gucken, ohne zu blinzeln oder Tränen in die Augen zu bekommen. Auch die viel zitierte Schmerzgrenze beim Hören ist von der Situation abhängig und bei dauerhafter Belastung beispielsweise bei einem Rock- Konzert zeugt nur ein Pfeifen (Tinnitus) und/oder Taubheitsgefühl danach im Ohr unmißverständlich davon, dass die vorangegangene Belastung viel zu hoch war. Es gibt in jeder der beiden Schnecken ca. 15.000 Haarsinneszellen, die nicht nachwachsen! Bei leichten akuten Schädigungen, wie z.B. das Verkleben von überanspruchten Härchen, können die Zellen in Zeiten absoluter Ruhe sich wieder regenerieren. Andauerde und wiederkehrende Schädigungen wie nach Discobesuchen ohne Lärmschutz führen unweigerlich zum Tod der Haarsinneszellen. Ein bewußter Umgang mit dem Gehör erscheint daher sinnvoll.

In diesem Zusammenhang muss man auch deutlich auf die Gefahr eines Tinnitus aufmerksam machen.
Ein Tinnitus ist generell so definiert, dass eine Person Geräusche auf dem Ohr hört. Dabei kann es sich um ein klassisches Pfeifen (Sinuston) oder auch um Zischen, Rauschen, Knacken , Klopfen oder andere periodische Geräusche handeln. Diese Geräusche können sowohl ihre Intensität über die Zeit ändern als auch mit dauerhafter Lautstärke zu hören sein. Dabei handelt es sich generell um physikalisch nicht existente Geräusche. Man spricht hierbei vom subjektiven Tinnitus. Dieser entsteht wahrscheinlich irgendwo in der Reizweiterleitungskette zwischen den Haarsinneszellen und dem Hörzentrum im Gehirn. Bei einem objektiven Tinnitus kann man das Geräusch auch physikalisch nachweisen. Diese Fälle sind aber sehr selten. Unbestritten ist, dass eine Überlastung des Gehörs beispielsweise nach dem Besuch eines Rockkonzerts ohne Hörschutz neben einer allgemeinen Taubheit sehr häufig einen Tinnitus zur Folge hat. In vielen Fällen bleiben diese Symptome nicht dauerhaft, sondern klingen nach einigen Minuten wieder ab. Sollte das Taubheitsgefühl und/oder der Tinnitus über Stunden andauern, sollte sofort ein Facharzt konsultiert werden. In diesem Fall ist von einer schweren Schädigung einer Vielzahl von Harsinneszellen im Cortischen Organ auszugehen. Man kann mit Infusionen und Sauerstoff Druckkammerbehandlungen die Erholung der Haarsinneszellen herbeileiten. Diese Therapie muss aber direkt nach Bemerken der Schädigung erfolgen und nicht erst Tage oder gar Monate später. Ich selbst erlebe so ca. 1 bis 4 mal im Jahr einen kurzen Tinnitus (ohne lärmbedingten Anlass, denn ich gehe mit meinen Ohren sehr sorgsam um und sorge für Gehörschutz). Dieser Tinnitus äußert sich als ca. 10 Sekunden andauernder Pfeifton auf einem Ohr. Interessant ist für mich, dass ca. 3 Sekunden vor Einsetzen des Sinuspfeiftones das betreffende Ohr eine Schwerhörigkeit von geschätzen -10dB bis -20dB in Mitten und Höhen entwickelt. Es klingt so, als ob jemand einen Gehörschutz auf das Ohr drückt. Danach setzt dann für kurze Zeit der Tinnitus ein. Auch Erfahrungsberichte von Bekannten decken sich mit diesen Beobachtungen. Ich halte diese sporadisch auftretenden Tinnitus-Symptome für normal. Oft lassen sie auf einen allgemeinen Stresszustand in der betreffenden Situation schließen. Bei einer Häufung der Tinnitusattacken würde ich in jedem Fall den Gang zu einem HNO Arzt emfehlen!

Tipp zum Gehörschutz

Ein professioneller Lärmschutz ist bei Personen, die sich regelmäßig einer lauten Umgebung aussetzen sinnvoll. Dazu gibt es zahlreiche Angebote, die von wenigen Cent zu mehreren Hundert Euro reichen. Ich halte übrigens persönlich nichts von (sehr teueren) Hörschutzstöpseln, die eine Schallreduktion von ca. 30dB versprechen, aber zusätzlich einen linearen Frequenzgang anpreisen. Eine stärkere Schallreduktion als ca. 30dB ist bei Signalen unter 2kHz kaum möglich, da diese wie gesagt über Knochenleitung weitergeleitet werden, welches über Ohrstöpsel nicht unterbunden werden kann. Daher ist bei Schallreduktionen um 30 dB kaum noch ein linearer Frequenzgang beim Hörempfinden umzusetzen.

Hörbeispiel 02b.mp3 – Simulation von lärmbedingtem Hörverlust (neue Version)

M. Fiedler, 20.11.1997, Text-Ergänzung am 12.11.2000,
Ergänzung der MP3s am 25.12.00,
Neuerstellung der Bilder am 23.07.01
Neue Absätze am 20.06.09 hinzugefügt.
Neu eingestellt am 04.02.18

Literatur

– von Bekesy, G. (1960): Experiments in hearing; McGrawHill, New York
– Davis, H. (1968): Mechanisms of the inner ear; Ann. Otol. Rhinol. Laryngol. 77: 644-655
– Eckert, Tierphysiologie 2. Auflage; Thieme- Verlag 1993
– „Keys“ 3-1997; PPV Presse Projekt Verlags GmbH
– Anleitungen zum „Composer“ und „Denoiser“; Behringer GmbH 1993
– Dudel et al. Neurowissenschaft, vom Molekül zur Kognition. Berlin, Heidelberg: Springer-Verlag 1996
– Luce R. Duncan Sound & Hearing, A conceptional Introduction. Hillsdale, new Jersey: Lawrence Erlbaum Associates 1993
– Pickles, James O. An Introduction of the physiology of Hearing. London San Diego etc.: Academic Press 1988

Weiterführende Links

Popkomm abgesagt / GEMA Stellungnahme / Gehörschutz und Hörschaden / Recording Fragen #19