Der Einstieg in Dolby Atmos

Als Semesterprojekt der Masterklasse Audio Design war die Aufgabe Spatial Audio zu nutzen. Für den Serienpiloten „Drei Schätze“ war damit klar, dass Magdalena Müller und ich uns einmal an Dolby Atmos versuchen möchten und die Serie als Dolby Atmos-Mischung produzieren. Aber wie läuft das eigentlich ab? Was gilt es zu beachten und wie kann man Atmos zu seinem Vorteil nutzen?

Die Produktion

In unserem Workflow haben wir den Set-Ton nicht anders aufgenommen, als wenn man einen Stereo- oder 5.1-Mix machen würde: Lavaliermikrofone für die Personen, ein Richtrohrmikrofon inklusive Raum-Atmos und Impulsantworten für alle Fälle. Als die Schnittdateien angeliefert worden sind, waren die ganzen Monospuren da. Selbst von Stereo fehlte jede Spur. Der Surround-Sound musste erst noch geschaffen werden.

Dolby Atmos Renderer

Dolby Atmos im Allgemeinen

Viele haben sicher schon von Dolby Atmos gehört. Spätestens im Kino merkt man es, weil der Ticketpreis einen Aufschlag beinhaltet. Dolby Atmos bietet die Möglichkeit nicht nur ein statisches 7.1.2-Bed zu haben, sondern auch Objekte dynamisch bewegen zu können. Dabei bricht man aus dem Kanal-basierten Konzept aus und nützt jeden einzelnen Lautsprecher im Raum. Vor allem in größeren Kinos bleibt es schließlich nicht bei 7.1.2: 7 Lautsprecher in der 2D-Ebenede (links, rechts, mittig, links hinten, rechts hinten und links sowie rechts seitlich), ein Subwoofer und zwei an der Decke. Doch ein Kanal für z.B. die linke Seite heißt nicht ein Lautsprecher. Um den Sweet-Spot zu erweitern, kann es mehrere Lautsprecher für einen Kanal geben und die lassen sich nur mit Dolby Atmos einzeln ansprechen. Grob gesagt ist das der Hauptverkaufspunkt von Dolby Atmos und der größte Mehrwert.

Dolby Atmos nutzt ein 7.1.2-Bed der kanalbasiert arbeitet und bietet 128 Spuren (-10 für die Bed-Kanäle) für 118 Objekte, die gleichzeitig wiedergegeben werden können. Dabei sind nur einzelne Klänge als Objekt in der Mischung und der Rest im Bed darunter.

Das Set-Up für Dolby Atmos-Mischungen

Zuerst gibt es zwei Möglichkeiten des Set-Ups: Die Dolby Bridge oder Send and Return-Plug-Ins. Die Bridge bietet die Kompatibilität zwischen verschiedenen Studios und macht das Set-Up von ProTools sehr einfach, da nur die Dolby Bridge konfiguriert werden muss und ProTools alles direkt an die Bridge schickt. Das bietet sehr viele Vorteile, war aber für unsere Produktion nicht hilfreich: Wir haben keine RMU was bedeutet, dass wir kein Dolby Atmos-Masterfile exportieren können. Das heißt das Projekt kann im Studio in Atmos wiedergegeben, aber nicht als Datei gespeichert werden. Damit wir von 7.1.2 mit Objekten auf 7.1.2, 7.1, 5.1 oder Stereo kommen, müssen wir Re-Renders machen. Das bedeutet alles einmal in Echtzeit abspielen und erneut in der Session aufnehmen. Da die Dolby Bridge leider keine Inputs unterstützt, ist das nicht möglich. Das geht nur mit den Send and Return-Plug-Ins auf die wir dann umgestiegen sind.

Im Dolby Atmos Renderer gilt es einmal alles einzustellen, wie z.B. das Audio-Interface, die Kanäle, die Lautsprecher und die Re-Render-Kanalspuren. Dann kann man sich an die ProTools-Session herantrauen. Dolby bietet sehr gute Templates an, von denen man einfach weiterarbeiten kann. Wenn man einen 7.1.2-AUX-Master angelegt hat (AUX-Master, kein echter Master), kann dieser mit einem Send-Plug-In an den Dolby Atmos Renderer geschickt werden. Der ProTools-Ausgang dieser Spur landet einfach auf einem Nirvana-Bus, weil ProTools sonst meckert. Jetzt bekommt der Atmos Renderer ein Signal. Aber wie hört man das jetzt?

Nun brauchen wir einen 7.1.2-Return-AUX, der das Return-Plug-In drinnen hat. Hier muss der Input aus dem Nirvana kommen – der sollte aber lieber ein anderer AUX-Kanal sein als der Nirvana-Output, da wir sonst mit viel Pech Rückkopplungen erzeugen könnten) – und der Ausgang auf die Abhöre damit was aus den Lautsprechern kommt. Und das soll es schon gewesen sein. Klingt einfach, war es bei uns aber nicht.

Denn wichtig zu wissen ist, dass bei den 7.1.2-Plug-Ins die ganzen Kanäle nicht gelinkt werden dürfen, sondern zuerst L (für links) mit z.B. Kanal 1 aus Atmos, dann R mit Kanal 2 aus Atmos etc. verlinkt werden muss. Dabei wählt man zuerst den Kanal aus, wie z.B. L, dann den Atmos-Kanal im Plug-In und dasselbe noch einmal mit R, C und allen anderen Kanälen. Diese schrittweise verlinken ist schwierig herauszufinden wenn man sich damit noch nie beschäftigt hat. Man verlinkt die Kanäle also einzeln. Auch wenn man aktiv im Plug-In immer nur den aktiv veränderbaren sieht, merkt sich das Plug-In die Auswahl und die Kanäle bleiben verlinkt. Versteht man das Prinzip, ist das Verwenden des Send and Return-Plug-Ins sehr einfach. Ich empfehle zudem sich ein Konzept für das Routing zu überlegen. Man endet zwangsläufig bei 100+ Spuren und benötigt ein System.

Objektspuren muss man dementsprechend bei den Bussen definieren und schickt diese Spur mit einem Send dann an einen eigenen AUX, der die Objektmetadaten an den Atmos Renderer weitergibt. Beide Spuren müssen permanent aktiv bleiben, da sonst dieses Objekt nicht funktioniert. Das Panning von Objekten ist aber nicht anders zum Panning im Bed.

Zu beachten ist, dass alle Lautsprecher auch korrekt eingepegelt werden müssen. Die Front-Lautsprecher bei 85 dB(C) bei rosa Rauschen bei -20 dBFS RMS, die Surround- und Decken-Lautsprecher bei 82 dB(C). Beim LFE-Subwoofer noch einen High-Cut bei 80–120 Hz hineingeben und darauf achten, dass er auf +10 dB eingestellt ist. Der Pegel sollte dabei bei den Lautsprechern eingestellt werden. Nur in der Software zu verändern, kann mit viel Pech zu bösen Überraschungen führen. Wenn der Pegel bei allen Lautsprechern passt, sollte die Abhörlautstärke unbedingt vorher eingestellt und nicht mehr berührt werden. Ansonsten kann man sich die gesamte Mischung verhauen.

Unser Routing-System

Unser Routing-System war wie folgt (pro Raum):

  • Dialog
    • ↓ Dialogspur(en)
    • ↓ Dialog-Sammelspur für den Raum | ↓ Reverb
    • ↓ Dialog-Stem
    • ↓ 7.1.2-AUX-Master
  • Foley/SFX
    • ↓ Foley-/SFX-Spur(en) | ↓ Reverb als Send auf bestimmten Tracks
    • ↓ Foley-/SFX-Sammelspur für den Raum
    • ↓ Foley-/SFX-Stem
    • ↓ 7.1.2-AUX-Master
  • Dialog
    • ↓ Musikspur(en) | ↓ Reverb als Send auf diegetischer Musik
    • ↓ Musik-Sammelspur für den Raum
    • ↓ Musik-Stem
    • ↓ 7.1.2-AUX-Master

Für jeden Raum gilt dasselbe Prinzip und jeder Raum hat bei uns eine eigene Farbe bekommen. Objekte gehen am Ende ebenfalls in den richtigen Stem, da diese sonst beim Re-Recording verloren gehen könnten. Den Routingplan zu erstellen dauert länger als gedacht. Bis alles so funktioniert wie man es möchte, vergehen doch mehrere Stunden. Aber wenn das passt, dann hat man das Fundament für die weitere Arbeit.

ProTools-Session

Die Dolby Atmos-Mischung

Nachdem die Sprache bei Serien und Filmen das Wichtigste ist, haben wir damit begonnen. Vorausgesetzt dass alle Spuren schon an den richtigen Stellen sind und fertig geschnitten, geht es ans Pegeln der Stimmen und dann der Foley-/SFX-Geräuschen, damit alle Klänge in ihrer Gruppe gleich laut sind. Dann haben wir mit dem Panoramisieren begonnen. Sprache bleibt bei uns hauptsächlich im Center. Wir haben aber je nach Bildposition der Person ganz leicht nach links/rechts panoramisiert (meist ±5, ab und zu höchsten ±20). Andere Klänge haben wir immer so gut wie möglich im Raum platziert. Dabei merkt man, dass wenn ein Klang nicht ganz am Rand ist, die Lautsprecher beider Seiten spielen und ggf. etwas irritieren können. Wo es geht, haben wir daher die Klänge eher am Rand als der Mitte des Raumes positioniert. Bei einigen SFX haben wir die Size erhöht. Das bringt ein ziemliches Volumen in den Raum, kann aber zu komischen Phasenproblemen führen, da dann mehrere oder sogar alle Lautsprecher gleichzeitig spielen. Daher würde ich sie nur sehr vorsichtig benutzen. Lampensurren und Restaurantmusik haben wir einfach an die Decke gegeben.

Die Objekte mitzufahren gestaltet sich manchmal schwierig: Ist es zu extrem, fühlt es sich falsch an, bewegt man zu wenig hat man das Gefühl, dass sich nichts bewegt. Man muss immer einen Mittelwert schaffen bei dem die Bewegung nicht stört und gleichzeitig angenehm und eindrucksvoll ist. Vor allem Geräusche, die im Bild nicht zu sehen sind, muss man sich erst einmal überlegen, die Szene analysieren und dementsprechend akustisch erweitern. Erst danach haben wir das Sprach-Processing gemacht: EQ, Compressor und ggf. Limiter.

Wenn man dazwischen Test-Screenings mit unbeteiligten oder unabhängigen Personen machen kann, kommt man vielleicht auch noch auf einige Probleme, die man selbst schon gar nicht mehr wahrnimmt. Dabei ist bei manchen Szenen die Sprache zu sehr untergegangen obwohl wir beide als TontechnikerIn nichts auszusetzen gehabt haben. Hört man ein Projekt aber 10, 20 oder 50 mal, dann kann man schnell betriebsblind werden und verliert das Gefühl wie es ist, wenn man Texte und Sprache zum ersten Mal hört. Im Kopf kann man dann den Text auswendig und braucht ihn nicht mehr verstehen, aber Unbeteiligte tun sich dann schwer. Daher mein Tipp: Wenn möglich Test-Screenings machen.

Von Dolby Atmos zu 7.1.2, 7.1, 5.1 oder 2.0

Nun hat man einen fertigen Dolby Atmos-Mix und möchte nur die Spuren exportieren. Wie kann man das sinnvoll machen? Im Dolby Atmos Renderer kann man Re-Renders aktivieren und von den 128 Spuren welche für Re-Renders belegen. Diese Kanalnummern schicken das downgemixte Signal an ProTools. Indem ein AUX mit 2.0, 5.1, etc. mit einem Return-Plug-In erstellt wird und dieser AUX auf eine Audiospur mit 2.0, 5.1, etc. geht, kann das Re-Render in der Session aufgenommen werden. Dabei ist wichtig, dass das Input-Monitoring NICHT eingeschaltet ist. Mit dieser Methode können auch mehrere Re-Renders gleichzeitig aufgenommen werden, sofern der Dolby Atmos Renderer noch genug Spuren frei hat. Nun heißt es abwarten und Tee trinken: Die ganze Session muss einmal abgespielt werden und dann sind die Re-Renders auch schon in der Session. Allerdings sind sie leicht verzögert und müssen wieder auf die richtige Position geschoben werden.

Dabei hilft ein Piepsgeräusch, das nur einen Frame lang ist und z.B. nach exakt einer und zwei Sekunden mit einem Bildflackern von einem Frame draufliegt. Dadurch kann man die Spuren leicht wieder auf die richtige Position schieben und die Latenz in der Aufnahme korrigieren.

Am Ende kann man die Spuren auswählen und mit CMD + ALT + K in ProTools exportieren. Nun kann man die Spuren entweder summiert als eine WAV-Datei speichern oder jeden Kanal als eigene WAV-Datei um sie weiter verarbeiten zu können. Und so kommt man leicht von Dolby Atmos auf geringere Surround-Systeme.

Wenn man im Dolby Atmos Renderer ein neues Masterfile erzeugt, in dem Renderer auf Aufnahme, dann Play drückt und die ProTools-Session abspielt, nimmt er auch gleich einen Dolby Atmos-Mastertrack auf. Auch hier wieder: abwarten und Tee trinken. Dieser Mastertrack kann dann in unterschiedliche Formate exportiert werden, wie z.B. in ADM BWF oder IMF IAB. Es können damit auch Offline-Re-Renders erzeugt werden.

Natürlich empfiehlt es sich die Mischung auch noch einmal auf anderen Systemen anzuhören. Sei es auf einer 5.1-Anlage daheim, auf einem Fernseher oder auf Kopfhörern. Man muss bedenken, dass die Mischung nicht immer auf super Lautsprechern abgehört wird und man in jedem Fall etwas vom Ton verstehen sollte. Am besten noch einmal kontrollieren und wenn nötig kleinere Korrekturen machen.

Re-Render-Einstellungen

Einige Tipps nebenbei

Wichtig sind Backups der Session zu haben. Vor allem das Zwischenspeichern und die Session zu kopieren kann wichtig werden. Wenn man irgendwas beim Arbeiten kaputt macht, ist sonst wertvolle Arbeitszeit für immer verloren. Aber auch die I/O-Setups und Konfigurationsdateien sollte man speichern, da man sie später wieder importieren kann. Es kann sich schnell etwas im Studio verändern, wenn mehrere Leute dort arbeiten und das kann die ganze Session verändern oder kaputt machen.

Fazit

Dolby Atmos hat viele Möglichkeiten für Audiomischungen im Filmbereich. Es gibt dem/r TontechnikerIn Freiheit gestalterisch mehr machen zu können. Das Setup kann manchmal etwas schwierig sein, sollte aber keine großen Schwierigkeiten bereiten wenn man sich mit 5.1, 7.1 oder 7.1.2 auskennt. Es erweitert das Bed mit Objekten, was auch der Hauptverkaufspunkt für Dolby Atmos-Mischungen ist. Das Produzieren mit Atmos macht viel Spaß und erst nach meiner ersten Atmos-Produktion habe ich erkannt, wie viel mehr Potential in diesem Workflow steckt. Sounds sind nicht mehr nur vorne und ein bisschen hinten, sondern können einen umgeben. Jede Szene fühlt sich plötzlich dynamischer an und lebendiger als zuvor. Die wahren Vorteile nimmt man erst wahr, wenn man sie erlebt hat.

Für mich war Drei Schätze ein spannendes Projekt und ein Testgelände für das Erforschen von Surround- und Atmos-Mischungen. Ich konnte viel durch den Serienpiloten lernen und bin stolz darauf zusammen mit Magdalena Müller die gesamte Pilotfolge vertont zu haben.

Foley & Sounddesign: Wie eine Serie oder ein Film vertont wird

Nachdem Drei Schätze abgedreht wurde, haben Magdalena Müller und ich auf den Rohschnitt der Video-CutterInnen gewartet. Idealerweise arbeitet man mit dem Picture Lock, sodass sich im Nachhinein nichts mehr verschiebt. In unserem Fall ist der Picture Lock noch nicht ganz erreicht, aber auch nur weil nachher noch auf die Musik von uns geschnitten wird. Der nächste Schritt neben der Mischung war es Foley aufzunehmen und uns um das Sounddesign zu kümmern. Mäggie und ich haben sogar einen kleinen Gastaustritt in der Serie.

Set-Up & Aufnahme

Am besten arbeitet man zu zweit: Eine Person sitzt vor dem Computer und kümmert sich um die Session, die andere Person vertont alles in einem akustisch optimierten Raum. Ersteren Part hat Mäggie übernommen, während ich alle Szenen, Bewegungen, (Inter-)Aktionen und Geschehnisse nachgespielt habe. Dabei ist es wichtig viel mit Objekten, Materialien und Mikrofonen zu experimentieren. Oft reicht es denselben Gegenstand neu aufzunehmen, aber in manchen Fällen sollte man sich überlegen aus was für einem Material ein Objekt besteht um vielleicht einen passenderen Sound für das Foley zu finden. Meist wird unterschätzt was Foley für einen Unterschied machen kann.

Wir haben uns für das Neumann TLM 103 bzw. 102 entschieden, da es am rauschärmsten war und einen relativ neutralen Frequenzgang aufweist. Das Sennheiser MKE 600-Richtrohrmikrofon hatte meist nicht genug Bass und ein hörbares Eigenrauschen. Da Geräusche meist nicht laut sind und gleich voluminös und basslastig werden können wenn man versucht sie lauter nachzustellen, sind leise Vorverstärker und ein rauscharmes Mikrofon ein Muss für Foley. Lediglich bei Türgeräuschen haben wir das MKE 600 benutzt, da wir die Tür in keinem akustisch optimierten Raum aufgenommen haben und wir so wenig Raumhall wie möglich in der Aufnahme haben wollten.

Währenddessen ist es immer gut gleich ein paar Spuren in der Session anzulegen und sich ein System zu überlegen. Wir haben es immer nach Szenen gruppiert und uns langsam vorgearbeitet. Anfangs haben wir noch Listen mit notwendigen Foleysounds erstellt, später einfach darauf hin losgearbeitet wenn uns etwas aufgefallen ist, das vertont werden muss. Bis auf ein paar sehr wenige Ausnahmen sind alle Sounds entweder aus dem O-Ton oder selbst aufgenommen. Nur ein paar Klänge sind von Libraries genommen worden. Das liegt einfach daran, dass man oft sehr lange braucht um den richtigen Sound zu finden und die Neuaufnahme vor allem in puncto Timing meist leichter ist.

Sobald die Aufnahme läuft heißt es: Talkback ausschalten, einatmen, Luft anhalten und aufnehmen. Denn selbst das leise Geräusch des Lautsprechers oder ein Atemzug ist in der Aufnahme drauf. Sogar meine Hose wurde zum akustischen Problem: Jede Bewegung hat immer wieder ein leichtes Rascheln drauf gehabt, sodass ich komplett still stehen, sitzen bzw. manchmal auch liegen musste.

Viel zu viele Geräusche

Selbst mit einem Serienpiloten der lediglich 19 Minuten lang ist, kann man schon mehrere Tage allein an der Foley-Aufnahme sitzen. Es heißt zwar immer, dass nur 2,5 akustische Streams gleichzeitig wahrgenommen werden können, aber dennoch gibt es so viele Interaktionen, dass man innerhalb einer Minute leicht über 25 kurze Sounds benötigt. Meist sind diese auch alle schnell erledigt, aber es summiert sich am Ende dennoch.

Man braucht es natürlich nicht übertreiben: Oft ist weniger mehr. Aber die Kleinigkeiten gut klingen zu lassen erfordert doch etwas Zeit. Vieles war durch den kleinen Aufnahmeraum zu basslastig. Mit einem Low-Cut zwischen 50 und 200 Hz, je nach Geräusch, sind wir gut weitergekommen.

Interessant war es zu sehen, dass oft auch viel außerhalb des Bilds passiert. Dabei ist es z.B. passiert, dass im ersten Bild eine Darstellerin ein Glas putzt, dann geschnitten wird und sie plötzlich nach dem nächsten Schnitt aus dem Nichts ein zweites Glas nimmt während das andere verschwunden ist. Optisch fällt das nicht auf, sie kann ja eines abgestellt haben und sich das nächste genommen haben. Akustisch fehlt es aber dennoch. Dadurch mussten wir außerhalb des Frames dem Schnitt regelrecht Continuity verleihen. An diese Dinge habe ich vorher noch gar nicht gedacht.

Immer dieses Timing…

Ist einmal alles aufgenommen, hat die Mäggie alles auf ihren rechten Platz geschoben. Durch leichte Bildlatenzen im Aufnahmeraum, hatten wir schon von Anfang an einen leichten Delay von ca. 100–200 ms. Dabei sind Geschehnisse im Bild noch leicht zu platzieren. Sobald man Geräusche vertont, die man nicht mehr ganz sieht, wird es schwieriger. Dabei waren vor allem Schritte bei Nahaufnahmen eine Herausforderung, da man merkt, dass das Geräusch manchmal nicht ganz synchron ist, aber man kann nicht sagen ob er nun zu früh oder zu spät angespielt wird. Meist ist es ein Ausprobieren bis es nicht mehr stört. Dann sollte das Timing in Ordnung sein.

Kreativ sein

Bei Drei Schätze sind die Klänge alle sehr weltnah. Damit meine ich, dass vieles davon Schritte waren, Gläser, Sessel, etc. Das kann man sehr leicht mit den korrespondierenden Gegenständen nachvertonen. In anderen Genres wie z.B. Sci-Fi müssen künstliche Objekte geschaffen werden. Oder ein Klang geschaffen zu dem es keinen realen Bezug gibt, weil dieser schlicht nicht existiert. Bei uns waren zwei Geräusche etwas kniffliger, wobei eines davon Foley war und das andere eigentlich SFX.

Nachdem der Serienpilot noch nicht ausgestrahlt wurde, kann ich noch nichts vorweg nehmen. Aber so viel sei gesagt: Das Foley-Geräusch wurde mit einem Locher, einem Hefter und einem Dosenöffner aufgenommen. Das SFX-Geräusch mit einem Blatt Papier.

Weitere Schritte

Nachdem die Foley-Aufnahmen abgeschlossen sind, geht es bei uns weiter mit SFX, Musik und der Dolby Atmos-Mischung. Während SFX-Sounds schon ausgesucht sind, geht es bei uns derzeit noch sehr um die Musik. Wir arbeiten dabei parallel am Panoramisieren der Spuren und fangen dabei auch schon mit Dolby Atmos-Objekten an. Näheres zur Dolby Atmos-Mischung folgt in einem späteren Blog-Eintrag.

Unser Gastauftritt ist in den Telefonstimmen mit der die Protagonistin redet. Einmal hat Mäggie den Text eingesprochen und einmal ich. Natürlich klingt es sehr Telefon-mäßig und man versteht nur bisschen was, aber immerhin ein kleiner Auftritt in dem Serienpiloten.

Zum Schluss noch ein paar Foley-Einblicke:

https://www.instagram.com/p/B8Q7jA4HZKc/
de_ATDE
en_GBEN de_ATDE