4. Audiotechnik Und Tonbearbeitung

Transcription

4.Audiotechnik und Tonbearbeitung4.14.24.34.44.5Grundlagen der AudiotechnikAnaloge AudiotechnikRaumklangDigitale AudiotechnikProgrammierung für AudioverarbeitungLiteratur:M. Warstat, Th. Görne: Studiotechnik, 5. Auflage,Elektor-Verlag 2002!H. Raffaseder: Audiodesign, Fachbuchverlag Leipzig 2002!B. Katz: Mastering Audio – The Art and The Science,!!Focal Press 2002LMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 1

Geschichte der digitalen Audiotechnik1926: Erstes Patent für PCM-Abtastung(P.M. Rainey, Western Electric)1962: PCM-Übertragungssystem(Bell Telephone)1974, Sony: PCM-Audio digital auf Magnetbandab 1975: Digitale Masterbänder in Tonstudios1979, Philips: Erste digitale Audiodisc1981, Philips/Sony: Compact Disc (CD)Sony digital tape recorder 19741988 Verkaufszahlen von CDs über denen von LPs1981: Standardisierung von MIDI (Synthesizer)1990: DAT-Recorder (Digital Audio Tape)1990: CD-R1992: Philips DCC und Sony MiniDisc (MD)1999, Sony/Philips: Super Audio CD (SACD) und DirectStream Digital1999: DVD-Audio2000 : Direct-to-disc Recording etabliert sichLMU München – Sommer 2009Prof. Hußmann: MedientechnikDAT Tape (1990–2005)Kap. 3 Teil b – Folie 2

Analog-/Digital-WandlungAbtastungDiskretisierung (Abtastrate)Quantisierung (Wortlänge)Abtastraten:– 32 kHz (Broadcast, Semi Professional)– 44.1 kHz für CDs, Mastering und Aufzeichnung mit Videogeräten der625/50 Norm– 44.056 kHz für Aufzeichnung mit Videogeräten der.525/59.94 Norm– 48 kHz professionelle Studionorm für Recorder mit feststehendenKöpfen– 96 kHz High End Mastering, DVD Audio– 2.8224 MHz „Direct Stream Digital“ (z.B. für SACD Super-Audio CD) Wortlängen:– 16 Bit (Audio-CD)LMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 3

Digitale PegelMaximaler digitaler Audiopegel: 0 dBFS (dB Full Scale)– Maximal möglicher Wert in der gewählten QuantisierungPrinzipiell unabhängig vom Spannungswert nach Analog-KonversionAlle real auftretenden Pegelwerte sind negativ1 Bit Wortlänge Verdopplung des Dynamik-Wertebereichs 6 dB8 Bit Wortlänge 48 dB (z.B. 00000000 –48 dBFS)16 Bit Wortlänge 96 dB24 Bit Wortlänge 144 dBDigitaler Headroom: Differenz zwischen Arbeitspegel und 0 dBFSMindestens –9 dBFS, oft höherer Abstand vorgeschlagen (z.B. –20 dBFS)„Intersample Peaks“, optimaler Arbeitsbereich für analoge VerstärkerD/A-Wandlerpegel 6 dBu entspricht digitalem ArbeitspegelRauschen in der digitalen Bearbeitung:A/D-Wandler: Rauschen bei ca. –104 dBFSDigitale Mixer: Rauschen bei ca. –120 dBFSLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 4

Digitales „OVER“?Übersteuerung0 dBFSAnaloges SignalWiedergewonnenes analoges Signalaus digitaler AufnahmeSignalanteile, die durch Übersteuerung bei der Aufnahmeverloren gehen, sind für immer verloren („Clipping“)„OVER“-Anzeige nur bei Aufnahme, nicht bei Wiedergabe!Digitales ClippingAkustisch wesentlich unangenehmer als bei analoger ÜbersteuerungRechteck-artige SchwingungenOVER-Anzeige bei digitalen Peakmetern:Folge von mehreren aufeinander folgenden 0 dBFS-Werten (z.B. 3)LMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 5

Audio-DitheringU u0 u1tAnnahme: Quantisierungsschwelle bei u0!(LSB, Least Significant Bit)Konstante Spannung u1 unterhalb u0 (z.B. u0/2)Sampling liefert Null-Werte–u00 0 0 0 0 0 U u0 u1tRauschen (Zufallsignal) mit niedrigerAmplitude beigemischtSampling liefert zufällige Wertereihe 0 und 1Durchschnitt (bei nachfolgender Glättung)entspricht u1 !–u01 1 0 0 0 1 1 0 Durch Hinzufügen von Rauschen kann die Auflösung derDigitalisierung gesteigert werden (Dithering)Gleichzeitig Quantisierungsverzerrungen reduziertLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 6

WortlängenmanagementDigitale Bearbeitung liefert größere WortlängenBerechnungsergebnisse in der SignalverarbeitungEs ist sinnvoll, mit längeren Wortlängen zu arbeitenIntern in digitalen AudiogerätenIn der digitalen Audio-BearbeitungsketteVermeiden der Akkumulation von Rundungsfehlern!Rückführung auf Medienwortlänge (Rundung)In einem einzigen Schritt, nicht mehrfachAm Ende der BearbeitungsketteMeist unter Verwendung von Dithering (Re-Dithering)LMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 7

Digitale AudiotechnikKlassifikationen digitaler Audiobausteine:Hardware oder SoftwareHardware notwendig für A/D- und D/A-KonversionHardware sinnvoll bei hohen Anforderungen an LatenzzeitHardware-Bedienelemente für Software-Lösungen(z.B. digitales Mischpult)Produktion oder ModifikationProduktion: Synthesizer, Tongeneratoren, MIDI-EingabegeräteModifikation: Mischung, Filter, EffekteLife oder PostprocessingLife: Aufnahmestudio, Life-Bühne, RundfunkPostprocessing: „offline“ NachbearbeitungHauptunterschied: Latenzzeiten z.B. für Effekt-RenderingLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 8

SoundkartenBestandteile:Digitaler Signal-Prozessor (DSP)Digital-Analog-Converter (DAC)Analog-Digital-Converter (ADC)Speicher (z.B. für Wellenformen bei Klangsynthese und als Puffer)Anschlüsse:Analoge und digitale Audio-Ein-/AusgängeMIDI-Ein-/AusgängeRaumklang- (Surround Sound-)AusgängeEinfache Soundfunktionalität heutzutage meistens "on board"Geschichte:Xerox Alto Prototyp beherrscht einfache Audio-Verarbeitung (1972)Erster Audio-fähiger Kleincomputer für den Massenmarkt: AppleMacintosh (1982)LMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 9

Digitales MischpultDigitales Mischpultmit eigenem DSP (Digital Sound Processor)Steuergerät für Software(z.B. Cubase, Logic)angeschlossen über FireWire oder USBReine Softwarelösung,Steuert u.U. Hardware (z.B. spezielle Soundkarten)LMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 10

Software: SequencerAufnahme und Erstellung (Komposition) von MIDI-DatenMischen llesMischpult)Digitale EffekteIntuemLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 11

Software: Audio-AufnahmeSound Studio 3 Zugriff auf Eingabegeräte (Mikrofone, Mischpult)FortschrittsanzeigeAussteuerungsanzeige und -KontrolleSpeicherung in diversen FormatenOft kombiniert mit anderen Funktionen (z.B. Postprocessing)LMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 12

Software: Audio-BearbeitungAudacityImport diverser Audio-FormateMisch- und SchnittfunktionenNachbearbeitung von Klangspektrum und PegelAnwendung von Audio-EffektenLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 13

Bearbeitung der Amplitude (1)Verstärken, Dämpfen, "Normalizing":nachträgliche Anpassung des gesamten SignalpegelsZ.B. Einstellen auf Standard-Durchschnittspegel („Normalizing“)bei Verstärkung werden auch unerwünschte Effekte (z.B.Rauschen, Nebengeräusche) mitverstärkt!Normalizing:Relativ zu welchem Standard?Bsp.: Abmischen eines Albums:Auf keinen Fall einzelne Titel auf Standard-Pegel „normalizen“Sinnvoller: Normalizing des Gesamtalbums(Charakter der Einzelsongs bleibt erhalten)LMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 14

Bearbeitung der Amplitude (2)Bearbeiten der Hüllkurve:Ein- und Ausblenden (fading)Typen von Fadern:linearlogarithmischexponentielldiverse ZwischenformenKompensation von "DC-Offset"Signal genau auf die gewünschte Null-Linie einstellenUnerwünschten "Gleichspannungsanteil" abziehenVorsicht beim Zusammenmischen verschiedener Signale:Gesamtpegel beachten! Signale werden meistens additivzusammengeführtDigitale Übersteuerung führt zu Clipping, welches nachträglich nichtmehr korrigiert werden kannAbhilfe: Einzelne Signale/Spuren vorher entsprechend abschwächenLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 15

DynamikUnterschied zwischen lauten und leisen PassagenHöchster minus kleinster Amplitudenwert in einem ZeitfensterMikrodynamikKleine Zeitfenster (Sekundenbruchteile)Eigenschaften von InstrumentenZ.B. Schlagzeug hat hohe MikrodynamikBearbeitung der Dynamik eines Einzelkanals vor der AbmischungMakrodynamikGroße Zeitfenster (Sekunden bis Minuten)Eigenschaften von Songs bzw. SzenenZ.B. pianissimo bis fortissimoBearbeitung der Gesamtdynamik eines längeren AbschnittsProbleme mit Dynamik:Übersteuerung bei WiedergabeUnhörbarkeit durch HintergrundgeräuscheLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 16

Varianten der U München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 17

Bearbeitung der Dynamik (1)Kompressor:Schwelle (threshold): Amplitudenwert, ab dem die Reduktion einsetztFaktor (ratio): Stärke der ReduktionEinsatz (attack) und Ausklingen (release): ÜbergangszeitenBeispiel:unkomprimiertLMU München – Sommer 2009komprimiertThreshold -10dBRatio 10.0Attack 10 msRelease 100 msProf. Hußmann: MedientechnikKap. 3 Teil b – Folie 18

Bearbeitung der Dynamik (2)Multiband-KompressorAufteilung des Signals in FrequenzbänderJedes Frequenzband einzeln komprimiertGeeignet zur selektiven Veränderung des KlangbildsExpander:Umkehrfunktion zum Kompressor (Dynamikerhöhung)Limiter:Schneidet Signal oberhalb der Schwelle auf festen Pegel abVermeidet ÜbersteuerungGate:Schneidet Signal unterhalb des Schwellwertes abKann zur Rauschunterdückung oder zum Ausschalten vonNebengeräuschen dienenLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 19

Bearbeitung des zeitlichen Verlaufs (1)Schneiden von Audio-MaterialFrüher wirklich mit der Schere (am Tonband)!Heute mit Cut, Copy und Paste im Audio-EditorMöglichst in Pausen schneidenImmer im Nulldurchgang schneiden (sonst Knacken hörbar)Schnitte zu ähnlichem Signal sind relativ problemlosSchnitte von leisem zu lautem Signal sind relativ problemlosSchwierig sind Schnitte innerhalb eines kontinuierlichen SignalsÜberblenden:Bearbeiten der Hüllkurven und ZusammenmischenKreuzblende (langsam) und Sturzblende (rasch)Schleifen (loop):Verlängern eines akustischen Ereignisses durch WiederholenSchnittregeln an der Nahtstelle zu beachtenLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 20

Bearbeitung des zeitlichen Verlaufs (2):ResamplingAndere Wiedergabegeschwindigkeit als SamplingrateÄndert die Zeitdauer und gleichzeitig alle TonhöhenBeispiel:OriginalResampling * 0,7Resampling * 1,4Beispiel: Erzeugung neuer TöneKugel auf Teller1/16 Resampling1/64 ResamplingLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 21

Bearbeitung des zeitlichen Verlaufs (3):TimestretchingZeitkorrektur ohne hörbare Tonhöhenveränderungnur in begrenztem Umfang möglichIdee: Wiederholung kleiner periodischer AbschnitteoriginalgedehntgestauchtLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 22

Bearbeitung des zeitlichen Verlaufs (4):PitchshiftingTonhöhenkorrektur bei gleicher SpieldauerZusammensetzbar aus Timestretching und ResamplingOriginalhöhertieferLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 23

Raumorientierte Bearbeitung: Echo und HallEcho:Signal einmal verzögert und abgeschwächt zurückgeführtParameter: Verzögerung, AbschwächungHall:Signal vielfach (unendlich oft) mit verschiedenen n können sehr komplex seinEchoprinzipLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 24

Schallausbreitung im geschlossenen RaumDirektschall:gerade Linie zwischen Quelle und Hörerkürzester WegErstreflexionen:längerer Weg, längere Laufzeitals unterschiedliches Signal wahrnehmbar (Echos)Mehrfachreflexionen:als einheitliches "Hall-" Signal wahrgenommenklingt mit der Zeit abQDirektschallErstreflexionenLMU München – Sommer 2009HQHMehrfachreflexionenProf. Hußmann: MedientechnikKap. 3 Teil b – Folie 25

ImpulsantwortVerhältnis von Direktschall, Erstreflexionen und Nachhall kannexperimentell ermittelt werden:Kurzer Impuls bestimmter Frequenz (Klatschen, Schuss)Spektrum des reflektierten Signals beschreibt Übertragungseigenschaftendes Raums (Impulsantwort)Mathematische Berechnung der Raumwirkung:– Faltung (convolution) des Eingangssignals mit ImpulsantwortBeispiel:Impulsantwort KathedraleFaltungsergebnisImpulsantwort BüroraumFaltungsergebnisOriginaltonLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 26

Phasenorientierte BearbeitungSehr kurze Verzögerungen (unter 30 ms) werden alsPhasenveränderungen wahrgenommen und beeinflussen denGesamtklangChorus:Sehr schnelle, minimal in der Höhe veränderte SignalrückführungLässt Klang voller erscheinenFlanging:Noch kleinere Verzögerungszeit (8 ms)Tonhöhe konstant - Überlagerung mit OriginalsignalFeedback: Effektsignal wird an Eingang zurückgeführtVerwendung z.B. bei GitarrenklängenPhasing:ähnlich zu Flanging, aber ohne Feedbacksynthetischer KlangLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 27

RestaurationFehler auf alten Tonträgern:Rauschfehler (Noise, Hiss)Clickfehler (Clicks)Knistern (Crackles) Denoising:"Fingerprint" (Spektrum) des Rauschens wird bestimmtdann exakt diese Frequenzen ausgefiltert Declicking:Signallücke durch Interpolation (oder zweiten Stereokanal) ersetzen Decrackling:Wiederholtes Declicking, auch automatisch ausgeführtLMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 28

4.Audiotechnik und Tonbearbeitung4.14.24.34.44.5Grundlagen der AudiotechnikAnaloge AudiotechnikRaumklangDigitale AudiotechnikProgrammierung für LMU München – Sommer 2009Prof. Hußmann: MedientechnikKap. 3 Teil b – Folie 29

Java Sound API"Low-level" APIzur Steuerung der Ein- und Ausgabe von Tonmedienumfasst Funktionen für digitale Audioinformati

Katz: Mastering Audio – The Art and The Science, !!Focal Press 2002 1. LMU München – Sommer 2009 Prof. Hußmann: Medientechnik Kap. 3 Teil b – Folie Geschichte der digitalen Audiotechnik 1926: Erstes Patent für PCM-Abtastung (P.M. Rainey, Western Electric) 1962: PCM-Übertragungssystem (Bell Telephone) 1974, Sony: PCM-Audio digital auf Magnetband ab 1975: Digitale Masterbänder in .