Audioqualität und möglichen Qualitätsverlust durch Kompression prüfen

G

Gracee

Gast
Hallo,
folgende Frage:
wenn ich drei Audiodateien habe, je ein mal .mp3, .flac und .wav, alle mit 16bit und 44.1kHz und unterschiedlichen kbit/s (fix 320kBit/s für mp3, fix 1411kBit für wav und irgendwas dazwischen für flac), und alle aus der selben Quelle stammen (z.b. CD), woran genau kann man erkennen (da Bit und kHz identisch), dass .mp3 zwar lossy ist (im Vergleich zur .wav Datei), .flac jedoch nicht?
Die kBit/s scheinen auf den ersten Blick schließlich das Einzige zu sein, das sich unterscheidet. Nur wie kann man nachprüfen, dass bei .flac-Dateien nicht doch etwas verloren gegangen ist?

Und wo wir schon mal dabei sind:
kann mir jemand kurz auch gleich erklären, wie es .mp3 bei der Kompression schafft, einen fixen kBit/s-Wert einzuhalten, .flac jedoch nicht?
Liegt dies daran, dass bei .mp3 dir Audioqualität zugunsten einer konstanten Bitrate variiert, während bei .flac auf eine unterschiedlich starke Kompression (und folglich Bitrate) bei konstanter Audioqualität abgezielt wird oder gibt es da einen anderen Grund?

Und warum haben dann .wav-Dateien eine konstante Bitrate von 1411kBit/s?
Liegts nur an der Lesegeschwindigkeit von CDs oder weshalb?
 
Wenn ich jetzt nicht falsch liege ist es relativ einfach:
Die Basis der Qualität ist natürlich immer das Ausgangsmaterial und der entsprechende Konverter.
-> wav: Rohdateien mit viel Speicherverbrauch. Wenn die eingestellte Abtastrate und Auflösung nicht unter der der Originalquelle liegt, bist du verlustfrei
-> Flac: komprimierte Daten, aber die ursprüngliche Daten, im Sinne von Ton, bleiben erhalten. Es entsteht halt ein entsprechender Mehraufwand bei der Rechenleistung um die Daten wieder zugänglich zu machen. Quasi ähnlich einer ZIP-Datei, die du auch nur entpackt nutzen kannst
-> mp3: das mit weitem Abstand schlechteste der drei Formate/Container. Es werden schlicht Frequenzen oben und unten abgeschnitten. Je nach Bitrate hörst du das dann mehr oder weniger. Es gehen immer Informationen bei dieser Technik verloren.
Ich merke es zum Beispiel an der Dynamik von manchen Liedern. Da hört man einen deutlichen Unterschied zwischen einer max-MP3 = 320kbps und einer FLAC aus selber Quelle heraus.

Zur Langzeitarchivierung habe ich für alle meine CDs FLAC benutzt. Es geht nichts verloren, die Daten sind um einiges kleiner als bei einem unkomprimierten Format wie WAV. Zudem hoffe ich darauf, dass eine Open-Source basierende Lösung auch noch in 20 oder 30 Jahren verarbeitbar bzw. auf dann aktuelle Formate umwandelbar sein wird. Mit propritären Formaten wie AAC ist das mehr als fraglich.
 
FLAC und ALAC im LPCM arbeiten variabel zur Bitrate - sie schneiden das ungenutzte Frequenzspektrum ab! Es entfällt die Datenrate für den Leerraum.
FLAC und ALAC im ADPCM arbeiten ähnlich dem LPCM, sodass man noch in Echtzeit der Wiedergabe die Bitraten dynamisch variieren sieht.

Hat das FALC-Medium eine Bitrate von 600 kbps und die Musik ist Klassik, dann ist das so korrekt, denn die klassische Musik erfordert wegen wenigeren Informationen (Anzahl, Impuls und Länge der Töne = Signalströme - Stärke = Datenrate) eine geringere Bitrate, es ist also Lossless. Herkömmliche, elektronische Musik enthält mehr Informationen, sie ordnet sich gen 900 kbps ein. Das ADPCM macht in Echtzeit ersichtlich, wie viel Bits eine Sequenz erfordert, da kann es bis unterhalb von 300 kbps variieren und ebenso auch bis oberhalb von 900 kbps.
 
wenn du eine WAV datei mit FLAC packst, kannst du ja die FLAC datei dann wieder nach WAV entpacken, dann sollte die entpackte WAV datei bitgleich zur original WAV datei sein.

und lossless kompression muss zwangsläufig immer variieren, da sie ja beim packen nie informationen wegschmeissen darf.

-andy-
 
rg88 schrieb:
-> mp3: (...)Es werden schlicht Frequenzen oben und unten abgeschnitten. Je nach Bitrate hörst du das dann mehr oder weniger. Es gehen immer Informationen bei dieser Technik verloren.
Ich will gar nicht mp3 verteidigen, aber in der dargestellten Form ist die Information nicht richtig. MP3 (und andere Kompressionsformate auch) machen sich die notorische Unzuverlässigkeit des menschlichen Gehörs zunutze. Das Gehör ist zwar ein extrem genauer Sinn, das Gehör kann zwei Ereignisse zeitlich voneinander unterscheiden, die das Auge nicht einmal wahrnehmen würde. Aber das Gehör lässt sich leicht täuschen: Lautere bzw. dynamischere Ereignisse 'übertönen' leisere in der Art, dass sie im Gehirn prioritär zur Kenntnis genommen werden.
Anwendungsbeispiele:
Jede Radiostation auf der Welt nutzt sogenannte "Enhancer" oder andere Geräte, die psychoakustische Manipulationen erlauben. Das Signal erscheint dem Ohr dann 'schöner', 'präsenter', 'runder', 'angenehmer' , also alles subjektive Eindrücke. Das Erstaunliche (um nicht zu sagen: Unheimliche) daran: das trifft für mindestens 99,9% des Publikums zu (wohlverstanden: ohne dass dies dem Publikum bewusst wäre; es wird nur im 1 zu 1-Vergleich offensichtlich)!
Weil die Werbewirtschaft ihre Produkte gegenüber der Konkurrenz, gegenüber Umgebungsgeräuschen und gegenüber der Kundschaft in jedem Fall herausheben will, sind die Spots am Fernsehen mit Hilfe von Excitern, Maximizern und Kompressoren auf höchstmögliche Lautheit getrimmt (Lautheit hier verstanden als laut und durchsetzungsfähig), was uns die unbeliebten pegelsprünge beschert.

Um nun zu mp3 zu kommen: Diese Komprimierungsmethode rechnet diejenigen Signale raus, die im jeweiligen Gesamtklang fürs menschliche Ohr nicht hörbar sind, weil sie von andern, lauteren Signalen übertönt werden. Das sind in der Regel (vierte, fünfte, ...) Obertöne. Ein Beispiel: Die (hohen) Obertöne einer Triangel sind in einer Aufnahme eines Orchesters, das ein Tutti spielt, vorhanden. Aber das Ohr hört sie nicht. So etwas rechnet mp3 raus.
Ist die Triangel aber in einer gewissermassen kammermusikalischen Umgebung zu hören, also in einem - sagen wir - Oboensolo mit dezenter Cellounterstützung, nimmt das Ohr diese Triangel anders wahr und entsprechend muss sich der Komprimierungsalgorithmus daran anpassen (kann übrigens sein, dass eine leise Stelle um mp3-Datenstrom mehr "Bandbreite" hat als ein Tutti).

Fazit: es gibt viele miese mp3, aber das Verfahren selbst funktioniert erstaunlich gut. Weil aber heutige Musik schon für CD-Produktionen zu Tode komprimiert wird, damit sie sich am Radio durchsetzt bzw. damit das Publikum währen der Dauer einer CD nicht das Volume nachjustieren muss, und weil die heutigen Abspielgeräte den Frequenzgang zusätzlich verbiegen, um "lauter", 'satter', 'fetter' zu klingen, kann es daraus dann natürlich keine guten mp3s geben.
 
Danke für die Erklärung. :)

Bilde mir aber trotzdem ein, beim Direktvergleich FLAC/MP3 einen Unterschied zu hören (AKG-Kopfhörer + X-Fi)
 
Naru schrieb:
FLAC und ALAC im LPCM arbeiten variabel zur Bitrate - sie schneiden das ungenutzte Frequenzspektrum ab! Es entfällt die Datenrate für den Leerraum.
FLAC und ALAC im ADPCM arbeiten ähnlich dem LPCM, sodass man noch in Echtzeit der Wiedergabe die Bitraten dynamisch variieren sieht.

Du sagst also, dass .flac sowohl lossy, als auch lossless sein kann, versteh ich das korrekt?

AndyMutz schrieb:
und lossless kompression muss zwangsläufig immer variieren, da sie ja beim packen nie informationen wegschmeissen darf.

Also das, was ich bereits in meinem Startbeitrag geschrieben hab, jup?

zazie schrieb:
Fazit: es gibt viele miese mp3, aber das Verfahren selbst funktioniert erstaunlich gut. Weil aber heutige Musik schon für CD-Produktionen zu Tode komprimiert wird, damit sie sich am Radio durchsetzt bzw. damit das Publikum währen der Dauer einer CD nicht das Volume nachjustieren muss, und weil die heutigen Abspielgeräte den Frequenzgang zusätzlich verbiegen, um "lauter", 'satter', 'fetter' zu klingen, kann es daraus dann natürlich keine guten mp3s geben.

Sprich: die .wav-Dateien, die man aus CDs zieht, verhalten sich in etwa wie .mp3-Dateien, da beide auf einen gleichbleibenden kBit/s-Wert (320 bei mp3, 1411 bei CD bzw .wav) getrimmt wurden und die entsprechende Audioqualität dabei eine untergeordnete Rolle spielt, solange nur die kBit/s passen. Versteh ich das so richtig?


@alle:
ich glaube, ihr habt meine Frage nicht richtig verstanden: wenn, ausgehend von einem CD-rip, .wav in jedem Fall lossless und .mp3 in jedem Fall lossy ist, und abgesehen von den kBit/s alle angezeigten Daten sowohl bei .mp3, als auch bei .flac und .wav identisch sind, woran kann man dann erkennen, ob .flac lossy oder lossless ist? Immerhin scheinen die kBit/s mehr mit der Kompression und nicht direkt mit lossy bzw. lossless zu tun zu haben, oder?

Und selbst, wenn man aufgrund von Genre und co. einschätzen kann, wie stark eine Kompression möglich ist, ist es immer noch nur eine Einschätzung und kein nachgewiesener Fakt.
Nachgewiesen wäre z.b., wenn man sich die Dateien im direkten Vergleich ansehen kann und .flac und .wav identisch (da aus der selben Quelle und in der selben Qualität) aussehen, ungeachtet der kBit/s, während .mp3 eindeutig abgeschnitten ist.
Meine Frage war nun, wie man genau dies sieht, ob .flac inhaltlich identisch zur .wav ist, sprich lossless, oder nicht?
 
FLAC ist immer verlustfrei. Es wird also im Endeffekt immer deinem wav entsprechen.
 
Gracee schrieb:
Du sagst also, dass .flac sowohl lossy, als auch lossless sein kann, versteh ich das korrekt?

Nein, tust Du nicht! Eine jede Signalwelle erfordert einen ungleich großen Datenstrom, das liegt daran, wie schon in Klammern gefasst, wie hoch, wie diffus und wie oft ein Impuls pro Zyklus stattfindet. Ein einzelner Midi-Ton braucht bspw. 16 Bit, zwei davon, 32 Bit, und wenn man diesen Datenstrom nach seinerm Inhalt beurteilt, dann braucht dieser mit dem gleichen Ton in der doppelten Länge 32 Bit und erhöhe ich dessen Impuls um den Faktor 2, was praktisch nicht in die doppelte Lautstärke resultiert, dann fallen weitere Bits an und, und, und ... Leuchtet das in etwa ein? Währenddessen einzig die Flöte tönt genügen womöglich 128 Bits, bei der Klarinette meistens etwas mehr, 160 Bits, das Piano im hohen und sogleich tiefen Frequenzspektrum 256 Bits ... Alles klar?

ADPCM ist ein adaptiver Datenstrom, er kann die Spektrallinien um ihren ungenutzten Raum in Echtzeit auftrennen und herausfiltern, diese während der Wiedergabe hinzu zu rechnen kostet entsprechned Rechenleistung. LPCM tut dies nicht, daher ist es ein lineares Verfahren, es legt dafür eine konstante Bitrate an. Es gibt noch variable Verfahren, MP3 zum Beispiel, es berechnet je nach Beurteilung der jeweiligen Spektrallinie die Datenrate als Durchschnittswert, dabei können jedoch Wellen um Toninhalte beschnitten werden.
 
Zuletzt bearbeitet:
Gracee schrieb:
Dann kann man es doch sicherlich nachprüfen, oder? ;)

Ja, indem du es mit dem Original vergleichst. :D
Haste nicht? Warum auch immer... anhand vom Frequenzverlauf KÖNNTE man vielleicht erkenne ob es vorher nicht doch mal mp3 codiert war.
 
Gracee schrieb:
kann mir jemand kurz auch gleich erklären, wie es .mp3 bei der Kompression schafft, einen fixen kBit/s-Wert einzuhalten, .flac jedoch nicht?
Liegt dies daran, dass bei .mp3 dir Audioqualität zugunsten einer konstanten Bitrate variiert, während bei .flac auf eine unterschiedlich starke Kompression (und folglich Bitrate) bei konstanter Audioqualität abgezielt wird oder gibt es da einen anderen Grund?

Und warum haben dann .wav-Dateien eine konstante Bitrate von 1411kBit/s?


Einen fixen kBit Wert einzuhalten ist denkbar einfach. Ohne jetzt zu verdeutlichen was MP3 genau macht: Du willst die Werte 1 2 4 6 speichern und für jede Zahl 2bit verbrauchen. 1 wäre also 01, 2 = 10 und die 4 geht schon nicht mehr, aber du kannst das nächst dichte speichern. In diesem Fall 4 etwa 11 und bei der 6 das selbe. Damit hättest du eine konstante Bitrate pro Wert, aber verlierst halt Teils Informationen. MP3 und auch neuere Codecs machen natürlich noch deutlich mehr, wie Zazie auch schon etwas ausgeführt hat.

Wav hat 1411kBit/s weil eine CD 2 Kanäle mit 16bit und eine Sampling Rate von 44,1kHz hat. 2 * 16 * 44,100 = 1411,200 bit pro sekunde und das wird dann als 1411kBit/s dargestellt, auch wenn es eigentlich etwas weniger sind.



Naru schrieb:
FLAC und ALAC im LPCM arbeiten variabel zur Bitrate - sie schneiden das ungenutzte Frequenzspektrum ab! Es entfällt die Datenrate für den Leerraum.
FLAC und ALAC im ADPCM arbeiten ähnlich dem LPCM, sodass man noch in Echtzeit der Wiedergabe die Bitraten dynamisch variieren sieht.

Dazu würde ich gerne eine Quelle sehen. Nicht wie LPCM und ADPCM funktionieren, sondern das Flac und Alac auch nur ansatzweise etwas damit zu tun haben.



Gracee schrieb:
wenn, ausgehend von einem CD-rip, .wav in jedem Fall lossless und .mp3 in jedem Fall lossy ist, und abgesehen von den kBit/s alle angezeigten Daten sowohl bei .mp3, als auch bei .flac und .wav identisch sind, woran kann man dann erkennen, ob .flac lossy oder lossless ist? Immerhin scheinen die kBit/s mehr mit der Kompression und nicht direkt mit lossy bzw. lossless zu tun zu haben, oder?

Nachgewiesen wäre z.b., wenn man sich die Dateien im direkten Vergleich ansehen kann und .flac und .wav identisch (da aus der selben Quelle und in der selben Qualität) aussehen, ungeachtet der kBit/s, während .mp3 eindeutig abgeschnitten ist.
Meine Frage war nun, wie man genau dies sieht, ob .flac inhaltlich identisch zur .wav ist, sprich lossless, oder nicht?

Um jetzt aber mal die von Anfang an gestellte Frage zu beantworten:

Wie sehe ich ob Flac wirklich lossless ist gegenüber der Wav.

Wenn du die Wav besitzt kannst du folgendes machen:

Du lädst dir FLAC runter. Packst dann eine WAV in den Ordner der Flac.exe und benennst sie um in "test.wav". Dann erstellst du eine .bat Datei in welche du folgendes schreibst:
Code:
.\flac.exe -8 test.wav
ren ".\test.wav" sha.wav
.\flac.exe -d test.flac
CertUtil -hashfile test.wav SHA256
CertUtil -hashfile sha.wav SHA256
Dann einfach die Powershell öffnen in dem Ordner und die bat ausführen.

Das macht einfach folgendes: Es erstellt eine Flac aus der Datei test.wav. Dann benennt es test.wav in sha.wav um und erstellt aus der Flac wieder eine Wav und dann wird der Hashwert der beiden Dateien berechnet.

Um den Unterschied zwischen MP3 und Flac/WAV zu sehen, lädst du dir am besten Spek runter und öffnest die MP3 und die Flac/WAV mit dem Programm. Du müsstest bei der MP3 ein Abschneiden der höheren Frequenzen sehen und den sogenannten "Shelf", wobei dieser bei 320kbit/s nicht sehr ausgeprägt ist.
 
Zuletzt bearbeitet:
Es bezweckt gar nichts, weil die Header der beiden Mediencontainer ungleich sind: Deine Methode begrenzt sich nicht lediglich auf den Datenstrom!
 
Naru schrieb:
Es bezweckt gar nichts, weil die Header der beiden Mediencontainer ungleich sind: Deine Methode begrenzt sich nicht lediglich auf den Datenstrom!

Sind sie nicht zwingend und sobald der gleiche Hash rauskommt ist auch der Datenstrom gleich.
 
Naru schrieb:
[...] Alles klar?

Nur bedingt ^^' aber ist das bei der Kompression jener Dateien nicht so, dass da nur die Bits gekürzt werden, welche beim "entpacken" bzw. wiedergeben der Datei letzten Endes aber alle wieder an ihrem Platz sind?

ldasta schrieb:
Ja, indem du es mit dem Original vergleichst. :D

Na rate mal, wo ich das Original bald unkomprimiert verlegen werde :rolleyes: :p
An sich müsste der Inhalt von .flac und .wav Dateien ja identisch sein, nur halt effektiver verpackt, oder?
In dem Fall dürfte es ja kein Problem sein, .flac und .wav Dateien, welche beide aus der selben Quelle stammen (z.b. CD), zu vergleichen und festzustellen, dass diese inhaltlich identisch zueinander sind, während .mp3-Dateien geschnitten sind. Und meine Frage diesbezüglich wäre eher die Frage, mit welchem Programm man dies am besten macht (bspw. visuelle Darstellung der Tondateien).

kumpert schrieb:
Um jetzt aber mal die von Anfang an gestellte Frage zu beantworten:
[...]

Klingt nach einem sehr komplizierten Vorgang, wenn man lediglich zwei bereits vorhandene Dateien (komprimiertes .flac und unkomprimiertes .wav) inhaltlich auf lossy/lossless miteinander vergleichen will.
 
Ganz einfach nochmal zusammengefasst: wav ist umkomprimiert, flac ist komprimiert. Beides aber verlustfrei.
 
@Gracee

Gracee schrieb:
Nur bedingt ^^' aber ist das bei der Kompression jener Dateien nicht so, dass da nur die Bits gekürzt werden, welche beim "entpacken" bzw. wiedergeben der Datei letzten Endes aber alle wieder an ihrem Platz sind?

Es wird nichts entfernt, was die Klangqualität beeinflusse - Es ist eine simple Stauchung, also das Stauchen der Wellenlänge auf das Potenzial hin, das wird von dem Decoder aufgerechnet, richtig, und das Stauchen von Platz durch die Bits, die eine Form aufweisen und diese angepasst wird, sodass sie wie inf ast luftdicht ineinandergehen, zumindest insoweit, dass die Identifikation durch die Quantisierung im Rahmen der Präszision liegt.


@rg88

+1
 
rg88 schrieb:
Bilde mir aber trotzdem ein, beim Direktvergleich FLAC/MP3 einen Unterschied zu hören (AKG-Kopfhörer + X-Fi)

Unter den Voraussetzungen, dass der MP3 Encoder gescheit arbeitet und bei der Wiedergabe keinerlei sonstige Verfälschungen einfließen, gilt MP3 (Lame Encoder) mit 190kbit/s als transparent für geschulte Ohren. Daher im Blindtest kann zum unkomprimiertem Material keine Differenz herausgehört werden. Alles darüber hinaus bringt allenfalls in extremen Einzelfällen noch eine Verbesserung. Wenn du es mit deinem Setup also schaffst da Differenzen zu hören ist das Einbildung oder aber "HiFi"-Hardware/Software die beim Decodieren von MP3 mit dem Signal herumpfuscht.
 
Da muss ich dir jetzt deutlich widersprechen. 192kbit und 320 kbit bei mp3s höre ich eindeutig heraus bei einigen Stücken.
 
@Piktogramm

In der Nuancierung stimmt das weitgehend, wie von 256 zu 320 kbps, aber der Sprung von 192 kbps ist zu groß als dass sich dies in der Dynamik und Plastizität nicht bemerkbar mache.
Pro Kanal sind die 96 kbps noch akzeptabel, daher gehen die 192 kbps noch in Ordnung, doch darunter fällt die Klangqualität erheblich ab, gen 128 kbps klingt es sogar ausgedünnt und der angebliche Hochtonbereich klingt nach Honky-Tonk-Piano.
Doch toll klingen die Formate MPEG-1 Audio Layer III und MPEG-2 Audio Layer III generell nicht, viel zu matschig und eintönig der Tiefton, der Tiefmittelton tot, der Mittelton unkernig und unpräsent, und der Hochton gleicht allenfalls einem verstummten Mittelhochton. In derartigen Bitraten zaubert das Advanced Audio Coding weitaus mehr her!

Ich rate Dir an, von dem Microsoft Sound Mapper - MME weg zu kommen und Dich stattdessen mit der Microsoft DirectSound Source Windows Audio Session Application Programming Interface - WASAPI auseinander zu setzen, in der Voraussetzung, dass die übrige Verbindung und die Engeräte daraus Profit ziehen können.

Ich hantiere mit dem PWM-Amplifier Panasonic SA-XR700 und speisen tut er die Magnat Quantum 670 Series - Ich höre mit meinem Positiv-Gen-Gehörsinn Deinen ach so tollen Gegengleich von Lossy zu Lossless mit links heraus! So etwas zu matschig, zu ausgedünnt, zu dynmamiklos, zu dumpf und zu räumlich unbetont, geradezu indiffus klingendes wie MP3 kann ich nicht überhören!
 
Zuletzt bearbeitet:
Zurück
Oben