16bit reicht für alle!

lamda

Lt. Commander
Registriert
Jan. 2008
Beiträge
1.575
Seit 1982 habe wir die CD und mit ihr den 16bit 44,1khz Audiostandard doch seit "kurzem" gibt es 24bit Audio Standards, DACs und Vermeintlich Kontent.
Wie mit dem aufkommen jeder Technologie gibt es hier das lager das sagen das ist "alles Quatsch und braucht eh keiner"
144fps vs. 60fps, HD vs fullHD. HD vs. 4K 4k vs. 8k und so weiter

(Höhere Sample raten gibt es auch aber lasst uns diese fass erst bei bedarf aufmachen)
Edit: Es geht hier also nicht primär um zeitliche Auflösung sonder um die Amplituden Auflösung
4bitpcm.png

https://upload.wikimedia.org/wikipedia/commons/2/21/4-bit-linear-PCM.svg
Danke an xxMuahdibxx der diese schöne Bild bei Wikipedia gefunden hat das veranschaulicht um was es geht.
Je höher die vertikale Auflösung desto näher kommen die Punkt an die analoge Original Funktion heran.

Ich würde hier gerne versuchen eine Sachliche Diskussion darüber zu führen und Information zu dem Thema zusammen zu tragen
damit wir anschließend gemeinsam
die fragen klären können:

1. Was sind die Theoretischen vor und Nachteile
Also nicht "Ich höre kein unterschid ergo braucht man nicht"
Es ist vollkommen legitim wen du dieser Meinung bist und vermutlich hast du recht schließlich waren 16dit die letzten 30 Jahre gut genug. warum sollte es das jetzt nicht mehr so sein.
Hier geht es mir mehr darum. was sind die Theoretischen physikalischen voreilte.
wievielt hat das theoretische (ideale) menschliche Ohr davon.

2. Was sind die Praktischen vor und Nachteile (wen vorhanden)
Hier geht es darum ist das mit vertretbarem technischem Aufwand überhaupt praktisch umsetzbar
Gibt es überhaupt Lautsprecher die mehr wie 16Bit Dynamik wiedergeben können?

Und weitere fragen die in der Diskussion aufkommen.
Ich dachte mir ich editiere diesen post um hier gewonnen Erkenntnisse/Quellen/Konsens zum Thema unterzubringen


1. Theoretische voreile.
https://en.wikipedia.org/wiki/Audio_bit_depth
16-bit digital audio found on CDs has a theoretical maximum SNR of 96 dB and professional 24-bit digital audio tops out as 144 dB
24bit scheint also mit Theoretisch 144dB eine höhere maximale SNR zu haben.

Doch was bedeutet das.
Edit: Danke an @reobase für deisne Link
https://www.head-fi.org/threads/24bit-vs-16bit-the-myth-exploded.415361/
Der lautest Ton kann um den Faktor SNR also 144dB lauter sein wie der noise floor.

Dynamik!=SNR?
Wie Xiph behauptet können auch Signale deutlich unter dem noise floor trotzdem noch wahrgenommen werden.
Ich konnte das hier experimentell bestätigen https://www.computerbase.de/forum/threads/16bit-reicht-fuer-alle.1900449/page-2#post-23256248
Laut https://people.xiph.org/~xiphmont/demo/neil-young.html kann man dadurch mit einem 16bit Signal und noise shaping auch 120bBA empfundene Dynamik erreichen.

Die Nachteile sind klar mehr bits= mehr daten = mehr speicher bedarf.

2. Praktisch voreile
Welche Dynamik kann ich den hören?
Hören kann der Mensch per Definition ab 0dB (EDIT: -9dB bei bestimmten Frequenzen)je nach Frequenz liegt die Schmerz grenze bei ca. 140dB
Qelle:
One way to define absolute dynamic range would be to look again at the absolute threshold of hearing and threshold of pain curves. The distance between the highest point on the threshold of pain curve and the lowest point on the absolute threshold of hearing curve is about 140 decibels for a young, healthy listener.
Bei entsprechen tiefen Tönen im Sub Bass und Infraschall Bereich halten einige Mensch aber auch deutlich mehr aus.

Laut der Occupational Safety and Health Administration
http://www.sengpielaudio.com/NIOSH-OSHA-Standards.gif
sind 130dbA für ca. 2 Minuten pro tag ok. 130dbA sind 180bB bei 20Hz
http://www.sengpielaudio.com/calculator-dba-spl.htm
Die maximale Dynamik die man einigermaßen sicher für eine (sehr)kurze zeit hören kann ist also ca. 140-180dB

Wie laut wir ein Ton wahrnehmen und wie schädlich er für unser Gehör ist hängt nicht nur von seiner Schalldruck ab sondern auch von seiner frequenz.
Ein 20hz Ton hören wir zb. viel leiser wie ein 5khz Ton. ca. 50db leiser.
Das könnte ihr aus dieser Tabelle ablesen
http://www.sengpielaudio.com/Bewertungsfilter02.gif

dBA ist als grob die empfunden Lautstärke wären dB sich auf physikalische Größen wie druck oder Spannung beziehen
Um von 20Hz-20kHz eine Dynamik von 100dBA zu erreichen braucht es daher schon über 150dB Dynamik

Die voreile von mehr wie 16bit und mehr wie 96dB Dynamik kann ich also wen überhaupt erst hören wen ich eine Anlage habe die übe 96dBSPL schafft?
Das ist also nur relevant für tiefe Bässe oder ungesund lautes hören?

Welche Dynamik hab ihr den im echten leben so?

Leises flüstern sind ca. 20dB
Ein Platzender Ballon direkt neben dem ohr erreicht 168dB (in 1m Entfernung noch 151dB)
http://www.hearingreview.com/2017/08/know-loud-balloons-can/
Krankenwagen mit Pressluft Horn 127dB (120dB in 20m Entfernung)
https://www.cirrusresearch.de/blog/wie-laut-ist-ein-martinshorn/

Also bräuchte es theoretisch schon mindesten 107dB-148dB Dynamik

Vorhergehend Diskussion zu dem Thema https://www.computerbase.de/forum/t...elio-x2-vs-audio-technica-msr7.1899854/page-2
 
Zuletzt bearbeitet:
ich finde hier wird das auch gut erklärt.
 
  • Gefällt mir
Reaktionen: Martin113
Bin kein Tontechniker zwischen zwei punkten gibt es beliebig viele Punkte. also verstehe ich nicht warum diese Zwei Punkte ein Limit bei der Auflösung sein sollen. Ich dachte eines der Probleme bei 24b ist das die eigentlichen Stufen nicht mehr so Linea sind wie bei 16b.
 
Der letzte Satz in diesem Video bezüglich der Arbeit die im Studio geleistet wird sagt eigentlich alles...
 
  • Gefällt mir
Reaktionen: Queen
Multivac schrieb:
zwei punkten gibt es beliebig viele Punkte. also verstehe ich nicht warum diese Zwei Punkte ein Limit bei der Auflösung sein sollen.
Klingt intuitiv richtig.
mehr bits = mehr stufen = mehr Auflösung
Oder man lässt die stufen halt gleich groß dann sind mehr Stufen gleich mehr Lautstärke.

https://people.xiph.org/~xiphmont/demo/neil-young.html
sagt aber:
It is also worth mentioning that increasing the bit depth of the audio representation from 16 to 24 bits does not increase the perceptible resolution or 'fineness' of the audio. It only increases the dynamic range, the range between the softest possible and the loudest possible sound, by lowering the noise floor. However, a 16-bit noise floor is already below what we can hear.

dazu frage ich mich aber:
was bedeutet in dem fall "perceptible resolution" wodurch wird das definiert was wahrnehmbar ist?
Wie kann er allgemein wissen das der 16bit noise floor bereits nicht hörbar ist? der noise floor und dessn hörbarkeit hängt dioch von der vertärkung und abseluten Lautstärke ab.

Multivac schrieb:
Ich dachte eines der Probleme bei 24b ist das die eigentlichen Stufen nicht mehr so Linea sind wie bei 16b.

Klingt auch erst mal nicht unlogisch.
wen dem so ist dan müsste es ja irgend wie ein Kompromiss geben wo mehr keine stufen aber dafür mit mehr toleranz im endefekt schlechter sind wie die groben stufen die aber exakter sind?

ich würde sagen minimal und maximal level sind quasi fest definiert durch eine Referenz Spannung und die stufen dazwischen sind halt Bruchteile davon
solange die stufen stätig steigen dh. die nächst höhere stufe auch wirklich ein höheres spannungs- level ausgibt wie die darunter ist mehr auch besser?
 
Zuletzt bearbeitet:
Die Schallwellen sind doch aber nicht stufig. :)

Eigentlich gibts diese und ähnliche Formen der Diskussion schon zuhauf. Um das mal kurz zusammenzufassen:
- 24bits sind für Aufzeichnungen, gerade professionell, die bessere Option. Da hat man mehr, was hinterher unter den Tisch fallen kann. Eben so, wie man bei Bildern ggfs. auch mal was wegschnippeln kann oder sich auf ein konkretes Fenster beschränken kann. Sie sind auch interessant für analoge Quellen: Je mehr Information ich aus einer kontinuierlichen Audiokurve herausholen kann, desto besser ist das.

- 24bits sind aber für den Heimanwender entweder nutzlos oder, schlimmstenfalls, eher kontraproduktiv. 24bit Resolution heißt, ich kriege außer dem hörbaren Bereich auch noch jede Menge nicht-hörbare Frequenzen mit, kann damit also sinngemäß Katzenvideos drehen. Also für die Katz, meine ich. Die hören das nämlich noch.

Problem bei Menschen: Wiedergabehardware ist nicht immer 24bit-fest. Wer kommt auch auf die Idee, nichthörbare Frequenzen unverfälscht von der Aufnahme bis zur Wiedergabe zu rekonstruieren und das auch sicherzustellen? Entsprechend kann es passieren, daß es Resonanzen gibt und nichthörbare Töne (wegen 24bit) plötzlich verfälscht hörbar werden.

Wir Menschen sind aber darauf geeicht, daß "mehr" immer auch "besser" ist. Intuitiv verstehen wir das Konzept "Optimum" nicht, daß also ein Sweetspot existiert zwischen "zuwenig" und "zuviel". Auch deswegen gab es die Loudness Wars und gibt es jetzt die Core Wars.

Es gibt sicher Ausnahmen - kein Ohr ist gleich dem anderen, nicht mal unbedingt an derselben Person. Aber es ist zumindest bisher nicht nachweisbar gewesen, daß 24bit sich "besser" anhören (oder überhaupt erstmal "anders") als 16. Oder 32, was das angeht. Ob das also DVD Audio war oder SACD oder "billiges" Red Book ist erstmal Nebensache. Ein Ohr hat nunmal nur eine beschränkte natürliche Auflösung, ebenso wie Augen oder Nasen oder sonstwelche anderen Sinnesorgane; entsprechend wird auch irgendwann der Punkt da sein, wo es dann egal ist, ob der TV 64K war oder 128K, weil unterscheiden können wir DAS beim besten Willen eh nicht mehr, egal wie nah (oder weg) dran wir uns befinden.

Relevanter ist der Aufnahmeprozeß bis hin zum Mastering. Alles was nicht aufgezeichnet wurde... fehlt. Und manchmal hat halt der Künstler einen besseren oder schlechteren Tag. Da ist es dann auch egal, ob die Transportkette hinterher "verlustfrei" war: wenn das Micro nur 64kBits/s geliefert hat, dann kann man das hundertmal in FLAC packen, die Qualität wird trotzdem nicht besser.

Relevanter ist auch ein natürliches Modell für die Aufnahme ebenso wie die Wiedergabe. Ein einzelnes Micro kann nicht stereophon aufnehmen und eine Soundbar nicht stereophon wiedergeben, ebenso wie ein Kopfhörer keinen Surroundsound wiedergeben kann. Psychoakustische Modelle, die dem entgegenwirken sollen, sind exakt das: sie gaukeln uns vor, Dinge wahrzunehmen, die nicht da sind. Das klappt bis zu einem gewissen Punkt, aber irgendwann geht es schief, und wie gut es ist, sich an derartige Vorspiegelung falscher Tatsachen zu gewöhnen, womöglich bis zu dem Punkt, wo man Realität nicht mehr von Illusion unterscheiden kann.... mag jeder für sich selber entscheiden.


Aber wie gesagt, umfangreiche und sehr viel besser erklärt, als ich das jemals könnte, Artikel und Diskussionen zum Thema gibt's überall im Netz zu finden. Einfach mal die Suchmaschine der Wahl anstrengen.
 
  • Gefällt mir
Reaktionen: Der Kabelbinder und Gee858eeG
Multivac schrieb:
zwischen zwei punkten gibt es beliebig viele Punkte.

Digital und Analog Denken geht halt nicht gleichzeitig ... denn genau das ist das Problem das man digital nicht diese beliebig vielen Punkte darstellen kann.

https://de.wikipedia.org/wiki/Samplingtiefe#/media/Datei:4-bit-linear-PCM.svg

da sieht man es doch schon genau das die Rote Linie als Analog Singnal ganz andere Stufen erreicht als das digitale Pendant ... Der Computer berechnet dabei nicht die Kurve neu sondern setzt die Treppen um mehr nicht.

Eine Analoge Kurve kannst du durch Formeln so genau beschreiben das du jedes kleinste Detail abstufen kannst.

Digital schaut das anders aus ... 16 bit bedeutet halt das man ein gewisse Auflösung hat ergo Treppen ... bei 24 bit sind das halt mehr daher werden mehr Details darstellbar.

zum SNR ...
https://de.wikipedia.org/wiki/Signal-Rausch-Verhältnis

Warum sollte es schlecht sein wenn man den gesamten Umfang des Hörens nutzen kann um gleichzeitig leise und seichte Stellen wiederzugeben um dann nach ein paar Sekunden die volle Dröhnung zu haben ?

Boah war das damals schon ein unterschied zwischen Soundblaster 2.0 und einer AWE 32 ...

Weiterhin kennen wir das Problem doch schon von der Farbtiefe 16 bit und 32 bit und auch mehr ... das ist nichts anderes sind auch nur Wellen mit einer gewissen Genauigkeit .
 
lamda schrieb:
Oder man lässt die stufen halt gleich groß dann sind mehr Stufen gleich mehr Lautstärke.
Und wenn man sie nicht gleich groß lässt, sind mehr Stufen eine feinere Auflösung.
 
Eigentlich wollte ich mich hier ja lieber Zurückhalten. da zu viel Halbwissen.

@RalphS
Die Frequenz liegt auf der Zeitachse! wir sprechen hier von der Magnitude des Signals.

>Resonanzen gibt und nichthörbare Töne (wegen 24bit) plötzlich verfälscht hörbar werden
mein auto rappelt ab 50kmh ich bin der Meinung 50kmh sollte allgemeines Tempolimit werden. Es gibt gutes und schlechtes Equipment.
>Aber es ist zumindest bisher nicht nachweisbar gewesen, daß 24bit sich "besser" anhören
Quelle wäre schön.

@xxMuahdibxx
Habe ich auch nicht gesagt. die frage ist wie viele unterscheidbare werte braucht es um aus dem wertkontinuierlichen Audiosignal ein wertdiskretes zu quantizieren mit ausreichender genauigkeit fuer gutes hifi. also einfacher gesagt Analog zu Digital zu Analog. sollte das Digital 16bit oder 24bit haben und wenn warum?
 
Zuletzt bearbeitet:
@Multivac
und hier ab Minute 9 noch was Interresanten dazu, wobei das ganze Video echt passend ist.
Speziell auch Minute 17.xx für die frage Analog zu digital und zu analog zurück.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Multivac
Es gibt keine "Stufen"!!! Ein D/A Wandler rekonstruiert aus den Daten ein analoges Signal. Diese Stufendarstellung, die man immer sieht, und diese feineren Stufen, die dann bei einer höheren Samplingrate/Bittiefe als "Argument" für eine genauere Wandlung herhalten muß, ist Quatsch. Zumindest bis 16 bit/44 kHz (22 kHz max. Signalfrequenz). Und da machen meine Ohren schon viel früher schlapp.

Wer einmal xiph gelesen und verstanden(!) hat, der braucht kein "Hi-Res" mehr.

Ich hab auch ein paar hochauflösende Musikdateien, hin bis zu 32bit/192 kHz. Wenn man sich mal so eine Datei in Audacity im Spektrographen anguckt, dann hat man "Musikanteile" bis vielleicht 25-30 khz und darüber kommt einfach nur noch "digitaler Müll".

Sämtlich hires-Dateien, die ich mit foobar auf 16/44 geschrumpft hab, klingen für mich absolut gleich (keine Chance im A/B Vergleich, die auseinander zu halten), müssen sie ja auch. Und ich hab keine Schrottanlage zuhause stehen.

Das gilt natürlich für Dateien, die man zum MusikHÖREN hat. Bei der Produktion im Tonstudio sieht das schon wieder ganz anders aus.
 
Zuletzt bearbeitet von einem Moderator:
  • Gefällt mir
Reaktionen: ChiliSchaf, RalphS und Der Kabelbinder
was "reicht" ist wie so oft gegenstand verschiedener meinungen.
und 16bit wurde nicht gewählt, weils sooo gut ist, es ist just good enough für den massenmarkt.
und es ist das, was ende der siebzigerjahre industriell machbar war, vorstellung 1981, marktverfügbarkeit 1982. was bedeutet: entwicklung der späten siebziger.
und es gibt halt leute, die hören die schwächen, weil das 16bit raster für das least signifikant bit doch vergleichsweise grob ist.
und es gibt andere, die hören das nicht, oder es ist ihnen wurscht. und das ist halt die mehrzahl, und kommerziell sind das die, die im einem massenmarkt zählen.

und meiner meinung nach weit mehr rolle als das format spielt, für was produziert wird.
popmusik z.b. ist in der mehrzahl für die wiedergabe auf low end billiggeräten optimiert, einfach weil die zielgruppe genau solche geräte verwendet.
was dann auf einer hochwertigen wiedergabeanlage entsprechend schlecht klingt.

was jemand als gutklingend erlebt, ist auch in hohem maße eine frage der konditionierung.
 
  • Gefällt mir
Reaktionen: muesler
Limitierender Faktor sind die Lautsprecher, Kopfhörer und die Räumlichkeiten in denen gehört wird.

Der Hype und die Diskussionen um verschiedene Aufzeichnungsverfahren liegt wohl daran das kaum jemand die ursprünglichen Signale kennt.
 
  • Gefällt mir
Reaktionen: Der Kabelbinder
Im Tonstudio wird eine möglichst hohe Auflösung verwendet, um das Audiosignal so genau wie möglich abzubilden. Beim Downmix für die Verbreitung fallen dann die "Kompressionsartefakte" nicht so stark ins Gewicht, da das Ausgangsmaterial "naturgetreuer" ist.
Ich z.B. nehme in meinem "Studio" mit 24 bit und 48 kHz auf...
Man kann das in etwa mit Short- und Longplay bei Videoaufnahmen vergleichen... Shortplay = bessere Qualität, benötigt aber auch mehr Platz...
 
lamda schrieb:
- 24bits sind aber für den Heimanwender entweder nutzlos oder, schlimmstenfalls, eher kontraproduktiv. 24bit Resolution heißt, ich kriege außer dem hörbaren Bereich auch noch jede Menge nicht-hörbare Frequenzen mit, kann damit also sinngemäß Katzenvideos drehen. Also für die Katz, meine ich. Die hören das nämlich noch.

Meinst du damit nicht eher die Samplingrate?

@lamda Hast du den Link aus dem anderem Thread gelesen? Da steht alles erklärt was du hier fragst.
 
@reobase
Welchen Link Aus welchem anderen Thread?
meinst du https://people.xiph.org/~xiphmont/demo/neil-young.html
Wen ja das habe ich gelesen. darauf beziehen sich ja einige meiner fragen

@whats4
Damit vertrittst du hier die Meinung der Mehr ist besser Fraktion.

@garbel
Ja richtig es gibt keine stufen.
Die stufen sind nur ein Artefakt der darstelleung.
Es gibt punkte auf verscheiden höhne die durch eine Funktion verbunden werden.

Wen alles richtig funktioniert dann gibt es nur eine (band limitierte) Funktion die duch genau all diese punkte geht.
das ist ganz grob die aussage von dem Nyquist–Shannon sampling theorem.
Aber mir gehts ja hier nicht um um das Zeit Raster sonder um das Amplituden Raster
(die Auflösung auf der anderen Achse)

Das eben jeder dieser punkte eine Diskrete Amplitude hat (irgend wo zwichen −32,768 to +32,767 im 16 bit falle)
führt dazu das, ein echtes Signal oder mathematisch berechnetes Signale auch mal irgend wo zwischen zwei diskreteren werten liegt.

Dan muss eben gerundet werden und das nächst best passende genommen werden.
Das führt zu https://de.wikipedia.org/wiki/Quantisierungsabweichung#Quantisierungsrauschen

@RalphS
Du verwechselst hier Sample Rate und Bit tiefe.

Um bei deinem Fernsehern Analogie zu bleiben.
Du sagst den unterschied zwischen 64K war oder 128K (Horizontale Pixel Auflösung) man unmöglich sehen deswegen ist es egal.
Aber das kommt doch darauf an wie groß mein Fernseher ist und wie nahe ich dran bin!
Habe ich ein Fernseher der nicht 1m breit ist sondern 32m dan löst der ja auch nicht feiner auf wie einm 2K Monitor
 
naja, sinnlos ist hohe auflösung natürlich nich ganz.
so verliert man durch kede bearbeitung, jeden effekt, immer, weil immer mit endlicher genauigkeit gerechnet wird, und diese verluste kaskadieren.
und mit 24 bit ist recht viel, was man verlieren kann, und es reicht noch immer.
drum arbeiten tonstudios so.

und zu den nichthörbaren frequenzen: klar stimmt das, daß man einen 30/40/+ bereich nicht hören kann als mensch, und selbst 20khz ist bestenfalls für entsprechend junge und noch nicht verschlissene leute direkt hörbar.

trotzdem ist der bereich wichtig, weil diese (nicht direkt hörbaren) frequenzen interferenzen mit durchaus hörbaren frequenzen bilden, und diese dadurch klanglich verändern.
und oft genug ist in dieser wechselwirkung der unterschied zwischen konserve und gutem klang zu suchen.

an sich hört der mensch sehr sehr gut, in dem bereich, der für den menschen am wichtigsten ist, und das ist, oh wunder, der bereich, in dem sich unsere sprache befindet. würden wir da noch besser hören, würden wir die luftmoleküle hören, die permanent aufs trommelfell einprasseln.

wenn man also davon spricht, daß viele tiere besser hören, so ist damit meist gemeint, daß viele die tieferen und höherem besser wahrnehmen als unsereiner.
daß der elephant und der wal mit tiefen gut können ist enenso nachvollziehbar, wie daß der insektenjäger gut mit hohen kann.
viele arten bewegen sich in dem für sie wichtigen bereich nah an der physikalischen grenze.

edit:
/me vertritt grundsätzlich niemals irgendwelche fraktionen.
 
whats4 schrieb:
trotzdem ist der bereich wichtig, weil diese (nicht direkt hörbaren) frequenzen interferenzen mit durchaus hörbaren frequenzen bilden, und diese dadurch klanglich verändern.
und oft genug ist in dieser wechselwirkung der unterschied zwischen konserve und gutem klang zu suchen.

Auch eine von vielen Behauptungen, die einfach so im Raum stehen.
 
Zurück
Oben