News Google Lyra: Effizienter Sprachcodec ist jetzt Open Source

Ist die Bitrate mit 3kb/s fix ?

Etwas mehr würde der Qualität sicher gut tun.
Den Einsatzzweck dafür sehe ich auch nicht.

Low Bandwith Audio Codec ist gut und recht.
Aber wer will sich die Qualität wirklich antun und welche Verbindung ist wirklich so schlecht?

Der Einzige Anwendungszweck der mit einfällt ist:
Audio auf Handys mitzuschneiden ohne auffällig viel Daten zu produzieren.

Wenn das häppchenweise nach Hause geschickt wird, merkt das kein Mensch.
 
  • Gefällt mir
Reaktionen: KitKat::new()
IBISXI schrieb:
Ist die Bitrate mit 3kb/s fix ?

Etwas mehr würde der Qualität sicher gut tun.
Den Einsatzzweck dafür sehe ich auch nicht.

Low Bandwith Audio Codec ist gut und recht.
Aber wer will sich die Qualität wirklich antun und welche Verbindung ist wirklich so schlecht?

Der Einzige Anwendungszweck der mit einfällt ist:
Audio auf Handys mitzuschneiden ohne auffällig viel Daten zu produzieren.

Wenn das häppchenweise nach Hause geschickt wird, merkt das kein Mensch.
"The implications of technologies like Lyra are far reaching, both in the short and long term. With Lyra, billions of users in emerging markets can have access to an efficient low-bitrate codec that allows them to have higher quality audio than ever before. Additionally, Lyra can be used in cloud environments enabling users with various network and device capabilities to chat seamlessly with each other. Pairing Lyra with new video compression technologies, like AV1, will allow video chats to take place, even for users connecting to the internet via a 56kbps dial-in modem."

Finde die Qualität in den Demos übrigens ziemlich gut.
 
  • Gefällt mir
Reaktionen: chartmix
Interessant, so unterschiedlich können die Meinungen sein.

Für mich hört sich das einfach nur k***e an.
So schlimm, das es für mich eine Auswirkung auf das verstehen der Sprache hat.

Vielleicht ist das anders, wenn man Englisch als Muttersprache hat.
Da wäre ein Demo in Deutsch interessant.

Aber die Sache mit dem Usecase ist immer noch nicht geklärt.
Wenn man keine gute Datenverbindung hat, kann man immer noch anrufen.

Und andere Codecs verbrauchen auch nicht einen Haufen Bandbreite.
Wer hat noch 56k Modems und kann nicht telefonieren?
 
Auf dem Google AI Blog gibts etwas weiter unten noch ein paar Hörbeispiele, die besser klingen als in dem Video. LPCNet scheint sogar noch etwas besser zu klingen.

Edit: LPCNet taugt laut eigener Aussage (noch) nicht für Real-Time Anwendungen. Na vielleicht kommt das noch.
 
chartmix schrieb:
Und? Ist doch auch free software (Apache Lizenz).
Also welche Abhängigkeit bzw. welches einsperren liegt hier vor?
Natürlich ist man OpenSource möglichst frei, das heißt aber nicht das man komplett frei und Unabhängig ist. Software ist allgemein etwas komplexes und benötigt einarbeitung und relativ viel Zeit. Was ist wenn Bazel plötzlich etwas implementiert, das dir nicht gefällt? Natürlich du kannst es forken, aber dann musst du dich um Bazel und das Programm tun oder jemand anders. Oder du wechselst mal ganz einfach das Build System.

Ich sehe es als falsch OpenSource / ClosedSource als binär anzusehen, es gibt wie so oft viel mehr Aspekte.

Wenn Google am Ende alle Tools liefert bestimmen Sie die Richtung auch wenn man dank OpenSource einfachst ausbrechen kann.
Das Grund System Android und Chromium ist auch OpenSource. Was wird am meisten genutzt?... Naja den meisten ist es wohl auch egal und finden es ok, dennoch ist es kein Katzensprung da wieder rauszukommen falls man will... Android ist auch ein gutes Beispiel wie man dann über die Zeit den Spieß umdreht und langsam die Leute darin einsperrt.

Aber wenn du das zu aluhutmäßig findest, dann tu das, ich wollte das nur kommentieren und nicht Leute die absolut nicht meiner Meinung sind überzeugen... das ist nur verschwendete Zeit.

Lyra ist da definitiv was harmloseres... aber Software ändert sich ab und zu auch und Lizenzen sind auch nicht in Stein gemeißelt... ich wollte nur mal darauf hinweißen... was Google mittlerweile an Software / Tools / Frameworks zu bieten hat ist schon krass, dass das alles nur aus reiner Nächstenliebe geschieht, daran glaube ich nicht mehr.
 
Woookie schrieb:
Die Qualität der Referenzschnippsel ist echt erstaunlich, verglichen mit anderen Codecs die bei 3-6kBit/s kaum noch nutzbar sind. LPC10 geht bei 2,4kBit/s noch, aber das ist dann schon sehr roboterhaft.
Nur mal als Vergleich: GSM braucht 13kBit/s in Fullrate als Low-Bandwith :D
Stimmt, allerdings sind LPC10 oder GSM-FR Codecs welche mit der Rechenleistung auskommen mussten welche mit akkubetriebenen Chips vor 30 Jahren bereitstellen konnten.
Das mussten Algorithmen sein welche mit deutlich(!) weniger Rechenoperationen auskommen im Vergleich zu Google Lyra oder LPCNet.
Mit der verfügbaren Rechenleistung von heute sind adaptive, dynamische Filter und das passende Synthetisieren von Obertönen möglich, so dass die Sprache recht natürlich klingt.

LPCNet basiert auf Codec2, meines Wissens nach. Codec2 (ebenfalls LPC-basiert) alleine klingt zwar besser als LPC10, aber ansonsten auch nicht so dolle.
 
Zuletzt bearbeitet:
IBISXI schrieb:
Ist die Bitrate mit 3kb/s fix ?

Etwas mehr würde der Qualität sicher gut tun.
Den Einsatzzweck dafür sehe ich auch nicht.
Der Einsatzzweck ist doch in dem Video von Google dazu klar erklärt - den Sprachkanal mit minimaler Bandbreite "am Leben lassen". Egal wie voll das Netzwerk ist - und das ist häufiger ein Problem, wenn man nicht gerade in den heimischen vier Wänden mit Breitband sitzt.
Für Höhere Bandbreiten gibt es genug Alternativen, aber mit 56kBit/s könntest du da 18 Gespräche vermitteln (bzw. auf einer ISDN-Leitung 21) - das ist schon eine Hausnummer.
 
###Zaunpfahl### schrieb:
Wenn Google am Ende alle Tools liefert bestimmen Sie die Richtung auch wenn man dank OpenSource einfachst ausbrechen kann.
Ich verstehe es nicht. Was bringt einen bei diesem Projekt in eine spezielle Googleabhängigkeit, die einen auf Dauer einsperren soll?
Das kann dir genauso bei jeder anderen Firma, Organisation oder Person passieren, die ein solches Projekt auf die Beine stellt.
Und niemand handelt aus purer Nächstenliebe.
 
Woookie schrieb:
den Sprachkanal mit minimaler Bandbreite "am Leben lassen". Egal wie voll das Netzwerk ist -

Genau, der Sprachkanal hat ja eine Sonderleitung :D, unabhängig von der Netzauslastung.

Wenn ein Netz voll ist, steigt die Latenz und das hat sogar Auswirkungen auf einen einfachen Ping.
Und auch normale Sprachcodecs sind selten an einer hohen Auslastung schuld.

Bringt... 0,0
In Zeiten von 56k Modems wäre das eine Revolution gewesen, aber jetzt?
 
Zuletzt bearbeitet:
Zurück
Oben