Notiz Microsoft Teams: Maschinelles Lernen hilft bei der Erkennung von Musik

Wieso nicht einfach rausfiltern? Wäre ein besseres Feature meiner Meinung nach. Keine Lust Musik mehrmals täglich an/aus machen wegen Meetings.
 
  • Gefällt mir
Reaktionen: Mar1u5, cbtestarossa, Mr Peanutbutter und 2 andere
chb@ schrieb:
Wieso nicht einfach rausfiltern? Wäre ein besseres Feature meiner Meinung nach. Keine Lust Musik mehrmals täglich an/aus machen wegen Meetings.
Das rauszufiltern ist sehr sehr schwierig, weils eben nicht einfach eine bestimmte frequenz sondern ein breites spektrum ist.

Du müsstest theoretisch das original-stück negieren einspeisen und damit den input überlagern; praktisch wie typischerweise ANC funktioniert, wenn ich nicht irre.
 
  • Gefällt mir
Reaktionen: Mar1u5, flo.murr und HaZu
Spike Py schrieb:
Du müsstest theoretisch das original-stück negieren einspeisen und damit den input überlagern; praktisch wie typischerweise ANC funktioniert, wenn ich nicht irre.
Macht die "KI" für dich:

 
  • Gefällt mir
Reaktionen: floTTes und NMA
Warum?

Ich habs drei Mal gelesen... aber ich verstehe es nicht.
 
  • Gefällt mir
Reaktionen: ChavezD, Mar1u5, FrAGgi und 15 andere
Könnte ja sein, dass du deinen Vortrag mit ein paar epischen Klängen untermalen willst.
Das hört sich bei niedrigen Bitraten nicht so an wie du dir das vorstellst
 
  • Gefällt mir
Reaktionen: USB-Kabeljau
Spielwiese für Entwickler.
Den Nutzen verstehe ich nicht. Teams wird doch überwiegend fürs Arbeitsumfeld genutzt. Musik hat da nichts zu suchen, außer man ist Musiker, dann aber das "Feature" in besserer Qualität bringen.
:freak:
 
  • Gefällt mir
Reaktionen: theoutsider, Mar1u5, Bright0001 und 5 andere
hRy schrieb:
Musik hat da nichts zu suchen, außer man ist Musiker,

Ehrlich gesagt werde ich da auch nicht ganz schlau...

So wie ich das jetzt kapiere kann mittem im Call jemand eine Gitarre auspacken und anzufangen zu spielen.
Dann wird Musik erkannt und der AudioCodec gewechselt zu 128kbits?
Was nützt Teams eigentlich? AAC? bestimmt nicht Vorbis oder?
 
  • Gefällt mir
Reaktionen: USB-Kabeljau und Fritzler
Musikunterricht?

Mal schauen was rauskommt.

Ich war überrascht wie viele Hürden es gibt für das was uns selbstverständlich erscheint wenn es um Sprache, Musik und generell Ton geht. Viele Probleme scheinen aber auch gelöst.

Zuletzt hat mich der Karaokemacher überrascht. Adeles "Easy on me" durch ein Programm gejagt und man hat zwei Tracks. Nur Gesang und nur Instrumente. Letzteres mit per Spracherkennung generierten Text zum mitsingen.

Da scheint mir MS Ansatz nicht überambitioniert? Endlich diesen Krach wegfiltern und nur richtige Musik durchlassen. :)
 
KitKat::new() schrieb:
Macht die "KI" für dich:

Aber funktioniert das auch bei Musik? Das Beispiel des Baby-Geschreis ist relativ simpel aber Musik kann so unterschiedlich sein -- das zuverlässig zu erkennen und herauszufiltern ist nochmal ein anderes Level.

Aber ich glaube ich hab den Artikel initial nicht ganz richtig verstanden. Es geht nicht darum Musik herauszufiltern, sondern zu erkennen und dann eine qualitativ bessere Übertragung zu aktivieren.
 
Bei Microsoft hat wieder jemand einen Popel entdeckt, jetzt muss das irgendwie als Feature einziehen.

Dabei läuft der Müll jetzt schon nicht gescheit...
 
  • Gefällt mir
Reaktionen: Dowinder, Zwenki und konkretor
Die sollten ihre Zeit lieber mal darein investieren, dass das Programm nicht schneckenlahm ist. Und der Chat nicht mal IRC das Wasser reichen kann.

Hätte MS nicht einfach Slack kaufen und ausschlachten können?
Ihren ganzen SharePoint-Collaboration-Mist hätten sie auch da dran flanschen können...
 
  • Gefällt mir
Reaktionen: Zwenki
Ich nehme an, das ist bereits Standard bei all den "Rechteverwertern" um Musikschnippsel in Youtube Videos zu finden (Das funktioniert so "gut", dass ein im Hintergrund vorbei fahrender Krankenwagen geclaimed und das Video entmonetarisiert wird) und M$ hat einfach einen unkomplizierten Weg gefunden dies in Teams zu integrieren und verkauft das jetzt als revolutionäres Feature ... Um offen die Software so zu verändern, dass sie mit hört und die Leute im Endeffekt "indirekt" darüber zu informieren, dass sie abgehört werden.

Selbstverständlich erhält der Nutzer die "Option" das alles abzustellen, aber 99% aller Anwender machen das eh nicht und man kann so schön seine "KI" trainieren ... Auf was auch immer man möchte.
 
Hab das jetzt zweimal gelesen, verstehe aber trotzdem noch Sinn dieses Features nicht. Was genau will Microsoft damit erreichen? Wenn ich in einer Teams-Konferenz bin, dann sollen die anderen meine Hintergrundgeräusche (Musik!) durch KI verstärkt mithören?
 
  • Gefällt mir
Reaktionen: 7H0M45
Na dann hoffen wir mal, dass TEAMS dann nicht auch gleich die GEMA informiert. XD

Kann Teams inzwischen eigentlich endlich Push to Talk?
Diese Funktion vermisse ich immer wieder, wenn ich das Programm auf der Arbeit verwenden muss.
 
  • Gefällt mir
Reaktionen: konkretor
RTX Voice nutzen, das funktioniert für Senden und Empfang und nicht nur für Musik. MS hängt da hinterher. Das Tool erzeugt im Prinzip eine virutelle Karte und tunnelt alles gefiltert durch. Man kann die Karte dann in jedem Programm auswählen, Teams inklusive.

Wenn ihr keine Lust auf Chips futtern von anderen in Games habt, einfach rausfiltern. Mir bleibt es ein Rätsel warum Unternehmen immer auf MS Produkte setzen. Man muss den Kram so tief in die Infrastruktur einbauen, dass man Jahre braucht um auf etwas besseres umzustellen.

Wir haben Skype in der Firma, finden alle ätzend und wollen Teams, bekommen es aber nicht so einfach los, da es dann auch noch mit den Kalendern / Outlook gekoppelt ist. Wird sich mit Teams wiederholen.
 
Zuletzt bearbeitet:
Spike Py schrieb:
Aber funktioniert das auch bei Musik? Das Beispiel des Baby-Geschreis ist relativ simpel aber Musik kann so unterschiedlich sein -- das zuverlässig zu erkennen und herauszufiltern ist nochmal ein anderes Level.
Es wird alles SEHR zuverlässig rausgefiltert, vorausgesetzt es ist keine menschliche Stimme. Benutze es selber, solange die Musik keine Stimme hat (oder zumindest keine menschliche), wird es nahezu perfekt rausgefiltert. Hatte den ein oder anderen Partner im Studium, der meint Open Mic nutzen zu müssen und dabei Musik über Lautsprecher abzuspielen (wenigstens ohne Lyrics). Ohne Nvidias KI hätte ich da einfach aufgelegt und gesagt er soll schreiben wenn was ist.

Je nach Art des Gesangs wird übrigens auch dieser relativ gut rausgefiltert.

Wer es mal selber nutzt wird überrasscht sein, wie gut gefiltert wird und wie gut noch die Originalstimme erhalten bleibt. Besonders im Vergleich zu sowas wie Discords Krisp. Da kommt nämlich noch so einiges durch und die Originalstimme verliert auch sehr deutlich an Qualität.

Tatsächlich einer der Hauptgründe für ne Nvidia Karte meinerseits. Aber ich hab auch viele Freunde mit klackernden Keyboards und schlechten Mikrofonen. Wünschte mir wirklich Nvidia würde das mal an Gamer vermarkten - also in Sinne von das als Feature in Games einzubauen. Den momentan läuft der Voice Chat in Games meistens über den selben Kanal wie der Spielton, weshalb man diesen nicht filtern kann. (Und Onlinespiele haben es echt nötig, gefühlt jedes dritte Match kommt einer mit nem Open Mic und Düsenjet oder extra lautem Keyboard daher - klar kann man die muten - hört aber halt auch nicht mehr wenn die was relevantes sagen)
 
  • Gefällt mir
Reaktionen: Mordi und Spike Py
Ich hab das nVidia-Tool auch mal getestet in Teams aber festgestellt, dass das einiges an Latenzen auf den Input gibt. Dadurch gab es häufig kollisionen im Dialog mit Kollegen was das ganze sehr unangenehm gemacht hat. Bei einem Monolog wie beim Streamen unproblematisch aber beim Dia-/Trilog (oder noch mehr) mit Kollegen leider daher keine Lösung für mich.
 
  • Gefällt mir
Reaktionen: pumuck|
Dann muss da aber was falsch laufen. Bei mir gibts gefühlt 0 Verzögerung. War teilweise schon mit 8 Leuten im Discord Call und benutze es allgemein immer bei Online Vorlesungen über Teams (weil selbst manche unserer Profs schlechte Mikrofone und klackernde Tastaturen haben :/)

Auch wenn ich mit Kumpels im Discord und gleichzeitig Ingame Voice Chat bin (vergesse ich Anfangs immer Ingame zu muten) kommt der Ton sowohl gefiltert über Discord als auch ungefiltert Ingame nahezu zeitgleich an.

Man muss halt auch sagen, dass RTX Broadcast ein bisschen verbuggt ist. Musste ich schon manchmal neustarten, weil gar kein Ton oder ein Hintergrundrauschen kam. Vtl. gabs damals nen Bug mit ner Verzögerung o.Ä.

Zu viele Hintergrundprogramme oder zu schwache GPU kann ich mit kaum vorstellen. Hab zwar ne 3090, aber selbst wenn die 100% ausgelastet ist und ne Shadowplay Aufnahme läuft, hab ich keine Verzögerung. Auch schon von Leuten mit zbs. 2060ern gelesen, dass es einwandfrei läuft.

Edit ah auf den Input - also wenn du redest? Das hab ich nie getestet. Filter immer nur andere. Hab mein Mikrofon schon an sich stundenlang eingestellt, sodass ich ne zusätzliche Filterung nicht brauche :p.
 
  • Gefällt mir
Reaktionen: Mordi
Es gibt so viel bei Teams das verbessert werden könnte bzw. müsste und die verschwenden ihre Zeit mit solchen Gimmicks.... Super
 
  • Gefällt mir
Reaktionen: Flywolf, Zwenki, Gnarfoz und eine weitere Person
Zurück
Oben