Hörexperiment im Rahmen meiner Diplomarbeit

ReLaX1982

Cadet 2nd Year
Registriert
Juli 2009
Beiträge
18
Es geht hier um einen subjektiven Test für sprachverbesserte Signale,
die in gestörter Umgebung entstanden sind bzw. simuliert wurden.

Dabei wird im Normalfall eine Standardroutine (bzw. ein Filter) verwendet.
Die Aufgabe besteht nun darin durch einen neuen Ansatz die Effizienz
zu steigern. Ein rechnerischer Test hat schon positive Resultate meines entwickelten
Algorithmusses hervorgebracht.

Nun möchte ich den subjektiven Test mit Leuten durchführen, die ca. eine halbe
Stunde Zeit
opfern, um den Test durchzugehen.
Vor Ende der Testreihe möchte ich natürlich nicht preisgeben, welcher Modus
jetzt rechnerisch besser war. Das verfälscht nur den Hörtest.

Zu jeder der 25 Datei sind 4 versionen verfügbar:

z.B. für wav_auto1:

bank -> Originalfile ohne Rauschen
bank_auto1 -> Originalfile plus Auto1 als Rauschquelle
bank_auto1_nr -> Sprachverbesserungsmodus 1
bank_auto1_s -> Sprachverbesserungsmodus 2

Zum Durchführen des Testes hört man sich eigentlich nur beide Modi an.
Bitte wenns geht ordentliche Boxen benutzen und relativ laut abspielen.
Dann bitte ich euch zu entscheiden, welches File (_s oder _nr) davon
authentischer bzw. besser verständlich ist.

Kriterien können sein: Ähnlichkeit der menschlichen Stimmer oder auch Störungen im Signal.
Wer möchte kann sich das Original- oder das verrauschte File auch anhören,
um mehr Einblicke zu gewinnen oder seine entgültige Entscheidung zu füllen.

Bitte immer eine Entscheidung fallen und im entsprechenden Feld eine "1" eintragen.
Bauchentscheidungen sind denke ich bei vielen Daten von Nöten, da der rechnerische
Test zwar Verbesserungen zeigte, diese aber z.T. gering ausfiehlen.
Wer sich unsicher ist, einfach beide Files nochmal anhören und abwägen.

Für mich ist jedes Ergebnis okay, dann eine rechnisch bessere Sprache muss
nicht zwangsläufig auch subjektiv besser empfunden werden.

Der Ablauf des Hörtestes ist auch im Files selber beschrieben, außerdem ist ein
Beispiel (MaxMustermann.ods und *.xls) dabei, welches nochmal alles wiederspiegelt.

Ich bedanke mich schonmal im Vorraus für alle Probanden und hoffe auf zahlreiche Tester,
um ein relativ gut auswertbares Ergebnis erzielen zu können.


Die Tabelle bitte im gewünschten Format hier upzuloaden oder mir per Mail zu schicken.
Aktuell werde ich den Test bis Abends 28.07.2009 laufen lassen.
Dies kann sich aber noch nach hinten verschieben, werde aber dann darauf hinweisen.


Hier die Daten per Zip oder rar:
-- Testdatendownload (rar) --
-- Testdatendownload (zip) --

Hier die Tabellen in Excel oder für OpenOffice
Excel-Dateien
Open-Office-Daten

mfg
ReLaX

PS: Wenn ich das falsche Forum erwischt habe, bitte ich um Verschiebung, danke!
 
Zuletzt bearbeitet:
AW: Höreperiment im Rahmen meiner Diplomarbeit

Ich habe den Test mal durchgeführt. Im Allgemeinen finde ich, dass die Stimme trotz Rauschen bei den Verrauschten Files am natürlichsten klingt. Ich weiß allerdings auch, dass es nicht möglich ist, aus einem fertigen Mix (was ja das Wavefile ist) ohne Verluste eine Bestimmte Stimme auszufiltern. Das Ergebnis kriegste mit Mail. Net dass man hier no andere beeinflusst.
 
AW: Höreperiment im Rahmen meiner Diplomarbeit

Ich habe auch eine Mail geschickt.

Grüße Philipp
 
Auch nicht schlecht, sich in einem Forum anzumelden für seine Diplomarbeit und kostenlose Helfer zu suchen.
Gibt ja zum Glück genug Leute die alles gern mitmachen.
 
ReLaX1982 das ist doch nicht dein ernst oder?

Bei jedem Hörer hast du angefangen von der Hardware bis hin zur räumlichen Umgebung komplett andere Bedingungen. Absolut 0 Vergleichbarkeit im Test.
Wir machen sowas bei meinem Arbeitgeber auch, allerdings in einem Schallschluckraum und entsprechendem Equipment.

Selbst wenn die geneigten Mit-Tester hier für eine ruhige Umgebung sorgen und sich wirklich auf deine Aufnahmen konzentrieren haben ihre Kopfhörer immernoch grundverschiedene Frequenzgänge.
Ich wette 50% der Zocker hier haben permanent irgendwelche Soundverschlimmbesserungen wie Dolby Headphone , CMSS, Crystalizer oder sonstwas aktiv.

Eine bessere/schlechtere Verständlichkeit ist im Endeffekt also nur zu einem kleinen Teil von deinen Referenzaufnahmen abhängig.

Wenn du nen halbwegs technisch versierten Prof hast wirst du wohl nicht umhin kommen deine Probanden alle am gleichen Equipment und unter gleichen Umgebungsbedingungen testhören zu lassen.

Wir haben bei uns jährlich mehrere Diplmonaten mit ähnlichen Arbeiten, von daher kriegt man schonmal mit was durchkommt und wo die Nachbesserungen fordern.
 
Auch nicht schlecht, sich in einem Forum anzumelden für seine Diplomarbeit und kostenlose Helfer zu suchen.
Gibt ja zum Glück genug Leute die alles gern mitmachen.
Die einen helfen, die anderen beschweren sich. Ich suche zu meinen Testhörern an der FH und auch unter Freunden noch einige andere aus dem und einem anderen Forum.

ReLaX1982 das ist doch nicht dein ernst oder?
Bei jedem Hörer hast du angefangen von der Hardware bis hin zur räumlichen Umgebung komplett andere Bedingungen. Absolut 0 Vergleichbarkeit im Test.
Wir machen sowas bei meinem Arbeitgeber auch, allerdings in einem Schallschluckraum und entsprechendem Equipment.
Ums mal kurz zu machen muss ich dir da rechtgeben, allerdings bekomme ich in der kurzen Zeit nicht alle an ein System, noch will ich den Hörern zumuten, dass diese sich zu viele Files anhören müssen. Irgendwann hört man automatisch auf auf kleine Veränderungen zu achten. Das verfälscht auch das Ergebnis. Es ist jetzt schon so, dass die 5 Rauschumgebung nur 2 Gruppen bilden, die kaum zu unterscheiden sind.

Danke schonmal an die, die mitgemacht haben.
 
Zuletzt bearbeitet:
@aldi... auch wenn es verfälscht ist, dann werden alle Dateien verfälscht! Das heißt man hört doch trotzdem einen Unterschied auch wenns nicht so klingt wie das Originalaufgenommene vom TE.
Ich hab mir getraut Teilzunhemen weil ich sagen kann das mein Soundequipment sich vom 13 jährigen Zocker hier abhebt.
 
Nein sorry, stimmt nicht.
Du weisst nie was im Soundpfad alles aktiv mitläuft.
Diese ganzen Soundveränderungsoptionen verändern das Spektrum sehr selektiv und sogut wie nie als ganzes.
Ein Detail in File A geht so z.B. relativ unverändert seinen Weg , während in File B ein Detail das sich nur eine Nuance davon unterscheidet von der Logik im z.B. Crystalizer als "verstärkenswerte Höhe" erkannt und demenstsprechend geboostet wird.

Obendrein brauchst du für echte Vergleichbarkeit sehr lineare Ausgabegeräte.
Wenn du z.B. ein hochfrequentes Warngeräusch untersuchst liegt eine Änderung von sagen wir mal 50Hz vielleicht genau auf der Grenze eines 08/15 Kopfhörers. Obwohl zwischen Ton A und B kein großer Unterschied besteht hast du durch nen abgeknickten Frequenzgang dann bei einem Ton 15dB weniger als beim anderen obwohl das so im Referenzgeräusch nicht vorhanden ist.

Ich sag das auch garnicht um Relax zu belehren, sondern um ihn davor zu bewahren viel Zeit in eine aussichtlose Sache zu stecken die , wie ich finde, vor keinem Prof bestand haben wird. Ne Diplomarbeit ist ne zeitintensive Sache die wohl keiner gern vor die Wand fährt.

Mein Tipp: Equipment organisieren, Freundeskreis als Probanden mobilisieren und das an einer Anlage in 2-3 Tagen am Stück durchziehen.
 
Zuletzt bearbeitet:
Ich weiß, dass die Übertragungsfunktionen durchaus andere sind und es Unterschiede gibt.
"Nur" unter Freunden wird die Anzahl zu gering.

Ich hab mir getraut Teilzunhemen weil ich sagen kann das mein Soundequipment sich vom 13 jährigen Zocker hier abhebt.
13-jährige Zocker machen hier ech nicht mit.

Werde aber mal schauen, ob ich die Ergebnisse noch separieren kann, sprich Online-Umfrage, Labor und zu Hause. Im Labor haben wir durchweg nur Sennheiser-Kopfhörer hoher Qualität.
Den genauen Frequenzgang kenn ich jetzt nicht. Außerdem hinkt das Beispiel mit dem Signalton, da ich Signale habe, die mit 8kHz abgetastet werden. Wer ein wenig Ahnung von der Materie hat, weiß welche Frequenzen im Signal überhhaupt nur enthalten sein können.

Für alle die, die nach rgebnissen fragen kann ich kann klar sagen, dass ich die nach Fertigstellung der Arbeit natürlich poste und ich im Gesamten den leuten danke, die teilgenommen haben.

mfg

PS: Tabellen könnt' ich auch hier uploaden ;)
 
Die Hardware ist doch nur die Hälfte deines Problems.
Was ist mit den Probanden selbst?
Bei uns gehen die durch nen intensiven Hörtest bevor sie für solche Versuche zugelassen werden.

Woher willst du wissen ob ein gewisses Signal unverständlich/zu leise ist oder ob dein Testhörer in diesem Frequenzbereich bereits ne leichte Hörschädigung hat? (In der Generation von heutigen Studenten bereits sehr sehr verbreitet dank Walkman, Disco & Co)

Ich z.B. habe auf dem rechten Ohr im Bereich zwischen 500 und 100 Hz einen ganz leichten Knick in der Hörkurve.
Das ist wirklich nicht viel , disqualifiziert mich aber schon für diese Versuche hier.

Also bevor du hier hunderte Stunden arbeit investierst solltest du dich vielleicht bei deinen späteren Prüfern absichern das denen diese herangehensweise genügt.
 
Zuletzt bearbeitet:
Was du hier schilderst ähnelt einer Marktforschung/untersuchung mit vielen Hunderten Probanden mit 100% denselben Vorraussetzungen. Es ist offensichtlich, dass man so einem Umfang in einer Diplomarbeit nicht leisten kann.

Nun mal zurück zum Thema.
 
Die Dimensionen sind völlig unwichtig, entweder eine Sache ist wissenschaftlich fundiert ermittelt oder eben nicht. Naja, viel Glück bei deiner Diplomarbeit.
 
Im Labor und an meinem Rechner habe ich ähnliche Systeme.
Um die Aussagekraft zu verstärken sind Online-Probanden mit ordentlichem Equipment, sprich Kopfhörern, gerne gesehen. Bei vielen Testern kann ich darüber nachdenken dass Ergebnis zu unterteilen.

Würde mich sehr freuen, wenn noch ein paar Leute aus diesem Forum teilnehmen, danke!

mfg
 
@aldi: Ich muss dir in dem Punkt rechtgeben, dass so ein Test in einer "geschützen" Umgebung, also sprich immer mit der gleichen Ausrüstung, gleicher Raum usw unter Umständen die bessere Aussagekraft hat.
Allerdings hängt so ein Hörtest meiner Meinung auch von dem späterem Einsatzgebiet ab. Wenn der Algorithmus mal in einer Software eingesetzt wird, die nicht nur von Profis im Studio oder ähnlichem eingesetzt wird, dann hat die Umfrage trotzdem einiges an Aussagekraft. Und zwar wie verschiedene Leute an verschiedenen Anlagen die Filter wahrnehmen.
Außerdem ist bei einer Samplingrate von 8kHz nicht davon auszugehen, dass eine Hifi-Anlage oder auch nur ein "normales" Gamingheadset das Frequenzspektrum nach oben hin begrenzen. Die höchste Frequenz die in der Datei vorkommt hat nur 4kHz. Dazu ist noch jedes Headset in der Lage...
 
Paar mal probieren, irgendwann kommt mal kein Fehler *g*
Sollte aber vll wirklich behoben werden.

EDIT: Habe mir die ersten beiden Ordner mal angehört.
Am angenehmsten ist ganz klar die Aufnahme mit Störgeräusch. Das kann man auch selbst gut ausblenden und man versteht die Person super.
Das jetzt ganz durchzuführen ist mir bissl zu aufwändig, vorallem da ich mal davon ausgehe, dass sich mein Eindruck nicht mehr ändern würde sondern immer das selbe bei mir raussprünge.

Denn, ohne jetzt die anderen beeinflussen zu wollen: Die nr Aufnahmen klingen, als hätten die Leute nen leichten Schnupfen und als wär die Datei schlecht komprimiert ;) Die Unterschiede im Störgeräusch sind vernachlässigbar zwischen den beiden.

Ich weiß, man kanns noch lesen, aber Leute die mitmachen wollen, müssen ja nicht so genau hingucken.
Mich würde aber später mal interessieren, ob das mehrere so empfinden, denn ich dachte nicht, dass es so offensichtlich ist.

Aber vll findest ja noch ein paar, die die Geduld haben ;)
 
Zuletzt bearbeitet:
Schlimm hier, da bittet einer ihm bei der Diplomarbeit zu helfen, und hier entsteht gleich eine Diskussion über Sinn und Unsinn, über Testparameter, über Umgebung, etc. etc.

Ich glaube, jemand der eine Diplomarbeit schreibt, wird schon nicht doof sein und die ganze Tatsachen hier schon überlegt und abgewägt haben.

Ich kann leider net testen, da ich derzeit kein Soundequipment habe.
 
Zuletzt bearbeitet:
Laar ich hoffe mal, dass du verstanden hast, wie der Test abläuft.
Es wird zwischen _nr und_s gewählt, nicht mehr nicht weniger.
 
Ja, schon klar. Ich käme aber bei allen Testdateien zu dem selben, doch recht eindeutigen Ergebnis. Fand ich nach deinem Einleitungstext, der eine schwere Entscheidung erwarten lies, erstaunlich.
Zusätzlich wollte ich nur noch anmerken, dass ich, unabhängig vom Test, garkeins von beiden einsetzen würde, sondern das Störgeräusch eigentlich unproblematisch finde.
 
Zuletzt bearbeitet:
Wie siehts aus, sind noch welche offen für den Test?
Dauert echt nur maximal 20 Minuten!
 
Zurück
Oben