Performancerating - Frage

Status
Für weitere Antworten geschlossen.

theorist

Lt. Commander
Registriert
Feb. 2008
Beiträge
1.527
Wie wird denn das Performancerating in den Computerbase-Artikeln ermittelt?
Werden die fps gemittelt oder werden die Verhältnisse bezogen auf eine bestimmte Karte gemittelt oder werden die Verhältnisse bezogen auf die jeweils schnellste/langsamste Karte gemittelt? Mathematisch korrekt wäre nur das zweite Verfahren und ich wollte eben sichergehen, dass Computerbase auch mathematisch korrekt arbeitet.

Zur Erklärung der drei Verfahren:

computerbase_ratingx7jx.png


Wie man sieht, unterscheidet sich das Rating je nach Rechenweise ganz erheblich. Verfahren 2 ist das einzige Verfahren, das ich als korrekt erachte.

/EDIT: Ich merke gerade, dass Verfahren 2 auch nicht wirklich sinnvoll ist:

computerbase_rating2h8y5.png


Offenbar muss man mit dem geometrischen Mittel arbeiten:

computerbase_rating3bm68.png


Das liefert gleiche Ratings, egal auf welche Karte man die Verhältnisse bezieht.
 
Zuletzt bearbeitet:
Wir verwenden deine "Variante 3". Mit der kleinen Anpassung, dass der Redakteur selbst festlegen kann, welche Grafikkarte als Referenzwert die 100% markieren soll.

(Wenn der Redakteur keine Referenzkarte auswählt, dann entsprechen die 100% einer gedachten "Über-Grafikkarte", die in jedem Benchmark den Bestwert erzielt).
 
Steffen schrieb:
Wir verwenden deine "Variante 3". Mit der kleinen Anpassung, dass der Redakteur selbst festlegen kann, welche Grafikkarte als Referenzwert die 100% markieren soll.
Also Variante 2?
Variante 3 ist auf jeden Fall unsauber und Variante 2 auch, wie man oben sieht. Je nachdem, welche Karte als Referenz gewählt wird, verändern sich die Verhältnisse. Wählt man Karte A als Referenz, ist Karte A im Rating um 50% schneller als Karte B. Wählt man Karte B als Referenz, ist Karte A sogar um 100% schneller als Karte B.

Steffen schrieb:
(Wenn der Redakteur keine Referenzkarte auswählt, dann entsprechen die 100% einer gedachten "Über-Grafikkarte", die in jedem Benchmark den Bestwert erzielt).
Was ist der Bestwert in einem Benchmark?

Mathematisch sauber erscheint mir nur, mit einer festgelegten, realen Referenzkarte und dem geometrischen Mittel zu arbeiten. Also entsprechend Verfahren 4. Hier ist es egal, welche Karte als Referenz gewählt wird, die Verhältnisse bleiben immer gleich.
 
Zuletzt bearbeitet:
Was ist der Bestwert in einem Benchmark?
Ich denke einfach mal das die besten Werte in allen Benches übernommen werden, wenn keine echte Karte als Referenz genommen wird.
 
Für jedes Diagramm einzeln wird zunächst der Bestwert gesucht. Das kann je nach Einheit (FPS oder Zeit in Sekunden) der kleinste oder größte Wert sein. Dann wird für jede Grafikkarte und jedes Diagramm der Quotient aus ihrem Wert und dem zuvor ermittelten Bestwert des Diagramms gebildet. Wenn das für alle Diagramme und Grafikkarten geschehen ist, wird je Grafikkarte das arithmetische Mittel ihrer Quotienten berechnet. Das ist das finale Ergebnis. Wenn ich deine Tabelle richtig verstehe, dann ist das Variante 3.

Es gibt nun noch die (häufig genutzte) Möglichkeit, dass der Redakteur explizit eine Referenz-Grafikkarte auswählt. Das führt dann optional noch anschließend dazu, dass das oben genannte "finale Ergebnis" jeder Grafikkarte durch das "finale Ergebnis" der Referenzkarte dividiert wird. Ich vermute das ist noch etwas anderes als deine Variante 2.

Zum geometrischen Mittel: Den von dir genannten Vorteil sehe ich ein. Ich frage mich aber, ob das geometrische Mittel nicht auch Nachteile hat.
 
Steffen schrieb:
Für jedes Diagramm einzeln wird zunächst der Bestwert gesucht. Das kann je nach Einheit (FPS oder Zeit in Sekunden) der kleinste oder größte Wert sein. Dann wird für jede Grafikkarte und jedes Diagramm der Quotient aus ihrem Wert und dem zuvor ermittelten Bestwert des Diagramms gebildet. Wenn das für alle Diagramme und Grafikkarten geschehen ist, wird je Grafikkarte das arithmetische Mittel ihrer Quotienten berechnet. Das ist das finale Ergebnis. Wenn ich deine Tabelle richtig verstehe, dann ist das Variante 3.
Ja, klingt nach Variante 3.
Dass die Methode unsauber ist, kann man sich mit einem ganz einfachen Beispiel klar machen:

computerbase_rating4d63r.png


Wenn man nur die Karten A und B auswertet und C außer Acht lässt, sind A und B im Ranking gleich schnell. Macht auch Sinn, denn in dem einen Benchmark ist Karte A um 33% schneller, im anderen Benchmark Karte B um 33%.
Nimmt man nun Karte C dazu, ändern sich auf einmal die Verhältnisse und Karte B ist im Ranking schneller als Karte A. Jeder, der einen kurzen Blick auf die Frameraten in den Benchmarks wirft, wird doch dann sagen: "Kann nicht sein, A und B sind im Mittel gleich schnell."
Die Methode hat einen systematischen Fehler. der das Ranking verzerrt.

Steffen schrieb:
Es gibt nun noch die (häufig genutzte) Möglichkeit, dass der Redakteur explizit eine Referenz-Grafikkarte auswählt. Das führt dann optional noch anschließend dazu, dass das oben genannte "finale Ergebnis" jeder Grafikkarte durch das "finale Ergebnis" der Referenzkarte dividiert wird. Ich vermute das ist noch etwas anderes als deine Variante 2.
Ja, das ist was anderes als meine Variante 2. Bei der Wahl der Grafikkarte durch den Redakteur geht es offenbar nur noch darum, was der Bezugspunkt für 100% im Ranking ist. Den kann der Leser auch selbst wählen, wenn er mit der Maus über eine Grafikkartenbezeichnung fährt.

Steffen schrieb:
Zum geometrischen Mittel: Den von dir genannten Vorteil sehe ich ein. Ich frage mich aber, ob das geometrische Mittel nicht auch Nachteile hat.
So spontan fällt mir keiner ein. Das geometrische Mittel verwendet man, wenn man Verhältnisse mitteln möchte. Genau das ist ja hier die Aufgabe.
/EDIT: Ein Nachteil fällt mir gerade ein. Wenn eine Karte in einem Benchmark kein Ergebniss erzielt (z.B. wegen Absturz oder Inkompatabilität) und in diesem Einzelfall mit 0,0 fps gewertet werden würde, liefert das geometrische Mittel auch 0 zurück. In diesem Fall müsste man auf eine Wertung dieses Einzelbenchmarks für diese Karte verzichten.

P.S.: Aufgrund der großen Anzahl von Benchmarks wird das Rating nicht wesentlich von der Wahl des Verfahrens abhängen. Die systematischen Fehler mitteln sich quasi raus. Aber ich fände es dennoch schöner, wenn man ein von Grund auf solides Verfahren wählt und sich nicht auf eine große Anzahl von Benchmarks verlässt. Und dieses solide Verfahren ist mein Verfahren 4 (siehe Startposting), d.h. eine Referenzkarte für die Ermittlung der Verhältnisse in allen Einzelbenchmarks festlegen und die Verhältnisse dann geometrisch mitteln.
 
Zuletzt bearbeitet:
Das ist gut, dass du den Thread aufgemacht hast, ich finde dieses Thema ist nämlich stark umstritten:
Wenn man Verfahren 1 anwedet erscheint es mir am saubersten, da man bei jeder Grafikkarte alle Benchmarks zusammen-zählt, um ein endergebnis zu erlangen, welches aussagt, wieviel die Grafikkarte leistet.

Andernfalls ist es ja logisch, wenn Gra1 in Titel 1 drei mal so schnell ist wie Gra2, aber in einem anderen Titel gleichschnell, so ist es ebenfalls logisch, dass sie mittel betrachtet 2mal so schnell ist.

Verfahren 1 bezieht allerdings nicht mit ein, dass die einen Spiele schneller laufen (um die 60fps), als die anderen (um die 10fps), das bedeutet, dass die Spiele, daie allsamt langsamer laufen (um die 10fps) komplett an bedeutung verlieren.
Genausogut könnte man den schnelleren Titel nehmen, und seinen Wert durch 2 teilen (zum beispiel wenn titel 2 0-1fps macht).

Also finde ich Verfahren 1 klingt ersteinmal gut, ist aber völlig falsch.

Verfahren 3 finde ich sehr gut
 
LukasKnapstein schrieb:
Verfahren 1 bezieht allerdings nicht mit ein, dass die einen Spiele schneller laufen (um die 60fps), als die anderen (um die 10fps), das bedeutet, dass die Spiele, daie allsamt langsamer laufen (um die 10fps) komplett an bedeutung verlieren.
Genau das disqualifiziert Verfahren 1. Es fließen nur die Benchmarks mit den höchsten fps-Werten maßgeblich ein.

LukasKnapstein schrieb:
Genausogut könnte man den schnelleren Titel nehmen, und seinen Wert durch 2 teilen (zum beispiel wenn titel 2 0-1fps macht).
Wenn du die fps alle auf ein bestimmtes Niveau anpasst, landest du doch schon bei Verhältnissen der einzelnen Grafikkarten zueinander. Also bei den Verfahren 2 bis 4.

LukasKnapstein schrieb:
Also finde ich Verfahren 1 klingt ersteinmal gut, ist aber völlig falsch.
Richtig, es ist Humbug. Ist zwar für den Laien am Verständlichsten, aber das Ziel soll ja sein, ein repräsentatives Rating zu gewinnen und nicht Mathe für Nixblicker mit völlig sinnlosen Ergebnissen zu betreiben.

LukasKnapstein schrieb:
Verfahren 3 finde ich sehr gut
Schau mal mein Posting über deinem an. Zwei im Schnitt gleichschnelle Grafikkarten sind im Rating auf einmal nicht mehr gleichschnell, wenn man weitere Grafikkarte mit einbezieht. Also untauglich. Ist aber das Verfahren, dass CB verwendet.

Verfahren 4 ist sinnvoll.
 
Variante 1 ist totaler Bullshit! Hier ein Beispiel mit von mir ausgedachten Zahlen

BioShock: HD4870 (200 FPS), GTX-280 (150 FPS)
Crysis: HD4870 (25 FPS), GTX-280 (45 FPS)

Verfahren-1:
Mittlere FPS: HD4870 (112,5 FPS), GTX-280 (97,5 FPS)
-> HD4870 hat 115% der Performance einer GTX-280


(Imo) Korrekt wäre:
BioShock: HD4870 (130%), GTX-280 (100%)
Crysis: HD4870 (55%), GTX-280 (100%)
-> HD4870 hat 92,5% der Performance einer GTX-280
 
eXEC-XTX schrieb:
(Imo) Korrekt wäre:
BioShock: HD4870 (130%), GTX-280 (100%)
Crysis: HD4870 (55%), GTX-280 (100%)
-> HD4870 hat 92,5% der Performance einer GTX-280

Bei der von mir propagierten Variante (Variante 4) komme ich auf rund 85% für die HD 4870. Du verwendest das arithmetische Mittel, das zu Problemen führt (siehe Startposting Variante 2a und 2b).
 
Mal ein kleiner Test, wie würdet ihr die folgenden Karten in einem Rating zahlenmäßig einordnen:

grakabenchq6fd.png


Seht ihr es auch so, dass Karte A gegenüber Karte B prozentual genauso viel schneller ist wie Karte B gegenüber C?
 
Zuletzt bearbeitet:
Hmm, realistisch betrachtet würde ich aus so einer kleinen Anzahl von Benchmarks kein Rating bilden. Karte 2 kann in ausgewählten Situationen gleich schnell sein wie Karte C, oder gleich langsam wie A. Ob ein Wert davon gar ein Ausreißer nach oben oder unten ist, weiß ich nicht.
Ich sehe es in dem Beispiel zumindest als problematisch an, Karte B nun eine Performance bescheinigen, die genau zwischen A und C liegt.
 
Klar sind die Werte übertrieben und auch zu wenig Benchmarks für ein echtes Rating vorhanden, aber ich möchte ja hier auch auf die grundsätzliche Problematik aufmerksam machen. Diese besteht auch, wenn die Werte realistischer gewählt werden und man sehr viele Benchmarks hat, nur ist der Fehler dann nicht mehr ganz so groß.

Ein Beispiel aus der Praxis:

Um meine Theorie zu untermauern, führe ich jetzt mal ganz Frech ein Beispiel aus der Computerbase-Praxis vor. Vielleicht macht das dann den einen oder anderen nachdenklich.
Erstmal unser "Arbeitsmaterial":
- Test: Radeon HD 5870
- Test: Radeon HD 5850

In beiden Tests wurden dieselben Testsysteme mit genau denselben Treibern verwendet. Die Benchmarkauswahl ist identisch und auch die Frameraten aller in beiden Tests überprüften Karten sind in allen Benchmarks identisch. Das verwundert auch nicht, denn Computerbase verwendet alte Ergebnisse wieder, um Zeit zu sparen und uns überhaupt diese Artikel-Vielfalt anbieten zu können. Hier mal am Beispiel von Call of Duty 5, in beiden Reviews identische Frameraten:

cb1_cod5bmzi.png


Kein Unterschied bis auf die HD 5850, die halt dazukommt. Dies zieht sich auch durch alle anderen Benchmarks, kann ja jeder selber nachprüfen.
Was erwarten wir nun im Rating? Na sonnenklar, die sollten auch identisch ausfallen bis auf das Vorhandensein der HD 5850. Tun sie das? Wer den Thread mitverfolgt hat, ahnt schon, dass die Ratings eben nicht identisch ausfallen, weil der mathematische Ansatz nicht sauber ist. Und hier jetzt auch Schwarz auf Weiß:

cb2_perfrat77d0.png


Im HD-5850-Test rücken alle Karten ein wenig näher zusammen als im HD-5870-Test, obwohl die Einzelbenchmarks genau identisch ausfallen.

Das Problem lässt sich ganz einfach aus der Welt schaffen, indem man nicht das vertraute arithmetische Mittel verwendet, sondern das geometrische Mittel. Hier noch etwas Lesestoff von Wikipedia:
- Arithmetisches Mittel
- Geometrisches Mittel

Vielen Dank für Ihre Aufmerksamkeit! ;)
 
Die Einzelbenchmarks sind aber nicht identisch. Die Ergebnisse jeder Karte sind gleich, nicht aber ihr Quotient in jedem Benchmark. Steffen hat bereits erwähnt, dass für jeden Benchmark der Quotient des Wertes jedes Testteilnehmers und des Bestwertes ermittelt wird. Den Bestwert lieferte in dem Fall oft genug die 5850 CF, weshalb sich so einige Quotienten verändert haben dürften. Ob du die Werte dann am Ende arithmetisch oder geometrisch mittelst, mag einen Unterschied ergeben. Aber er ist wohl noch kleiner als hier zu sehen.

Hinzu kommt, dass es immer mal passieren kann, dass einzeln Produkte 0 als Ergebnis liefern. Das mag etwa bei Treiberinkompatibilitäten passieren. Mit der Null kannst du aber nicht weiterrechnen. Beim arithmetischen Mittel geht das, auch wenn das nur mit dem Hinweis passieren kann, dass im finalen Rating Tests einiger Produkte drin stecken, in denen es gar nix abgeliefert hat. Das könnte man allerdings als gerechte Strafe für Fehlfunktionen hinnehmen.

Letztendlich bin ich mir nicht sicher, ob die Berechnungsmethode geändert werden sollte. Aber das ist eh Steffens Ding. Ich denke aber, mehr as formale Kritik ist das hier nicht. So sehr liegen wir nicht daneben. Recht magst du aber trotzdem haben. :)
 
Jirko schrieb:
Die Einzelbenchmarks sind aber nicht identisch.
Doch, die Frameraten sind überall gleich. Dass Benchmarks der HD 5850 hinzukommen, sollte nix am Verhältnis der alten Karten zueinander ändern.

Jirko schrieb:
Hinzu kommt, dass es immer mal passieren kann, dass einzeln Produkte 0 als Ergebnis liefern. Das mag etwa bei Treiberinkompatibilitäten passieren. Mit der Null kannst du aber nicht weiterrechnen.
Man kann die Ergebnisse mit Null einfach weglassen, die Rechnung mit dem geometrischen Mittel funktioniert dann weiterhin. Aber es stimmt natürlich, dass dann fehlende Funktionen im Rating nicht abgestraft werden. Ist aber auch die Frage, ob sowas überhaupt ins Rating reingehört.

Jirko schrieb:
Ob du die Werte dann am Ende arithmetisch oder geometrisch mittelst, mag einen Unterschied ergeben. Aber er ist wohl noch kleiner als hier zu sehen.
Zumindest ändern sich die Verhältnisse der alten Karten zueinander dann nicht mehr, wenn man neue Karten mittestet. Und eine Karte, die in allen Benchmarks doppelt so schnell ist wie eine andere, ist auch im geometrischen Mittel doppelt so schnell.
In einem Rating mit geometrischem Mittel kann man aber schon davon ausgehen, dass die Karten noch etwas mehr zusammenrücken. Das ist kein Indiz für einen Fehler, sondern das Resultat einer sinnvolleren Berechnungsmethode. ;)
 
Zuletzt bearbeitet:
Da das Thema offenbar den Meisten egal ist und niemand mit der Situation unglücklich ist, hat sich die Diskussion wohl erledigt.
Ich werde jedenfalls hier nicht mehr posten und mich aus dem CB-Forum zurückziehen. Bin insgesamt unzufrieden mit der Forenpolitik und der Kompetenz der Forenbetreiber. Hier wurde mir wieder mal der Unwille zur Diskussion seitens der Forenbetreiber aufgezeigt:
https://www.computerbase.de/forum/threads/645651/

Dass man alle Speku-Postings zur Radeon HD 5750/5750 gelöscht hat, ist für mich auch ein Unding.

Adieu Computerbase und ein Dankeschön an all Diejenigen, die meine Postings zu schätzen wussten.
 
Weiß du was das Problem ist? Das du drohst, vorab urteilst und die Gegenargumente gar nicht erst abwarten willst. Von daher ist es doch müßig, eine Diskussion von deiner Seite ist gar nicht erwünscht. Die Drohung aus dem Forum zu verschwinden, wenn eine Regel nicht zu deinen Gunsten geändert wird, macht sich nicht gerade gut als Einsteig, worüber soll man denn da noch diskutieren. Während man alle Diskussion und Gründe in den anderen Threads geflissentlich ignoriert. Das ist halt Erpressung und nichts anderes.

Auch die Tatsache, dass die Threads zur 57xx Serie entfernt wurden, als Unding zu bezeichnen, ohne sich jemals für die Hintergründe zu interessieren, kann wohl kaum als kooperativ und sachliche Kritik gewertet wurden. Wenn ihr aber Bock drauf habt Probleme mit ATI zu bekommen, nur zu. Für uns gab es keine bessere Möglichkeit, die User und die Seite effektiv zu schützen. Auch CB macht es sicherlich keinen Spaß News zu entfernen, aber es gab hinreichende Gründe.

Ansonsten hat das mit dem Thema hier wirklich nichts zu tun und die Inszenierung deines Abgangs sei dir gegönnt, aber nicht ohne Klarstellung.
 
Zuletzt bearbeitet:
Status
Für weitere Antworten geschlossen.
Zurück
Oben