PresentMon Beta: Intel mit neuem Benchmark-Tool und neuer Messmetrik

Wolfgang Andermahr
104 Kommentare
PresentMon Beta: Intel mit neuem Benchmark-Tool und neuer Messmetrik
Bild: Intel

Intel stellt mit PresentMon Beta ein neues öffentliches Benchmark-Tool vor, das auf allen Grafikkarten und mit allen APIs lauffähig ist. Darüber hinaus gibt es mit „GPU Busy“ eine neue Messmetrik. Sie soll es einfacher machen, zu untersuchen, inwieweit die CPU oder eben die GPU den limitierenden Faktor darstellt.

Benchmark-Tools gibt es viele. Die bekanntesten davon sind CapFrameX, das von ComputerBase genutzt wird, Nvidias FrameView und AMDs OCAT. Auch wenn dies drei verschiedene Werkzeuge sind, ist deren Basis jeweils gleich – bezogen darauf, wie die unterschiedlichen Bilder pro Sekunde erfasst werden. All diese Tools nutzen PresentMon, das lustigerweise von Intel stammt – so gesehen sind alle drei großen PC-Hardwarehersteller in Benchmark-Prozesse eingebunden. PresentMon überwacht das so genannte Event Tracing for Windows, kurz ETW, und kann so Daten sammeln, wie lange einzelne Ereignisse gebraucht haben.

PresentMon Beta und GPU Busy sollen Benchmarks vereinfachen

Wer auf eine grafische Oberfläche verzichtet, kann auch mit PresentMon selber Benchmarks erstellen. Die Möglichkeit hat die Redaktion genutzt, als DirectX 12 frisch erschienen ist. Da es sich jedoch um ein reines Kommandozeilenprogramm handelt, ist dies eher umständlich. Das wird sich jetzt aber ändern. Denn Intel wird in den kommenden Tagen, vermutlich am Montag, ein neues PresentMon, aktuell „PresentMon Beta“ genannt, zum Download anbieten. Dabei handelt es sich um ein vollständiges Benchmark-Tool mit grafischer Oberfläche und sogar einem Overlay.

Davon abgesehen führt Intel zugleich eine neue Messmetrik ein. Sie hört auf die Bezeichnung „GPU Busy“ – dabei ist eigentlich der Name Programm. Das Ziel dieser Metrik ist, dem Nutzer genauer zeigen zu können, welche Komponente während des Benchmarks den limitierenden Faktor darstellt: Prozessor oder die Grafikkarte. Aktuell ist dies anhand von Benchmark-Ergebnissen völlig unklar. Es bleibt abseits eines FPS-Vergleiches nur die Möglichkeit, die GPU-Auslastung im Auge zu behalten. GPU Busy soll dies nun ändern.

ComputerBase wirft in diesem Bericht sowohl einen kurzen Blick auf das neue PresentMon als Tool als auch auf GPU Busy.

PresentMon Beta: Das Tool im Blickpunkt

PresentMon kann aktuell und auch in der Zukunft mit jeder Hardware umgehen. Folglich ist es egal, ob ein AMD- oder ein Intel-Prozessor bzw. eine Nvidia-, AMD- oder Intel-Grafikkarte im Rechner stecken, denn das Tool funktioniert immer. Sämtliche aktuellen APIs werden unterstützt: DirectX 9 bis DirectX 12, OpenGL und Vulkan. Wie die alten Versionen wird Intel auch von der neuen Variante den Quellcode auf GitHub zur Verfügung stellen. Die von Intel genutzte API wird ebenfalls erneut zur freien Verfügung gestellt. Darüber hinaus bleibt die alte API vom originalen PresentMon verfügbar.

ComputerBase lag für den Bericht PresentMon in der Version 0.5 Beta 1 (Download) vor. Die optische Oberfläche ist dabei simpel gehalten und besteht derzeit aus nicht viel mehr als ein paar Menüpunkten. Sie bieten die wichtigsten Basics, für das reine Benchmarking ist eigentlich alles Wichtige vorhanden.

So kann die Prozesserkennung automatisch oder manuell erfolgen. Darüber hinaus lässt sich der Benchmark-Hotkey frei einstellen und auch die Benchmark-Dauer konfigurieren. Außerdem ist es möglich, das grafische Overlay zu konfigurieren – dies ist bereits erstaunlich ausführlich möglich.

So gibt es für das Overlay mit „Basic“, „GPU Focus“ und „Power/Temp“ drei verschiedene Presets. „Basic“ zeigt einfach nur die Durchschnitts-FPS, das 1 %-Perzentil und die Durchschnitts-Frametimes an. „GPU Focus“ konzentriert sich auf die Telemetriedaten der Grafikkarte, abgesehen von den Benchmark-Daten werden also auch Temperatur, Taktrate, Spannung, Auslastung, Power, Lüfterdrehzahl und Speicherauslastung angezeigt. „Power/Temp“ belässt es neben den Benchmark-Daten bei Power, Temperatur und GPU-Auslastung.

Es lassen sich eigene Overlay-Presets erstellen

Wer etwas anderes will, kann entweder die Presets anpassen oder gleich ein völlig eigenes Preset erstellen. Die Möglichkeiten sind dabei erstaunlich ausführlich und erschlagen einen auf den ersten Blick etwas. Diverse Parameter von der Grafikkarte und auch dem Prozessor lassen sich auf Wunsch in dem Overlay überwachen. Gibt das Netzteil Daten aus, können auch sie angezeigt werden. Abgesehen von den FPS lassen sich diese Daten ebenfalls als Durchschnitts-, Perzentil-, Maximal- oder Minimalwert anzeigen. Darüber hinaus ist es möglich, ein grafisches Verlaufsdiagramm oder nur den reinen Zahlenwert darzustellen. Farben lassen sich ändern und die Größe frei skalieren, ebenso die Wertebereiche.

Das Overlay ist per Shortcut im Spiel an- und abschaltbar. Während eines Benchmarks schaltet sich das Overlay selbstständig ab (lässt sich auch abschalten). Das ist deswegen wichtig, da das Overlay aktuell noch Performance kostet – deswegen auch noch die Bezeichnung „Beta“ im Namen. Intel arbeitet jedoch daran – die Ressourcenkosten sollen mit der Zeit kleiner werden. PresentMon Beta als reines Benchmark-Tool benötigt dagegen wie das „alte“ PresentMon quasi keinerlei Ressourcen.

Darüber hinaus lässt sich das Overlay an allen Ecken des Windows-Fensters befestigen (eine freie Platzierung ist aktuell nicht möglich). Die Abtastrate und die Hintergrundfarbe können ebenfalls eingestellt werden. Das Overlay basiert dabei nicht wie die meisten aktuell genutzten Overlays auf dem RivaTuner Statistic Server, sondern nutzt eine eigene, völlig neue Entwicklung.

Das Overlay in der Praxis

Intel hat eigentlich ein optisch schönes und modern wirkendes Overlay entwickelt. Es überzeugt mit einer hübschen, zurückhaltenden Farbgebung und trotzdem mit auffallenden Messwerten – wer möchte, kann die Farbgestaltung aber problemlos völlig umgestalten und nach den eigenen Wünschen anpassen. Das Overlay lässt sich on the fly während des Spielens genauso nach Wahl einstellen wie vor dem Start des Titels. Alle Änderungen werden sofort übernommen.

Zwei Sachen fallen aber negativ auf. Das Overlay ist zwar schick gestaltet, wirkt qualitativ allerdings ungewöhnlich schlecht. Es macht den Eindruck, als würde es mit einer erstaunlich geringen Auflösung gerendert. Entsprechend grobpixelig wirkt die Darstellung und ist von „scharf und detailliert“ weit entfernt. Das muss Intel unbedingt noch ändern. Darüber hinaus skaliert das Overlay nicht selbstständig. Wenn im Overlay also viele Eigenschaften dargestellt werden, passt sich dessen Höhe nicht automatisch daran an. Daher kann es passieren, dass das Overlay unten einfach abgeschnitten wird. Manuell lässt sich die Höhe (und generell die Größe) des Overlays zwar frei anpassen, hier sollte es aber eine Automatik geben.

Ansonsten gibt es nichts zu kritisieren. Ganz im Gegenteil sogar: Intels Overlay macht abgesehen von der dargestellten Qualität bereits jetzt einen sehr guten Eindruck – gar einen so guten, dass man allen anderen Overlays vermutlich bereits klar überlegen ist. Nicht bei der Vielfalt der darstellbaren Optionen, aber bei der optischen Darstellung und der Flexibilität der Anzeigemöglichkeiten. Hier verhält sich das Tool absolut vorbildhaft.

Darüber hinaus funktioniert es bereits gut. Mit dem Shortcut hat sich das Overlay während des Testens zuverlässig an- und abschalten lassen und bei jedem ausprobierten Spiel einwandfrei funktioniert. Es kann zwar mal passieren, dass das Overlay beim ersten Spielstart nicht sofort erscheint, doch dann hat es immer geholfen, PresentMon kurz zu schließen und anschließend wieder zu starten.

Das kann PresentMon nicht

Das neue PresentMon ist bereits jetzt ein mächtiges Benchmark- und Überwachungs-Tool, das eigentlich bereits beim ersten Anlauf alle wichtigen Features mitbringt und gleichauf mit dem aktuellen Platzhirsch CapFrameX liegt. Eins kann PresentMon aber (überhaupt) nicht: eine grafische Ausarbeitung der Ergebnisse. Stattdessen spuckt es einfach eine Datei aus, die diverse Rohdaten enthält.

Dies ist eine große Stärke von CapFrameX, denn die vorher aufgenommenen Messwerte lassen sich ausführlich auf diverse Arten darstellen, Analysen und Vergleiche sind damit einfach durchzuführen. Die gute Nachricht ist jedoch, dass auch die Benchmark-Daten vom neuen PresentMon kompatibel mit CapFrameX sind. Es ist also möglich, die mit PresentMon aufgenommenen Dateien in den CapFrameX-Ordner zu kopieren und dann mit CapFrameX zu analysieren. Dabei gilt es aber zu bedenken, dass CapFrameX die aktuell noch PresentMon-exklusiven Informationen wie GPU Busy natürlich nicht darstellen kann.

Intel hat nicht ausgeschlossen, dass PresentMon irgendwann in Zukunft auch eine grafische Analyse der Daten ermöglicht. Stand jetzt scheint dies jedoch noch ein weiter entferntes Feature zu sein.

Aktuell ist es daher ohne Hilfsmittel ziemlich umständlich, die Daten zu analysieren. Pro Benchmark-Durchlauf erstellt PresentMon zurzeit zwei Dateien: eine kleine mit den wichtigen Basis-Informationen wie AVG-FPS und den Perzentil-FPS und eine große Datei, die wortwörtlich alles beinhaltet – für jeden einzelnen Frame. Der Aufbau dieser Datei ist identisch zu den bisherigen Dateien, jedoch gibt es neue Spalten. Hinter „msGPUActive“ versteckt sich GPU Busy. Neu ist auch, dass die Telemetriedaten der Hardware in der Datei gespeichert werden. Die großen Dateien können problemlos für die Aufarbeitung von CapFrameX gelesen werden.

GPU Busy: Eine Benchmark-Metrik mit Zukunft

Zumindest aus Sicht eines Grafikkarten-Redakteurs ist das Overlay zwar spannend, doch das eigentliche Highlight von PresentMon Beta ist definitiv die neue Metrik GPU Busy. Für Benchmarks wie die AVG- oder Perzentil-FPS nutzen das alte und das neue PresentMon wie auch alle anderen Tools das so genannte ETW-Event „msBetweenPresents“. Es beschreibt die Zeit in Millisekunden, wie lange es in der Renderpipeline von einem so genannten Present-Call bis zum nächsten gebraucht hat. Es handelt sich quasi um den Zeitraum, in dem Windows alle benötigten Daten für einen Frame gesammelt und an Prozessor sowie Grafikkarte geschickt hat, bis die Grafikkarte diesen dann fertig gestellt hat.

GPU Busy stellt dagegen nur einen ganz speziellen Zeitraum dar, der innerhalb der msBetweenPresents liegt. GPU Busy hat das Ziel, sich ganz alleine auf die Grafikkarte zu konzentrieren und alle anderen Komponenten wie die CPU auszulassen. Mit anderen Worten: Wann fängt die Grafikkarte mit dem Rendern eines Frames an und wann ist sie fertig? Das ist GPU Busy. Dabei werden nicht nur die reinen Berechnungen des Prozessors ignoriert, sondern auch die Zeit, die der Prozessor im Auftrag der Grafikkarte verbringt. Denn bevor die GPU mit der Arbeit loslegt, muss der Grafikkartentreiber erst Vorarbeit vollbringen – auf der CPU. Das ist ein Overhead, der zulasten des Prozessors geht. AMD, Nvidia und Intel versuchen, ihn so gering wie möglich zu halten. Mit der reinen Rechenleistung der GPU hat das Ganze aber nichts zu tun.

Und was bringt es? Aktuell ist nicht immer einfach zu sagen, welche Komponente limitiert: Prozessor oder Grafikkarte? Natürlich gibt es Anhaltspunkte, wirklich gesichert ist dies aber nicht, vor allem der feine Übergang ist quasi unmöglich zu erkennen – jedenfalls ohne Zugriff auf und Verständnis von komplexen Entwickler-Tools. GPU Busy soll das nun ändern.

Tests mit GPU Busy in Anno 1800

Um zu zeigen, wie das genau funktioniert, hat ComputerBase eigene Benchmarks erstellt. Sie wurden auf einem Ryzen 9 7950X3D und einer GeForce RTX 4080 durchgeführt. Als Spiel dient Anno 1800, da der Titel sehr CPU-lastig ist, in hohen Auflösungen aber vor allem bei Einsatz von 8-fachem MSAA nach wie vor hohe Anforderungen an die Grafikkarte stellt. Durch das Wechseln der Auflösung von Ultra HD bis hinab zu 720p lässt sich somit eine deutlich steigende CPU-Last simulieren.

In 3.840 × 2.160 zeigen sich Ryzen 9 7950X3D und GeForce RTX 4080 in Anno 1800 als ziemlich ausgeglichenes Gespann. Zu Beginn der Sequenz wird ein kurzfristiges CPU-Limit ermittelt, denn dort benötigen die auf den Bildschirm gebrachten Bilder länger, als die Grafikkarte zum Rendern braucht. Doch nach einigen Frames ändert sich das Verhalten und zwischen den msBetweenPresents und den msGPUActive zeigt sich ein Gleichstand. Das bedeutet, dass in dem Fall die Grafikkarte die Framerate ausbremst – und genau das lässt auch die GPU-Auslastung vermuten, die in der Testsequenz bei den vollen 100 Prozent liegt. Während der gesamten Testsequenz beträgt die Durchschnitts-Framerate 50,4 FPS, die Grafikkarte wäre laut der neuen Metrik zu 51,4 FPS in der Lage.

Prozessor und Grafikkarte im Einklang
Prozessor und Grafikkarte im Einklang (Bild: Intel)

CPU-Limits werden deutlich verständlicher

Die Situation ändert sich dann aber in geringeren Auflösungen massiv. Bereits in 2.560 × 1.440 zeigt sich, dass die Grafikkarte zu einer deutlich höheren Leistung in der Lage wäre, als schlussendlich auf dem Bildschirm ankommt. Die Frametime-Messungen machen nicht nur ein plötzlich ungleichmäßiges Framepacing des Spiels sichtbar, sondern auch einen deutlichen Unterschied zwischen den normalen Frametimes und GPU Busy. Die Grafikkarte wäre also dazu in der Lage, deutlich schneller zu rendern als das, was schlussendlich auf dem Bildschirm ankommt, 81,2 FPS (msBetweenPresents) zu 100,5 FPS (msGPUActive) sagen die mit PresentMon aufgezeichneten Daten. Und die GPU-Auslastung deutet Ähnliches an, auch wenn die Anzeige selbst eben völlig ungenau ist. Damit limitiert in diesem Testszenario der Prozessor – alternativ ist auch ein unnötiger Treiber-Overhead der Grafikkarte denkbar, durch den sich die CPU durcharbeiten muss. Im Fall von Anno 1800 ist es allerdings mit Sicherheit ein CPU-Limit.

Anno 1800, 7950X3D + RTX 4080
Anno 1800, 7950X3D + RTX 4080 – 3.840 × 2.160
0612182430Millisekunden 150100150200250300350400450507Frames

In 1.920 × 1.080 wird das Ganze auf die Spitze getrieben. Das Framepacing von Anno 1800 ist nach wie vor schlecht, wenn die CPU die Framerate bestimmt. Mit 78,9 FPS läuft der Benchmark und ist entsprechend noch mal langsamer als in WQHD. Das klingt im ersten Augenblick unwahrscheinlich, kann im absoluten CPU-Limit aber passieren. Spiele geraten dann gerne aus dem Tritt und laufen leicht langsamer. Je mehr die CPU den Flaschenhals darstellt, desto größer wird der Effekt.

GPU Busy verrät dann, dass die Grafikkarte ohne Ende Leistungsreserven hat: 145,3 FPS wären laut der GPU-Busy-Metrik möglich, wenn der Prozessor unendlich schnell wäre. In dem Fall sagen die Ergebnisse von WQHD und vor allem von Full HD aus, dass es problemlos möglich ist, die GPU-Last zu erhöhen, ohne dass die Framerate sinkt. Das kann durch die Auflösung, aber auch durch eine Grafikoption passieren.

Zu bedenken gilt es, dass Anno 1800 mit den Anforderungen an den Prozessor ein absolutes Worst-Case-Szenario ist. Normalerweise sind beide Messmetriken deutlich näher beieinander.

Schlussworte

Intel hat mit der neuen Betaversion von PresentMon einen großen Schritt nach vorn gemacht: Von einem umständlich zu bedienenden Profi-Tool mit klar besseren Alternativen zu einem Werkzeug, das eine Alternative zu den aktuell besten Tools darstellt. Es hat das Potenzial, seine Mitbewerber in Zukunft sogar ganz abzulösen.

Nvidias FrameView und vor allem AMDs OCAT hat Intel mit dem neuen PresentMon gleich mal links liegen gelassen, einzig CapFrameX stellt sich PresentMon erfolgreich in den Weg. Beide Tools haben unterschiedliche Stärken und Schwächen, für einen ersten ernsten Versuch ist PresentMon aber ein voller Erfolg. Die eigentlichen Benchmark-Features, die Optionsvielfalt und besonders das völlig neue Overlay funktionieren bereits jetzt sehr gut. Letzteres zeigt viel Potenzial (auch wenn es noch kleinere Probleme gibt).

Wo das Tool dagegen klar das Nachsehen hat, ist bei der Präsentation der Daten. Denn die ist bei PresentMon quasi nicht gegeben, mehr als eine Excel-Datei mit diversen Zahlen gibt es nicht. Hier ist CapFrameX dem Intel-Tool noch weit voraus.

Schon jetzt eine sinnvolle Alternative

Und dennoch: Für Benchmarks und Analysen ist das neue PresentMon bereits jetzt eine sinnvolle Alternative, und zwar aus zweierlei Gründen. So sind die PresentMon-Benchmark-Dateien kompatibel mit CapFrameX, die grafische Aufarbeitung kann also weiterhin über das etablierte Tool erfolgen.

Der Hauptgrund ist aber vielmehr in der neuen Metrik „GPU Busy“ zu suchen, die erstmals auch ohne äußerst komplizierte Entwickler-Profiling-Tools eine genauere Analyse zwischen GPU- und CPU-Limit beziehungsweise der Frage, ob Grafikkarte oder Prozessor den Rechner ausbremst, zulässt. Vorher musste dies anhand von Auslastungsangaben abgeschätzt werden, nun gibt es deutlich greifbarere Zahlen.

Intel PresentMon
Intel PresentMon (Bild: Intel)

Deswegen wird ComputerBase PresentMon demnächst bei neuen Spiele-Releases regelmäßig einsetzen, denn mit GPU Busy wird deutlich genauer als jetzt festzustellen sein, inwieweit ein Spiel den Prozessor oder die Grafikkarte belastet. Und auch die Frage, welche CPU und welche GPU gut zueinanderpassen, lässt sich damit einfacher beantworten.

Andere Tools bekommen Zugriff auf GPU Busy

Da Intel den Quellcode von PresentMon zur Verfügung stellen wird und auch andere Entwickler Zugriff auf die GPU-Busy-Metrik bekommen sollen, ist dies jedoch kein unüberwindbares Problem für die anderen Tools – sie können angepasst werden. Doch selbst wenn das geschieht, hat sich PresentMon gleich beim ersten Versuch auf den zweiten Platz der Benchmark-Tools für private und professionelle Nutzer katapultiert. Einzig CapFrameX bleibt nach wie vor (bzw. noch?) der Platzhirsch.

ComputerBase hat die Informationen und die Betaversion von PresentMon von Intel vorab erhalten. Sie wurden unter NDA zur Verfügung gestellt. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt. Eine Einflussnahme des Herstellers auf die Meldung fand nicht statt, eine Verpflichtung zur Veröffentlichung bestand nicht.

Dieser Artikel war interessant, hilfreich oder beides? Die Redaktion freut sich über jede Unterstützung durch ComputerBase Pro und deaktivierte Werbeblocker. Mehr zum Thema Anzeigen auf ComputerBase.