Blender Cycles AMD Benchmark

Pintion

Cadet 2nd Year
Registriert
Juli 2015
Beiträge
27
Blender Cycles Benchmark (mit How To)

Hi,
ich bin neu hier obwohl ich schon jahrelang mit lese. Ich hab mich heute registriert um euch um etwas zu bitten.

Es geht um Blender eine mächtige open Source Grafiksoftware, mit einer ebenso mächtigen Renderengine namens Cycles. Cycles ist vergleichbar mit Lux, was viele wohl vom Luxmark kennen.

Cycles war jahrelang nur (brauchbar) in CUDA programmiert und somit nur mit NVIDIA nutzbar. In den letzten Wochen hat sich aber einiges am OpenCL code getan womit Cycles jetzt auch mit AMD Grafikkarten der GCN Architektur nutzbar ist.
Da in der Blender Cummunity natürlich fast nur NVIDIA Grafikkarten vertreten sind ist es schwer an AMD Benchmarks zu kommen, weshalb ich hier um Benchmark Ergebnisse bitte.

Wer also mitmachen will folgt am besten der folgenden Schritt für Schritt Anleitung.
  1. Ladet Blender von der offiziellen Blender Hompage.
    (nehmt die zip Datei, dann müsst ihr nichts installieren)
  2. Ladet die Benchmark Szene bmw27_benchmark_for_dummies.blend runter.
    (Aus meinem Forum Post auf blenderartist.org)
  3. Öffnet die bmw27_benchmark_for_dummies.blend Datei mit blender.exe, welche ihr im Blender zip Ordner findet.
  4. Folgt den Anweisungen in der Blender Datei.
  5. Postet euer Ergebniss hier dann in folgendem Format.
GPU Manufactura: AMD or NVIDIA
GPU: RX XXX, HD 7XXX, GTX XXX,
(for Kaveri: Axx 7xxx)
GPU Clock: in MHz
GPU Memory Clock: in MHz
GPU Size: in GB
Driver Version Number: 15.xx.xx,
35x.xx
CPU: Intel xxx, AMD xxx
CPU Clock: in MHz
Blender Version: 2.7x
(you get the version shown
each time you start Blender)
Operating System: Win X, Ubuntu x.x
Render Time: mm:ss.tt
Tile Size: 512x512 (for example)

Bei Unklarheiten einfach fragen!

Je kürzer die Zeit, desto schneller ist Eure Grafikkarte.
Ergebnisse gibt es hier:
OpenCL+CUDA


Insbesondere würde ich mich über Ergebnisse einer AMD R9 285 bzw R9 380 im vergleich zu einer R9 280 freuen. Letztere ist im Luxmark gut 10% schneller und mich würde interessieren ob man das auf den geringen Speicher Durchsatz von Tonga schieben kann.
Wenn also jemand Lust hat mal mit verschiedenen Speichertaktraten zu spielen würde mich das sehr freuen.
Kaveri Benchmarks mit der iGPU wäre auch klasse!
Oder mal ne Fury!
NVIDIA darf natürlich auch mit benchen! ;)

edit: ich hab die Benchmark Datei nochmal überarbeitet, es sollte jetzt noch übersichtlicher sein und ich habe noch eine Anleitung für NVIDIA Nutzer hinzugefügt.

Julian
 
Zuletzt bearbeitet: (Mehr infos und Übersichtlickeit)
Ich bin bis Montag leider unterwegs, dann werd ich den thread nochmal mit ner Bilder Anleitung editieren.

Rechts sollte das property window sein. Da musst du die kleine Kamera auswählen und dann solltest du die Option sehen. Hier ist nen Bild dazu.
http://www.baptistecaquot.fr/blog/wp-content/uploads/render-gpu.png
Versuch dort auch malbei "feature set" auf experimental umzustellen.
Falls es die Option "Device" nicht geben sollte, musst du ganz oben in der Mitte die render engine auf cycles umstellen. Sollte aber eigentlich Standard sein.
Ansonsten hilft noch in den user Preferencen auf openCL umzustellen.
http://www.systemagnostic.com/wp-uploads/2013/01/Screen-Shot-2013-01-21-at-20.32.19.png
User preferences findest du ganz oben links im Dropdown Menü.
 
ist die Tile-Größe nicht relevant für die Render-Geschwindigkeit (ist jedenfalls bei Cuda so).
D.h. die voreingestellten 16x16 Tiles sind alles andere als toll um sie auf einer Grafikkarte rechnen zu lassen. Wäre es da nicht angebracht eine größere Vorzugeben? Oder ist das bei OpenCL nicht nötig?

Siehe
http://www.forum-3dcenter.org/vbulletin/showthread.php?t=556393
Da sind die, die die größten Tiles haben auch immer mit die schnellsten.
 
Zuletzt bearbeitet:
Doch du hast recht. Wenn man mit der CPU rendert nimmt man besser kleine tiles und bei GPU große. Bei openCL am beste sogar noch größere als bei CUDA. Ich bin eigentlich davon ausgegangen, dass in der bmw27.blend eine größere tile size eingestellt ist...
Wenn aber alle mit der gleichen tile size rendern sollten die Ergebnisse hier vergleichbar sein.
 
Scheint so, als wenn Blender meine 270x noch nicht unterstützen möchte. Ich kann sie nicht auswählen, sondern hab nur 2 Drop Downs dort...
 
Hi,

nach dem Umstellen auf OpenCL in den User Preferences hatte ich die Option für meine 7950.

Das Ergebnis:

Time 1. Durchlauf: 03:33.73
Time 2. Durchlauf: 02:56.99
Time 3. Durchlauf: 02:57.18

GPU Takt: 880 MHZ
Speicher Takt: 1250 MHZ

Prozessor: i3-3220

OS: Win7 Pro, 64 Bit


Kopie aus dem CCC:

Treiber-Paketversion 15.20.1046-150622a-186188C
Catalyst-Version 15.7
Anbieter Advanced Micro Devices, Inc.
2D-Treiberversion 8.01.01.1500
2D-Treiberpfad /REGISTRY/MACHINE/SYSTEM/ControlSet001/Control/CLASS/{4D36E968-E325-11CE-BFC1-08002BE10318}/0000
Direct3D-Version 9.14.10.01128
OpenGL-Version 6.14.10.13397
Mantle-Treiberversion 9.1.10.0077
Mantle-API-Version 98308
AMD Catalyst Control Center-Version 2015.0622.2137.37044
AMD Audio-Treiberversion 7.12.0.7721



Auf der Arbeit hab ich ein Notebook mit einer AMD FirePro M5100 Mobility Pro, kann da auch gerne mal testen.

-edit-
Tile size war übrigens auf 128x128 voreingestellt.
Mit 256x256 ist die Zeit bei 02:14.32 im ersten und 01:52.17 im zweiten Durchlauf.
 
Zuletzt bearbeitet:
Tile Size?
Und warum der große Unterschied zwischen 1 und 2/3?
Cache?
 
Thx.
Man sieht was die für einen ungeheuren Einfluss auf das Ergebnis hat.
 
yoah, mit 512x512 bin ich auf
1. 01:27.22 und
2. 01:27.91
runter. (hatte das Programm zwischen den Läufen mit kleineren Tiles nicht geschlossen)

Keine Ahnung, ob das gut ist. Blender könnte für mich auch ein Dorf in Böhmen sein ;)
 
Der erste run ist langsamer, weil da der kernel kompiliert wird. Hatte ich vergessen dazu zu schreiben. ;)
Und je geringer die Zeit desto besser natürlich! ;)
Ergänzung ()

So ich hab den ersten Post jetzt editiert. Er ist jetzt übersichtlicher und die verlinkte .blend Datei enthält eine Schritt für Schritt Anleitung in Wort und Bild. Somit sollte das benchen kein Problem mehr sein sollte.
 
Zuletzt bearbeitet:
Ergebnisse von meinem Arbeitsrechner (Dell Precision M4800)

Grafikkarte: AMD FirePro M5100 FireGL V (Cape Verde)
GPU Takt: 775 MHz
Grafikspeicher takt: 1125 Mhz
Treiberversionsnummer: 14.301.1019-150124a-180200C-Dell
CPU: Intel i7-7800MQ @ 2,70GHz
Blender Version: 2.75a
Betriebssystem: Win 7 Professional, 64bit
Eure Zeit:
Durchlauf 1: 05:43.56
Durchlauf 2: 05:21.34
Tile Size: 512x512


CCC-Auszug:

Treiber-Paketversion 14.301.1019-150124a-180200C-Dell
Anbieter Advanced Micro Devices, Inc.
2D-Treiberversion 8.01.01.1423
2D-Treiberpfad /REGISTRY/MACHINE/SYSTEM/ControlSet001/Control/CLASS/{4D36E968-E325-11CE-BFC1-08002BE10318}/0000
Direct3D-Version 9.14.10.01061
OpenGL-Version 6.14.10.13096
Mantle-Version Nicht verfügbar
Mantle API Version Nicht verfügbar
AMD FirePro Control Center-Version 2015.0124.2249.40957
AMD Audio-Treiberversion 7.12.0.7719
 
Super, vielen Dank.
Ich werde demnächst auch mal eine HD 7770 testen, aber als GHz Edition. Mal sehen, ob die Leistung proportional zum Takt steigt!
 
tarpoon schrieb:
Ergebnisse von meinem Arbeitsrechner (Dell Precision M4800)

Grafikkarte: AMD FirePro M5100 FireGL V (Cape Verde)
GPU Takt: 775 MHz
Grafikspeicher takt: 1125 Mhz
Treiberversionsnummer: 14.301.1019-150124a-180200C-Dell
CPU: Intel i7-7800MQ @ 2,70GHz
Blender Version: 2.75a
Betriebssystem: Win 7 Professional, 64bit
Eure Zeit:
Durchlauf 1: 05:43.56
Durchlauf 2: 05:21.34
Tile Size: 512x512

Zum Vergleich eine GTX 750ti mit den Takten deiner AMD, jeweils nur 1 Durchlauf mit OpenCL und CUDA:

Grafikkarte: Asus GTX 750ti
GPU Takt: 775 MHz
Grafikspeicher takt: 1125 Mhz
Treiberversionsnummer: 353.06
CPU: Intel C2Q 9400 @ 2,66GHz
Blender Version: 2.75a
Betriebssystem: Win Vista, 32bit
Zeit:
Durchlauf 1 (OpenCL): 06:48.72
Durchlauf 1 (CUDA): 04:32.79
Tile Size: 256x256
 
Ich hab meine GTX 750 Ti auch mal mit openCL gebencht:

GPU: NVIDIA GTX 750 Ti
GPU Clock: 775 MHz
GPU Memory Clock: 1125 MHz
Driver Version Number: 353.06
CPU: Intel i3-4330
Blender Version: 2.75a
Operating System: Win 8.1 Pro, 64bit
Render Time:07:41.33
Tile Size: 256x256

Bin mir nicht sicher, woher der riesige Unteschied kommt. Bist du sicher, dass die 775 MHz bei dir durchgängig anlagen und die Karte nicht darüber geboostet hat?
 
Ja, da bin ich sicher.
Ich habe die Karte so getaktet, dass der Boost bei 775 MHz lag. Basistakt also deutlich darunter.
Hast du die Taktverdoppelung bei GDDR5 berücksichtigt? Als Speichertakt wir im NVinspector ja das doppelte angezeigt (2250MHz bei 1125MHz)
 
Jo klar, hab ich beachtet. Hatte halt die ganze Zeit den msi afterburner laufen, aber der kann ja wohl unmöglich so viele resources fressen!?
 
Zum Verlgeich mal eine Titan X

Grafikkarte: EVGA Titan X
GPU Takt: 1415 MHz (liegt beim Rendern auch an laut Afterburner)
Grafikspeicher takt: 3500/7000 Mhz
Treiberversionsnummer: 353.62
CPU: Intel 5960X @ 4,2GHz
Blender Version: 2.75a
Betriebssystem: Win10 x64
Zeit:
Durchlauf 2 (CUDA) 2:26
Tile Size: 512x600
Durchlauf 3 (Cuda) 2:40
Tile Size: 1024x600
Durchlauf 4 (Cuda) 2:27
Tile Size: 512x512

Hätte ich jetzt nicht gedacht, wenn man das Ding in einem Rutsch auf der Graka rendert, dann wird es langsamer.

Edit: Featureset Experimental vergessen. Zahlen kommen gleich noch mal neu.
 
Zuletzt bearbeitet:
Weiß nicht ob das hier vielleicht auch von Bedeutung ist: Wenn ich beim Luxmark (auch OpenCL) die Taktraten der Grafikkarte via Afterburner verändere, werden diese nicht im Benchmark angewendet. Da wird immer der Standardtakt angelegt. Speichertakt geht aber schon. Scheinbar bezieht OpenCL den anzulegenden Takt aus anderen "Quellen". Das müsste man hier vielleicht auch mal gegentesten.
 
Zuletzt bearbeitet:
Zurück
Oben