Welche Bandbreite benötigt AMD 7970 GHz Edition?

brooker

Lt. Commander
Registriert
März 2008
Beiträge
1.343
Hallo zusammen,

da ich bisher keine Antwort auf meine Frage im WWW gefunden haben, wende ich mich an Euch. Kann mir jemand sagen, wieviel Bandbreite, MB/s, eine AMD 7970, speziell bei 1000MHz GPU-Takt, benötigt?

Im konkreten Fall möchte ich gern ermitteln, welche Bandbreite in MB/s bei einer OpenCL Anwendung (unter Volllast der GPU, und Speicher sowie Controller bei ca. 10%) benötigt. Gibt es dafür eine Software mit der ich das ermitteln kann?

Resultierend ist die Frage zu klären, ob ich mit 8000MB/s die Grafikkarte ohne Bottleneck betreiben kann.

Danke für Eure Unterstützung.

Grüße Brooker
 
Zuletzt bearbeitet:
Hi,

sorry, ich merke gerade, dass ich mich unpräzise ausgedrückt haben. Ich meinte nicht die Anbindungsbandbreite in bit, sondern die Transferbandbreite in MB/s.

Ich hoffe, ich habe die richtigen Begriffe verwendet.

Danke.

Grüße Brooker
 
Meinst du Speicherbandbreite oder PCIe-Bandbreite?
Was meinst du mit benötigt? Dass es keine Performanceverluste gibt, dass es läuft, dass es flüssig läuft?
Es ist hilfreich, wenn du dich noch etwas präziser ausdrücken könntest.
Außerdem kommt es auf die Anwendung an. Warscheinlich musst du das sowieso selbst testen aber ich warte mal auf Antwort.
 
Zuletzt bearbeitet:
... ich denke es ist die PCIe-Bandbreite die ich wissen muss.

... die angedachte Anwendung ist Folding@home mit dem Team von Computerbase :o))

Ich möchte dafür einen System mit 1x oder 2x 7970er ansetzen die mit maximaler Perfomance rechnen können. Der ich leider nur begrenzte Recourcen habe, möchte ich im Vorfeld klären, was dafür notwendig ist. Denn daraus leitet sich dann wieder das Board, die CPU usw. und somit die Kosten ab.

Ich hoffe, jetzt ist es greifbar für Euch.?
 
Frag doch das Team von CB. Die müssen es ja wissen ;)
 
... das ist ein Tip, die Kollegen lesen das hier auch ;o)
 
Auch dafür gibt es Prog. erlese sie. Es geht ja um CS.
 
schau mal in den Bericht von Gentlem4n unter technische Eckdaten. Speicherbandbreite 264.000 MB/s.

Dazu noch Wikipedia mit PCI Express. bei PCI3.0 und x16 Lanes hast du 15.754 MB/s.

Dh man rennt eigentlich eher in eine PCIe Bremse.

Aber beides ist schneller als deine 8000mb/s. Wäre nur zu klären, wie du quasi gezielt 8000mb/s abfeuerst und bei der GPU auslesen kannst, was ankommt ^^

lg
fire
 
... ich glaube, wir reden hier gerade aneinander vorbei. Es geht hier nicht um Speicherbandbreite, sondern um die benötigte Bandbreite der Schnittstelle PCIe.

8000MB/s ist die maximale Bandbreite der Schnittstelle PCIe2/2.1 mit 16 Lanes und die frage ist, ab diese ausreicht.
 
@firexs

Ich glaube nicht, dass es auf diese Weise funktioniert/berechnet wird. Sonst würde es 1. keinen Sinn machen eine Speicherbandbreite von mehr als 15.754 MB/s auf pci-e 3.0 zu verbauen und 2. gäbe es kein gejammer allerortens, dass die 256-bit Anbindung bei modernen Grafikkarten "zu wenig" sei.

Mir fehlt zwar das Grundverständnis einer Grafikkarte, um zu erklären wie das richtig zusammenhängt, aber deine Annahme muss falsch sein.

@ Topic

Hier ist das Folding Forum. Auf dieses wird in der FAQ der Uni Stanford für weitergehende Fragen verwiesen.
https://foldingforum.org/index.php
http://folding.stanford.edu/home/faq/faq-gpu2-common/

Da würde ich nachfragen.

Soweit ich das verstanden habe, findet Folding aber hauptsächlich auf der Grafikkarte selber statt, sodass die PCI-E Anbindung dafür zweitrangig ist.

Bei Nvidia läuft das über CUDA. Hab mal einen Thread für Seti@home verlinkt(läuft auch über CUDA). Da ist der Unterschied zwischen PCI-E 1.0 x16 und PCI-E 1.0 x4 gerade mal 10%. Wenn man sich überlegt, dass PCI-E 2.0 die doppelte Leistung bringt, dürften sich die Unterschiede in der Anbindung kaum auswirken.

http://setiathome.berkeley.edu/forum_thread.php?id=62704
 
Zuletzt bearbeitet:
... nun kommt Licht ins Dunkel. Danke.
 
... so. Ich habe das mal ausprobiert.

Setup: System wie unten, openCl-Benchmark LUXXMARK 2.0 64bit

Folgendes Ergebnis:

Der Benchmark-Wert ändert sich nach der Bereitsstellung von nur 8 statt 16 Lanes auf PCIe 3.0 nicht. Heißt, eine Schnittstellenbandbreite von 7877 MB/s ist ausreichend für die Anwendung openCl.

Was für mich überraschend war. Sofern ich den RAM-Takt erhöhte, verschlechterte sich das Benchmark-Ergebnis.

Hat da einer eine Erklärung für?

Grüße Brooker
 
Wieviel Bandbreite eine GPU über den PCI-E benötigt, ist nicht API abhängig (also von DX CUDA OpenCL) sondern anwendungsabhängig.

Raytracer, wie zum Beispiel der in Luxxmark, funktionieren in der Regel so, dass sämtliche Daten der Szene im DRAM der GPU vorliegen und die GPU das prinzipiell alleine komplett berechnen kann. Deshalb muss die CPU der GPU über den PCI-E nur sagen, dass sie eben das Raytracerprogramm ausführen soll um die Szene zu berechnen. Aus diesem Grund ist die Performance eines Raytracers von der PCI-E Bandbreite unabhängig.

Leider kann ich nicht 100 Prozentig sagen, wie die Folding-Simulationen genau funktionieren und wie viel PCI-E Bandbreite sie benötigen (wenn mir jemand den Quelltext verlinkt schaue ich ihn mir mal an). Afaik liegen dort ebenfalls sämtliche Daten im DRAM der GPU vor und die GPU kann diese Problemstellung ebenfalls komplett alleine berechnen. Die CPU muss der GPU also wieder nur mitteilen, dass sie ein Programm starten soll um den nächsten Zeitschritt der Simulation zu berechnen. Aus diesem Grund werden Daten nur zu Beginn der Simulation die über den PCI-E auf die GPU hochgeladen und am ende wieder heruntergeladen. Deshalb sollte das Problem auch komplett PCI-E Bandbreiten unabhängig sein.
 
Zuletzt bearbeitet:
Hallo Nai,

ok, dass würde erklären, warum nur ca. 150MB des Speichers der GPU benutzt werden. Heißt, die Schnittstelle wird maximal zum Speicher lesen und auslesen und zum Start-Stopp-Signal der CPU benötigt. Interessant.

Schade, dass Du den Post nicht früher gelesen hast ;o))

Grüße Brooker
 
Zurück
Oben