News SupremeRAID SR-1010: SSD-RAID mit 110 GB/s und 19 Mio. IOPS dank GPU

Ich genehmigte mir gerade ein abendliches Bier :schluck:beim lesen dieses Artikels. Bei "110 GB/s ...und... 19 Millionen IOPS" konnte ich es vor lauter Erstaunen nicht mehr drin behalten. Jetzt bin ich gerade am Bildschirm wischen. :volllol::D

Hier geht was wahnsinnig ab!
 
  • Gefällt mir
Reaktionen: andi_sco
davidzo schrieb:
Es sind ja nur x4 lanes pro SSD + x16 für die GPU. Also 128 Lanes und ein Dualsocket Epyc hat biszu 160 mit Spezialboards, 128 default (sogar schon bei 1P). Viele boards haben zwar maximal 6 oder 7x PCIe Gen4x16 Slots, aber dazu noch SFF-TA-1009 oder ähnliche high density Verbinder. Da sind dann bis zu x16 Dualport, also 2x8 Lanes mit bis zu Gen5 auf einem Stecker etwa in SAS Größe.
Außerdem wird seit SAS24G auch häufig multiplexed, also selbst wenn man nur 16gb/s von der CPU hat (x8), hängt man da 2x 12gb/s SAS dran, also 24gb/s, da die CPU verbindung ohnehin selten das Bottleneck darstellt.
Ich meine 128 PCI Gen4 Lanes sind sind theoretisch 256gb/s - hier erreicht man aber nur 110gb/s.
Worauf ich eigentlich hinaus wollte ist, dass ich es extrem umständlich finde wenn der RAID Controller selbst keine Schnittstellen zur Verfügung stellt. Im Fall von PCIe 5.0 x16 hat man ja 64GB/s aber das Full Duplex und auch für Schreibzugriffe.

Für mich riecht das mehr nach schnellem Geld. Man nehme eine relativ günstige GA106 basierte GPU, packe etwas Software dazu und verauft wird das Ganze dann sicher um ein Schweinegeld wie das meiste neue RAID Equipment.


Da der Controller selbst 32GB/s Bandbreite hat (4.0 x16) vermute ich einmal:
.) Alle Lesezugriffe werden während dem laufenden Betrieb rein von der der CPU abgearbeitet => hier ist der RAID Controller eigentlich überflüssig, ansonsten müsste man die 110GB/s ja über den Controller schleifen.
.) Die Schreibzugriffe laufen über den Controller, damit dieser den Schreibcache bzw. die Generierung der Prüfsummen übernimmt (speziell bei RAID6 ist das ohne Hardwarebeschleunigung sonst extrem zäh). Deshalb die 22GB/s. Das dürfte das praktische Limit der Schnittstelle sein.
.) Beim Rebuild laufen auch alle Daten über den Controller, da dieser die Daten wieder mit Hilfe der Prüfsummen wiederherstellen muss, deshalb wieder das 22GB/s Limit.


Was der Markt jedoch wirklich braucht ist meiner Meinung nach ein sinnvoller PCIe 4.0/5.0 Controller, der selbst Schnittstellen für 8-16 M.2 SSDs bietet und für ein verträgliches Budget den Standard bietet, der mit klassischen Festplatten RAID Controllern die ganzen Jahre möglich war:
.) RAID6 mit der Möglichkeit einzelne defekte SSDs im Betrieb zu tauschen
.) Batterie/Kondensatorgestützten Schreibcache
 
  • Gefällt mir
Reaktionen: Mac_Leod
eastcoast_pete schrieb:
Anwendungen a la HANA brauchen.
Ob sie‘s brauchen weiß ich nicht. Aber nutzen auf jeden Fall. Und da sie (SAP) jetzt noch eine Firma gekauft haben, die sehr schnelle SSD virtuell als RAM anbindet, werden sie sich dieses Produkt mit Sicherheit ansehen.
Speicher kann für eine HANA weder zu groß noch zu schnell sein.
 
MichaG schrieb:
Noch weitaus mehr Leistung als klassische NVMe-RAID-SSD-Lösungen bietet die SupremeRAID SR-1010 vom kalifornischen Unternehmen GRAID. Mit Unterstützung von einer Nvidia-GPU sollen Daten sequenziell mit bis zu 110 GB/s gelesen werden. Wahlfrei sollen bis zu 16 Millionen IOPS erreicht werden.

Zur News: SupremeRAID SR-1010: SSD-RAID mit 110 GB/s und 19 Mio. IOPS dank GPU
Man hätte erwähnen müssen, daß diese Software keine Prüfung der geschriebenen Daten beinhaltet, ergo wenn die nvme keine Rückmeldung gibt, dann ist nicht gewährleistet, daß die Daten wirklich korrekt geschrieben werden. Ergo für den datenkritschen Einsatz ist diese Lösung wertlos.
Mehr dazu bei Level1Techs:
 
  • Gefällt mir
Reaktionen: geollum und Masamune2
Gibt es da nicht sowas wie „Windows 10 Workstation Edition“,die verspricht ja solch Limitierungen aufzuheben?
 
DataD schrieb:
Gibt es da nicht sowas wie „Windows 10 Workstation Edition“,die verspricht ja solch Limitierungen aufzuheben?
Die Edition, die Du meinst, unterstützt in erster Linie bis zu 4 CPUs und bis zu 6TB RAM, mit solchen NVMe-Raids hat das jedoch nichts zu tun... oder welche Limitierungen meinst Du denn?
 
blubberz schrieb:
Ist ja dann schneller als der Arbeitsspeicher, oder?
Im Durchsatz verglichen mit Desktop PCs ja, in der Zugriffszeit nicht.
Da liegt Ram im Nanosekundenbereich mit 50-60ns,
SSDs bei ca 50 Mikrosekunden, Unterschied Faktor 1000
 
  • Gefällt mir
Reaktionen: Gast12345 und Bigfoot29
massaker schrieb:
Die Edition, die Du meinst, unterstützt in erster Linie bis zu 4 CPUs und bis zu 6TB RAM, mit solchen NVMe-Raids hat das jedoch nichts zu tun... oder welche Limitierungen meinst Du denn?
Mir war so als wäre dort auch von Datenspeicher-Leistung die Rede gewesen.
Ergänzung ()

https://www.microsoft.com/de-ch/mic...rosoft-announces-windows-10-pro-workstations/
Ergänzung ()

Hatte wohl den punkt Persistenter Speicher seiner Zeit nur Überflogen😅
Ergänzung ()

Aber halt! Mit dem Testsystem welches beschrieben wurde muss ja ein Server OS von Microsoft genutzt worden sein welches dann auch alle funktionen von Win 10 Workstation beinhalten würde. Bzw. Win10 Workstation genutzt wurde.
 
Zuletzt bearbeitet:
Masamune2 schrieb:
Ist irgendwie etwas Augenwischerei denn die Leseleistung könnte man auch komplett ohne die Karte erreichen, hier ist die PCIe Bandbreite die ein System hat letztendlich der Flaschenhals. Da die Karte selbst ja auch nur ein einem PCIe x16 Slot steckt können die Daten beim lesen da ja nicht durchwandern, sonst wär bei PCIe 4 bei knapp 31GB/s Schluss.
Interessant ist erst die Schreibgeschwindigkeit aber die Zahl ist dann nicht mehr so schön hoch. Da begrenzt eben die Schnittstelle der Karte.
Dabei gilt zu berücksichtigen, dass das Ding scheinbar 2 Slots blockiert.
Bei einem standard 2 HE Server ist das schon viel.
 
DataD schrieb:
Mir war so als wäre dort auch von Datenspeicher-Leistung die Rede gewesen.
Im Vergleich zu aktuellen Linux Kerneln ist Windows schon ziemlich langsam was IO betrifft. Selbst mit I/O Ring, der Windows Variante von io_uring was unter Linux das Mittel der Wahl für richtig schnelles IO ist. Siehe z.B. hier ne Messung von Jens Axboe.

Wobei man im Detail natürlich ein bisschen differenzieren muss. IO mit großen Blöcken ist einfach und da bekommt man auch unter Windows die Schnittstellen problemlos ausgelastet. Aber wenn man wissen will wie groß der Einfluss des OS ist, dann testet man mit maximaler Last, heißt kleine Blöcke, tiefe IO Queues etc. damit generiert man maximal viele IO Befehle die das OS abarbeiten muss und da zeigt sich dann, dass Windows einen großen Overhead im Vergleich zu Linux hat. io_uring unter Linux ist eine fantastische Möglichkeit Systemcalls zu vermeiden die teuer sind was Rechenzeit angeht. Wie schon in #15 verlinkt, ist es möglich mit einem einzigen Core weit über 10M IOPS abzuarbeiten mit io_uring was die reine Rechenzeit für das IO angeht. Und je schneller das OS IO abarbeiten kann, umso mehr Rechenzeit steht für andere Aufgaben zur Verfügung.
 
Zuletzt bearbeitet: (Typo)
madmax2010 schrieb:
Jetzt nur die Frage: Why :D
Selbst im Enterprise umfeld wirds da schon wirklich schwierig die noch zu rechtfertigen. Nutzrt man sie im CDN, braucht der server eine Anbindung von mindestens 1 Tbit/s und am Ende limitiert dann doch die CPU :D
Aus einem einfachen Grund: um CPU Cycles zu sparen und diese dann für andere Berechnungen frei zu haben, da die GPU fast alle Rechenschritte bzgl. der SSDs übernimmt.
 
eastcoast_pete schrieb:
Erster Impuls: Haben wollen! Dann: NVIDIA GPU
Kannst du uns verdeutlichen was du damit meinst? Gibt es eine AMD oder Intel GPU die hier mehr Leistung bieten könnte? Das wäre natürlich interessant.
Ergänzung ()

Fresh-D schrieb:
Das ist jetzt aber überraschend - Zitat Artikel:
SupremeRaid SR-1010 mit Nvidia-A2000-GPU (Bild: GRAID)
 
  • Gefällt mir
Reaktionen: Bigfoot29
Fresh-D schrieb:
Das Ding sieht aus wie die A2000 von NV...
Wenn Du den News-Text gelesen hättest, dann würdest Du wissen, dass "das Ding" ist einfach eine A2000 mit einer Video-Anschluss-losen Blende (die sind nicht einmal weg gelötet, sind unter der Blende noch da!). Da ist einfach ein anderer Treiber+Lizenzen drauf (sieh Dir am besten das Video von Linus an!). Ist quasi so ähnlich wie die PhysX-Beschleuniger damals, als man das einfach mit einer älteren Graka erledigt hat.
 
  • Gefällt mir
Reaktionen: andi_sco, Bigfoot29 und DataD
Chuuei schrieb:
Die Devices sind immer direkt am Host angeschlossen
Also ist der Controller kein Controller sondern ein Prüfsummengenerator?
 
Nore Ply schrieb:
Also ist der Controller kein Controller sondern ein Prüfsummengenerator?
Das ist zu 95% korrekt. Parity-Offloader, wenn Du das mit den Ssl-Offloadern für Webkram vergleichen willst. :)

Das "Produkt" ist der PO und der zugehörige Dateisystemtreiber.

Regards, Bigfoot29
 
  • Gefällt mir
Reaktionen: Gast12345 und Nore Ply
Bigfoot29 schrieb:
Das "Produkt" ist der PO und der zugehörige Dateisystemtreiber.
laut dem ltt video ist das "tolle" an dieser kombination, dass anscheinend der treiber per lizenz an die gpu gebunden ist. nicht nur, dass man sich propritären krams ins system holt, man kann bei einem gpu defekt anscheinend noch nicht mal schnell das ding austauschen. bei normalen hw-raid-controllern ist ja zumindest das möglich. da es wohl dieses produkt und vielleicht auch die ganze firma nicht lange geben wird, ist das natürlich besonders vertrauenserweckend :)
 
  • Gefällt mir
Reaktionen: Piktogramm
Jein... üblicherweise hast Du natürlich entweder Ersatz-HW da, deren Lizenz ja notfalls kurzfristig per Inter-Netz geliefert werden kann oder aber das System ist eh nicht nur 1x in Betrieb sondern irgendwo gibts noch ein Fallback.

Aber insgesamt stimmt es schon... sowohl das Produkt selbst (keine echte Datensicherheit, HW-Ersatz, Bindung an nur ein Dateisystem) als auch die Hintergründe sind noch... ausbaufähig. :D

Aber so ist das nunmal... der erste, der was Rad-ähnliches erfunden hat, wird auch nicht wegen der Kritik "so ganz rund läuft das aber noch nicht!" aufgehört haben. Irgendwer hat ne Idee und setzt es um. Jetzt liegt es an den Beteiligten, was Rundes draus zu machen. - Oder es verschwindet halt wieder in der Versenkung.

Regards, Bigfoot29
 
  • Gefällt mir
Reaktionen: andi_sco
Zurück
Oben