syfsyn
Admiral
- Registriert
- Nov. 2010
- Beiträge
- 8.841
Da Blackwell solala ist und die arch auf 64bit umgestellt wurde darum kein cuda 32bit support und kein 32bit physx mehr
War das neben der grottenschlechte Effizienz der Sargnagel für die gen.
Es kommt theoretisch noch rubin aber ich ahne das nvidia eher blackwell in n3 neu auflegen wird was gut für die Effizienz wird oder was eher sein wird den Takt auf 3,2ghz hievt
Die alternative wäre feynmen 2028 und in a16 node als apu was sowieso nvidia ziel ist
Aus der arch Sicht her muss nvidia die sm auf 256 alu steigern und den legacy support ohne rbar aufgeben was hags voraussetzt
Das ist gut für ne gpu, das wird aber teuer da kleine chips sich nur für apu lohnen und ein halo Produkt nur den die dicksten chip gibt sprich Profi karten
Da man von den 12gpc nicht abweichen kann wären das 12*256*16=49152 alu davon rechnen maximal 36864
ich gehe aber davon aus das maximal per gpc je 14sm aktiv sind also 32256 alu bei grob 3,6ghz
Das wird keine cpu schaffen reale 232tf
Der halbe chip könnte es aber geben mit dann 116tf 600w PL
Da auch zen6 mittlerweile mit 7,0ghz gehandelt wird ich gehe eher von 6,7ghz aus. dürfte ne rtx5090 endlich ausgelastet werden (reale 84tf mit hags) in einen dx12 spiel.
Der chip wäre mit nur 6 gpc bei grob 327mm²
name vermutlich Fe204 ak3 rtx f6000
Der cache wird dadurch per gpc halbiert von aktuell 48mb auf 6gpc a14sm a256alu
Der L1 steigt aber zum doppelten auf per sm
Das ist zum Nachteil für ai workloads aber in gaming macht das nix, da gaming Echtzeit ist und große cache ins leere laufen. Das ist seit ada gen so.
Die folge nvidia muss feynmen als apu bringen mit dann maximal 2 gpc und an ram angebundenen ddr6 mit 512bit (14gt/s) +-896gb/s
Es ist noch unklar ob nvidia auch x86 cpu verbauen kann Sinnvoll wäre es.
Der kleinere chip als apu wäre mit cpu bei 202mm² gpu tile 112mm² cpu um die 90mm² intel 8p+32 ecores
perf bei grob rtx4080lvl dazu die alte gpu bis rtx40 als physx Beschleuniger 50% PT bei ada möglich
Stromaufnahme bei 120w
apu also 200w tdp
Ob es desktop feymen gibt ist unklar die Tendenz ist nein.
rubin ist klar ne data center ai gpu da man hier deutlich von geforce design abweichen wird. ähnlich wie es hopper 2017 war
Der Fokus liegt hier bei den tensor cores die maximal vervierfacht werden dürften aus derzeit 4 wird 16
Darum gehe ich fasst davon aus das blackwell in n3 refreshed wird eventuell mit schon halbierten cache
Für mich als Spieler lohnt kein Wechsel vor feynmen und eventuell gar keine nvidia mehr sondern amd apu bis dahin müsste es separate physx Treiber geben.
Das ist eher blöd gelaufen mit den dgpu, amd mit udna und nvida mit feynmen sind die cpu bei grob 7,7ghz n2 node
48% mehr ipc 2028 an und das kann min ne 1,5 fache rtx5090 auslasten
amd apu sind entsprechend auf a14 node bei grob 12288 alu und grob 4,0ghz unterwegs 130tf im maximum
Warum keine desktop gpu liegt an am6 512bt si und maximal 16gt/s ddr6 camm2 module 1024gb/s+cache 248gb/s eventuell hbm4 4gb mit 1024bit 5,6gbits +716gb/s insgesamt theoretische 1,9pb/s
Das ist möglich da a14 bis zu 85% kleiner wird als n4
Eine dgpu ist denkbar aber wird in der Herstellung zu teuer. primär vram preise
Zumal das tile nur 185mm² misst 4se a24cu doppelte alu menge. apu tdp bei 250w chip package bei 250mm²
das gute an dem design man kann die ddr6 module selber in der Größe bis 192gb gehen, vram ist also kein problem mehr
Die zeit der dgpu ist vorbei ich rechne noch mitn refresh blackwell als rtx60 gen danach nur noch apu name unklar möglich das nvidia diese igp als ptx Serie bringt mit eigenen Treiber.
Der Fokus ist ai und cache ist teuer in der Fläche da es vor a14 nicht möglich ist diese in der Fläche zu halbieren
Sobald aber bspd kommt was ich mit a14 rechne können alu Blöcke gestapelt werden, eventuell legt man die alu auf den cache und Si.
Das ermöglicht noch mehr perf. Aber ne dgpu wird damit nicht kommen die Ursache liegt am vram preis. derzeit min für 32gb grob 320$
Und weniger als 24gb sind ab der ps6 bzw xbox pc nicht zu gebrauchen
Nvidia versuch das über ai Generierung zu fixen also den vram bedarf drastisch zu verkleinern, das wird scheitern.
Engines die das unterstützen wären nur UE5 und möglich unity der Rest fokussiert sich auf publisher engines die auf die ps6 und ps5 pro sein wird wobei ps5 pro das min darstellt.
Das wird man deutlich sehen wo mit udna und massiv viel vram. Das wird wie in filmen aussehen: Da man es quasi per pathtraycing mit denoising x64 darstellen kann.
Nviida muss ne gaming dgpu mit ampere Grundgerüst neu erstellen und massiv viel mehr vram verbauen um da mitzuhalten sofern nvidia überhaupt noch ne Plattform hat wo man dgpu verbauen kann.
Darum die apu Systeme
ada war gut /rtx40, blackwell /rtx50 ist ne Katastrophe gleicher node keine Effizienz Verbessrung, ans limit bei tbp und massiv in cpu limits, einzig dx12 spiele profitieren vom neuen amp Einheit wenn die cpu das schafft. hags erforderlich
Voll auf Software Fokussiert.
Das ist das ende eines Giganten und hoffentlich mit win 12 Treibern für die alten gens win 12 akä xbox os
Win 11 wird uns erhalten bleiben bis zum eol 2030
Das ist ein speku thread klar kann es anders kommen aber alle Anzeichen sagen klar aus das nvidia gamer egal sind, man nimmt sie mit auf dem Weg zur robotic Ausrüster und ai Farmen Bauer.
ich habe die Theorie seit übern Jahr und es ist das schlechte Szenario wo alles zur apu Systemen wandert
Wäre blackwell schon doppelte alu mit reduzierten sram Anteil also in n3 und nicht in 64bit umgestellt (software)
wäre das ein valider upgrade zu ner rtx40 gpu geworden. min +50% perf. je sku und doppelten vram allerdings gddr6
und leicht größeren Si etwa 256bit fürn gb205 32gb
Das nvidia aber die ada gen mit 64bit Umstellung und kein nodesprung gemacht hat rächt sich.
Derzeit kann ich nur amd rx9070/xt rx9060xt empfehlen
Nvidia ist raus und die rtx40 Serie ist im Abverkauf schon bei den preisen am steigen.
Die p/l gpu aktuell ist die rx9070 das beste, das schafft keine nvidia gpu. Und der dxr abstand ist klein -15% bei gleicher sm vs cu menge
Viel text viele Ideen aber immer das gleiche ich weiß ich wünschte es wäre anders.
Letzte game kauf soulreaver 1&2 remaster endlich ordentliche Steuerung
BO6 das hat kein dxr, cw hat es
robocop war nett bei der demo und billig
beyoud two souls war billig
nebenbei können die nicht mal die Texturen besser packen bo6 frisst 90gb
benchmark 140fps 7,9gb Auslastung 97% sobald alles geladen ist
Wenn ich mir das erste bo ansehen sehe ich da kaum ein unterschied 90gb vs 9gb aber deutlich
ja es ist eckiger das stört aber kaum.
Das 90fps limit war damals sinnig bis dahin war der Mp halbwegs brauchbar
Warum ich es geholt habe nun Benchmarks gefolgt von zombies. Zumal geld habe ich begrenzt aber rumliegen nützt es nix
War das neben der grottenschlechte Effizienz der Sargnagel für die gen.
Es kommt theoretisch noch rubin aber ich ahne das nvidia eher blackwell in n3 neu auflegen wird was gut für die Effizienz wird oder was eher sein wird den Takt auf 3,2ghz hievt
Die alternative wäre feynmen 2028 und in a16 node als apu was sowieso nvidia ziel ist
Aus der arch Sicht her muss nvidia die sm auf 256 alu steigern und den legacy support ohne rbar aufgeben was hags voraussetzt
Das ist gut für ne gpu, das wird aber teuer da kleine chips sich nur für apu lohnen und ein halo Produkt nur den die dicksten chip gibt sprich Profi karten
Da man von den 12gpc nicht abweichen kann wären das 12*256*16=49152 alu davon rechnen maximal 36864
ich gehe aber davon aus das maximal per gpc je 14sm aktiv sind also 32256 alu bei grob 3,6ghz
Das wird keine cpu schaffen reale 232tf
Der halbe chip könnte es aber geben mit dann 116tf 600w PL
Da auch zen6 mittlerweile mit 7,0ghz gehandelt wird ich gehe eher von 6,7ghz aus. dürfte ne rtx5090 endlich ausgelastet werden (reale 84tf mit hags) in einen dx12 spiel.
Der chip wäre mit nur 6 gpc bei grob 327mm²
name vermutlich Fe204 ak3 rtx f6000
Der cache wird dadurch per gpc halbiert von aktuell 48mb auf 6gpc a14sm a256alu
Der L1 steigt aber zum doppelten auf per sm
Das ist zum Nachteil für ai workloads aber in gaming macht das nix, da gaming Echtzeit ist und große cache ins leere laufen. Das ist seit ada gen so.
Die folge nvidia muss feynmen als apu bringen mit dann maximal 2 gpc und an ram angebundenen ddr6 mit 512bit (14gt/s) +-896gb/s
Es ist noch unklar ob nvidia auch x86 cpu verbauen kann Sinnvoll wäre es.
Der kleinere chip als apu wäre mit cpu bei 202mm² gpu tile 112mm² cpu um die 90mm² intel 8p+32 ecores
perf bei grob rtx4080lvl dazu die alte gpu bis rtx40 als physx Beschleuniger 50% PT bei ada möglich
Stromaufnahme bei 120w
apu also 200w tdp
Ob es desktop feymen gibt ist unklar die Tendenz ist nein.
rubin ist klar ne data center ai gpu da man hier deutlich von geforce design abweichen wird. ähnlich wie es hopper 2017 war
Der Fokus liegt hier bei den tensor cores die maximal vervierfacht werden dürften aus derzeit 4 wird 16
Darum gehe ich fasst davon aus das blackwell in n3 refreshed wird eventuell mit schon halbierten cache
Für mich als Spieler lohnt kein Wechsel vor feynmen und eventuell gar keine nvidia mehr sondern amd apu bis dahin müsste es separate physx Treiber geben.
Das ist eher blöd gelaufen mit den dgpu, amd mit udna und nvida mit feynmen sind die cpu bei grob 7,7ghz n2 node
48% mehr ipc 2028 an und das kann min ne 1,5 fache rtx5090 auslasten
amd apu sind entsprechend auf a14 node bei grob 12288 alu und grob 4,0ghz unterwegs 130tf im maximum
Warum keine desktop gpu liegt an am6 512bt si und maximal 16gt/s ddr6 camm2 module 1024gb/s+cache 248gb/s eventuell hbm4 4gb mit 1024bit 5,6gbits +716gb/s insgesamt theoretische 1,9pb/s
Das ist möglich da a14 bis zu 85% kleiner wird als n4
Eine dgpu ist denkbar aber wird in der Herstellung zu teuer. primär vram preise
Zumal das tile nur 185mm² misst 4se a24cu doppelte alu menge. apu tdp bei 250w chip package bei 250mm²
das gute an dem design man kann die ddr6 module selber in der Größe bis 192gb gehen, vram ist also kein problem mehr
Die zeit der dgpu ist vorbei ich rechne noch mitn refresh blackwell als rtx60 gen danach nur noch apu name unklar möglich das nvidia diese igp als ptx Serie bringt mit eigenen Treiber.
Der Fokus ist ai und cache ist teuer in der Fläche da es vor a14 nicht möglich ist diese in der Fläche zu halbieren
Sobald aber bspd kommt was ich mit a14 rechne können alu Blöcke gestapelt werden, eventuell legt man die alu auf den cache und Si.
Das ermöglicht noch mehr perf. Aber ne dgpu wird damit nicht kommen die Ursache liegt am vram preis. derzeit min für 32gb grob 320$
Und weniger als 24gb sind ab der ps6 bzw xbox pc nicht zu gebrauchen
Nvidia versuch das über ai Generierung zu fixen also den vram bedarf drastisch zu verkleinern, das wird scheitern.
Engines die das unterstützen wären nur UE5 und möglich unity der Rest fokussiert sich auf publisher engines die auf die ps6 und ps5 pro sein wird wobei ps5 pro das min darstellt.
Das wird man deutlich sehen wo mit udna und massiv viel vram. Das wird wie in filmen aussehen: Da man es quasi per pathtraycing mit denoising x64 darstellen kann.
Nviida muss ne gaming dgpu mit ampere Grundgerüst neu erstellen und massiv viel mehr vram verbauen um da mitzuhalten sofern nvidia überhaupt noch ne Plattform hat wo man dgpu verbauen kann.
Darum die apu Systeme
ada war gut /rtx40, blackwell /rtx50 ist ne Katastrophe gleicher node keine Effizienz Verbessrung, ans limit bei tbp und massiv in cpu limits, einzig dx12 spiele profitieren vom neuen amp Einheit wenn die cpu das schafft. hags erforderlich
Voll auf Software Fokussiert.
Das ist das ende eines Giganten und hoffentlich mit win 12 Treibern für die alten gens win 12 akä xbox os
Win 11 wird uns erhalten bleiben bis zum eol 2030
Das ist ein speku thread klar kann es anders kommen aber alle Anzeichen sagen klar aus das nvidia gamer egal sind, man nimmt sie mit auf dem Weg zur robotic Ausrüster und ai Farmen Bauer.
ich habe die Theorie seit übern Jahr und es ist das schlechte Szenario wo alles zur apu Systemen wandert
Wäre blackwell schon doppelte alu mit reduzierten sram Anteil also in n3 und nicht in 64bit umgestellt (software)
wäre das ein valider upgrade zu ner rtx40 gpu geworden. min +50% perf. je sku und doppelten vram allerdings gddr6
und leicht größeren Si etwa 256bit fürn gb205 32gb
Das nvidia aber die ada gen mit 64bit Umstellung und kein nodesprung gemacht hat rächt sich.
Derzeit kann ich nur amd rx9070/xt rx9060xt empfehlen
Nvidia ist raus und die rtx40 Serie ist im Abverkauf schon bei den preisen am steigen.
Die p/l gpu aktuell ist die rx9070 das beste, das schafft keine nvidia gpu. Und der dxr abstand ist klein -15% bei gleicher sm vs cu menge
Viel text viele Ideen aber immer das gleiche ich weiß ich wünschte es wäre anders.
Letzte game kauf soulreaver 1&2 remaster endlich ordentliche Steuerung
BO6 das hat kein dxr, cw hat es
robocop war nett bei der demo und billig
beyoud two souls war billig
nebenbei können die nicht mal die Texturen besser packen bo6 frisst 90gb
benchmark 140fps 7,9gb Auslastung 97% sobald alles geladen ist
Wenn ich mir das erste bo ansehen sehe ich da kaum ein unterschied 90gb vs 9gb aber deutlich
ja es ist eckiger das stört aber kaum.
Das 90fps limit war damals sinnig bis dahin war der Mp halbwegs brauchbar
Warum ich es geholt habe nun Benchmarks gefolgt von zombies. Zumal geld habe ich begrenzt aber rumliegen nützt es nix