tomgit
Rear Admiral
- Registriert
- Nov. 2015
- Beiträge
- 5.164
a.) Diminishing Returns sind auch bei Bildmodellen eine Sache. Nur weil das Modell ein vielfaches größer ist, bedeutet es nicht zwangsweise, dass das Modell auch ein vielfaches besser ist. Quantifizierungen erlauben oftmals 99% der Qualität bei einem deutlich geringeren Hardwarebedarftherealcola schrieb:Kann man nicht weil man nicht die nötigen Ressourcen im System hat.
b.) Fine-Tuning ist bei Bildmodellen viel geläufiger als bei Sprachmodellen, d.h. spezialisierte Modelle sind wahrscheinlicher zu finden oder einfacher zu produzieren
c.) Sehr gute Modelle passen bereits in unter 20GB VRAM und eine 5090 fasst 32GB VRAM
d.) Menschen, die das professionell machen, oder extreme Enthusiasten haben oftmals sogar Workstation-Grafikkarten! Und eine RTX Pro 6000 hat etwa 96GB VRAM, wovon man mehrere parallel schalten kann.
e.) Im Zweifel kann man auch kleinere Bilder generieren lassen und diese upscalen, inzwischen auch mit sehr guten Ergebnissen