Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)
Vor ein paar Tagen veröffentlichte Google eine Beschränkung der kostenlosen Gemini Bildgenerierung auf 100 Bilder am Tag. Heute war aber schon nach 10 Bildern Schluss.
Ist eigentlich etwas in Aussicht, das eine 3090 als "Mainstream" Lösung für lokale Generierung ablösen könnte? Ist ja nun auch schon n paar Jährchen alt. 4090 hat ebenfalls 24 GB Vram und die 5090 ist zwar schneller verbreaucht aber auch wesentlich mehr. Ist da irgendwas abseit von umgelöteten Varianten mit mehr Vram in Aussicht? Ich hab eine 3090, aber wenn ich für die Arbeit was neues zusammenstellen müsste, wäre da wohl nur die 5090 die auch neu verfügbar ist und Sinn macht, oder?
Die wären eine Option. Allerdings muss man hier erstmal abwarten wie gut der Support sein wird für AMD und comfyui. Da muss AMD auch stark in die Pflicht genommen werden.
Andernfalls kann man aktuell echt nur hoffen das der "Super" refresh wirklich mit 24GB daher kommen wird.
Danke für den Upscaler! War da tatsächlich schon auf der Suche nach was Gutem. Heute Abend in meine Portable Installation gepackt. Werde ich die Tage mal durchtesten!
Edit: ah, what the hell. Mal die Standard Dame rein gepackt und 3-fach hochskaliert... ich bin schwer begeistert!
Edit 2: mal probieren, Supersharp als Upscaler dran zu hängen. Dann dürfte 4k Wallpapern nix mehr im Wege stehen.
Von 2.62 it/s auf 4.21 it/s mit SDXL 1024x1024 durch neue Version von pytorch ROCm 7.0.0 RC1 (23 September 2025)... Es geht Vorwärts.
Aktuell kann ich Flux 1 Dev FP8 nicht testen da es nur im CPU Modus stecken blieb. Ich warte auf ein Fix für ComfyUI.
Habt ihr eigentlich eine sichere Methode um mit Nano Banana bei Gemini direkt in 16:9 Bilder zu erstellen? Oder bei Perplexity und Seedream 4 direkt 16:9. Egal was ich versuche, irgendwie kommt fast jedes Bild nur im Format 1:1 heraus.
Bei anderen Anbieter kann z.B. bei Seedream direkt Formate wie 16:9 auswählen. Ich verstehe einfach nicht warum die größten Anbieter sowas nicht anbieten. Und selbst ein "Erstelle ein Bild in 16:9 wird ignoriert. Auch wenn man ein 16:9 transparentes Bild angibt und sagt er soll das bearbeiten, kommt nur 1:1 heraus. Wenn ich aber ein richtig Bild in 16:9 habe und nur kleine Änderungen möchte, gibt er mir wieder 16:9 aus.
Bei OpenAI hat man neben 1:1 immerhin noch 2:3 und 3:2, aber auch da muss man für 16:9 später das Bild noch erweitern oder schneiden...
Bei Openart.ai z.B. geht 16:9 mit Seedream oder Nano. Andere Seiten habe ich jetzt nicht geschaut. Ich würde (wenn ich mir ein Abo holen würde) eine solche bewährte Multimodel-Seite nehmen
Habe Gemini nachgefragt. (Gemini 2.5 Flash). Aktuell ein internes Problem. Die untersuchen und arbeiten dran für ein fix. Temporär läuft nur noch 1:1 und maximal 1024x1024. Alle anderen Formate bzw. Auflösungen werden ignoriert. Vorher funktionierte es einwandfrei.
Mehr kann ich es leider nicht helfen. Ich hatte vor ein paar Wochen ein paar Bildern in Google Gemini Web herum experimentiert.
Bei Openart.ai z.B. geht 16:9 mit Seedream oder Nano. Andere Seiten habe ich jetzt nicht geschaut. Ich würde (wenn ich mir ein Abo holen würde) eine solche bewährte Multimodel-Seite nehmen
Habe Gemini nachgefragt. (Gemini 2.5 Flash). Aktuell ein internes Problem. Die untersuchen und arbeiten dran für ein fix. Temporär läuft nur noch 1:1 und maximal 1024x1024. Alle anderen Formate bzw. Auflösungen werden ignoriert. Vorher funktionierte es einwandfrei.
Mehr kann ich es leider nicht helfen. Ich hatte vor ein paar Wochen ein paar Bildern in Google Gemini Web herum experimentiert.
Super, dass hilft mir schon mal weiter. Ich habe durch mein Pixel Smartphone ein Google Abo und auch kostenloses Perplexity Pro Abo (Nano Banana, GPT Image1, Seedream, Flux auswählbar) bekommen. Da ist es dann natürlich ärgerlich, wenn überall nur 1:1 geht. Und selbst bei der Adobe Cloud sind mittlerweile einige Bildgeneratoren dabei. Jetzt in der Beta sogar direkt in Photoshop Nano Banana und Flux.
Da tue ich mich schwer noch ein Abo abzuschließen, damit ich 16:9 erstellen kann. Dann werde ich einfach mal abwarten.
"NVIDIA and Black Forest Labs worked together to quantize FLUX.1 Kontext [dev], reducing the model size from 24GB to 12GB for FP8 (NVIDIA Ada Generation GPUs) and 7GB for FP4 (NVIDIA Blackwell architecture). The FP8 checkpoint is optimized for GeForce RTX 40 Series GPUs, which have FP8 accelerators in their Tensor Cores. The FP4 checkpoint is optimized for GeForce RTX 50 Series GPUs and uses a new method called SVDQuant, which preserves image quality while reducing model size."
Nvidia hat da einige Optimierungen mit Flux gemacht. Geht über ComfyUI + NIM laden.
Flux Krea Modell anschauen -> sehr realistisch, natürlich
Qwen Model, ist genial zum Bearbeiten von Bildern,
Wenn du eine 4000er 5000er GPU hast, sollte 12GB VRAM eigentlich dann reichen. Eventuell schauen, dass du nichts anderes offen hast.
-> ComfyUI hat mittlerweile eine eigene Plattform, muss also nicht mehr umständlich installieren alles, sondern sollte mit wenigen Klicks funktionieren. https://www.comfy.org/
@MiZubiki Wenn Du bereits Erfahrungen mit Forge hast, wäre das hier (Forge Neo) für Dich passend, ich habe es noch nicht selbst getestet, aber schon öfter davon gelesen. Es ist quasi Forge mit Unterstützung aller neuen Modelle, inkl. der Verfahren, die für maximale Beschleuningung sorgen wie Sage Attention, Nunchaku Modelle etc.
Was auf Deinem System an Modellen am schnellsten und besten läuft, findest Du am einfachsten per Trial and Error heraus, indem Du mal die verschiedenen Modellvarianten durchprobierst Noch ein Video zu Forge Neo:
YouTube
An dieser Stelle steht ein externer Inhalt von YouTube, der den Forumbeitrag ergänzt. Er kann mit einem Klick geladen und auch wieder ausgeblendet werden.
PS: Bzgl. Flux Modelle hat mir dieser kürzlich releaste Finetune gut gefallen (habe die Fp16 Variante genutzt, gibt aber auch q4gguf 7GB Variante usw.). Ist im Prinzip Flux Dev mit wesentlich besserer Haut-/und generell Detail-Darstellung
Ist sehr gut gelungen, zb. auch die Schatten der Wimpern usw. - es wurde wahrscheinlich mehr als nur Qwen allein einsgesetzt, also LORA(s) und ein anderes Modell zum Refinen (Hautdetails usw.) im Upscale Prozess?