[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Bastelschlumpf schrieb:
Google Gemini - nur noch 10 Bilder am Tag?

Vor ein paar Tagen veröffentlichte Google eine Beschränkung der kostenlosen Gemini Bildgenerierung auf 100 Bilder am Tag. Heute war aber schon nach 10 Bildern Schluss.
Die Firmen haben aus der DotCom Zeit gelernt und wollen jetzt schneller Geld verdienen.

Habe noch das https://support.google.com/gemini/answer/16275805?hl=de gefunden.
 
Ist eigentlich etwas in Aussicht, das eine 3090 als "Mainstream" Lösung für lokale Generierung ablösen könnte? Ist ja nun auch schon n paar Jährchen alt. 4090 hat ebenfalls 24 GB Vram und die 5090 ist zwar schneller verbreaucht aber auch wesentlich mehr. Ist da irgendwas abseit von umgelöteten Varianten mit mehr Vram in Aussicht? Ich hab eine 3090, aber wenn ich für die Arbeit was neues zusammenstellen müsste, wäre da wohl nur die 5090 die auch neu verfügbar ist und Sinn macht, oder?
 
Hier ein Beispiel was mit dem Upscaler "SUPIR" möglich ist.

QWN_Joker_SUPIR.jpg
 
Danke für den Upscaler! War da tatsächlich schon auf der Suche nach was Gutem. Heute Abend in meine Portable Installation gepackt. Werde ich die Tage mal durchtesten!

Edit: ah, what the hell. Mal die Standard Dame rein gepackt und 3-fach hochskaliert... ich bin schwer begeistert!

Edit 2: mal probieren, Supersharp als Upscaler dran zu hängen. Dann dürfte 4k Wallpapern nix mehr im Wege stehen.
 

Anhänge

  • ComfyUI_temp_napfk_00001_.png
    ComfyUI_temp_napfk_00001_.png
    4,7 MB · Aufrufe: 95
Zuletzt bearbeitet: (Zusatz)
  • Gefällt mir
Reaktionen: MechanimaL und Rickmer
Habt ihr eigentlich eine sichere Methode um mit Nano Banana bei Gemini direkt in 16:9 Bilder zu erstellen? Oder bei Perplexity und Seedream 4 direkt 16:9. Egal was ich versuche, irgendwie kommt fast jedes Bild nur im Format 1:1 heraus.

Bei anderen Anbieter kann z.B. bei Seedream direkt Formate wie 16:9 auswählen. Ich verstehe einfach nicht warum die größten Anbieter sowas nicht anbieten. Und selbst ein "Erstelle ein Bild in 16:9 wird ignoriert. Auch wenn man ein 16:9 transparentes Bild angibt und sagt er soll das bearbeiten, kommt nur 1:1 heraus. Wenn ich aber ein richtig Bild in 16:9 habe und nur kleine Änderungen möchte, gibt er mir wieder 16:9 aus.

Bei OpenAI hat man neben 1:1 immerhin noch 2:3 und 3:2, aber auch da muss man für 16:9 später das Bild noch erweitern oder schneiden...

Wie macht ihr das?
 
Bei Openart.ai z.B. geht 16:9 mit Seedream oder Nano. Andere Seiten habe ich jetzt nicht geschaut. Ich würde (wenn ich mir ein Abo holen würde) eine solche bewährte Multimodel-Seite nehmen :)
 
  • Gefällt mir
Reaktionen: Ayo34
Habe Gemini nachgefragt. (Gemini 2.5 Flash). Aktuell ein internes Problem. Die untersuchen und arbeiten dran für ein fix. Temporär läuft nur noch 1:1 und maximal 1024x1024. Alle anderen Formate bzw. Auflösungen werden ignoriert. Vorher funktionierte es einwandfrei.

Mehr kann ich es leider nicht helfen. Ich hatte vor ein paar Wochen ein paar Bildern in Google Gemini Web herum experimentiert.
 
  • Gefällt mir
Reaktionen: Ayo34
MechanimaL schrieb:
Bei Openart.ai z.B. geht 16:9 mit Seedream oder Nano. Andere Seiten habe ich jetzt nicht geschaut. Ich würde (wenn ich mir ein Abo holen würde) eine solche bewährte Multimodel-Seite nehmen :)
Mordekai2009 schrieb:
Habe Gemini nachgefragt. (Gemini 2.5 Flash). Aktuell ein internes Problem. Die untersuchen und arbeiten dran für ein fix. Temporär läuft nur noch 1:1 und maximal 1024x1024. Alle anderen Formate bzw. Auflösungen werden ignoriert. Vorher funktionierte es einwandfrei.

Mehr kann ich es leider nicht helfen. Ich hatte vor ein paar Wochen ein paar Bildern in Google Gemini Web herum experimentiert.

Super, dass hilft mir schon mal weiter. Ich habe durch mein Pixel Smartphone ein Google Abo und auch kostenloses Perplexity Pro Abo (Nano Banana, GPT Image1, Seedream, Flux auswählbar) bekommen. Da ist es dann natürlich ärgerlich, wenn überall nur 1:1 geht. Und selbst bei der Adobe Cloud sind mittlerweile einige Bildgeneratoren dabei. Jetzt in der Beta sogar direkt in Photoshop Nano Banana und Flux.

Da tue ich mich schwer noch ein Abo abzuschließen, damit ich 16:9 erstellen kann. Dann werde ich einfach mal abwarten.
 
  • Gefällt mir
Reaktionen: Mordekai2009 und MechanimaL
Hat einer von Euch ein Flux fp8 Modell auf einer 4070ti (12GB) zum Laufen bekommen?

Ich haben jetzt ein 4 Bit Modell am laufen, wenn auch recht langsam. Das Promtverständnis und Textgenerierung ist aber echt toll.

Mich würde interessieren ob einer von Euch schon mal unterschiedliche Quantisierungen von Flux gegenübergestellt hat?

Ich nutze derzeit Forge. Könnte ich eventuell mit Comfy Ui zeiteffizienter Bilder generieren? Ich habe mit ComfyUi noch keinerlei Erfahrung.

Lg
 
MiZubiki schrieb:
Hat einer von Euch ein Flux fp8 Modell auf einer 4070ti (12GB) zum Laufen bekommen?

Das könnte interessant für dich sein:
https://blogs.nvidia.com/blog/rtx-ai-garage-flux-kontext-nim-microservice-siggraph/

"NVIDIA and Black Forest Labs worked together to quantize FLUX.1 Kontext [dev], reducing the model size from 24GB to 12GB for FP8 (NVIDIA Ada Generation GPUs) and 7GB for FP4 (NVIDIA Blackwell architecture). The FP8 checkpoint is optimized for GeForce RTX 40 Series GPUs, which have FP8 accelerators in their Tensor Cores. The FP4 checkpoint is optimized for GeForce RTX 50 Series GPUs and uses a new method called SVDQuant, which preserves image quality while reducing model size."

Nvidia hat da einige Optimierungen mit Flux gemacht. Geht über ComfyUI + NIM laden.

+ das neuste Update:
https://blogs.nvidia.com/blog/rtx-ai-garage-comfyui-wan-qwen-flux-krea-remix/

-> bessere Performance und du solltest Dir:
  • Flux Krea Modell anschauen -> sehr realistisch, natürlich
  • Qwen Model, ist genial zum Bearbeiten von Bildern,

Wenn du eine 4000er 5000er GPU hast, sollte 12GB VRAM eigentlich dann reichen. Eventuell schauen, dass du nichts anderes offen hast.

-> ComfyUI hat mittlerweile eine eigene Plattform, muss also nicht mehr umständlich installieren alles, sondern sollte mit wenigen Klicks funktionieren.
https://www.comfy.org/
 
  • Gefällt mir
Reaktionen: SaschaHa und Rickmer
@MiZubiki Wenn Du bereits Erfahrungen mit Forge hast, wäre das hier (Forge Neo) für Dich passend, ich habe es noch nicht selbst getestet, aber schon öfter davon gelesen. Es ist quasi Forge mit Unterstützung aller neuen Modelle, inkl. der Verfahren, die für maximale Beschleuningung sorgen wie Sage Attention, Nunchaku Modelle etc.

Was auf Deinem System an Modellen am schnellsten und besten läuft, findest Du am einfachsten per Trial and Error heraus, indem Du mal die verschiedenen Modellvarianten durchprobierst :) Noch ein Video zu Forge Neo:


PS: Bzgl. Flux Modelle hat mir dieser kürzlich releaste Finetune gut gefallen (habe die Fp16 Variante genutzt, gibt aber auch q4gguf 7GB Variante usw.). Ist im Prinzip Flux Dev mit wesentlich besserer Haut-/und generell Detail-Darstellung :)
 
  • Gefällt mir
Reaktionen: SaschaHa
Qwen Image Edit ist großartig (Sofa steht bei uns auf der Arbeit):
ComfyUI_00970_.png
 
  • Gefällt mir
Reaktionen: MechanimaL und MiZubiki
Geht garantiert als Foto durch!

QWN__00017_.jpg
 
  • Gefällt mir
Reaktionen: Rickmer, Keuleman und MechanimaL
Hier nur CPU und 32 GB RAM, für nebenher generieren langt es so eben mit Flux Schnell. Hier daher eine Tasse Kaffee für Euch:

ComfyUI_00002_.png
 
blubberbirne schrieb:
Geht garantiert als Foto durch!

Ist sehr gut gelungen, zb. auch die Schatten der Wimpern usw. - es wurde wahrscheinlich mehr als nur Qwen allein einsgesetzt, also LORA(s) und ein anderes Modell zum Refinen (Hautdetails usw.) im Upscale Prozess?
 
Zurück
Oben