Wolfgang schrieb:
Gerne weitere Vorschläge von euch für AI-Benchmarks
Nice, Wunschliste:
- T2T/LLM: Gemma 3 oder ein Llama 3.x was man lange verwendet. Quantisierung irgendwas mit min 4. Z.B. Gemma 3 mit 4B, 12B und 27B wären interessant (jeweils in Q4_K_M). Der VRAM Bedarf ist ungefähr das 1,2fache der Download-DAtei. Da sieht man dann auch wie stark der VRAM limitiert.
- S2T/ASR (Automatic Speech Recogntion): Whisper und FasterWhisper jeweils mit large-v3-turbo und large-v2 (nicht v3, weil large-v2 das saubere im Sinne von weniger bugyy vmtlich ist und nach meinem letzten Stand auch OpenAI das selbst für deren API noch verwendet).
- T2S/TTS (Text to Speech): fishaudio oder xtts-v2
- T2I/ Image Generation: flux 1.0 dev q8 und fp16 (hat dann auch beide Performances mit drin). SD 3.5 und SDXL. Über ComfyUI oder Forge.
- (I2I- oder V2V-Hochskalierung/Hochschärfung: Habe ich keine Ahnung von. Gerade mal mit Upscayl 2.15.0 (für Fotos rumgespielt, s.u.)
@Alle: Bitte gerne weitere AI-Anwendungsfälle kommentieren, interessiert mich auch.
Alles für jeden kostenlos nutzbar, das finde ich auch gut.
Wolfgang schrieb:
Das ganze ist ja immer noch "Early Access", wo wir aktuell viel rumprobieren und schlussendlich noch wenig Ahnung haben, dafür aber viel lernen.
Wegen Quantisierung ist auch diese Grafik nützlich. Q8 wegen vllt Geschwindigkeit ggf. (falls VRAM nicht limitiert), Q6 wegen weniger VRAM und top Qualität und Q4 um noch halbewegs gute Qualität zu haben
(bei LLM, wenn überhaupt, bei Image Generation sieht das mindestens schon bei Q4 ungünstiger aus).
Quelle
Wen es interessiert zum kostnelosen lokalen Upscalen mit dem Programm Upscayl:
Btw. Falls wen das kostenlose lokale "Upscayl"ing interessiert: High Fidelity, Remacri, Ultra Mix sind imo die besten, ausprobiert an einem Personenfoto.
- High Fidelity wirkt im Gesamten etwas natürlicher, auch wenn mehr Artefakte und nicht so fein.
- Remacri feiner aber wirkt hauch gemalt
- Ultra Mix wirkt auch feiner ein bisschen verschärft, irgendwie stimmt der kontrast oder so da auch nicht so. Vllt wenn man den überdrehten Kontrast oder was das ist rausdreht beste.
Nicht zu empfehlen (die beiden REALESRGAN nur von den customs probiert): schlechteste RealESRGAN_General_WDN_x4_v3 hat Augen völlig vermasselt < RealESRGAN_General_x4_v3 und Upscayl Lite sehen zu sehr wie gemalt aus < Upscayl Standard sieht immer noch ein bisschen gemalt aus und weichgezeichnet. Das noch eine andere ist für Animes und das noch eine andere Ultra Sharp war bei den Augen etwas zu stark. Ultra Sharp könnte man ggf. noch mal zu den oberen dreien packen.
ABER: Ehrlich gesagt finde ich es einfach kubisch oder linear hochskaliert mit gimp besser, auch wenn es unschärfer ist xD. Könnte jetzt theoretisch darauf noch mal das alles ausprobieren (also als andere Basis), aber dazu habe ich jetzt keine Lust mehr

und eigentlich sollte das ja dabei sein (?).