News Gemini Omni und Gemini Flash 3.5: Googles neue Spitzenmodelle für Agenten und das Weltverständnis

Andy

Tagträumer
Teammitglied
Registriert
Mai 2003
Beiträge
8.391
Meh. Gefühlt für kleine Linux-Hilfe zwischendurch deutlich schlechter als vorher, auch im "Pro Erweitert"-Modus. Außerdem gibt's gerade noch Kinderkrankheiten mit der neuen Formatierung - ich muss nach der ersten Antwort immer einmal darauf hinweisen, dann nimmt er die alte Formatierung, mit der es geht.
1779226937730.png


(Und falls mir jemand sagen kann, welche nvidia-Treiber für Blackwell-gpu-passthrough in ubuntu 24.04 funktionieren zwecks ollama in docker / was ich da sonst noch beachten muss, bin ich dankbar für eine PN ;) - "NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.")
 
Zuletzt bearbeitet:
Najo, das neue Antigravity 2 ist schon sehr nackt. Dafür das es im Kern wahrscheinlich noch immer VSCode nutzt, fehlen aktuell viele Features (fehlendes SSH tut am meisten weh).
Wennst Gemini in der "IDE" dann zuschaust wie es über WSL Tool calls absetzt, wird einem schon etwas mulmig.Fragt man Gemini ob es das beheben kann erklärts das dadurch aktuell 3-5x Usage entsteht ein nativer Ansatz bald folgen soll. Wie gewohnt kennt Gemini nichts aus dem Google eigenen Produktportfolio. Braucht Links zur Antigravity Doku.
Aber es gibt ja noch die neue Gemini CLI äh Antigravity CLI. Damit gehts dann schon wesentlich besser.

Ohne jetzt alles gelesen zu haben hab ich mal Gemini 3.5 Flash auf ein größeres Projekt mit brauchbarer Map los gelassen, Grillme Sessions, PRDs usw erzeugt, ein paar Feature Slices AFK über Shellscripte implementieren lassen. Das geht schon sehr gut und vor allem wesentlich schneller. Was positiv auffällt ist das Gemini nicht mehr von selbst aus den Skills/Plans rausspringt, weil er panisch nach jeden 2. Toolcall in "ich muss jetzt implementieren Muster" zurück fällt.
Wie bei den alten Flash Modellen geht er bei "alten" Projekten trotz Map und klarer Anweisung gerne auf Erkundungsmissionen. Versucht jedes Code File zu lesen, verliert den Context, fängt wieder von Vorne an, verliert sich in Endlosschleifen.
Ich finde man merkt noch immer das Google auf frische "Demoprojekt-Szenarien" hin optimiert. So als ob es keine Expertise an größeren Projekten gibt. Die KI ist bestimmt gut, aber es gibt eben nicht nur To-Do-Listen Apps und Side Scrolling / Jump & Run Demos.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Madden.
Zurück
Oben