News „Rechenbasierte Nutzung“: Google berechnet Limits bei Gemini künftig neu

UNRUHEHERD schrieb:
Vermutlich wäre das "Flash-Lite" das alte Flash und "Flash Thinking Level Extended" das alte Thinking?

wenn ich mich an meine nutzungs-zeit so entsinne, dann gab es beider zu 100% vorher nicht gab

pro ist für mich die einzige variante, wie ich mit all meinen 18 gems kommuniziere. auf thinking greife ich nur zurück, wenn ich mal wieder das kontigent erreicht habe. was in meinem fall sehr schnell passieren kann...denn ich nutze die KI täglich einige stunden, privat wie beruflich
 
Ja, es macht Sinn. Aber nein, das ist nicht kundenfreundlich oder transparent. Ein System, in dem sinnvollerweise die Kontextlänge mit einfließt, ist für ein Endkunden-DAU-System viel zu komplex. Das versteht von 10000 Benutzern vielleicht einer, eher noch weniger. Das ist jetzt die Abrechnung dafür, dass man die dicken Cloud-LLMs in jeden Mist einbauen musste und die Leute sich durch die kostenfreie Nutzung nicht mit irgendwas Technischem auseinandersetzen mussten.

Ich hoffe, dass das richtig nach hinten losgeht.
 
andy_m4 schrieb:
Naja. Kommt drauf an. Zum Beispiel (um bei Google zu bleiben) die Gemma 4 Modelle funktionieren auch auf normaler Hardware ganz gut und reichen für viele Dinge völlig aus.
Ja für kleine Sachen.
Also mit Freunden bauen wir gerade ein Drehbuch für eine Serie. Eine Folge soll mal ca. 15 min lang werden. Wir erstellen keine Videos.
Es ist unfassbar schwierig. Haben mittlerweile ca. 24 Agenten aufgesetzt. Über 60 Rules und vorgaben erstellt und so. Hat sich alles so entwickelt über die letzten 2-3 Monate.
Wenn du da mal wirklich richtig Deep Dive eintauchen tust mit KI da merkst du einfach wie krass schlecht Gemma 4 wäre. So ein Ding kann sich viel zu wenig merken.
Man merkt einfach wie krass überlegen hier antrophic ist. Es arbeitet aber immer nur ein Agent. Wenn der fertig ist überprüft das der nächste . Findet der ein Fehler geht es wieder zurück.
Wir bauen hier ein richtig krasses Fundament für die Zukunft.
Und mit Cowork hast du jederzeit Zugriff vom Smartphone und siehst was gerade gearbeitet wird :)

Wenn dann neue YouTube Videos über den neuesten Shice kommen frag ich kurz Opus ob wird das für unser Projekt was übernehmen können zum Verbessern dann sagt es mir nö nö ihr seid mit dem Projekt wie wir es aufsetzen meilenwert voraus .

Sowas ist für einen normalo lokal nicht möglich . DAs brauchst du so einen Monster PC. unbezahlbar. Abo kannst halt auch mal pausieren und so. Frag nicht nacht den Abos wie viele wir grad laufen haben...

Video machen ist gar nicht so das Problem . Wobei wir das noch nicht angehen. Wo es wirklich noch brutal schwierig ist sind Konsistenz bei Bilder.
Jede Rasse hat seinen einzigartige Look. Jede Rasse hat einzigartige Waffen etc.
Ergänzung ()

NerdmitHerz schrieb:
wenn ich mich an meine nutzungs-zeit so entsinne, dann gab es beider zu 100% vorher nicht gab

pro ist für mich die einzige variante, wie ich mit all meinen 18 gems kommuniziere. auf thinking greife ich nur zurück, wenn ich mal wieder das kontigent erreicht habe. was in meinem fall sehr schnell passieren kann...denn ich nutze die KI täglich einige stunden, privat wie beruflich
Die Gems sind gut aber sobald du viel Chattest vergisst er leider die Gem Vorgaben. DAs ist alles Supoptimal finde ich.
 
usernamehere schrieb:
Endkunden-DAU-System viel zu komplex

das würde bedeuten, dass du dich als DAU gegenüber Ki siehst

ist das nicht bissel schwach?

Fraggil schrieb:
Die Gems sind gut aber sobald du viel Chattest vergisst er leider die Gem Vorgaben. DAs ist alles Supoptimal finde ich.

das problem hab ich 0
 
  • Gefällt mir
Reaktionen: Dark_Soul
Fraggil schrieb:
Wenn du da mal wirklich richtig Deep Dive eintauchen tust mit KI da merkst du einfach wie krass schlecht Gemma 4 wäre. So ein Ding kann sich viel zu wenig merken.
Mag alles sein. Kann ich nicht beurteilen.
Wobei ich mich bei solchen Dingen auch Frage, warum schreibt man ein (Dreh-)Buch, wenn man dann eh alles die Automatik machen lässt.
Das ist ein bisschen so, als wollte ich komponieren. Aber statt selber mir eine Melodie auszudenken usw. überlasse ich alles dem Computer.

Also ja. Ich verstehe, das es da natürlich beim Drehbuch schreiben auch viele Dinge gibt, die wenig spannend sind. Zum Beispiel Dinge, die mit der eigentlichen Story nicht wirklich was zu tun haben, die man aber machen muss, weil sie eben dazu gehören. Da ist so ein LLM sicher praktisch. Aber so groß, wie Du das erzählst, das klingt ja so, als würde es weit darüber hinaus gehen.
So nach dem Motto: Wir geben eigentlich nur noch eine ganz grobe Story-Line vor und definieren grob Hauptcharaktere und nu mach mal.

Und ja. Ich verstehe, wenn man das im professionellen Umfang zu macht, um irgendwie Content zu generieren.
Aber wenn ich aus Spaß was mache, da wäre mir das irgendwie zu doof.
Aber vielleicht verstehe ich das auch falsch.

Hinzu kommt, das die kommerziellen Modelle oft recht restriktiv sind und manchmal auch eine bestimmte Moralvorstellung transportieren, was insbesondere für kreatives Schreiben ein Problem darstellen kann.

Fraggil schrieb:
krass schlecht Gemma 4 wäre
Gemma 4 war ja jetzt auch nur ein Beispiel was ich gewählt hab, weil das eben passend zum Topic ist.

Fraggil schrieb:
Wir bauen hier ein richtig krasses Fundament für die Zukunft.
Und mit Cowork hast du jederzeit Zugriff vom Smartphone und siehst was gerade gearbeitet wird
Das klingt alles sehr nach Übertechnisierung von Kreativität.

Um noch mal auf den Musik-Bereich zurück zu kommen:
Also ich kann auch Dank Computertechnik ein ganzes Orchester für mich spielen lassen usw. Und das Mal zu machen, ist auch mal ganz lustig. Aber am meisten Spaß macht tatsächlich ganz altmodisch und unplugged eine Gitarre (oder was auch immer für ein Instrument) in die Hand zu nehmen und zu spielen und probieren und zu improvisieren.

Fraggil schrieb:
So ein Ding kann sich viel zu wenig merken.
Wenn Context-Window-Size ein Problem ist, nimm Llama 4 Scout. :-)
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: sioh
NerdmitHerz schrieb:
pro ist für mich die einzige variante, wie ich mit all meinen 18 gems kommuniziere.
Wie machst du das - mit allen 18 gleichzeitig, die sich dann beraten und dir eine Antwort ausgeben?

Meine Nutzung ist seitenweise Text redigieren nach einem Katalog sehr umfangreicher Anweisungen. Dafür genügte bisher aber sogar Gemini Flash. Die Pro-Variante habe ich nur für sehr umfangreiche Fragestellungen zu meiner Farm oder rund um die Gesundheit ausgepackt. Ich bin gespannt, ob diese entspannte Nutzung in Zukunft schnell an Grenzen der Gratis- oder Billovariante stoßen wird.
 
UNRUHEHERD schrieb:
Die Pro-Variante habe ich nur für sehr umfangreiche Fragestellungen zu meiner Farm oder rund um die Gesundheit ausgepackt.
Eine super Idee mit einem Datensammelkonzern sich über Gesundheit zu unterhalten.
 
Die token-/rechenbasierte Abrechnungen werden bei allen Anbietern in die Hose gehen, sofern die Preise nicht DEUTLICH fallen.

Die flash, mini, nano und sonstigen schnellen Modelle der verschiedenen Anbieter kann man de facto vergessen, weil man sich einfach noch weniger drauf verlassen kann.

Und die besseren Modelle sind einfach zu teuer, als dass die Nutzung sinnvoll wäre. Meine 40 Euro Github Copilot Rechnung wäre mit dem neuen tokenbasierten Abrechnungsmodell ab 1. Juni bei über 1000 Euro. Wer soll das zahlen? Das ist ja nicht mal mehr für Enterprisekunden sinnvoll argumentierbar.

Die ganzen Rechenzentren die da jetzt aus dem Boden gestampft werden, haben in Zukunft wohl ganz viel Leerlauf.

Ich warte eigentlich nur noch drauf, bis die chinesischen Open Source Modelle weiter aufschließen und werde das dann alles lokal abwickeln....
 
UNRUHEHERD schrieb:
Wie machst du das - mit allen 18 gleichzeitig, die sich dann beraten und dir eine Antwort ausgeben?

wie kommst du auf gleichzeitig?

ich hab 18 verschiedene bereiche und mir dafür jeweils 1 gem erstellen lassen mit den passenden prompts dazu. je nach bereich nehme ich den passenden gem

den ich am meisten nutze ist mein -> Bio-Hacking (Health) - Der Code für diesen Gem hier (Nutrition, Sleep & Health)
 
Es gibt doch eine gut Versteckte Verbrauchsanzeige und es ist lächerlich, heute 3 Anfragen gestellt mittels Pro und 5% vom Wochenlimit sind weg.

Auch nett das man als Zahlender Kunde nicht über solche Änderungen informiert wird,
 
  • Gefällt mir
Reaktionen: dhwz
jonathansmith schrieb:
Meine 40 Euro Github Copilot Rechnung wäre mit dem neuen tokenbasierten Abrechnungsmodell ab 1. Juni bei über 1000 Euro. Wer soll das zahlen? Das ist ja nicht mal mehr für Enterprisekunden sinnvoll argumentierbar.
Ahhh, das ist mal eine Hausnummer. Na da bin ich mal gespannt was da noch kommt^^ Das schreit ja geradezu danach, dass es bald wieder RAM geben könnte... xD
 
steirerblut schrieb:
Dafür ist die Performance zB. in Gemini CLI mit tollem AI Pro Konto teils unterirdisch. Das Ding gönnt sich teils 30-60 Minuten Bedenk Zeiten für ein Grep auf ne 8kb *.md Datei.
Kann ich nicht bestätigen. Habe plus bzw. Premium (also unter Pro) und gemini cli ist extrem schnell.
 
Die ganzen Cloud.Modelle strahlen nicht mehr wirklich Attraktivität aus.
Ja. Die sind recht leistungsfähig. Und ja. Für berufliche Zwecke ist das auch von mir aus oft angebracht und sinnvoll. Aber privat? Da ist mir ein lokales Modell lieber.

Da dauert es dann zwar länger und die Antworten sind qualitativ auch nicht ganz so gut.
Aber auf der anderen Seite gewinnt man auch Qualität. Weil man nicht mehr darüber nachdenken muss, ob man jetzt eine Anfrage wirklich stellt oder es sich eigentlich nicht lohnt dafür Tokens zu verschwenden. Man muss sich um Privatsphäre keine Gedanken machen. Man hat einfach die Freiheit das Ding benutzen zu können ohne nervigerweise irgendwelche anderen Dinge ständig im Blick halten zu müssen.
Oder auch dieses ganze Ding mit: Wir ändern jetzt die Abrechnung, führen neue Tarife ein, ändern irgendwas am Verhalten, dem Funktionsumfang etc. etc. etc.

Das ist mir alles einfach zu stressig.
Stattdessen kann ich mir sogar ganz entspannt News über Änderung von Nutzungslimits und Preise reinziehen. :-)
 
  • Gefällt mir
Reaktionen: Kuristina
andy_m4 schrieb:
Eine super Idee mit einem Datensammelkonzern sich über Gesundheit zu unterhalten.
Würde ja mit meinem Arzt darüber sprechen, aber den interessieren Blutbilder einen feuchten Kehricht. Was und wie viel soll ich bei einem extremen Vitamin D- und Eisenmangel nehmen? Welche Form, über welchen Zeitraum? Was ist sicher und was nicht?

Juckt meinen Hausarzt nicht. Der macht keine Termine zur Besprechung eines Blutbilds, weil er überarbeitet ist. Eine andere Praxis, die mich aufnimmt, habe ich in der Gegend nicht gefunden. Untersucht wurden die beiden Sachen auch erst, nachdem ich nach einer Internetrecherche darum gebeten habe.

Für mich ist in dieser Angelegenheit keine schnelle Hilfe verfügbar. Am besten noch am Schalter an der Apotheke im Ort, wo ich nach KI-Recherche etwas einschätzen konnte, ob ich mich um den Mangel kümmern sollte oder ob das alles im tolerierbaren Bereich ist.

Die frei verfügbare Info im Internet ist sonst dünn: Entweder professionelle Seiten, die von Empfehlungen absehen ("Sprechen Sie Ihren Arzt oder Ihre Ärztin darauf an") oder Anekdoten von Leuten, die eine Selbstmedikation vorgenommen haben.

Ja, gerade für sowas finde ich KI extrem praktisch. Es muss ja kein Name in den Dokumenten auftauchen. Ich finde legitim, wenn jemand das nicht will - für mich war die Problemlösung hier aber wichtiger als der Schutz meiner Daten.
Ergänzung ()

NerdmitHerz schrieb:
wie kommst du auf gleichzeitig?
Ah okay - jetzt verstehe ich. Ich hatte mal gelesen, dass Leute mehrere Agenten miteinander argumentieren lassen für komplexe Fragestellungen, und wusste nicht, ob das über die Gem-Funktion möglich ist.
 
Habe ich das richtig verstanden? Wenn die gestellte Frage zu komplex ist (nicht zwingend die Fragestellung ist komplex, sondern die zur Beantwortung notwendigen Ressourcen in Form von verbrauchten kWh an Strom sind je nach Frage zu hoch), dann es sein, dass bereits nach einer einzigen Frage das künftige Limit erreicht ist?

Das dürfte dazu führen, dass künftig die Kosten der Abonnenten exorbitant steigen oder die Abonnenten kündigen reihenweise, weil sie das zusätzliche Geld nicht zahlen können oder wollen.
 
UNRUHEHERD schrieb:
Würde ja mit meinem Arzt darüber sprechen
Ja. Klar.
Kommt natürlich auch darauf an, um was es geht. Und selbst wenn man zum Arzt geht, kann es ja durchaus Sinn, sich vorher ein wenig zu informieren (siehst Du ja offensichtlich auch so).

Anyway. Mir gings ja auch primär darum das Datenschutzproblem zu adressieren und weniger eine Aussage darüber zu treffen, wie sinnvoll es ist bei einer gesundheitlichen Frage eine KI zu befragen.

UNRUHEHERD schrieb:
Ja, gerade für sowas finde ich KI extrem praktisch
Das verstehe ich.
Unglücklicherweise zeichnet sich da ein Trend ab. Wie haben zu wenig Ärzte und allgemein ist die medizinische Versorgung nicht so, wie man sich das wünschen würde, also versuchen wir es mit Digitalkram zu erschlagen.
Nicht das man das nicht auch sinnvoll einsetzen kann. Aber mein Eindruck ist (insbesondere in der Politik) so, das das gemacht wird statt die darunterliegenden Probleme anzugehen.

UNRUHEHERD schrieb:
Es muss ja kein Name in den Dokumenten auftauchen.
Naja. Meistens besteht ja die Gefahr, das man über Querverweise dann doch identifizierbar wird, weil man eben noch viele andere Dinge benutzt. Ist ja nicht so, das Du nur im Internet gehst für diese eine medizinische Frage und sonst gar nicht online bist.

Selbst Fachleuten, die sich Mühe geben Datensätze zu anonymisieren passiert es ja immer wieder, das es später gelingt diese Datensätze zu deanonymisieren.
Wenn das also auch Profis passiert, sollte man sich nicht der Illusion als Laie hingeben, das man mit ein bisschen aufpassen das im Griff hat.

Ich will hier auch nichts überdramatisieren. Allerdings ist die potentielle Gefahr halt da und der sollte man sich bewusst sein. Google weiß Dank Deiner Interaktionen im Zweifel mehr über Dich als Deine Freunde.
Weiß nicht wie es Dir geht, aber in mir löst das ein unbehagliches Gefühl aus.

Und im realen Leben würde ja auch niemand auf die Idee kommen mit einem Wildfremden irgendwelche Dinge durchzusprechen oder zu akzeptieren, das der neben einem her läuft und die ganze Zeit Dich beobachten und sich notiert, was Du so machst. Und online gibts dann diese Hemmschwelle sich zu entblößen plötzlich nicht mehr.


Weyoun schrieb:
Wenn die gestellte Frage zu komplex ist (nicht zwingend die Fragestellung ist komplex, sondern die zur Beantwortung notwendigen Ressourcen in Form von verbrauchten kWh an Strom sind je nach Frage zu hoch), dann es sein, dass bereits nach einer einzigen Frage das künftige Limit erreicht ist?
Ich weiß nicht, worauf Du Dich beziehst. Aber wenn es hier drauf ist:
Ja klar. Im Prinzip ist das denkbar.

Weyoun schrieb:
Das dürfte dazu führen, dass künftig die Kosten der Abonnenten exorbitant steigen oder die Abonnenten kündigen reihenweise, weil sie das zusätzliche Geld nicht zahlen können oder wollen.
Na mal gucken wie das dann in der Praxis tatsächlich ist. Und man wird da sicher ggf. nachregeln, weil einem ja auch nicht geholfen ist, wenn einem reihenweise die zahlenden Kunden weglaufen. Harte Limits wird es vermutlich vor allem für Kostenlos-User geben.

Was ich daran schwierig finde, das man vorher bei einer Frage gar nicht abschätzen kann, wieviel von seinem "Volumen" tatsächlich verbraucht. Da war "Anzahl der Abfragen" natürlich leichter nachvollziehbar.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: UNRUHEHERD
Zurück
Oben