News Mehrere Gigawatt Rechenleistung: Anthropic baut Part­ner­schaft mit Google und Broadcom aus

mischaef

Kassettenkind
Teammitglied
Registriert
Aug. 2012
Beiträge
7.348
  • Gefällt mir
Reaktionen: the_IT_Guy, BrollyLSSJ, nipponpasi und eine weitere Person
Bin ich eigentlich der einzige, der Gigawatt als Einheit für Rechenleistung für totalen Quatsch hält? Ich weiß, CB kann dafür nichts, die KI-Firmen selber geben das so an.

Token pro Sekunde finde ich viel passender, darunter kann man sich wenigstens ungefähr was vorstellen.
 
  • Gefällt mir
Reaktionen: the_IT_Guy, Vanoncam, KeinNutzerName und 2 andere
Krik schrieb:
Token pro Sekunde finde ich viel passender, darunter kann man sich wenigstens ungefähr was vorstellen.
Damit können die meisten noch weniger anfangen...

BTT: Das man ausgrechnet mit Broadcom, der Heuschrecke der IT-Industrie paktiert halte ich für nicht gut. Man hat ja gesehen, was die VMware Übernahme für einen Murks verursacht hat.
 
  • Gefällt mir
Reaktionen: LCTron
Krik schrieb:
Bin ich eigentlich der einzige, der Gigawatt als Einheit für Rechenleistung für totalen Quatsch hält?
Ist halt aus Sicht der Betreiber die maßgebliche Einheit, weil hier die notwendige Energie Versorgung entsprechend abgebildet ist.
 
  • Gefällt mir
Reaktionen: LCTron, eSportWarrior und Abrexxes
@Krik , der Stromverbrauch sind halt laufende Kosten und der grösste Posten.
 
  • Gefällt mir
Reaktionen: LCTron
Flutefox schrieb:
Damit können die meisten noch weniger anfangen...
Es trifft es zwar nicht ganz, aber den Laien kann man das mit verarbeitete Wörter pro Sekunde recht einfach umschreiben. Das rafft er dann auch.

@Abrexxes
Man kann das ja zusätzlich angeben.
 
  • Gefällt mir
Reaktionen: MalWiederIch und KeinNutzerName
mischaef schrieb:
500 Geschäftskunden jeweils mehr als eine Million US-Dollar pro Jahr ausgeben
Das hört sich so an, als würde ich den Laden mit meinem Claude Max Abo nur belästigen^^
 
  • Gefällt mir
Reaktionen: the_IT_Guy und Kuristina
Krik schrieb:
Token pro Sekunde finde ich viel passender, darunter kann man sich wenigstens ungefähr was vorstellen.
Finde ich überhaupt nicht. Ich habe absolut keine Ahnung, wie viele Token eine Anfrage benötigt. 10, 100, 1000000? Bei Gigawatt weiß ich wenigstens welche Größenordnung dort benötigt wird. Und ich würde behaupten die breite Bevölkerung kennt ihren eigenen Stromverbrauch und kann hochrechnen, aber von Token haben die keine Ahnung.
 
  • Gefällt mir
Reaktionen: eSportWarrior, evilhunter und feed3r
Benutzer0815 schrieb:
Finde ich überhaupt nicht. Ich habe absolut keine Ahnung, wie viele Token eine Anfrage benötigt. 10, 100, 1000000?
Aber wo in der Technik Welt hat man das als Laie denn schon?
Es geht dabei doch eher um die Vergleichbarkeit untereinander, etwas was doppelt so viele Token pro Zeiteinheit schafft, ist effektiv quasi doppelt so schnell. Kombinieren kann man das ja weiterhin durch Leistungsaufnahme und bringt dann sogar noch eine Effizienzmetrik mit. Quasi Token pro Sekunde und GW.
Benutzer0815 schrieb:
Bei Gigawatt weiß ich wenigstens welche Größenordnung dort benötigt wird. Und ich würde behaupten die breite Bevölkerung kennt ihren eigenen Stromverbrauch und kann hochrechnen, aber von Token haben die keine Ahnung.
Ich denke viel eher, die Masse kann sich in Zahlen gar nicht vorstellen was GW in der Größenordnung überhaupt ist.

Und über die Zeit ergibt so eine Einordnung auch überhaupt keinen Sinn. Das kommt in etwa der Aussage nahe, ich fahre nen VW Golf. Ja welchen denn? 1er, 2er, ... 7er, 8er? Kombi? GTI? R? Zum Zeitpunkt der Aussage wo es vielleicht nix vergleichbares gibt, mag das noch funktionieren. Aber über die Zeit nicht...
 
  • Gefällt mir
Reaktionen: MalWiederIch und Krik
Benutzer0815 schrieb:
Und ich würde behaupten die breite Bevölkerung kennt ihren eigenen Stromverbrauch (...)
Da wette ich aber alle meine verbrauchten kWh dagegen.
 
  • Gefällt mir
Reaktionen: MalWiederIch
Krik schrieb:
Es trifft es zwar nicht ganz, aber den Laien kann man das mit verarbeitete Wörter pro Sekunde recht einfach umschreiben. Das rafft er dann auch.

@Abrexxes
Man kann das ja zusätzlich angeben.
Naja du meinst man solle eine hypothetische Tokenztahl angeben wenn ein User das gesamte System alleine nutzen würde? Dann hat man da keine Ahnung 4 Millionen? oder 4 Milliarden?

Weiss nicht finde nicht dass das soooooo viel Sinn macht

Finde GW eigentlich schon ok - ausser es gäbe den Gigasprung in der Effizienz :D

1 GW+ ist ein Brocken der so viel braucht wie eine mittlere Grossstadt wie Stuttgart.

Immerhin bei Anthropic platzt die Blase nicht :D :D
 
Zuletzt bearbeitet:
Benutzer0815 schrieb:
Ich habe absolut keine Ahnung, wie viele Token eine Anfrage benötigt.
Manche KIs geben das an.

Ansonsten kann man sich daran halten:
1775552958182.png

Wenn du nur nach dem Wetter fragst, wirst du deutlich unter 1000 Tokens bleiben.

Benutzer0815 schrieb:
Bei Gigawatt weiß ich wenigstens welche Größenordnung dort benötigt wird.
Aber das ist doch nur die elektrische (oder thermische oder beides) Leistung. Das ist, als ob man fragt, wie schnell ein Auto fährt und als Antwort bekommt man dann 150 KW. Ein Traktor mit 150 KW fährt vielleicht 50 km/h. Ein Familienauto erreicht damit mehr als 180 km/h.
 
  • Gefällt mir
Reaktionen: Xarxarus
trotzdem hat man die grösse der prinzipiellen leistungsfähigkeit der rest ist nur schnöde Mechanik.
 
Uzer1510 schrieb:
Naja du meinst man solle eine hypothetische Tokenztahl angeben wenn ein User das gesamte System alleine nutzen würde?
Jo, den Rest kann man dann mit einem Dreisatz erahnen, also wie viele Kunden ungefähr gleichzeitig bedient werden können, usw.

Uzer1510 schrieb:
die grösse der prinzipiellen leistungsfähigkeit
Also ich kann von GW ausgehend nicht die Leistungsfähigkeit eines Rechenzentrums einschätzen.

Industry-standard average tokens per ChatGPT consumer message/interaction (input + output) is typically ~800–2,000 tokens (short chats ~500–1,000; longer reasoning/coding sessions 2,000+).
Quelle
Wenn man jetzt noch wüsste, wie viele Tokens das Rechenzentrum schafft, dann könnte man ausrechnen, wie viele Leute es bedienen kann.
 
Naja ich denke das kann man mit GW doch ganz grob genauso - so 1,5 GW reichen z.B. für den kleinsten der "Grossen" AI Systeme - für Musks Colossus 2.

Jo klar tokens ist sicher priunzipiell besser - aber da ja inzwischen fast alle Modelle Multimodal sind - wie viele Tokens braucht Sprach, Bilderekennung, Bilderzeugung, Video und Sounderzeugung etc. Und was verbrät reasoning?

Eine direkter short chat braucht vielleicht 2000 tokens - ausser der short chat besteht aus einer Agentenanweisung bau mir mal ein besseres GTA 6 als Rockstar bringt in der besten Unreal Grafik die es gibt

Und ich glaube dahin geht AI - in immer unspezifischere Fragen durch Nutzer - also nicht mehr wie funktioniert XY sondern mach mal eine iPhone App die die Gravitaion lokal aufhebt. :D

Durch immer mehr Multimodal Reasoning und Agenten verliert halt token / sec zunehmend an Vergleichbarkeit - das war ok für so eher einfache Textwissensanfragen - finde ich, weil ja immer mehr hinter den Kulissen irgendwo rumwerkelt.

Wer weiss ob heute ein "mach mal nen kleinen Comic film über so'n Raumschiff" nicht dazu führt dass die AI das in Agenten auteilt und damit das auf dem Computerscreen des Videos richtig aussieht kurz mal die Rätsel der Gravitation löst und beweist ob es Gott gibt oder nicht und was der so auf Amazon bestellt, weil irgendein Agent das wichtig fand damiot das korrekt dargestellt wird :D und man aus Versehen auf Ultra Max Super Thinking and Reasoning gestellt hatte.
 
Zuletzt bearbeitet:
Uzer1510 schrieb:
Und wie viele Tokens/s bzw. Kundenchats/s schafft das? ;)

Ich finde es erstaunlich, dass hier im Forum bei GPUs über FPS, Leistungsaufnahme und Energieaufwand pro generiertem Bild diskutiert wird. Aber bei Rechenzentren ist eine ähnliche Metrik nicht erwünscht?
 
  • Gefällt mir
Reaktionen: Drahminedum
Wäre das sinnvoll hätte sich das auch etabliert - aber hat es nicht.

GW folgt halt dem Prinzip dass alle grob gleich effizient sind - und man so halt grob miteinander vergleichen kann wer den "längsten" hat :D

Für einen grossen Anbieter der international mitspielen will braucht es halt inzwischen ab 1 GW aufwärts für ein AI Zentrum damit das nicht mehr in der Hobbyliga spielt. Ich finde das eine ausreichende Einordnung.

Die tatsächliche Leistungsfähigkeit im Endnutzer Bereich hängt dann eh von 1000 Faktoren ab.
 
Krik schrieb:
Aber bei Rechenzentren ist eine ähnliche Metrik nicht erwünscht?
Deine Frage war eine andere ...
Krik schrieb:
Bin ich eigentlich der einzige, der Gigawatt als Einheit für Rechenleistung für totalen Quatsch hält?
Eine sinnvolle Metrik ist sicher von Vorteil, wobei das ja schon schwierig ist darzustellen, weil der Verbrauch je Aufgabenstellung extrem variiert. Als totalen Quatsch empfinde ich Gigawatt deshalb nicht, damit hat man wenigstens eine Vorstellung vom Energiebedarf der hochgelobten KI Anwendungen.
 
Uzer1510 schrieb:
Ich finde das eine ausreichende Einordnung.
Ich nicht. ;)

Uzer1510 schrieb:
Die tatsächliche Leistungsfähigkeit im Endnutzer Bereich hängt dann eh von 1000 Faktoren ab.
Da wird es sicher Statistiken geben, denn die Betreiber werden ausrechnen, wie viele zahlende Kunden sie mit einem Rechenzentrum bedienen können. Und darauf kommt es doch am Ende an.
 
Zurück
Oben