GPU primär für LLM (KI)

ratpertus · Donnerstag um 12:30

Winston90 schrieb:
Die untersuchten LLMs scheinen ein von Sprache losgelöstes Verständnis zu haben und erst im letzten Schritt eine Überführung der Struktur in eine bestimmte Sprache vorzunehmen.

Das dürfte insgesamt ein spannendes Feld sein, weil es vermutlich gar nicht so einfach ist, die genauen Prozesse bis zu dem Moment, wo sie verbalisiert werden, nachzuvollziehen und begrifflich zu fassen. "Sprache" ist ja ein zutiefst menschliches Konzept - und ob sich das so einfach auf LLM übertragen lässt? Schon mit Blick auf den Menschen wäre ja die Frage, wie unsere Gedanken tatsächlich repräsentiert sind, bevor wir sie aussprechen. Auch da muss man ja trennen, denn Denkprozesse laufen ja auch vor dem Spracherwerb ab ...

Xes · Donnerstag um 12:48

ratpertus schrieb:
1. Wie viel Geld bist du bereit auszugeben?
ca. 300€

Sind die denn fix? Ich stecke längst nicht so tief in der Materie wie manch anderer hier, aber meiner Erfahrung mit ein wenig privatem ausprobieren nach, möchtest du für lokale LLMs so viel VRAM wie möglich.
Die 12GB einer RTX 3060 sind dahingehend nicht ganz so mies wie die 8GB meiner RTX 3070, trotzdem dürftest du damit relativ schnell ans Limit kommen, wenn du versuchst die etwas größeren, "smarteren" Modelle zu nutzen.
Wenn du das Ganze tatsächlich für einen produktiven Zweck einsetzen möchtest und mit etwas Blick auf die Zukunft, würde ich mal schauen ob du nicht direkt auf eine 16GB Karte gehst.
Die relativ neue RTX 5060Ti gibt es in der 16GB Variante ab ca. 450€.

ratpertus · Donnerstag um 12:52

@Xes Nein, nicht wirklich fix. Aber aktuell gibt meine Portokasse nicht mehr her. Evtl. schiebe ich die Investition noch etwas und versuche dann eine halbwegs zukunftsträchtige Entscheidung und Investition zu tätigen.

ChatGehPeeTee · Donnerstag um 13:20

——

nutrix · Donnerstag um 13:31

ratpertus schrieb:
@Xes Nein, nicht wirklich fix. Aber aktuell gibt meine Portokasse nicht mehr her. Evtl. schiebe ich die Investition noch etwas und versuche dann eine halbwegs zukunftsträchtige Entscheidung und Investition zu tätigen.

Das würde ich stark empfehlen. Du bist noch ca. 150 € von einer 5060 TI mit 16 GB VRAM entfernt, und das würde ich doch eher als gute Investition für die nächste Zeit für Deinen Zweck sehen als eine ältere GPU. Eine 4060 TI kostet fast genauso viel, und eine 3060 TI und tiefer lohnt sich für KI so nicht mehr.

40% mehr bei MLPerf Client 0.5 Tokens/sec, das ist schon beachtlich mehr.

https://www.tomshardware.com/pc-components/gpus/rtx-5060-ti-16gb-vs-rtx-4060-ti-16gb-gpu-faceoff

https://cdn.mos.cms.futurecdn.net/Z3ThicFtkdfLiU4rdnZMwG-1200-80.png.webp

Oder Du kommst wirklich günstig zu dem Preis zu einer gebrauchten RTX 3080 oder 4070
https://www.hardwareluxx.de/index.p...e-rtx-5060-ti-mit-16-gb-im-test.html?start=17

ratpertus · Donnerstag um 17:44

Schon mal herzlichen Dank an alle, die sich mit Ratschlägen und Ideen beteiligt haben! Und auch vielen Dank für die interessanten, halb off-topic Gesprächsfäden!
Ich werde einen Kauf erst mal aufschieben und keinen Schnellschuss machen, sondern längerfristig planen. Bis dahin schaue ich mal, was man mit llama.cpp und UMA für die iGPU so erreichen kann.

Suche

GPU primär für LLM (KI)

ratpertus

Cadet 4th Year

Xes

Admiral

ratpertus

Cadet 4th Year

ChatGehPeeTee

Cadet 4th Year

nutrix

Commodore

Anhänge

ratpertus

Cadet 4th Year

Ähnliche Themen