News Perplexity Computer: Auto­ma­tische Aufteilung zwi­schen lokaler und Cloud-KI

mischaef

Kassettenkind
Teammitglied
Registriert
Aug. 2012
Beiträge
7.560
Perplexity arbeitet laut eigenen Angaben an einer neuen Hybrid-Funktion für Perplexity Computer, bei der Aufgaben automatisch zwischen lokalen KI-Modellen und leistungsstärkeren Cloud-Modellen aufgeteilt werden. Dadurch sollen sensible Daten besser geschützt werden, ohne die Fähigkeiten großer Frontier-Modelle einzubüßen.

Zur News: Perplexity Computer: Auto­ma­tische Aufteilung zwi­schen lokaler und Cloud-KI
 
  • Gefällt mir
Reaktionen: BrollyLSSJ, Mr Peanutbutter, Kuristina und eine weitere Person
Das klingt erstmal nach etwas positiven, wenn wir schon dabei sind, dass die Blase noch eine gute Weile am Leben bleibt.
 
Wenn die Daten wirklich sensibel sind, wäre es mir aber zu heikel, einem kleinen lokalen Modell die Entscheidung zu überlassen, was "raus" gehen darf und was nicht.

Human-in-the-loop rauszunehmen ist natürlich komfortabler für den Anwender, bringt aber eben meistens auch ein gewisses Risiko mit sich.
 
  • Gefällt mir
Reaktionen: Ozmog
Mal eine andere Frage:
Warum sind Cloudasysteme leistungsstärker?
Klar, die Rechner sind stärker, aber dafür greifen mehr Leute darauf zu, d.h. die Leistung muß geteilt werden.
Für den Privatmann dürfte es doch gar nicht auffallen, oder?
Zumal ich schon öfter die Sanduhr bei ChatGPT (bezahlt) und Copilot sehen konnte vei,verhältnismäßig einfachen Dingen.
Liegt es daran, daß bei der Cloud das Datenmaterial umfangreicher ist? Zwar auch unspezifischer in der Masse, dafür aber auch Fälle abdecken, die in den lokalen Daten noch nicht vorlagen.
 
Muntermacher schrieb:
Klar, die Rechner sind stärker, aber dafür greifen mehr Leute darauf zu, d.h. die Leistung muß geteilt werden.
Für den Privatmann dürfte es doch gar nicht auffallen, oder?
Auf den stärkeren Systemen kann man bessere Modelle laufen lassen. Das funktioniert insgesamt, weil du niemals vollzeit (24/7) Rechenleistung benötigst. Man kann also als Anbieter die Kapazität zwischen den Kunden aufteilen. Lokal ist die Anschaffung dür dich dagegen viel zu teuer. Es profitieren also alle davon: du hast bessere Ergebnisse und der Anbieter verdient Geld mit der Dienstleistung.
 
@Tzk
Das ist klar. Was ich nur meine ist, ist es HW oder LLM Basis? Wenn man privat ein System hat mit Leistung x, dann braucht der Anbieter die 1000fach stärkere Leistung, wenn er 1000 Kunden gleichzeitig anbieten möchte.

Aber selbst wenn er 2000fachs Leistung hat, macht sich das beim Anwender im privaten Bereich bemerkbar? Also ist es ein Unterschies, ob ich 5 oder 10 Sekunden warten muß?
 
nachtfrost23 schrieb:
Wenn die Daten wirklich sensibel sind, wäre es mir aber zu heikel, einem kleinen lokalen Modell die Entscheidung zu überlassen, was "raus" gehen darf und was nicht.

Human-in-the-loop rauszunehmen ist natürlich komfortabler für den Anwender, bringt aber eben meistens auch ein gewisses Risiko mit sich.
Denke eine Zwischenstufe bzw. Konfigurierbarkeit wäre ganz gut. Während man vorher alles manuell machen soll und zukünftig alle automatisch sein soll, finde ich eigentlich Hybrid-Modelle ganz gut, bei dem automatisch analysiert und vorgeschlagen wird, der Anwender aber final drüberschauen und genehmigen muss (bzw. an der Stelle auch manuell noch Korrekturen vornehmen kann).
 
Muntermacher schrieb:
@Tzk
Das ist klar. Was ich nur meine ist, ist es HW oder LLM Basis? Wenn man privat ein System hat mit Leistung x, dann braucht der Anbieter die 1000fach stärkere Leistung, wenn er 1000 Kunden gleichzeitig anbieten möchte.
Nein, das ist ein Denkfehler. Du setzte voraus, dass 1000 Kunden das System gleichzeitig zu 100% nutzen, das ist aber nicht der Fall.
Auch lassen sich unterschiedliche Aufgaben parallel abarbeiten. Nicht jeder Arbeitsschritt ist genau gleich, manche Arbeitsschritte erfordern erst bestimmte vorhergende Arbeitsschritte.

Dazu gibt es ja noch Caches, die gleichartige Aufgaben von verschiedenen Kunden beschleunigen können.
 
  • Gefällt mir
Reaktionen: Muntermacher
Muntermacher schrieb:
@Tzk
Das ist klar. Was ich nur meine ist, ist es HW oder LLM Basis? Wenn man privat ein System hat mit Leistung x, dann braucht der Anbieter die 1000fach stärkere Leistung, wenn er 1000 Kunden gleichzeitig anbieten möchte.
Der limitierende Faktor lokal ist die Größe eines LLMs und das Ökosystem um die Cloudmodelle herum. Ich kann auf meinen Rechnern zum Beispiel Modelle betreiben, die mit Kontext 96 GB (Windows) oder grob 115GB (OSX) groß sind. Da ist schon einiges an Wissen drin, aber das ist nur ein Bruchteil der Größe, die ein ChatGPT oder Claude Opus hat. Da die Modelle ein vielfaches größer sind, ist da auch mehr Wissen drin. Hinzu kommt: Das ist bei den Frontiermodellen ja nicht nur ein isoliertes LLM sondern ein riesiges System aus Services, Agents und Funktionen etc.pp. die erst dafür sorgen, dass das Erlebnis rund ist. Allein einem lokalen Modell Websearch zu ermöglichen ist schon ein Akt. Und das ist nur ein winziges Detail von all den Dingen, die es bei Nutzung der Cloudmodelle "gratis" gibt.

Eine Gruppe von Personen lokal mit einem LLM zu beliefern ist gar nicht so schlimm - wir haben bei uns in der Firma z.B. ein paar DGX Sparks (die sind vergleichbar mit nem Mac mini - nur mit mehr Unified RAM - darüber kann man prima jeweils ganze Teams in "OK" Geschwindigkeit versorgen
 
  • Gefällt mir
Reaktionen: DIE_KUH, silentdragon95 und Muntermacher
Perplexity hat schon 2 X meinen über Promoaktionen erhaltenen Pro-Account wieder auf die Umsonst-Version runtergestuft, seitdem habe ich es nicht einmal mehr benutzt, mich sind sie als Kunden endgültig los. Habe jetzt einen Gemini Pro Account und bin zufrieden
 
Gemini und Perplexity sind aber sehr verschiedene Sachen und nicht für das gleiche vorgesehen.
Außerdem ist eine Promoaktion nur einmalig einlösbar. Gemini fand ich vorletzte Woche so unbrauchbar, dass ich mein kauf bereut habe. Das hat so schlechte Ergebnisse erzielt. War da schon sehr verwundert.
 
Was waren das denn für Beispiele? Habe schon lange Gemini und bin sehr glücklich. In den Benchmarks sind die auch ganz oben mit dabei.
 
  • Gefällt mir
Reaktionen: Kuristina
Umgang mit Dokumenten. Anhand von Quellen Aussagen machen. Oder neue Konzepte mit den Infos von Dokumenten schreiben. Gemini hat nur mini kurz geschrieben, nie wirklich brauchbare Konzeptblöcke und ich hab mich da 2h ein abgepromptet. NoteBookLM hat nur schrott fabriziert. Länger als eine Seite wurde es nie. Wenn ich versucht hab es auf einzelne Kapitel runterzubrechen wollte es nicht mehr weiterhelfen. Und das alles nach den letzten mega Update. Claude hat es nicht 1:1 umgesetzt sondern viel besser und mitgedacht.
Außerdem hat Gemini die ganze Zeit nur rumgezickt, weil es dachte, dass ich damit hacken möchte etc.
Hat fast immer die Ausgabe abgeschnitten und dann verweigert. Ich wollte aber nur, dass es bestimmte Tätigkeiten innerhalb von Security Lösungen beschreibt. Unbrauchbar für mich.
Ich hab eher basic Dinger verlangt...nichts wildes :/
 
Zurück
Oben