News Meta präsentiert „Code Llama“: Neues KI-Modell speziell für Programmierer

missi schrieb:
Bei dem Link welcher per Mail kommt lande ich immer in einer xml Seite .. was stimmt hier nicht? wie kommt man zum Download oder Installiert das?
Du hast Punkt 1 in der Mail nicht gelesen.
 
Artikel-Update: Meta erweitert die Llama-Modelle um Varianten, die speziell auf das Programmieren ausgelegt sind. Die Grundlage ist das Llama-2-Sprachmodell, das durch Training angepasst wurde. Wie beim Basismodell ist es frei verfügbar, kann also sowohl für die Forschung als auch die kommerzielle Nutzung verwendet werden.

Meta bietet das als „Code Llama“ bezeichnete Modell in drei Varianten an: Das allgemeine Code-Basismodell, ein für Python spezialisiertes Modell und ein „Instruct“-Version, die durch die Feinabstimmung besonders gut mit natürlichen Spracheingaben umgehen soll. Details zu den Modellen finden sich im Blog-Beitrag und in dem Paper, der Code ist auf GitHub abrufbar und der Download ist bei Meta möglich.

Die Unterstützung beim Programmieren gilt als eine der am meisten genutzten Anwendungsfälle bei den KI-Assistenten, die auf Large Language Models (LLM) basieren. Microsoft bietet das etwa mit dem GitHub Copilot, aber auch generative Chatbots wie ChatGPT und Bard beherrschen entsprechende Funktionen. Nutzer müssen aber – wie bei den KI-Chatbots üblich – mit irreführenden bis falschen Antworten rechnen, laut einer Studie erhalten etwa 52 Prozent der ChatGPT-Ergebnisse Ungenauigkeiten.
 
Foxel schrieb:
Auch interesant für das Training wurden wohl ca. 1000 A100 GPUs benutz 6 Monate lang.
3.3M GPU hours of computation on hardware of type A100-80GB
https://github.com/facebookresearch/llama/blob/main/MODEL_CARD.md

Ich würde ja zu gerne mal die Cluster (und deren Eckdaten) sehen auf denen Meta, Amazon, Google, MS und OpenAI ihre KIs Trainieren.
Bei Teslas KI für die FSD Beta ist wohl mittlerweile auch die Rechenleistung fürs Training der limitierende Faktor für den Fortschritt.
 
  • Gefällt mir
Reaktionen: Foxel
Könnt ihr beim Gendern zumindest bei einer Variante bleiben ? Zuerst wird von Forschenden gesprochen, dann aber von KI-Entwicklern, statt KI-Entwickelnden. Und weiter über Entwickler statt Entwickelnde. Unternehmen ? Wieso nicht direkt Unternehmende. Nutzer ? Dann aber bitte Nutzende.

Oder bleibt doch einfach bitte bei Forschern und erspart euch dieses Messer im Kopf :freak:
 
  • Gefällt mir
Reaktionen: lordtofu und eSportWarrior
Zurück
Oben