Sprachmodelle & Chat · Meta

Llama

Metas Open-Weights-Sprachmodelle — von 1B bis 405B Parametern, lokal lauffähig.

DSGVO-konform· USA

Llama von Meta ist die wichtigste Open-Weights-Modellfamilie der letzten zwei Jahre. Anders als ChatGPT oder Claude wird Llama nicht als fertiges Produkt verkauft — Meta veröffentlicht die Modellgewichte unter einer eigenen Lizenz, die kommerzielle Nutzung erlaubt, solange das Unternehmen nicht über 700 Millionen monatliche Nutzer hat.

Mit Llama 3.3 (Dezember 2024) und der angekündigten Llama-4-Generation hat Meta die Lücke zu den geschlossenen Spitzenmodellen weitgehend geschlossen. Reasoning-Benchmarks erreichen GPT-4-Niveau bei deutlich niedrigeren Inferenzkosten, da das Modell auch in spezialisierten Cloud-Diensten wie Together AI oder Groq läuft.

Für Unternehmen ist das interessant aus drei Gründen: erstens Self-Hosting (Daten verlassen die eigene Infrastruktur nicht), zweitens vorhersagbare Kosten ohne Token-Vendor-Lock-in, drittens Anpassbarkeit durch Feintuning auf eigene Daten.

Schwächen liegen vor allem im Ökosystem: Es gibt keinen offiziellen Meta-Chat-Client, die Tool-Use- und Function-Calling-Konventionen sind über Drittanbieter implementiert, und die Lizenz ist trotz Offenheit keine reine Open-Source-Lizenz im OSI-Sinn.

Screenshot

Screenshot der Llama-Website
Llama · Website-Screenshot1280 × 800

Pro & Contra

+ Pro
  • Vollständig Open Weights
  • Größenstufen für jeden Use-Case
  • Starker Reasoning-Score (Llama 3.3)
  • Kann lokal/on-prem laufen
− Contra
  • Kein offizieller Chat-Client
  • Multimodalität noch begrenzt
  • Lizenz keine echte OSS (Llama Community License)

Anwendungsfälle

Self-HostingForschungEmbedded LLMsRAG-Backends

Verwandte Tools