KI-Toolnavigator — Das kuratierte Verzeichnis für Künstliche Intelligenz

Llama

Metas Open-Weights-Sprachmodelle — von 1B bis 405B Parametern, lokal lauffähig.

DSGVO-konform· USA

Llama von Meta ist die wichtigste Open-Weights-Modellfamilie der letzten zwei Jahre. Anders als ChatGPT oder Claude wird Llama nicht als fertiges Produkt verkauft — Meta veröffentlicht die Modellgewichte unter einer eigenen Lizenz, die kommerzielle Nutzung erlaubt, solange das Unternehmen nicht über 700 Millionen monatliche Nutzer hat.

Mit Llama 3.3 (Dezember 2024) und der angekündigten Llama-4-Generation hat Meta die Lücke zu den geschlossenen Spitzenmodellen weitgehend geschlossen. Reasoning-Benchmarks erreichen GPT-4-Niveau bei deutlich niedrigeren Inferenzkosten, da das Modell auch in spezialisierten Cloud-Diensten wie Together AI oder Groq läuft.

Für Unternehmen ist das interessant aus drei Gründen: erstens Self-Hosting (Daten verlassen die eigene Infrastruktur nicht), zweitens vorhersagbare Kosten ohne Token-Vendor-Lock-in, drittens Anpassbarkeit durch Feintuning auf eigene Daten.

Schwächen liegen vor allem im Ökosystem: Es gibt keinen offiziellen Meta-Chat-Client, die Tool-Use- und Function-Calling-Konventionen sind über Drittanbieter implementiert, und die Lizenz ist trotz Offenheit keine reine Open-Source-Lizenz im OSI-Sinn.

Screenshot

Pro & Contra

+ Pro

Vollständig Open Weights
Größenstufen für jeden Use-Case
Starker Reasoning-Score (Llama 3.3)
Kann lokal/on-prem laufen

− Contra

Kein offizieller Chat-Client
Multimodalität noch begrenzt
Lizenz keine echte OSS (Llama Community License)

Anwendungsfälle

Self-HostingForschungEmbedded LLMsRAG-Backends

Llama

Screenshot

Pro & Contra

Anwendungsfälle

Verwandte Tools

Kimi

Poe

Ollama