Llama
Metas Open-Weights-Sprachmodelle — von 1B bis 405B Parametern, lokal lauffähig.
Llama von Meta ist die wichtigste Open-Weights-Modellfamilie der letzten zwei Jahre. Anders als ChatGPT oder Claude wird Llama nicht als fertiges Produkt verkauft — Meta veröffentlicht die Modellgewichte unter einer eigenen Lizenz, die kommerzielle Nutzung erlaubt, solange das Unternehmen nicht über 700 Millionen monatliche Nutzer hat.
Mit Llama 3.3 (Dezember 2024) und der angekündigten Llama-4-Generation hat Meta die Lücke zu den geschlossenen Spitzenmodellen weitgehend geschlossen. Reasoning-Benchmarks erreichen GPT-4-Niveau bei deutlich niedrigeren Inferenzkosten, da das Modell auch in spezialisierten Cloud-Diensten wie Together AI oder Groq läuft.
Für Unternehmen ist das interessant aus drei Gründen: erstens Self-Hosting (Daten verlassen die eigene Infrastruktur nicht), zweitens vorhersagbare Kosten ohne Token-Vendor-Lock-in, drittens Anpassbarkeit durch Feintuning auf eigene Daten.
Schwächen liegen vor allem im Ökosystem: Es gibt keinen offiziellen Meta-Chat-Client, die Tool-Use- und Function-Calling-Konventionen sind über Drittanbieter implementiert, und die Lizenz ist trotz Offenheit keine reine Open-Source-Lizenz im OSI-Sinn.
Screenshot

Pro & Contra
- Vollständig Open Weights
- Größenstufen für jeden Use-Case
- Starker Reasoning-Score (Llama 3.3)
- Kann lokal/on-prem laufen
- Kein offizieller Chat-Client
- Multimodalität noch begrenzt
- Lizenz keine echte OSS (Llama Community License)
Anwendungsfälle
Verwandte Tools
Gemini
Googles Multimodal-LLM-Familie — mit Gemini 3.5 Flash als neuem Frontier-Modell (I/O 2026): 4× schneller bei Frontier-Reasoning, in App, AI Studio und Vertex.
Cohere Command
Enterprise-LLM aus Toronto — RAG-first, mehrsprachig, mit nativer EU-Verfügbarkeit.
ChatGPT
Der bekannteste KI-Assistent für Dialog, Recherche und Textarbeit.