Stable Diffusion
Offenes Bildmodell — lokal lauffähig, voll anpassbar.
Stable Diffusion veränderte 2022 die KI-Bildgenerierung grundlegend, indem die Modellgewichte als Open Source veröffentlicht wurden. Was bei Midjourney und DALL·E nur als Cloud-Service zu haben ist, läuft bei Stable Diffusion auch auf der eigenen Grafikkarte — mit allen Konsequenzen für Datenschutz, Anpassbarkeit und Kosten.
Um das Basismodell ist eine außergewöhnliche Community gewachsen: Civitai, Hugging Face und unzählige Discord-Server beherbergen tausende fein-getunte Varianten — von photorealistischen Porträts über Comic-Stile bis zu Architektur-Renderings. LoRA-Feintuning erlaubt es, mit überschaubarem Trainingsaufwand eigene Stile in das Modell einzubringen.
Der Preis dieser Flexibilität ist Komplexität: Setup, Modellverwaltung und Prompt-Engineering haben eine spürbare Lernkurve. Die Standard-Qualität liegt unter Midjourney; mit dem richtigen Modell und Workflow kann sie diese aber übertreffen. Stability AI bietet zusätzlich eine API für Cloud-Nutzung an.
Empfohlen für Teams mit eigener GPU-Infrastruktur, für Projekte mit strengen Datenschutzanforderungen und für alle, die kontrollieren möchten, was ihr Modell kann — und was nicht.
Screenshot

Pro & Contra
- Open Source
- Lokal nutzbar
- Riesige Modell-Community
- LoRA-Feintuning
- Setup anspruchsvoll
- Qualität hängt vom Modell ab
Anwendungsfälle
Verwandte Tools
Playground
Browser-Studio mit FLUX, Stable Diffusion und einem aufgeräumten Layered-Editor — Pixar-bis-Photoreal in einer Oberfläche, ohne lokale Installation.
Lexica
Stable-Diffusion-basierter Generator mit der wahrscheinlich besten Prompt-Suchmaschine — Millionen kuratierte Prompts plus saubere Generation in einem Tool.
Google Whisk
Googles Experimental-Tool für visuelles Remixen — Bilder werden zu „Subjekt + Szene + Stil" und zu neuen Bildern kombiniert, powered by Imagen 3 + Gemini.