Vanna AI
Open-Source-Text-to-SQL-Agent mit RAG über das Datenbank-Schema — selbst hostbar, jeder LLM nutzbar.
Vanna AI ist die ehrlichste Open-Source-Antwort auf das Text-to-SQL-Problem: keine Magie-LLM-Calls, sondern ein klar dokumentierter RAG-Workflow. Man trainiert Vanna auf das Datenbank-Schema, fügt Beispiel-Queries und Geschäftsdokumente hinzu, und ab dann kann jede natürliche Frage in passendes SQL übersetzt werden — auf der eigenen Datenbank, mit dem eigenen LLM, im eigenen Stack.
Die Plug-and-Play-Philosophie macht Vanna für Engineering-Teams attraktiv: ChatGPT oder Claude oder Mistral als LLM, Postgres oder Snowflake oder DuckDB als DB, ChromaDB oder pgvector als Embedding-Store. Alles tauschbar, alles dokumentiert. Das macht Vanna zur EU-freundlichen Wahl, wenn keine Daten an US-SaaS-Anbieter raus dürfen.
Der train()-Workflow ist die unterschätzte Stärke: Jede gute Antwort kann zurück in den Vector Store geschrieben werden, jede schlechte korrigiert. Über Wochen wird das Modell für die eigene Domäne immer treffsicherer.
Schwächen: Für eine UI muss man eine Streamlit-App oder den Slack-Bot selbst aufsetzen; eine polierte SaaS-Erfahrung wie bei Hex oder ThoughtSpot gibt es nicht. Visualisierungen sind rudimentär. Multi-User-Berechtigungen gibt es nur in der (kostenpflichtigen) Cloud-Version.
Empfohlen für Engineering-Teams, die einen produktiven SQL-Agenten in eigene Anwendungen oder Slack-Workflows einbauen wollen — und für jeden, der Datenresidenz-Anforderungen hat, die SaaS-Tools ausschließen.
Screenshot

Pro & Contra
- Komplett Open Source (MIT)
- RAG-Trainings-Workflow für SQL-Beispiele
- Plug-and-Play mit jedem LLM und jeder DB
- Self-Hosting trivial möglich
- Setup erfordert Python-Kenntnisse
- Visualisierungen rudimentär
- Multi-User-Funktionen rudimentär ohne Cloud
Anwendungsfälle
Verwandte Tools
Power BI Copilot
AI-Funktion in Microsoft Fabric / Power BI — Berichte, DAX und Erklärungen aus dem Datenmodell heraus.
ThoughtSpot Spotter
Such-getriebene BI-Plattform mit AI-Agent Spotter — komplexe Folgefragen in natürlicher Sprache, Antworten mit Quellen.
Databricks AI/BI Genie
Conversational-Analytics-Layer auf Databricks Lakehouse — Text-to-SQL mit Unity-Catalog-Awareness.