AI-Hosting – die Zukunft deiner Projekte ist jetzt digital souverän.
AI-Modelle fully managed, gehosted in Deutschland. Für Agenturen und Developer, die DSGVO-konforme KI-Anwendungen bauen wollen.
Einfach implementiert. Komplett souverän.
API-Key abrufen und loslegen. Alles verwaltet im mStudio. So schnell hattest du noch kein AI-Modell am Start. Das beste: Alle Daten liegen komplett in deiner Hand.
AI-Modelle
Aus diesen Modellen kannst du wählen:
Ministral-3-14B-Instruct-2512
Europäisches Open-Source-Modell mit 14 Milliarden Parametern, optimiert für hochwertige Text‑, Chat‑ und Vision-Anwendungen in Webprojekten.
Devstral-Small-2-24B-Instruct-2512
Coding-Modell, das sich besonders für Code-Generierung, Debugging sowie agentische Programmieraufgaben eignet.
Qwen3-Embedding-8B
Open-Source-Embedding-Modell von Alibaba Cloud Al. Effizient für Suche, Empfehlungen und Datenanbindung.
gpt‑oss‑120b
Open‑Source‑Modell von OpenAI, veröffentlicht unter Apache 2.0‑Lizenz. Starkes reasoning und agentische Fähigkeiten bei effizientem Ressourcenverbrauch.
Whisper-Large-V3-Turbo
Leistungsstarkes Speech-to-Text-Modell für schnelle und präzise Transkription in zahlreichen Sprachen. Ideal, um Meetings, Podcasts, Webinare oder Support-Anrufe in Text umzuwandeln und diese weiterzuverarbeiten.
Einfach
Easy Implementierung. Rufe deinen API-Key ab und lege los. Parallel kannst du einen Open WebUI-Container starten und mit deinem LLM chatten. Alles dokumentiert im Developer Portal. So einfach hattest du noch kein AI-Modell am Start.
Digitale Souveränität
AI-Hosting ist unabhängig von großen Digitalkonzernen. Alle Modelle werden in unserem Rechenzentrum in Deutschland gehostet. So garantieren wir, dass keine Trainingsdaten gespeichert werden.
KI nutzen, ohne Daten zu teilen.
Beim mittwald AI-Hosting hast du volle Kontrolle über deine KI – keine Cloud-Umwege, keine versteckten Datenflüsse. Jetzt loslegen!
Wähle deinen Tarif
Was bedeuten Token in der Praxis?
Das alles kannst du mit deinen Token konkret umsetzen. Von Chatbots über Bildanalyse bis hin zu Content-Generierung.
Die Tabelle enthält Token-Schätzungen für das OSS-120B-Modell und berechnet, wie viele Einheiten der jeweilige Tarif abdecken könnte. Es handelt sich um Näherungswerte, da die tatsächliche Token-Anzahl je nach konkreter Eingabe und Ausgabe variieren kann.
Token-Richtwerte fürs Programmieren
Neben OSS-120B nutzen viele Entwickler das devstral Modell für Programmieraufgaben.
Die folgende Tabelle zeigt Näherungswerte - die tatsächliche Token-Anzahl hängt von der Programmiersprache und Code-Komplexität ab.
Hinweis: Die Token-Anzahl variiert je nach Programmiersprache. Faustregel: 100 Zeilen Code = 1.000 Tokens (Python), ~700 Tokens (JavaScript), ~1.150 Tokens (SQL). Bei agentischen Workflows können mehrere API-Aufrufe pro Aufgabe anfallen, was zu höherem Token-Verbrauch führt.
Token-Verbrauch für Audio (Whisper Modell)
Für die Transkription von Audio-Dateien mit dem Whisper-Modell gilt die Faustformel: 20 Millisekunden entsprechen 1 Token. Die Abrechnung erfolgt dabei immer auf die volle Sekunde aufgerundet.
Ohne US-Transfer
Dr. Nepomuk Gasteiger, visionbites
Für Kunden, die jeden Datentransfer in die USA ausschließen, ist das in Kombination mit OpenWeb UI schon ziemlich cool.
Bleib informiert!
Rund um das AI-Hosting entwickelt sich viel. Im Newsletter liest du als erstes, welche Features wir als nächstes releasen.
Support rund um die Uhr
Wenn der Schuh drückt, sind wir am Start. Unter +49 5772 293 150 zu jeder Zeit, mit persönlichem Ansprechpartner und unter 1 Minute Wartezeit. Egal ob bei Hosting, CMS oder Shop - auf uns kannst du dich verlassen.
Hier bekommst du Antworten
Im AI-Hosting kannst du pro Organisation im mStudio einen oder mehrere OpenAI-kompatible APIKeys generieren. Mit diesen API-Keys kannst du unsere aktuell verfügbaren fünf KI-Modelle direkt ansprechen und in eigene Anwendungen, Workflows oder Systeme integrieren.
Zusätzlich hast du die Möglichkeit, automatisch einen Open WebUI-Container zu erstellen. Dieser eignet sich ideal, um die Modelle direkt über eine grafische Oberfläche zu testen, mit ihnen zu chatten oder Prototypen zu entwickeln.
Darüber hinaus kannst du im Container-Hosting weitere AI-nahe Services betreiben und mit dem AIHosting kombinieren, zum Beispiel:
- Vektordatenbanken
- Agenten-Frameworks
- eigene Inferenz- oder Orchestrierungsdienste
Die eingesetzten Modelle sind öffentlich verfügbar und stammen aus Open-Source-Communities oder aus frei nutzbaren Projekten. Es handelt sich dabei um sogenannte Open-Weight-Modelle, die transparent einsetzbar sind und sich problemlos in eigene Anwendungen integrieren lassen.
Um AI-Hosting zu nutzen, benötigst du:
- einen Zugang zum mStudio
- eine angelegte Organisation im mStudio
- einen aktiven Paid Plan für AI-Hosting
Ein klassisches Hosting-Paket (z. B. Webhosting, vServer oder Dedicated Server) ist nicht erforderlich. Diese Voraussetzung galt ausschließlich während der Beta-Phase.
Sobald deine Organisation angelegt und ein Paid Plan aktiviert ist, kannst du ein Projekt erstellen und im Bereich AI-Hosting einen oder mehrere API-Keys generieren.
Die aktuell verfügbaren Modelle findest du jederzeit im Developer-Portal. Zum Start stehen folgende Modelle zur Verfügung:
- OSS‑120B (OpenAI)
Open‑Weight‑Modell mit starkem Reasoning und sehr guten agentischen Fähigkeiten. Geeignet für komplexe Aufgaben, Analysen und anspruchsvolle Workflows. - Whisper‑Large‑V3‑Turbo
Leistungsfähiges Speech‑to‑Text‑Modell für Transkription, Voice‑Interfaces und Audio‑Workflows. - Qwen3‑Embedding‑8B
Embedding‑Modell für semantische Suche, Textähnlichkeit, RAG‑Setups und Empfehlungssysteme. - Devstral‑Small‑2‑24B
Speziell optimiert für agentenbasierte Coding‑Aufgaben, Code‑Generierung, Refactoring und Debugging. - Ministral 3 14B
Vielseitiges Sprachmodell für allgemeine Text‑, Chat‑ und Reasoning‑Aufgaben.
Weitere Modelle werden sukzessive ergänzt.
Ja. Alle Anfragen werden ausschließlich innerhalb unserer eigenen Infrastruktur verarbeitet. Es findet kein Datentransfer außerhalb Deutschlands statt – auch nicht in Drittstaaten wie die USA. Eingaben werden nicht zum Training der Modelle verwendet. Alle Prozesse erfüllen die Anforderungen der DSGVO.
Inhalte wie Texteingaben oder Prompts werden nicht dauerhaft gespeichert. Sie dienen ausschließlich der unmittelbaren Verarbeitung und werden anschließend verworfen.
Die eingesetzten Modelle sind nicht lernfähig im Sinne eines Trainings auf Nutzerdaten. Deine Eingaben haben keinen Einfluss auf zukünftige Antworten.
Viele CMS wie TYPO3 CMS oder WordPress unterstützen Plugins oder Extensions mit OpenAIkompatibler API-Anbindung. Dort kannst du einfach deinen mittwald-AI-Hosting-API-Key hinterlegen und die Funktionalität direkt nutzen.
Open WebUI ist eine benutzerfreundliche Open-Source-Oberfläche für die Arbeit mit Sprachmodellen. Du kannst dort:
- direkt mit den mittwald-Modellen chatten
- eigene API-Keys (z. B. von OpenAI) verwenden
- Modelle vergleichen und testen
Der Container lässt sich im mStudio mit wenigen Klicks automatisch erstellen.
Ja. Die jeweils geltenden Limits sind transparent in der Tariftabelle einsehbar.
Aktuell gibt es keinen harten Cut, wenn du dein Token-Limit überschreitest:
- Bei 75 % Auslastung erhältst du einen Hinweis im mStudio.
- Bei 90 % Auslastung wirst du zusätzlich per E-Mail informiert.
Sollten wir feststellen, dass du deine Limits regelmäßig überschreitest, kommen wir aktiv auf dich zu, um gemeinsam eine passende Lösung zu finden.
Diese Regelung ist eine temporäre Lösung zum Start. Perspektivisch sind Modelle wie Pay-per-Token oder ein automatisches Stoppen der API ab einer bestimmten Überschreitung vorgesehen.
Das lässt sich im Voraus nie zu 100 % exakt bestimmen – der Tokenverbrauch hängt stark vom Use Case, vom gewählten Modell sowie von Länge und Anzahl der Anfragen ab.
So gehst du am besten vor:
- Wenn du bereits APIs wie z. B. OpenAI nutzt, kannst du dich an deinem bisherigen Tokenverbrauch orientieren.
- Alternativ startest du mit einem Tarif und beobachtest deinen tatsächlichen Verbrauch.
- Deinen aktuellen Tokenverbrauch kannst du jederzeit transparent im mStudio einsehen.
- Alle Tarife haben monatliche Laufzeiten, sodass du flexibel upgraden oder downgraden kannst.
Token-Zahlen sind abstrakt. Die folgende Übersicht zeigt Näherungswerte, was du mit den jeweiligen Tarifen konkret umsetzen kannst. Die Angaben basieren auf dem OSS‑120B‑Modell und dienen ausschließlich zur Orientierung. Der tatsächliche Verbrauch kann je nach Prompt und Antwort variieren.
Eine Übersicht für typische Nutzungsszenarien findest du hier.
Unser Support‑Team steht dir während der regulären Supportzeiten per Ticket, Telefon oder Live‑Chat zur Verfügung.
Zusätzlich findest du im Developer Portal ausführliche technische Dokumentation, Code‑Beispiele und Hinweise zur API‑Nutzung, zu Modellen sowie zu typischen Integrationsszenarien rund um AI‑Hosting.
Darüber hinaus kannst du dich im Agentur-Hub mit anderen Agenturen sowie Entwicklerinnen und Entwicklern austauschen.
Aktuell gibt es keine separate Test‑ oder Trial‑Funktion für AI‑Hosting.
Du kannst jedoch den kleinsten verfügbaren Tarif buchen, AI‑Hosting einen Monat lang nutzen und anschließend direkt wieder kündigen. Es gibt dabei keine Mindestlaufzeit über den gebuchten Zeitraum hinaus.
So kannst du AI‑Hosting realistisch im Produktivbetrieb testen – inklusive API‑Keys, Modellen und Limits.
Der offizielle Live‑Gang von AI‑Hosting ist für den 14. Januar geplant.
API‑Keys, die während der Beta‑Phase erstellt wurden, bleiben noch bis Ende Januar 2026 gültig.
Wenn du in dieser Zeit in einen Paid‑Plan wechselst, musst du deinen bestehenden API‑Key nicht ändern – er wird automatisch übernommen.
Nach Ablauf der Übergangsphase werden reine Beta‑Keys deaktiviert.
Hast du noch 'ne Frage?
Wir haben die Antwort parat. Ruf uns an unter
+49 5772 293 150 oder schreib uns im Chat.