AI-Hosting – die Zukunft deiner Projekte ist jetzt digital souverän.
AI-Modelle fully managed, gehosted in Deutschland. Beta-Version für Agenturen und Developer, die DSGVO-konforme KI-Anwendungen bauen wollen.
Einfach implementiert. Komplett souverän.
API-Key abrufen und loslegen. Alles verwaltet im mStudio. So schnell hattest du noch kein AI-Modell am Start. Das beste: Alle Daten liegen komplett in deiner Hand.
AI-Modelle
Wähle aus diesen LLMs:
Mistral-Small-3.2-24B-Instruct
Europäisches Open-Source-Modell von Mistral AI. Zuverlässig für vielseitige Text- und Chat-Aufgaben
Qwen3-Embedding-8B
Open-Source-Embedding-Modell von Alibaba Cloud AI. Effizient für Suche, Empfehlungen und Datenanbindung.
Devstral-Small (Beta) [coming soon]
Agentisches Coding-Modell auf Basis von Mistral-Small 3.1, entwickelt mit All Hands AI. Praktisch für Coding-Automatisierung und Agentic Use Cases.
DeepSeek-R1-Distill-Qwen-32B (Beta) [coming soon]
Destilliertes Modell aus der DeepSeek-Community (China). Stark für Logik, Datenanalyse und Wissensintegration.
Einfach
Easy Implementierung. Rufe deinen API-Key ab und lege los. Parallel kannst du einen Open WebUI-Container starten und mit deinem LLM chatten. Alles dokumentiert im Developer Portal. So einfach hattest du noch kein AI-Modell am Start.
Digitale Souveränität
AI-Hosting ist unabhängig von großen Digitalkonzernen. Alle Modelle werden in unserem Rechenzentrum in Deutschland gehostet. So garantieren wir, dass keine Trainingsdaten gespeichert werden.
Kostenfreie Beta
AI-Hosting steht dir derzeit als Beta-Version kostenfrei zur Verfügung. Langfristig rechnest du die Nutzung der AI-Modelle zum Festpreis mit fixem Token-Konto ab. Für eine bessere Planbarkeit.
Ohne US-Transfer
Dr. Nepomuk Gasteiger, visionbites
Für Kunden, die jeden Datentransfer in die USA ausschließen, ist das in Kombination mit OpenWeb UI schon ziemlich cool.
AI-Hosting (Beta) = Teil deines Hostings
AI-Hosting (Beta) ist Bestandteil deines Hostings. Wenn du deine Webprojekte im mStudio verwaltest, steht es dir in der Beta-Phase kostenfrei zur Verfügung.
Finde deinen passenden Tarif:
Bleib informiert!
AI-Hosting ist derzeit im Beta-Stadium. Wir entwickeln es stetig weiter. Im Newsletter liest du als erstes, welche Features wir als nächstes releasen.
Support rund um die Uhr
Wenn der Schuh drückt, sind wir am Start. Unter +49 5772 293 150 zu jeder Zeit, mit persönlichem Ansprechpartner und unter 1 Minute Wartezeit. Egal ob bei Hosting, CMS oder Shop - auf uns kannst du dich verlassen.
Hier bekommst du Antworten
Im Rahmen der Beta kannst du dir pro Projekt im mStudio einen API-Key generieren und direkt mit den bereitgestellten KI-Modellen arbeiten. Wenn dein Hosting-Tarif Container-Hosting unterstützt, kannst du zusätzlich automatisch einen Open WebUI-Container erstellen – ideal, um direkt per Oberfläche mit den LLMs zu chatten oder sie zu testen.
Die eingesetzten Modelle sind öffentlich verfügbar und stammen aus der Open-Source-Community oder aus frei nutzbaren Projekten. Einige davon sind nicht vollständig Open Source im klassischen Sinn, können aber problemlos in eigenen Anwendungen verwendet werden.
Um AI-Hosting nutzen zu können, benötigst du einen Zugang zum mStudio. Falls du noch keinen Account hast, kannst du diesen unkompliziert und kostenlos anlegen.
Zusätzlich brauchst du ein kostenpflichtiges Hosting-Paket im mStudio – also beispielsweise einen vServer, Dedicated Server oder ein Webhosting-Paket. Diese Pakete kannst du vorab 10 Tage lang kostenlos testen, um AI-Hosting unverbindlich auszuprobieren.
Sobald dein Paket eingerichtet ist, legst du im mStudio zunächst eine Organisation an, erstellst ein Projekt und findest im Projektbereich unter „AI-Hosting“ die Möglichkeit, dir einen API-Key zu generieren.
Aktuell stehen im AI-Hosting zwei Open-Source-Modelle zur Verfügung. Mistral-Small-3.2-24B-Instruct ist ein vielseitig einsetzbares Sprachmodell, das sich für Textverständnis, Reasoning und auch Vision-Anwendungen eignet.
Qwen3-Embedding-8B ist speziell für Embedding-Aufgaben optimiert und eignet sich unter anderem für semantische Suche, Text-Ähnlichkeitsanalysen und Empfehlungssysteme.
Voraussichtlich als Nächstes folgen zwei weitere Modelle: Devstral-Small, ein auf agentenbasierte Coding-Aufgaben spezialisiertes Modell, sowie DeepSeek-R1-Distill-Qwen-32B (Beta), das besonders gut für logische Aufgaben, Datenanalysen und strukturierte Wissensverarbeitung geeignet ist.
Ja. Alle Anfragen laufen ausschließlich in unserer eigenen Infrastruktur. Es findet kein Datentransfer außerhalb Deutschlands statt – auch nicht in die USA. Kundendaten werden nicht zum Training der Modelle verwendet.
Während der Nutzung werden deine Inhalte (z. B. Texteingaben an das Modell) nicht gespeichert – sie dienen ausschließlich der unmittelbaren Verarbeitung und werden danach verworfen. Eine Löschung ist daher nicht notwendig, da keine Inhaltsdaten dauerhaft vorgehalten werden.
Die eingesetzten Sprachmodelle sind zudem nicht lernfähig im Sinne von „Training on user data“. Das bedeutet: Deine Eingaben beeinflussen das Modellverhalten nicht und fließen auch nicht in spätere Antworten ein.
Alle Prozesse entsprechen den Anforderungen der DSGVO.
Viele CMS wie TYPO3 CMS oder WordPress unterstützen bereits Plugins oder Extensions, bei denen man einen OpenAI-kompatiblen API-Key hinterlegen kann. Dort kannst du einfach deinen mittwald-AI-Hosting-Key eintragen – fertig.
Open WebUI ist eine benutzerfreundliche Open-Source-Oberfläche für die Arbeit mit Sprachmodellen. Du kannst dort direkt dein mittwald-Modell eintragen oder auch eigene API-Keys (z. B. von OpenAI) nutzen. Über das mStudio kannst du dir den Container mit wenigen Klicks anlegen.
Ja, aktuell gilt ein Limit von 300 Requests pro Minute pro API-Key. Weitere Limits oder Abrechnungsmodelle können sich im Laufe der Beta anpassen.
Unser Support-Team steht dir während der regulären Supportzeiten zur Verfügung – per Ticket, Telefon oder Live-Chat. In der Beta-Phase wollen wir aktiv von dir lernen. Daher kann es sein, dass dein Anliegen intern an unsere AI-Expert*innen weitergeleitet wird. Diese melden sich dann ggf. individuell per Ticket, E-Mail oder auch per Videocall bei dir zurück.
Zusätzlich bieten wir im August wöchentliche Entwickler-Calls an, in denen du direkt deine Fragen stellen kannst. Auch im Agentur-Hub kannst du dich mit anderen Agenturen und Entwicklern austauschen.
Ein konkretes Datum für den offiziellen Launch gibt es noch nicht. Wir evaluieren derzeit, welche Use-Cases für unsere Kunden am wichtigsten sind. Geplant ist ein offizieller Release im Laufe des Jahres 2025 – inklusive möglicher weiterer Modelle und Features.
Hast du noch 'ne Frage?
Wir haben die Antwort parat. Ruf uns an unter
+49 5772 293 150 oder schreib uns im Chat.