LIVEEU verabschiedet Durchführungsverordnung zum AI Act·Wir haben fünf LLMs mit Rechtstexten getestet. Das Ergebnis hat uns überrascht·Neue Open-Source-Modelle unterbieten API-Preise um 40 %Sonntag, 5. Juli 2026

Neue Open-Source-Modelle unterbieten API-Preise um 40 %

Eine neue Generation offener Sprachmodelle sorgt für Preisdruck bei den etablierten API-Anbietern. Was das für Unternehmen bedeutet, die auf günstige Inferenz setzen.

ER
ecompanion Redaktion3.7.2026 · 7 Min. Lesezeit
↗ Teilen🔖 Merken🎧 Anhören
artikel-hero · contentmachine

Der Preiskampf im Markt für KI-Inferenz nimmt Fahrt auf: Gleich mehrere Anbieter offener Sprachmodelle haben in dieser Woche neue API-Preise angekündigt, die im Schnitt rund 40 Prozent unter dem Niveau der etablierten Anbieter liegen. Möglich wird das durch effizientere Trainingsverfahren und optimierte Inferenz-Architekturen, die den Rechenaufwand pro Anfrage spürbar senken, ohne bei der Antwortqualität größere Abstriche zu machen. Besonders im Fokus steht ein neues Modell, das bei Standardbenchmarks für Textverständnis und Programmierung nahezu gleichauf mit den führenden proprietären Modellen liegt, dabei aber deutlich weniger Parameter benötigt — für Unternehmen mit hohem Anfragevolumen wie Kundenservice-Chatbots kann das erhebliche Kosteneinsparungen bedeuten.

Warum die Preise jetzt fallen

Der Preisverfall ist keine kurzfristige Marketingaktion, sondern das Ergebnis technischer Fortschritte bei der Modellkomprimierung und beim sogenannten Mixture-of-Experts-Ansatz, bei dem nur ein Teil der Modellparameter für eine gegebene Anfrage aktiviert wird und dadurch der Energie- und Rechenaufwand pro Anfrage erheblich sinkt. Hinzu kommt ein verschärfter Wettbewerb: Mit jedem neuen leistungsfähigen Open-Source-Modell steigt der Druck auf die geschlossenen Anbieter, ihre Preise zu rechtfertigen oder ebenfalls zu senken — Analysten sehen darin eine strukturelle Verschiebung, von der vor allem Unternehmen profitieren, die nicht an einen einzelnen Anbieter gebunden sein wollen.

Was Unternehmen jetzt beachten sollten

Für Entscheider, die über einen Wechsel oder eine Diversifizierung ihrer KI-Anbieter nachdenken, lohnt sich ein genauer Blick auf mehr als nur den Preis pro Token: Wichtig sind auch Latenzzeiten, die Verfügbarkeit in europäischen Rechenzentren und die Frage, wie transparent ein Anbieter mit Trainingsdaten und Nutzungsbedingungen umgeht. Trotz der erfreulichen Preisentwicklung mahnen Branchenkenner zur Vorsicht vor vorschnellen Wechseln allein aus Kostengründen — wer produktive Anwendungen auf einem neuen Modell aufbaut, sollte zunächst in einer Testumgebung prüfen, ob die Qualität für den eigenen Anwendungsfall tatsächlich ausreicht, denn ein niedrigerer Preis nützt wenig, wenn dafür die Fehlerquote in geschäftskritischen Prozessen steigt.

open-sourcepreise