Databricks Blog10. Juni 2026

KI-Serving-Plattform, die sich an Ihr Modell anpasst

Von KI aus dem englischen Original übersetzt. Auf Englisch ansehen

Zusammenfassung

Databricks bietet jetzt eine vollständig verwaltete KI-Serving-Plattform, die sich automatisch an die Ressourcenanforderungen Ihres Modells anpasst, von scikit-learn bis zu 70B LLMs, ohne manuelle Konfiguration. Dies führt zu bis zu 90 % niedrigeren Infrastrukturkosten und <10ms p99 Latenz-Overhead für Kunden, die von selbstverwalteten Stacks migrieren.

* Was es ist: Eine vollständig verwaltete Plattform, die jedes Modell in Produktion ausführt, von einem 2 MB scikit-learn-Klassifikator auf einem CPU-Kern bis zu einem feinabgestimmten 70B LLM auf acht GPUs, ohne manuelle Einstellungen. * Die Herausforderung, die es löst: Benutzerdefinierte Modelle haben sehr unterschiedliche Ressourcenprofile und Traffic-Muster, sodass keine einzelne statische Konfiguration für alle passt. Die Plattform passt sich stattdessen an, hält die Latenz niedrig und sorgt gleichzeitig für die Effizienz jedes Knotens. * Die Ergebnisse: 300K+ QPS bei <10ms p99 Latenz-Overhead und bis zu 90 % geringere Infrastrukturkosten für Kunden, die von selbstverwalteten Stacks migrieren.

Original lesen →Auf Englisch ansehen

KI-Serving-Plattform, die sich an Ihr Modell anpasst

Ähnliche Artikel

Die 3 Fragen, die Sie beantworten müssen, um KI von der Experimentierphase zur Wirkung zu führen

Einblicke in die Infrastrukturstrategien, die KI-Führungskräfte antreiben

Wie wir GPUs in Databricks AI zuverlässig halten

Wir feiern die Gewinner der 2026 Built-On Databricks Startup Challenge