← ニュース一覧
Databricks Blog2026年6月10日
モデルに適応するAIサービングプラットフォーム
英語原文から AI が翻訳しました。 英語版を見る
要約
Databricksは、scikit-learnから70B LLMまで、モデルのリソース要件に自動的に適応するフルマネージドAIサービングプラットフォームを提供開始しました。手動設定は不要です。これにより、自己管理スタックから移行する顧客は、インフラコストを最大90%削減し、p99レイテンシーオーバーヘッドを10ms未満に抑えることができます。
* 概要: 2MBのscikit-learn分類器を1つのCPUコアで実行する場合から、ファインチューニングされた70B LLMを8つのGPUで実行する場合まで、あらゆるモデルを本番環境で実行できるフルマネージドプラットフォームです。設定は不要です。 * 解決する課題: カスタムモデルはリソースプロファイルとトラフィックパターンが大きく異なるため、単一の静的設定ではすべてに対応できません。このプラットフォームは、レイテンシーを低く保ちながら、すべてのノードを効率的に保つように適応します。 * 結果: 自己管理スタックから移行する顧客は、300K+ QPSでp99レイテンシーオーバーヘッドを10ms未満に抑え、インフラコストを最大90%削減できます。