Databricks Blog2026年6月10日

モデルに適応するAIサービングプラットフォーム

英語原文から AI が翻訳しました。英語版を見る

要約

Databricksは、scikit-learnから70B LLMまで、モデルのリソース要件に自動的に適応するフルマネージドAIサービングプラットフォームを提供開始しました。手動設定は不要です。これにより、自己管理スタックから移行する顧客は、インフラコストを最大90%削減し、p99レイテンシーオーバーヘッドを10ms未満に抑えることができます。

* 概要: 2MBのscikit-learn分類器を1つのCPUコアで実行する場合から、ファインチューニングされた70B LLMを8つのGPUで実行する場合まで、あらゆるモデルを本番環境で実行できるフルマネージドプラットフォームです。設定は不要です。 * 解決する課題: カスタムモデルはリソースプロファイルとトラフィックパターンが大きく異なるため、単一の静的設定ではすべてに対応できません。このプラットフォームは、レイテンシーを低く保ちながら、すべてのノードを効率的に保つように適応します。 * 結果: 自己管理スタックから移行する顧客は、300K+ QPSでp99レイテンシーオーバーヘッドを10ms未満に抑え、インフラコストを最大90%削減できます。

原文を読む →英語版を見る

News

AIを実験段階から影響力のあるものへと移行させるために答えるべき3つの質問

databricks-blog1d ago

News

Inside the infrastructure strategies propelling AI leaders

databricks-blog1d ago

News

Databricks AIでGPUの信頼性を維持する方法

databricks-blog2d ago

News

2026 Built-On Databricks Startup Challengeの受賞者を祝う

databricks-blog2d ago

モデルに適応するAIサービングプラットフォーム

関連記事

AIを実験段階から影響力のあるものへと移行させるために答えるべき3つの質問

Inside the infrastructure strategies propelling AI leaders

Databricks AIでGPUの信頼性を維持する方法

2026 Built-On Databricks Startup Challengeの受賞者を祝う