← ニュース一覧
Databricks Blog2026年5月5日
1日10兆サンプル:Databricksにおける従来の監視インフラを超えるスケーリング
英語原文から AI が翻訳しました。 英語版を見る
要約
Databricksは現在、毎日10兆サンプルを処理しており、カスタマイズされたオープンソースソリューションでTSDBと集計レイヤーを再構築することにより、従来の監視インフラストラクチャを超えてスケーリングしています。新しいLakehouseベースのプラットフォームであるHydraは、高カーディナリティメトリクスに対して50倍安価なストレージで豊富なデバッグ機能を提供します。
Databricksの監視システムは、AWS、Azure、GCP全体で50億を超えるアクティブな時系列をリアルタイムで管理しています。 急速なスケーリングにもかかわらず、これらのシステムを信頼性が高く、低タッチに保つために、オープンソースの監視ソリューションをカスタマイズすることで、TSDBと集計レイヤーを再構築しました。 高カーディナリティのトラブルシューティングメトリクスの大幅な増加に直面して、Hydraと呼ばれる新しいLakehouseベースのプラットフォームを開発しました。このアプローチにより、大規模なデバッグ機能と既存のスタックよりも50倍安価なストレージが実現しました。