Databricks Blog2026년 5월 5일

하루 10조 샘플: Databricks에서 기존 모니터링 인프라를 넘어선 확장

영어 원문을 AI가 번역했습니다. 영어로 보기

요약

Databricks는 이제 매일 10조 개의 샘플을 처리하며, 맞춤형 오픈소스 솔루션으로 TSDB 및 집계 레이어를 재구성하여 기존 모니터링 인프라를 넘어 확장하고 있습니다. 새로운 Lakehouse 기반 플랫폼인 Hydra는 고카디널리티 메트릭에 대해 50배 저렴한 스토리지로 풍부한 디버깅 기능을 제공합니다.

Databricks의 모니터링 시스템은 AWS, Azure, GCP 전반에 걸쳐 50억 개 이상의 활성 시계열을 실시간으로 관리합니다. 급격한 확장에도 불구하고 이러한 시스템을 안정적이고 적은 터치로 유지하기 위해 오픈소스 모니터링 솔루션을 맞춤화하여 TSDB 및 집계 레이어를 재구성했습니다. 고카디널리티 문제 해결 메트릭의 급증에 직면하여 Hydra라는 새로운 Lakehouse 기반 플랫폼을 개발했습니다. 이 접근 방식은 기존 스택보다 50배 저렴한 스토리지로 대규모 디버깅 기능을 제공합니다.

원문 보기 →영어로 보기

하루 10조 샘플: Databricks에서 기존 모니터링 인프라를 넘어선 확장

관련 기사

AI를 실험에서 영향으로 전환하기 위해 답해야 할 3가지 질문

Inside the infrastructure strategies propelling AI leaders

Databricks AI에서 GPU 신뢰성을 유지하는 방법

2026 Built-On Databricks 스타트업 챌린지 수상자 축하