← 전체 뉴스
Databricks Blog2026년 5월 5일
하루 10조 샘플: Databricks에서 기존 모니터링 인프라를 넘어선 확장
영어 원문을 AI가 번역했습니다. 영어로 보기
요약
Databricks는 이제 매일 10조 개의 샘플을 처리하며, 맞춤형 오픈소스 솔루션으로 TSDB 및 집계 레이어를 재구성하여 기존 모니터링 인프라를 넘어 확장하고 있습니다. 새로운 Lakehouse 기반 플랫폼인 Hydra는 고카디널리티 메트릭에 대해 50배 저렴한 스토리지로 풍부한 디버깅 기능을 제공합니다.
Databricks의 모니터링 시스템은 AWS, Azure, GCP 전반에 걸쳐 50억 개 이상의 활성 시계열을 실시간으로 관리합니다. 급격한 확장에도 불구하고 이러한 시스템을 안정적이고 적은 터치로 유지하기 위해 오픈소스 모니터링 솔루션을 맞춤화하여 TSDB 및 집계 레이어를 재구성했습니다. 고카디널리티 문제 해결 메트릭의 급증에 직면하여 Hydra라는 새로운 Lakehouse 기반 플랫폼을 개발했습니다. 이 접근 방식은 기존 스택보다 50배 저렴한 스토리지로 대규모 디버깅 기능을 제공합니다.