Réponses Approximatives, Décisions Exactes : Nouvelles Fonctions Sketch pour l'Analyse
Traduit de l'original anglais par IA. Voir en anglais
Databricks propose désormais de nouvelles fonctions sketch pour des réponses approximatives aux questions d'analyse, incluant les sketches de quantiles KLL pour les percentiles, les sketches Theta et Tuple pour le chevauchement d'audience, et les fonctions Top-K approximatives pour les tendances en temps réel. Ces fonctions permettent des calculs plus rapides et plus économes en mémoire sur des ensembles de données massifs, avec des sketches fusionnables pour des mises à jour incrémentielles et des comptages et agrégations combinés.
- Percentiles en millisecondes, pas en minutes : Les sketches de quantiles KLL calculent P50, P90, P99 sur des ensembles de données massifs en mémoire constante. Stockez les sketches et fusionnez-les pour des mises à jour incrémentielles instantanées. - Chevauchement d'audience à une fraction du coût : Les sketches Theta et Tuple effectuent des unions, des intersections et des différences d'ensembles sur des ensembles de valeurs distinctes. Les sketches Tuple associent également des métriques (sommes, mins, maxes) à chaque clé pour un comptage et une agrégation combinés. - Tendances en temps réel sans retraitement : Les fonctions Top-K approximatives identifient les éléments les plus fréquents en mémoire bornée, fusionnables sur différentes fenêtres temporelles.