← ニュース一覧
MLflow Blog2026年4月28日
AIが何を見ているかを確認:画像、音声、ファイルのためのマルチモーダルトレーシング
英語原文から AI が翻訳しました。 英語版を見る
要約
Databricksは、画像、音声、ファイルのためのマルチモーダルトレーシングをサポートするようになりました。これにより、不透明なbase64文字列ではなく、これらのアーティファクトをトレース内で直接視覚化し、操作できるようになります。この機能強化により、GenAIエージェントのデバッグが改善され、ストレージコストが削減され、大規模なマルチメディア文字列の直接保存が回避されるため、トレースクエリが高速化されます。
エージェントが画像を分析し、音声を文字起こしし、PDFを処理します。しかし、何か問題が発生した場合、トレースには不透明なbase64文字列、つまりJSONに埋め込まれた数メガバイトのiVBORw0KGgo...しか表示されません。画像が送信されたことはわかっても、その内容が何であったかはわかりません。音声が返されたことはわかっても、再生することはできません。そして、これらの数メガバイトの文字列はすべてトレースデータベースに直接保存され、ストレージコストを膨らませ、クエリを遅くしています。