← ニュース一覧
MLflow Blog2026年2月24日
マルチターン評価とシミュレーション:チャットボット向けMLflowによるAI可観測性の強化
英語原文から AI が翻訳しました。 英語版を見る
要約
MLflow 3.10は、マルチターン評価と会話シミュレーションをサポートし、完全な会話のスコアリングとエージェント変更の再現可能なテストを可能にします。これにより、複数ターンにわたってのみ発生する障害を捕捉し、チャットボットの可観測性を向上させます。
MLflow 3.10では、マルチターン評価と会話シミュレーションが導入され、会話全体をスコアリングしたり、再現可能なシナリオでエージェントの変更をテストしたり、複数ターンにわたってのみ表面化する障害を捕捉したりできるようになります。