← ニュース一覧

MLflow Blog2026年2月24日

マルチターン評価とシミュレーション：チャットボット向けMLflowによるAI可観測性の強化

英語原文から AI が翻訳しました。英語版を見る

要約

MLflow 3.10は、マルチターン評価と会話シミュレーションをサポートし、完全な会話のスコアリングとエージェント変更の再現可能なテストを可能にします。これにより、複数ターンにわたってのみ発生する障害を捕捉し、チャットボットの可観測性を向上させます。

MLflow 3.10では、マルチターン評価と会話シミュレーションが導入され、会話全体をスコアリングしたり、再現可能なシナリオでエージェントの変更をテストしたり、複数ターンにわたってのみ表面化する障害を捕捉したりできるようになります。

原文を読む →英語版を見る

関連記事

News

マルチハーネスAIエージェントには多層オブザーバビリティが必要：MLflowにおけるOmnigent

mlflow-blog2d ago

News

MLflowのロールベースアクセスコントロールを使用してLLMチームを管理する方法

mlflow-blog19d ago

News

MLflow AI Gateway を介した Claude Code のルーティング

mlflow-blog40d ago

News

ブラックボックスから可観測性へ: MLflowによるOpenClawのトレース

mlflow-blog59d ago