+
K
注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
評価スイートの実行からの指標は、評価指標ダッシュボードで見ることができるレポートに収集されます。ユーザーは、評価関数の集約結果を比較したり、個々のテストケースの結果を調査したりできます。
より深い分析、LLM トレースの表示、または実行間の比較を行うには、ロジック機能ビューで 評価指標ダッシュボードを表示する を選択します。そこから、指標、期間、および他のベンチマークの深い比較のために、実行のバッチを選択できます。