Tech LLM-as-a-Judgeの信頼性を向上させる「評価ルーブリック+フォーム形式」プロンプト設計
RESEARCH-FIRST: LLM-as-a-Judgeの信頼性を高めるためには、単一のスコア出力ではなく、根拠の抽出(Evidence Extraction)と評価基準(Rubric)への適合性を個別に判断させる「多段階評価」が有効で...
Tech
Tech
Tech
Tech
Tech
Tech
Tech
Tech
Tech
Tech