文档API 参考📓 教程🧑‍🍳 食谱🤝 集成💜 Discord🎨 Studio
文档

Evaluators (评估器)

评估器描述
AnswerExactMatchEvaluator使用 ground truth 标签评估 Haystack 管道预测的答案。它逐个字符检查预测的答案是否与 ground truth 答案完全匹配。
ContextRelevanceEvaluator使用 LLM 评估是否可以从提供的上下文中推断出生成的答案。
DeepEvalEvaluator使用 DeepEval 评估生成式管道。
DocumentMAPEvaluator使用 ground truth 标签评估 Haystack 管道检索到的文档。它检查检索到的文档列表在多大程度上仅包含 ground truth 标签中指定的相关文档,或者也包含不相关的文档。
DocumentMRREvaluator使用 ground truth 标签评估 Haystack 管道检索到的文档。它检查 ground truth 文档在检索到的文档列表中的排名。
DocumentNDCGEvaluator使用 ground truth 标签评估 Haystack 管道检索到的文档。它检查 ground truth 文档在检索到的文档列表中的排名。此度量称为归一化折扣累积增益 (NDCG)。
DocumentRecallEvaluator使用 ground truth 标签评估 Haystack 管道检索到的文档。它检查检索到了多少 ground truth 文档。
FaithfulnessEvaluator使用 LLM 评估是否可以从提供的上下文中推断出生成的答案。不需要 ground truth 标签。
LLMEvaluator使用包含用户定义的指令和示例的提示来评估输入。
RagasEvaluator使用 Ragas 框架评估检索增强生成管道。
SASEvaluator使用 ground truth 标签评估 Haystack 管道预测的答案。它使用微调的语言模型检查预测答案与 ground truth 答案之间的语义相似度。