H

Hallucination Evaluation Model

由vectara開發
HHEM-2.1-Open是Vectara開發的幻覺檢測模型,用於評估大語言模型生成內容與給定證據的一致性。
下載量 229.46k
發布時間 : 10/25/2023

模型概述

專為檢測大語言模型(LLM)幻覺設計的文本分類模型,特別適用於檢索增強生成(RAG)場景,量化評估生成內容與事實的一致性程度。

模型特點

高性能檢測
在RAGTruth基準測試中超越GPT-3.5-Turbo和GPT-4的平衡準確率
輕量高效
32位精度下內存佔用不足600MB,現代x86 CPU處理2k詞元輸入僅需約1.5秒
無限上下文支持
相比前代HHEM-1.0的512詞元限制,支持長上下文場景
非對稱檢測
能識別事實正確但不符合上下文的特殊幻覺類型

模型能力

文本一致性評估
RAG場景幻覺檢測
跨句子邏輯關係分析

使用案例

檢索增強生成(RAG)
摘要事實核查
當LLM基於檢索結果生成摘要時,驗證摘要內容是否與檢索證據一致
在RAGTruth-Summ基準上達到64.42%平衡準確率
問答系統驗證
評估問答系統生成的答案是否嚴格基於提供的上下文
在RAGTruth-QA基準上達到74.28%平衡準確率
內容審核
事實性聲明驗證
檢測用戶生成內容(UGC)中與已知事實矛盾的陳述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase