開源LettuceDetect幻覺檢測模型 - 專為RAG應用設計，識別答案無上下文支持詞元

首頁

Lettucedect Base Modernbert En V1

由KRLabsOrg開發

LettuceDetect 是一個基於 ModernBERT 的幻覺檢測模型，專為 RAG 應用設計，能夠識別答案中未被上下文支持的詞元。

大型語言模型

Transformers

英語開源協議:MIT #長上下文幻覺檢測 #RAG應用優化 #詞元級分類

下載量 4,361

發布時間 : 2/10/2025

模型概述

該模型用於檢測答案文本中未被給定上下文支持的詞元，適用於檢索增強生成（RAG）應用。

模型特點

長上下文支持

支持擴展上下文（最多 8192 個詞元），適合處理詳細且大量的文檔。

詞元級檢測

能夠識別答案文本中未被上下文支持的詞元，並聚合為片段。

高性能

在 RAGTruth 數據集上表現優異，優於 GPT-4 和 Luna 等模型。

模型能力

幻覺檢測

詞元分類

長上下文處理

使用案例

檢索增強生成（RAG）

答案驗證

驗證生成的答案是否基於提供的上下文，避免幻覺內容。

準確識別未被上下文支持的詞元片段。

🚀 LettuceDetect：幻覺檢測模型

LettuceDetect是一個基於Transformer的模型，用於對上下文和答案對進行幻覺檢測，專為檢索增強生成（RAG）應用程序而設計。該模型利用了ModernBERT的長上下文支持能力，能夠處理詳細且廣泛的文檔，準確判斷答案是否得到給定上下文的支持。

LettuceDetect Logo

模型名稱：lettucedect-base-modernbert-en-v1
組織：KRLabsOrg
Github：https://github.com/KRLabsOrg/LettuceDetect

🚀 快速開始

LettuceDetect是一個基於Transformer的模型，用於對上下文和答案對進行幻覺檢測，適用於檢索增強生成（RAG）應用。該模型基於ModernBERT構建，因其支持擴展上下文（最多8192個標記）而被特別選擇和訓練。這種長上下文能力對於需要處理詳細和廣泛文檔以準確確定答案是否得到給定上下文支持的任務至關重要。

✨ 主要特性

長上下文支持：基於ModernBERT（Large）架構，支持擴展上下文（最多8192個標記），能夠處理詳細且廣泛的文檔。
精準檢測：經過訓練，能夠識別答案文本中未得到給定上下文支持的標記，幫助用戶準確找出答案中被認為是幻覺的部分。
多語言支持：支持英文，適用於各種英文語境下的幻覺檢測任務。

📦 安裝指南

安裝lettucedetect庫：

pip install lettucedetect

💻 使用示例

基礎用法

from lettucedetect.models.inference import HallucinationDetector

# 對於基於Transformer的方法：
detector = HallucinationDetector(
    method="transformer", model_path="KRLabsOrg/lettucedect-base-modernbert-en-v1"
)

contexts = ["France is a country in Europe. The capital of France is Paris. The population of France is 67 million.",]
question = "What is the capital of France? What is the population of France?"
answer = "The capital of France is Paris. The population of France is 69 million."

# 獲取標記級別的預測結果，然後聚合為跨度，以便用戶查看答案中被認為是幻覺的部分。
predictions = detector.predict(context=contexts, question=question, answer=answer, output_format="spans")
print("Predictions:", predictions)

# 預測結果示例：[{'start': 31, 'end': 71, 'confidence': 0.9944414496421814, 'text': ' The population of France is 69 million.'}]

📚 詳細文檔

模型詳情

屬性	詳情
模型架構	ModernBERT（Large），支持擴展上下文（最多8192個標記）
任務類型	標記分類 / 幻覺檢測
訓練數據集	RagTruth
語言	英文

工作原理

該模型經過訓練，能夠識別答案文本中未得到給定上下文支持的標記。在推理過程中，模型返回標記級別的預測結果，然後將其聚合為跨度，使用戶能夠準確查看答案中被認為是幻覺的部分。

性能表現

示例級別結果：在RAGTruth數據集的測試集上進行評估，大型模型lettucedetect-large-v1的整體F1分數達到79.22%，優於基於提示的方法（如GPT-4，63.4%）和基於編碼器的模型（如Luna，65.4%），也超過了微調後的LLAMA-2-13B（78.7%），並與最先進的微調後的LLAMA-3-8B（83.9%）具有競爭力。
跨度級別結果：在跨度級別上，該模型在所有數據類型上均取得了最佳分數，顯著優於之前的模型。

引用信息

如果您使用了該模型或工具，請引用以下論文：

@misc{Kovacs:2025,
      title={LettuceDetect: A Hallucination Detection Framework for RAG Applications}, 
      author={Ádám Kovács and Gábor Recski},
      year={2025},
      eprint={2502.17125},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2502.17125}, 
}