P

Phi3 Hallucination Judge Merge

由grounded-ai開發
該模型用於檢測語言模型輸出中的幻覺現象,即響應連貫但事實錯誤或脫離上下文的情況。
下載量 63
發布時間 : 4/25/2025

模型概述

一個專門用於檢測語言模型輸出幻覺的二分類模型,通過微調實現高性能的幻覺檢測能力。

模型特點

高性能幻覺檢測
在幻覺檢測任務中表現優異,F1分數達到0.81,超越多個前沿語言模型。
輕量級適配器
採用PEFT適配器技術,實現高效微調而不需要修改基礎模型。
標準化提示策略
提供標準化的輸入格式和提示策略,便於快速集成到現有系統中。

模型能力

幻覺檢測
文本分類
語言模型輸出評估

使用案例

語言模型質量評估
模型輸出驗證
驗證語言模型生成內容的事實準確性
準確識別85%的幻覺輸出
內容審核
事實核查
自動檢測生成內容中的事實錯誤
召回率達到87%的錯誤檢測
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase