P

Phi3 Hallucination Judge Merge

Developed by grounded-ai
該模型用於檢測語言模型輸出中的幻覺現象,即響應連貫但事實錯誤或脫離上下文的情況。
Downloads 63
Release Time : 4/25/2025

Model Overview

一個專門用於檢測語言模型輸出幻覺的二分類模型,通過微調實現高性能的幻覺檢測能力。

Model Features

高性能幻覺檢測
在幻覺檢測任務中表現優異,F1分數達到0.81,超越多個前沿語言模型。
輕量級適配器
採用PEFT適配器技術,實現高效微調而不需要修改基礎模型。
標準化提示策略
提供標準化的輸入格式和提示策略,便於快速集成到現有系統中。

Model Capabilities

幻覺檢測
文本分類
語言模型輸出評估

Use Cases

語言模型質量評估
模型輸出驗證
驗證語言模型生成內容的事實準確性
準確識別85%的幻覺輸出
內容審核
事實核查
自動檢測生成內容中的事實錯誤
召回率達到87%的錯誤檢測
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase