幻覺檢測

# 幻覺檢測

Phi3 Hallucination Judge Merge

該模型用於檢測語言模型輸出中的幻覺現象，即響應連貫但事實錯誤或脫離上下文的情況。

大型語言模型

基於Llama-3.2-3B-Instruct微調的聲明驗證模型，專門用於檢測AI生成文本中的幻覺或未支持的陳述。

文本分類英語

Xlm Roberta Mushroom Qa

該模型專門為SemEval 2025 Task3: Mu-SHROOM競賽任務微調，用於識別大語言模型輸出中的幻覺文本片段。

大型語言模型

Rootsignals Judge Llama 70B

Root Judge是一款強大的中型大語言模型，專為可靠且可定製的LLM系統評估而設計。基於Llama-3.3-70B-Instruct微調，擅長成對偏好判斷和帶來源引用的多輪指令遵循任務。

大型語言模型

Safetensors 英語

Hallucination Evaluation Model

HHEM-2.1-Open是Vectara開發的幻覺檢測模型，用於評估大語言模型生成內容與給定證據的一致性。

大型語言模型

Transformers 英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase