A

Ai Detector

由SuperAnnotate開發
基於RoBERTa Large微調的生成文本檢測模型,用於識別AI生成內容
下載量 2,160
發布時間 : 9/25/2024

模型概述

該模型專為檢測生成/合成文本而設計,對訓練數據篩選、識別科學與教育領域的欺詐作弊行為具有關鍵意義。

模型特點

平衡訓練數據
使用4.4萬組均衡樣本訓練,包含人類文本與14種LLM生成內容
多領域覆蓋
訓練數據涵蓋維基百科、Reddit問答和科研論文三大領域
抗過擬合設計
通過卡方檢驗移除關鍵n-gram,確保模型學習真實特徵而非表面模式
良好校準性
優化損失函數與標籤平滑處理,使預測置信度與實際準確率匹配

模型能力

檢測AI生成文本
識別大語言模型內容
區分人類寫作與機器生成

使用案例

教育領域
學術誠信檢測
識別學生作業中的AI生成內容
可檢測GPT-4生成文本準確率達98.5%
數據篩選
訓練數據淨化
過濾數據集中的合成文本
對LLaMA-Chat生成內容檢測準確率98%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase