R

Roberta Large Llm Content Detector

由SuperAnnotate開發
基於 RoBERTa Large 微調的生成文本檢測模型,用於識別 AI 生成內容
下載量 21.51k
發布時間 : 3/28/2024

模型概述

該模型旨在檢測生成/合成文本,對訓練數據篩選、識別科學與教育領域的欺詐作弊行為具有重要意義

模型特點

高精度檢測
在多種文本類型上表現出色,綜合檢測準確率達 87%
數據多樣性
使用 HC3 和 IDMGSP 兩個數據集混合訓練,確保模型泛化能力
合理置信度
經過校準處理,預測概率與實際準確率相匹配
抗過擬合
通過移除關鍵 n-gram 和標籤平滑技術防止過擬合

模型能力

檢測 AI 生成文本
區分人工寫作與機器生成內容
提供生成概率評分

使用案例

教育領域
學術誠信檢測
識別學生作業中的 AI 生成內容
幫助教育工作者發現潛在的學術不端行為
數據篩選
訓練數據淨化
過濾訓練數據中的合成文本
提高下游模型訓練質量
內容審核
虛假內容識別
檢測社交媒體中的 AI 生成虛假信息
輔助人工審核工作
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase