R

Roberta Large Llm Content Detector

Developed by SuperAnnotate
基于 RoBERTa Large 微调的生成文本检测模型,用于识别 AI 生成内容
Downloads 21.51k
Release Time : 3/28/2024

Model Overview

该模型旨在检测生成/合成文本,对训练数据筛选、识别科学与教育领域的欺诈作弊行为具有重要意义

Model Features

高精度检测
在多种文本类型上表现出色,综合检测准确率达 87%
数据多样性
使用 HC3 和 IDMGSP 两个数据集混合训练,确保模型泛化能力
合理置信度
经过校准处理,预测概率与实际准确率相匹配
抗过拟合
通过移除关键 n-gram 和标签平滑技术防止过拟合

Model Capabilities

检测 AI 生成文本
区分人工写作与机器生成内容
提供生成概率评分

Use Cases

教育领域
学术诚信检测
识别学生作业中的 AI 生成内容
帮助教育工作者发现潜在的学术不端行为
数据筛选
训练数据净化
过滤训练数据中的合成文本
提高下游模型训练质量
内容审核
虚假内容识别
检测社交媒体中的 AI 生成虚假信息
辅助人工审核工作
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase