roberta-large-llm-content-detector開源模型 - 免費部署精準識別AI生成內容

首頁

Roberta Large Llm Content Detector

由SuperAnnotate開發

基於 RoBERTa Large 微調的生成文本檢測模型，用於識別 AI 生成內容

文本分類

Transformers

英語開源協議:其他 #生成文本檢測 #AI內容識別 #RoBERTa微調

下載量 21.51k

發布時間 : 3/28/2024

模型概述

該模型旨在檢測生成/合成文本，對訓練數據篩選、識別科學與教育領域的欺詐作弊行為具有重要意義

模型特點

高精度檢測

在多種文本類型上表現出色，綜合檢測準確率達 87%

數據多樣性

使用 HC3 和 IDMGSP 兩個數據集混合訓練，確保模型泛化能力

合理置信度

經過校準處理，預測概率與實際準確率相匹配

抗過擬合

通過移除關鍵 n-gram 和標籤平滑技術防止過擬合

模型能力

檢測 AI 生成文本

區分人工寫作與機器生成內容

提供生成概率評分

使用案例

教育領域

學術誠信檢測

識別學生作業中的 AI 生成內容

幫助教育工作者發現潛在的學術不端行為

數據篩選

訓練數據淨化

過濾訓練數據中的合成文本

提高下游模型訓練質量

內容審核

虛假內容識別

檢測社交媒體中的 AI 生成虛假信息

輔助人工審核工作

🚀 SuperAnnotate - LLM內容檢測器

SuperAnnotate的LLM內容檢測器是一個基於RoBERTa Large微調的模型，旨在檢測文本是否為生成的合成文本。該功能對於確定文本作者、保證訓練數據質量以及檢測科學和教育領域的欺詐和作弊行為至關重要。

🚀 快速開始

前置要求

安裝 generated_text_detector，運行以下命令：

pip install git+https://github.com/superannotateai/generated_text_detector.git@v1.0.0

使用示例

from generated_text_detector.utils.model.roberta_classifier import RobertaClassifier
from transformers import AutoTokenizer
import torch.nn.functional as F

model = RobertaClassifier.from_pretrained("SuperAnnotate/roberta-large-llm-content-detector")
tokenizer = AutoTokenizer.from_pretrained("SuperAnnotate/roberta-large-llm-content-detector")

text_example = "It's not uncommon for people to develop allergies or intolerances to certain foods as they get older. It's possible that you have always had a sensitivity to lactose (the sugar found in milk and other dairy products), but it only recently became a problem for you. This can happen because our bodies can change over time and become more or less able to tolerate certain things. It's also possible that you have developed an allergy or intolerance to something else that is causing your symptoms, such as a food additive or preservative. In any case, it's important to talk to a doctor if you are experiencing new allergy or intolerance symptoms, so they can help determine the cause and recommend treatment."

tokens = tokenizer.encode_plus(
    text_example,
    add_special_tokens=True,
    max_length=512,
    padding='longest',
    truncation=True,
    return_token_type_ids=True,
    return_tensors="pt"
)

_, logits = model(**tokens)

proba = F.sigmoid(logits).squeeze(1).item()

print(proba)

✨ 主要特性

文本檢測功能：能夠有效檢測生成的合成文本，對於確定文本作者、保障訓練數據質量以及防範欺詐和作弊行為具有重要意義。
模型校準良好：在訓練過程中，不僅注重最大化預測質量，還避免了過擬合，獲得了具有足夠置信度的預測器。

📦 安裝指南

運行以下命令安裝 generated_text_detector：

pip install git+https://github.com/superannotateai/generated_text_detector.git@v1.0.0

📚 詳細文檔

模型詳情

模型描述

屬性	詳情
模型類型	基於預訓練RoBERTa的自定義二元序列分類架構，具有單個輸出標籤
語言	主要為英語
許可證	SAIPL
微調模型	RoBERTa Large

模型來源

倉庫：用於HTTP服務的GitHub倉庫

訓練數據

訓練數據來自兩個開放數據集，按不同比例混合並經過過濾：

HC3 | 63%
IDMGSP | 37%

最終訓練數據集包含約 20k 對文本 - 標籤，且類別大致平衡。值得注意的是，數據集中的文本具有邏輯結構：人類編寫和模型生成的文本都針對同一提示/指令，但提示本身在訓練中未使用。

⚠️ 重要提示

此外，利用卡方檢驗識別出與目標標籤相關性最高的關鍵n-gram（n範圍為2到5），並將其從訓練數據中移除。

特性

在訓練過程中，一個重要目標不僅是最大化預測質量，還包括避免過擬合併獲得一個有足夠置信度的預測器。模型校準達到了以下狀態：

校準圖

訓練細節

選擇自定義架構是因為它能夠進行二元分類，同時提供單個模型輸出，並且損失函數中集成了可定製的平滑設置。

訓練參數：

基礎模型：FacebookAI/roberta-large
訓練輪數：10
學習率：5e - 04
權重衰減：0.05
標籤平滑：0.1
預熱輪數：4
優化器：SGD
調度器：帶預熱的線性調度器

性能表現

該模型在由訓練數據的保留子集和SuperAnnotate的封閉子集組成的基準測試中進行了評估。基準測試包含1k個樣本，每個類別200個樣本。以下是該模型與其他開源解決方案和流行API檢測器的性能對比表：

模型/API	Wikipedia	Reddit QA	SA instruction	Papers	平均
Hello - SimpleAI	0.97	0.95	0.82	0.69	0.86
RADAR	0.47	0.84	0.59	0.82	0.68
GPTZero	0.72	0.79	0.90	0.67	0.77
Originality.ai	0.91	0.97	0.77	0.93	0.89
LLM content detector	0.88	0.95	0.84	0.81	0.87