R

Roberta Large Llm Content Detector

SuperAnnotateによって開発
RoBERTa Largeをファインチューニングした生成テキスト検出モデル、AI生成コンテンツの識別に使用
ダウンロード数 21.51k
リリース時間 : 3/28/2024

モデル概要

このモデルは生成/合成テキストの検出を目的としており、トレーニングデータのフィルタリングや科学・教育分野における不正行為の識別に重要な意義を持つ

モデル特徴

高精度検出
様々なテキストタイプで優れた性能を発揮し、総合検出精度87%を達成
データ多様性
HC3とIDMGSPの2つのデータセットを混合してトレーニングし、モデルの汎化能力を確保
適切な信頼度
較正処理を経ており、予測確率と実際の精度が一致
過学習防止
重要なn-gramの削除とラベル平滑化技術により過学習を防止

モデル能力

AI生成テキストの検出
人間の執筆と機械生成コンテンツの区別
生成確率スコアの提供

使用事例

教育分野
学術的誠実性検出
学生の課題におけるAI生成コンテンツを識別
教育者が潜在的な学術不正行為を発見するのに役立つ
データフィルタリング
トレーニングデータの浄化
トレーニングデータ中の合成テキストをフィルタリング
下流モデルのトレーニング品質を向上
コンテンツ審査
虚偽コンテンツ識別
ソーシャルメディア上のAI生成虚偽情報を検出
人工審査作業を補助
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase