A

Ai Detector

SuperAnnotateによって開発
RoBERTa Largeを微調整した生成テキスト検出モデルで、AI生成コンテンツを識別
ダウンロード数 2,160
リリース時間 : 9/25/2024

モデル概要

このモデルは生成/合成テキストの検出専用に設計され、トレーニングデータの選別や科学・教育分野の不正行為識別に重要な意義を持つ

モデル特徴

バランス調整済みトレーニングデータ
4.4万組の均衡サンプルでトレーニング、人間のテキストと14種のLLM生成コンテンツを含む
マルチドメインカバレッジ
トレーニングデータはWikipedia、Reddit Q&A、学術論文の3大領域を網羅
過学習防止設計
カイ二乗検定で重要n-gramを除去、表面的なパターンではなく真の特徴を学習
良好な較正性
損失関数最適化とラベル平滑化処理により、予測信頼度と実際の精度が一致

モデル能力

AI生成テキストの検出
大規模言語モデルコンテンツの識別
人間執筆と機械生成の区別

使用事例

教育分野
学術誠実性検出
学生課題のAI生成コンテンツを識別
GPT-4生成テキスト検出精度98.5%を達成
データ選別
トレーニングデータ浄化
データセット内の合成テキストをフィルタリング
LLaMA-Chat生成コンテンツ検出精度98%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase