L

Longformer Base Plagiarism Detection

由jpwahle開發
該模型使用Longformer架構訓練,專門用於檢測機器改寫的抄襲文本,在學術誠信維護中具有重要應用價值。
下載量 59.47k
發布時間 : 3/2/2022

模型概述

基於Longformer-base-4096預訓練模型微調的抄襲檢測系統,可識別通過SpinBot等工具改寫的學術文本,平均F1值達80.99%。

模型特點

長文檔處理能力
採用滑動窗口注意力機制,可有效處理長達4096個token的學術文檔
多改寫工具識別
針對SpinBot和SpinnerChief等主流改寫工具優化檢測效果
學術場景優化
在論文預印本、學位論文等學術文本上表現優異(F1最高達99.68%)

模型能力

機器改寫文本識別
學術抄襲檢測
長文本語義分析

使用案例

學術誠信維護
論文抄襲檢測
識別學生論文中使用改寫工具偽裝的抄襲內容
對SpinBot改寫文本檢測F1值達99.68%
出版審查輔助
輔助期刊編輯檢測投稿論文的潛在抄襲行為
相比傳統文本匹配系統(如Turnitin)效果更優
教育質量保障
作業原創性檢查
自動篩查學生作業中的機器改寫內容
人工評估一致性達78.4%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase