R

Rota

由rti-international開發
ROTA是一個機器學習模型,用於將自由文本的罪行描述轉換為標準化的罪行代碼類別,輔助刑事司法研究。
下載量 19
發布時間 : 3/2/2022

模型概述

該模型通過自然語言處理技術,將非結構化的罪行文本自動分類到NCRP代碼手冊中的指控類別,解決手動編碼耗時問題。

模型特點

高效文本預處理
採用500+正則表達式處理拼寫錯誤和縮寫,移除法規前綴等噪聲數據,實現文本標準化
多類別分類
支持85+指控類別的分類,涵蓋從交通違規到暴力犯罪等廣泛罪行類型
高準確率
在交叉驗證中達到0.934的整體準確率和0.931的MCC分數
置信度評分
提供預測置信度分數,可通過閾值過濾低置信度預測以提高準確率

模型能力

罪行文本分類
法律文本標準化
刑事司法數據分析

使用案例

刑事司法研究
罪行數據標準化
將各州非標準化的罪行描述統一編碼為NCRP標準類別
實現跨司法管轄區罪行數據的可比性分析
批量罪行分類
自動處理大規模罪行記錄,替代人工分類
測試顯示可節省90%+人工編碼時間
法律數據分析
犯罪模式分析
通過標準化分類識別特定地區或時期的犯罪趨勢
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase