D

Deoffxlmr Mono Tamil

由Hate-speech-CNERG開發
該模型用於檢測泰米爾語代碼混合文本中的冒犯性內容,基於XLM-Roberta-Base模型訓練,在EACL 2021達羅毗荼語系冒犯性語言識別共享任務中表現優異。
下載量 100
發布時間 : 3/2/2022

模型概述

專門用於識別泰米爾語(包括純文本及代碼混合形式)中的冒犯性內容的單語模型,採用Transformer架構,在特定數據集上取得了較高的檢測準確率。

模型特點

單語專注優化
專門針對泰米爾語(包括代碼混合形式)進行優化,相比多語言模型在特定語言任務上表現更優
集成策略優勢
採用遺傳算法集成技術,在共享任務中獲得了泰米爾語子任務第一名的成績
低資源語言解決方案
針對泰米爾語等低資源語言的冒犯性內容檢測難題提供了有效解決方案

模型能力

泰米爾語文本分類
代碼混合文本處理
冒犯性內容識別

使用案例

內容審核
社交媒體內容過濾
自動檢測泰米爾語社交媒體中的冒犯性言論
在測試集上達到0.76的加權F1分數
語言研究
達羅毗荼語系語言分析
用於研究泰米爾語等低資源語言中的冒犯性語言特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase