Tiroberta Abusiveness Detection
基於TiRoBERTa微調的提格里尼亞語侮辱性內容檢測模型,在13,717條YouTube評論數據集上訓練
Downloads 210
Release Time : 5/18/2023
Model Overview
專為提格里尼亞語設計的侮辱性語言檢測模型,支持吉茲字母和拉丁轉寫文本,適用於低資源語言環境下的內容審核研究
Model Features
雙文字腳本支持
同時處理吉茲字母和拉丁轉寫的提格里尼亞語文本,適應真實場景
多任務學習框架
可擴展支持侮辱性檢測、情感分析和主題分類三項任務
低資源優化
專為提格里尼亞語等低資源語言設計的預訓練架構
文化敏感標註
由母語者標註確保文化語境準確性
Model Capabilities
提格里尼亞語文本分類
侮辱性內容識別
多任務學習支持
雙文字腳本處理
Use Cases
內容審核
社交媒體評論過濾
自動檢測提格里尼亞語YouTube評論中的侮辱性內容
準確率86.7%,可減少人工審核工作量
學術研究
低資源NLP研究
作為提格里尼亞語NLP任務的基線模型
提供13k+標註數據集的基準性能
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98