T

Turkish Toxic Language Detection

由 fc63 开发
该模型是基于 `dbmdz/bert-base-turkish-cased` 微调而来,用于对土耳其语文本进行二元有毒性分类。
下载量 107
发布时间 : 12/30/2024

模型简介

该模型用于检测土耳其语文本中的有毒内容,支持二元分类(有毒/非有毒)。

模型特点

多标签支持
支持多种评估指标,如准确率、F1值、精确率和召回率。
数据处理
对训练数据进行了清理和预处理,包括去除URL、提及、特殊字符、俚语等。
训练策略
采用Hugging Face的 `Trainer` API进行训练,应用了欠采样来平衡类别分布。

模型能力

土耳其语文本分类
有毒内容检测

使用案例

内容审核
社交媒体内容过滤
自动检测社交媒体上的有毒评论或帖子。
准确率高达96%
在线社区管理
帮助管理员识别和移除有毒内容,维护社区健康。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase