🚀 Qwen2-VL 7B RSLORA新加坡冒犯性表情包模型卡片
本模型是针对新加坡语境下冒犯性表情包分类对Qwen2-VL-7B-Instruct进行微调后的版本。它基于multimodal_meme_classification_singapore数据集进行训练。
📚 详细文档
🔍 模型描述
此模型会考虑新加坡的社会背景,对表情包是否具有冒犯性进行分类。它借助了Qwen2-VL-7B-Instruct的视觉和文本理解能力。
- 开发者:曹宇轩、吴家扬、Alistair Cheong Liang Chuen、Bryan Shan Guanrong、Theodore Lee Chong Jen和Sherman Chann Zhi Shen
- 模型类型:视觉语言模型(VLM)
- 语言(NLP):英语
- 许可证:MIT
- 微调基础模型:Qwen/Qwen2-VL-7B-Instruct
🌐 模型来源
💻 使用示例
📌 直接使用
该模型可直接用于表情包分类。具体代码示例请参考“如何开始使用模型”部分。
📌 下游应用(可选)
此模型可进一步针对其他相关任务进行微调,或集成到更大的内容审核系统中。
🚫 适用范围外的使用
该模型是专门针对新加坡语境进行训练的,可能无法很好地泛化到其他文化或语言中。不应使用该模型对个人或群体做出确定性的判断。
⚠️ 偏差、风险和局限性
与任何机器学习模型一样,该模型可能会表现出训练数据中存在的偏差。重要的是要意识到这些局限性,并负责任地使用该模型。需要进一步的研究来评估和减轻潜在的偏差。
💡 使用建议
用户应意识到模型性能可能存在偏差和局限性。建议将此模型作为辅助人工审核人员的工具,而非替代人工判断。
🚀 如何开始使用模型
使用示例请参考模型仓库的README:https://github.com/aliencaocao/vlm-for-memes-aisg
🔧 技术细节
📊 训练数据
该模型基于multimodal_meme_classification_singapore数据集进行训练。该数据集包含在新加坡语境下标记为冒犯性或非冒犯性的表情包。
📋 训练过程
关于训练过程的更多详细信息可在论文中找到。
📈 评估
该模型在保留的测试集上实现了0.8192的AUROC和0.8043的准确率。有关评估方法的更多详细信息请参考论文。
📄 许可证
本模型使用的许可证为MIT。
📖 引用
@misc{yuxuan2025detectingoffensivememessocial,
title={Detecting Offensive Memes with Social Biases in Singapore Context Using Multimodal Large Language Models},
author={Cao Yuxuan and Wu Jiayang and Alistair Cheong Liang Chuen and Bryan Shan Guanrong and Theodore Lee Chong Jen and Sherman Chann Zhi Shen},
year={2025},
eprint={2502.18101},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2502.18101},
}
📋 信息表格