🚀 Qwen2-VL 7B RSLORA新加坡冒犯性表情包模型卡片
本模型是針對新加坡語境下冒犯性表情包分類對Qwen2-VL-7B-Instruct進行微調後的版本。它基於multimodal_meme_classification_singapore數據集進行訓練。
📚 詳細文檔
🔍 模型描述
此模型會考慮新加坡的社會背景,對錶情包是否具有冒犯性進行分類。它藉助了Qwen2-VL-7B-Instruct的視覺和文本理解能力。
- 開發者:曹宇軒、吳家揚、Alistair Cheong Liang Chuen、Bryan Shan Guanrong、Theodore Lee Chong Jen和Sherman Chann Zhi Shen
- 模型類型:視覺語言模型(VLM)
- 語言(NLP):英語
- 許可證:MIT
- 微調基礎模型:Qwen/Qwen2-VL-7B-Instruct
🌐 模型來源
💻 使用示例
📌 直接使用
該模型可直接用於表情包分類。具體代碼示例請參考“如何開始使用模型”部分。
📌 下游應用(可選)
此模型可進一步針對其他相關任務進行微調,或集成到更大的內容審核系統中。
🚫 適用範圍外的使用
該模型是專門針對新加坡語境進行訓練的,可能無法很好地泛化到其他文化或語言中。不應使用該模型對個人或群體做出確定性的判斷。
⚠️ 偏差、風險和侷限性
與任何機器學習模型一樣,該模型可能會表現出訓練數據中存在的偏差。重要的是要意識到這些侷限性,並負責任地使用該模型。需要進一步的研究來評估和減輕潛在的偏差。
💡 使用建議
用戶應意識到模型性能可能存在偏差和侷限性。建議將此模型作為輔助人工審核人員的工具,而非替代人工判斷。
🚀 如何開始使用模型
使用示例請參考模型倉庫的README:https://github.com/aliencaocao/vlm-for-memes-aisg
🔧 技術細節
📊 訓練數據
該模型基於multimodal_meme_classification_singapore數據集進行訓練。該數據集包含在新加坡語境下標記為冒犯性或非冒犯性的表情包。
📋 訓練過程
關於訓練過程的更多詳細信息可在論文中找到。
📈 評估
該模型在保留的測試集上實現了0.8192的AUROC和0.8043的準確率。有關評估方法的更多詳細信息請參考論文。
📄 許可證
本模型使用的許可證為MIT。
📖 引用
@misc{yuxuan2025detectingoffensivememessocial,
title={Detecting Offensive Memes with Social Biases in Singapore Context Using Multimodal Large Language Models},
author={Cao Yuxuan and Wu Jiayang and Alistair Cheong Liang Chuen and Bryan Shan Guanrong and Theodore Lee Chong Jen and Sherman Chann Zhi Shen},
year={2025},
eprint={2502.18101},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2502.18101},
}
📋 信息表格