🚀 阿拉伯语ORPO LLAMA 3
本项目基于微调模型,旨在解决阿拉伯语文本生成中语言连贯性和准确性的问题,为阿拉伯语自然语言处理提供更优质的解决方案。
🚀 快速开始
你可以从这里试用该模型,并与我分享你的见解。
✨ 主要特性
此模型是 meta-llama/Meta-Llama-3-8B-Instruct 的微调版本,使用 ORPO 在 2A2I/argilla-dpo-mix-7k-arabic 数据集上进行微调。虽然评估结果显示基础的 llama3 表现更优,但在实际应用中,微调后的模型在输出连贯(大多正确)的阿拉伯语文本方面表现更佳。
📚 详细文档
📖 故事缘起
本模型是 meta-llama/Meta-Llama-3-8B-Instruct 的微调版本,使用 ORPO 在 2A2I/argilla-dpo-mix-7k-arabic 数据集上进行微调。
我想尝试使用 ORPO,看看它能否让像 llama3 这样有偏向性的英语模型更好地适配阿拉伯语,或者是否会失败。
虽然评估结果更倾向于基础的 llama3,但在实践中,我发现我微调后的模型在输出连贯(大多正确)的阿拉伯语文本方面要好得多,我觉得这很有趣。
我鼓励大家从这里试用该模型,并与我分享你的见解 ^^
📊 评估与结果
此结果使用 lighteval 进行 community|arabic_mmlu 任务评估得出。
领域 |
Llama-3-8B-Instruct |
阿拉伯语-ORPO-Llama-3-8B-Instruct |
全部 |
0.348 |
0.317 |
抽象代数 |
0.310 |
0.230 |
解剖学 |
0.385 |
0.348 |
天文学 |
0.388 |
0.316 |
商业伦理 |
0.480 |
0.370 |
临床知识 |
0.396 |
0.385 |
大学生物学 |
0.347 |
0.299 |
大学化学 |
0.180 |
0.250 |
大学计算机科学 |
0.250 |
0.190 |
大学数学 |
0.260 |
0.280 |
大学医学 |
0.231 |
0.249 |
大学物理学 |
0.225 |
0.216 |
计算机安全 |
0.470 |
0.440 |
概念物理学 |
0.315 |
0.404 |
计量经济学 |
0.263 |
0.272 |
电气工程 |
0.414 |
0.359 |
初等数学 |
0.320 |
0.272 |
形式逻辑 |
0.270 |
0.214 |
全球事实 |
0.320 |
0.320 |
高中生物学 |
0.332 |
0.335 |
高中化学 |
0.256 |
0.296 |
高中计算机科学 |
0.350 |
0.300 |
高中欧洲历史 |
0.224 |
0.242 |
高中地理 |
0.323 |
0.364 |
高中政府与政治 |
0.352 |
0.285 |
高中宏观经济学 |
0.290 |
0.285 |
高中数学 |
0.237 |
0.278 |
高中微观经济学 |
0.231 |
0.273 |
高中物理学 |
0.252 |
0.225 |
高中心理学 |
0.316 |
0.330 |
高中统计学 |
0.199 |
0.176 |
高中美国历史 |
0.284 |
0.250 |
高中世界历史 |
0.312 |
0.274 |
人类衰老 |
0.369 |
0.430 |
人类性行为 |
0.481 |
0.321 |
国际法 |
0.603 |
0.405 |
法理学 |
0.491 |
0.370 |
逻辑谬误 |
0.368 |
0.276 |
机器学习 |
0.214 |
0.312 |
管理学 |
0.350 |
0.379 |
市场营销 |
0.521 |
0.547 |
医学遗传学 |
0.320 |
0.330 |
杂项 |
0.446 |
0.443 |
道德争议 |
0.422 |
0.306 |
道德场景 |
0.248 |
0.241 |
营养学 |
0.412 |
0.346 |
哲学 |
0.408 |
0.328 |
史前史 |
0.429 |
0.349 |
专业会计学 |
0.344 |
0.273 |
专业法律 |
0.306 |
0.244 |
专业医学 |
0.228 |
0.206 |
专业心理学 |
0.337 |
0.315 |
公共关系 |
0.391 |
0.373 |
安全研究 |
0.469 |
0.335 |
社会学 |
0.498 |
0.408 |
美国外交政策 |
0.590 |
0.490 |
病毒学 |
0.422 |
0.416 |
世界宗教 |
0.404 |
0.304 |
(所有领域)平均 |
0.348 |
0.317 |
📄 许可证
本项目采用 llama3 许可证。
模型信息表格
属性 |
详情 |
模型类型 |
阿拉伯语ORPO LLAMA 3 |
训练数据 |
2A2I/argilla-dpo-mix-7k-arabic |
许可证 |
llama3 |
语言 |
阿拉伯语 |
任务类型 |
文本生成 |