G

Gemma 2 9b It SimPO

由 princeton-nlp 开发
基于SimPO目标在gemma2-ultrafeedback-armorm数据集上微调的Gemma 2.9B模型,用于偏好优化任务
下载量 21.34k
发布时间 : 7/16/2024

模型简介

该模型是使用SimPO(简单偏好优化)算法在Gemma 2.9B基础上微调得到的,旨在通过偏好优化数据集增强大语言模型的训练效果。

模型特点

SimPO优化算法
采用简单偏好优化算法,无需参考模型,通过奖励函数与生成概率对齐提升性能
高效训练
在8块H100 GPU上仅需约100分钟即可完成微调
性能提升
相比基础模型,在多个评估指标上表现更优

模型能力

文本生成
偏好优化
问答系统
对话系统

使用案例

对话系统
智能问答
用于构建知识问答系统
在AE2 LC评估中达到72.4分
内容生成
长文本生成
生成较长的连贯文本
平均生成长度1833个token
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase