Gemma-2-9B-It-SPPO-Iter3开源语言模型 - 免费使用高效对话与内容创作帮手

Home

Gemma 2 9B It SPPO Iter3

Developed by UCLA-AGI

基于自博弈偏好优化方法在第三轮迭代中开发的89亿参数语言模型，以google/gemma-2-9b-it为起点，使用UltraFeedback数据集进行微调

大型语言模型

Transformers

English#自博弈偏好优化 #多轮迭代微调 #英语文本生成

Downloads 6,704

Release Time : 6/29/2024

Model Overview

该模型采用自博弈偏好优化方法进行对齐优化，主要用于英语文本生成任务

Model Features

自博弈偏好优化

采用SPPO方法进行三轮迭代优化，提升模型性能

高质量数据集

使用UltraFeedback数据集和合成数据进行训练

迭代改进

经过三轮迭代，每轮性能均有提升

Model Capabilities

英语文本生成

对话系统

内容创作

Use Cases

对话系统

智能客服

用于构建英语智能客服对话系统

内容生成

文章创作

辅助英语文章写作和内容生成

属性	详情
模型类型	一个在合成数据集上微调的 80 亿参数类 GPT 模型。
语言（NLP）	主要为英语
许可证	Apache-2.0
微调基础模型	google/gemma-2-9b-it

模型	LC. 胜率	胜率	平均长度
Gemma-2-9B-SPPO Iter1	48.70	40.76	1669
Gemma-2-9B-SPPO Iter2	50.93	44.64	1759
Gemma-2-9B-SPPO Iter3	53.27	47.74	1803

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Gemma 2 9B It SPPO Iter3

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 Gemma-2-9B-It-SPPO-Iter3

🚀 快速开始

✨ 主要特性

模型描述

其他模型链接

AlpacaEval 排行榜评估结果

训练超参数

📚 详细文档

引用