Gemma-2-9B-It-SPPO-Iter3開源語言模型 - 免費使用高效對話與內容創作幫手

首頁

Gemma 2 9B It SPPO Iter3

由UCLA-AGI開發

基於自博弈偏好優化方法在第三輪迭代中開發的89億參數語言模型，以google/gemma-2-9b-it為起點，使用UltraFeedback數據集進行微調

大型語言模型

Transformers

英語#自博弈偏好優化 #多輪迭代微調 #英語文本生成

下載量 6,704

發布時間 : 6/29/2024

模型概述

該模型採用自博弈偏好優化方法進行對齊優化，主要用於英語文本生成任務

模型特點

自博弈偏好優化

採用SPPO方法進行三輪迭代優化，提升模型性能

高質量數據集

使用UltraFeedback數據集和合成數據進行訓練

迭代改進

經過三輪迭代，每輪性能均有提升

模型能力

英語文本生成

對話系統

內容創作

使用案例

對話系統

智能客服

用於構建英語智能客服對話系統

內容生成

文章創作

輔助英語文章寫作和內容生成

屬性	詳情
模型類型	一個在合成數據集上微調的 80 億參數類 GPT 模型。
語言（NLP）	主要為英語
許可證	Apache-2.0
微調基礎模型	google/gemma-2-9b-it

模型	LC. 勝率	勝率	平均長度
Gemma-2-9B-SPPO Iter1	48.70	40.76	1669
Gemma-2-9B-SPPO Iter2	50.93	44.64	1759
Gemma-2-9B-SPPO Iter3	53.27	47.74	1803

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Gemma 2 9B It SPPO Iter3

模型概述

模型特點

模型能力

使用案例

🚀 Gemma-2-9B-It-SPPO-Iter3

🚀 快速開始

✨ 主要特性

模型描述

其他模型鏈接

AlpacaEval 排行榜評估結果

訓練超參數

📚 詳細文檔

引用