G

Gemma 2 9b It SimPO

princeton-nlpによって開発
SimPO目標に基づきgemma2-ultrafeedback-armormデータセットでファインチューニングされたGemma 2.9Bモデル、選好最適化タスク用
ダウンロード数 21.34k
リリース時間 : 7/16/2024

モデル概要

このモデルはSimPO(シンプル選好最適化)アルゴリズムを使用してGemma 2.9Bをベースにファインチューニングされ、選好最適化データセットを通じて大規模言語モデルのトレーニング効果を強化することを目的としています。

モデル特徴

SimPO最適化アルゴリズム
シンプルな選好最適化アルゴリズムを採用、参照モデル不要で報酬関数と生成確率のアライメントにより性能向上
効率的なトレーニング
H100 GPU 8枚で約100分のみでファインチューニング可能
性能向上
ベースモデルと比較し、複数の評価指標で優れたパフォーマンス

モデル能力

テキスト生成
選好最適化
質問応答システム
対話システム

使用事例

対話システム
インテリジェントQA
知識質問応答システムの構築に使用
AE2 LC評価で72.4点を達成
コンテンツ生成
長文生成
長く一貫性のあるテキストを生成
平均生成長1833トークン
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase