F

Fsfairx Gemma2 RM V0.1

sfairXCによって開発
Gemma-2-9Bアーキテクチャに基づく報酬モデルで、RLHFワークフローでトレーニングされ、対話や推論タスクに適しています。
ダウンロード数 51
リリース時間 : 7/8/2024

モデル概要

このモデルはGemma-2-9Bアーキテクチャに基づく報酬モデルで、RLHFワークフローでトレーニングされ、主に対話能力、推論能力、安全性の評価に使用されます。

モデル特徴

高性能な対話能力
対話能力ベンチマークテストで98.04点という高いスコアを獲得し、優れた性能を発揮します。
強力な推論能力
推論能力スコアは92.31で、複雑な論理推論タスクに適しています。
RLHFトレーニング
強化学習人間フィードバック(RLHF)ワークフローでトレーニングされ、モデルの性能を最適化します。

モデル能力

対話評価
推論評価
安全性評価
高難度対話処理

使用事例

対話システム
インテリジェントカスタマーサービス
カスタマーサービス対話の品質評価に使用され、ユーザー体験を向上させます。
対話能力スコア98.04
教育
教育アシスタント
教育対話の論理性と正確性を評価します。
推論能力スコア92.31
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase