S

Skywork Reward Gemma 2 27B

Skyworkによって開発
Skywork-Reward-Gemma-2-27Bはgemma-2-27b-itアーキテクチャに基づいて構築された先進的な報酬モデルで、複雑なシナリオにおける嗜好問題の処理に優れています。
ダウンロード数 107
リリース時間 : 9/5/2024

モデル概要

このモデルは高性能な報酬モデルで、数学、プログラミング、セキュリティなどの分野における複雑な嗜好問題の処理に特化しており、わずか8万組の高品質な嗜好データのみでトレーニングされています。

モデル特徴

高性能報酬モデル
RewardBenchランキングで1位を獲得し、複雑なシナリオにおける嗜好問題の処理に優れています
高品質データトレーニング
8万組の厳選された高品質な嗜好データのみを使用してトレーニングされています
多分野能力
数学、プログラミング、セキュリティなど複数の分野における嗜好問題の処理に優れています

モデル能力

嗜好スコアリング
複雑なシナリオ処理
数学問題評価
プログラミング問題評価
安全コンテンツ評価

使用事例

モデルアライメント
強化学習における報酬モデル
強化学習における報酬信号プロバイダーとして機能し、人間の嗜好に合致したAIモデルのトレーニングを支援します
RewardBenchで93.8の総合スコアを達成
コンテンツ評価
レスポンス品質評価
AIが生成したレスポンスの品質を評価し、優れた回答と劣った回答を区別します
チャット、困難なチャット、安全性、推論能力など複数の次元で優れたパフォーマンスを発揮
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase