I

Internlm Xcomposer2d5 7b Reward

internlmによって開発
InternLM-XComposer2.5-Rewardは、InternLM-XComposer2.5を基に訓練されたマルチモーダル報酬モデルで、人間の嗜好に合致した報酬スコアを提供できます。
ダウンロード数 767
リリース時間 : 1/21/2025

モデル概要

このモデルは、テキスト、画像、動画の分野における嗜好サンプルで訓練されており、対話や画像分析などのタスクの出力品質を評価できます。

モデル特徴

マルチモーダル評価
テキストと画像入力を同時に処理し、総合的な評価が可能
人間の嗜好アライメント
嗜好サンプルによる訓練で、評価結果が人間の嗜好と一致
高性能
VLRewardBenchやRewardBenchなど、複数のベンチマークで優れた性能を発揮

モデル能力

対話品質評価
画像分析評価
マルチモーダルコンテンツ評価
嗜好ランキング

使用事例

コンテンツ評価
対話品質スコアリング
AIアシスタントが生成した対話応答の品質を評価
0-10点のスコアを提供可能
マルチモーダルコンテンツランキング
画像とテキストを含む複数の応答を品質でランク付け
品質の高い順にランキング結果を返す
モデル訓練
強化学習報酬モデル
強化学習における報酬信号の提供者として機能
人間の嗜好に合致したAIモデルの訓練を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase