S

Skywork VL Reward 7B

Developed by Skywork
Skywork-VL-Reward-7Bは7Bパラメータのマルチモーダル報酬モデルで、Qwen2.5-VL-7B-Instructアーキテクチャを基に、報酬モデルトレーニング用の価値ヘッド構造を追加しています。
Downloads 30
Release Time : 4/25/2025

Model Overview

これは効率的なマルチモーダル理解と推論の報酬モデルで、マルチモーダル強化学習をサポートすることを目的としています。

Model Features

マルチモーダル理解
画像とテキスト情報を同時に処理し、マルチモーダル理解と推論を行うことができます。
高性能
VL-RewardBenchとRewardBenchでSOTAスコアを達成しました。
オープンソース貢献
オープンソースコミュニティに強力なマルチモーダル報酬モデルを提供しています。

Model Capabilities

マルチモーダル理解
画像テキスト分析
報酬モデルトレーニング

Use Cases

マルチモーダル強化学習
マルチモーダル報酬モデルトレーニング
マルチモーダル強化学習モデルのトレーニングに使用され、報酬信号を提供します。
VL-RewardBenchで73.1のSOTAスコアを獲得しました。
画像テキスト理解
画像テキスト分析
画像とテキストの結合情報を分析し、理解と推論能力を提供します。
RewardBenchで90.1の高スコアを獲得しました。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase