V

Visualprm 8B V1 1

OpenGVLabによって開発
VisualPRM-8B-v1.1は80億のパラメータを持つ先進的なマルチモーダルプロセス報酬モデルで、Best-of-N評価戦略によりマルチモーダル大規模言語モデルの推論能力を向上させます。
ダウンロード数 249
リリース時間 : 4/13/2025

モデル概要

このモデルは、既存のマルチモーダル大規模言語モデル(MLLMs)の推論能力を向上させることを目的としており、プロセス報酬メカニズムによりモデルの出力を最適化します。

モデル特徴

マルチモーダルプロセス報酬
プロセス報酬メカニズムによりマルチモーダル推論ステップを評価し最適化する
Best-of-N評価戦略
BoN戦略を採用して複数の候補応答から最適解を選択する
大規模訓練データ
VisualPRM400Kデータセットに基づいて訓練され、40万のサンプルを含む
広範な適用性
異なる規模とアーキテクチャのマルチモーダル大規模言語モデルの性能を向上させることができる

モデル能力

マルチモーダル推論評価
プロセス報酬スコアリング
最適応答選択
幾何問題解答
ビジョン - 言語の統合理解

使用事例

教育
幾何問題解答評価
モデルの幾何問題の段階的な解答を評価し最適化する
InternVL2.5 - 78Bで5.9点の性能向上を実現
研究
マルチモーダルモデル最適化
報酬モデルとして他のマルチモーダル大規模言語モデルを最適化する
3種類のMLLMsと4種類の異なる規模の推論性能を向上させる
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase