X

Xgen Mm Phi3 Mini Instruct Dpo R V1.5

Salesforceによって開発
xGen-MMはSalesforce AI Researchが開発したマルチモーダル基礎モデルシリーズで、BLIPシリーズを改良し、高品質な画像キャプションとインターレース画像テキストデータでトレーニングされています。
ダウンロード数 305
リリース時間 : 8/9/2024

モデル概要

このモデルはxGen-MMシリーズのDPO(Direct Preference Optimization)バージョンで、マルチモーダル理解能力と安全性の向上に焦点を当て、画像テキスト生成やインタラクティブタスクに適しています。

モデル特徴

マルチモーダル理解
単一画像および複数画像のベンチマークテストで優れたパフォーマンスを発揮し、複雑なマルチモーダルインタラクションタスクをサポートします。
セキュリティ最適化
DPOトレーニングにより有害コンテンツ生成確率を大幅に低減(VLGuardスコア5.2、ベンチマークモデルを上回る)。
総合性能
POPE、MMBench、SEED-IMGなどの複数のベンチマークテストで同類モデルを凌駕しています。

モデル能力

画像説明生成
複数画像推論
安全なコンテンツフィルタリング
ビジュアルQA
クロスモーダル理解

使用事例

コンテンツモデレーション
有害コンテンツ検出
画像やテキスト中の潜在的な有害コンテンツを自動識別
VLGuardスコア5.2(低いほど良い)
教育
マルチモーダル学習アシスタント
教材中の画像テキストコンテンツを解析し説明を生成
MMBench開発セットスコア76.4
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase