X

Xgen Mm Phi3 Mini Instruct R V1

Salesforceによって開発
xGen-MMはSalesforce AI Researchが開発した最新の基盤大規模マルチモーダルモデルシリーズで、BLIPシリーズを改良し、強力な画像理解とテキスト生成能力を備えています。
ダウンロード数 804
リリース時間 : 5/6/2024

モデル概要

xGen-MMはSalesforce AI Researchが開発した大規模マルチモーダルモデルシリーズで、画像とテキストの共同処理をサポートし、さまざまな視覚言語タスクに適しています。

モデル特徴

強力なマルチモーダル能力
画像とテキストの共同処理をサポートし、優れた画像理解とテキスト生成能力を備えています。
効率的な視覚トークンサンプリング
柔軟な高解像度画像エンコーディングをサポートし、効率的な視覚トークンサンプリング能力を備えています。
文脈学習能力
事前学習済み基盤モデルは強力な文脈学習能力を示しています。

モデル能力

画像キャプション生成
視覚的質問応答
マルチモーダル推論
画像テキスト共同処理

使用事例

視覚的質問応答
画像内容質問応答
画像内容に関する自然言語質問に答えます。
複数のベンチマークテストで優れた性能を示しています。
画像キャプション生成
自動画像キャプション
画像の詳細な自然言語説明を生成します。
COCOなどのデータセットで優れた性能を示しています。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase