X

Xgen Mm Phi3 Mini Base R V1.5

Salesforceによって開発
xGen-MMはSalesforce AI Researchによって開発された一連の最新の基礎大規模言語モデル(LMMs)で、BLIPシリーズをベースに改良され、強化機能が組み込まれ、より強力な基礎能力を持っています。
ダウンロード数 830
リリース時間 : 8/12/2024

モデル概要

xGen-MMシリーズのモデルは、高品質の画像キャプションデータセットと交錯画像テキストデータで大規模に訓練され、マルチモーダルタスクの処理をサポートしています。

モデル特徴

マルチモーダルコンテキスト学習
強力なマルチモーダルコンテキスト学習能力を備え、画像とテキストの複雑な相互作用を処理できます。
高性能ベンチマークテスト
VQAv2、TextVQA、OKVQAなどの複数のベンチマークテストで優れた性能を発揮します。
交錯画像テキスト処理
専用に最適化された交錯画像テキスト処理能力で、複雑なマルチモーダルシーンに適しています。

モデル能力

画像理解
テキスト生成
マルチモーダル質問応答
画像キャプション生成
コンテキスト学習

使用事例

ビジュアル質問応答
画像内容に関する質問応答
画像内容に基づいて関連する質問に回答します。
VQAv2ベンチマークテストで66.9点を獲得しました。
画像キャプション生成
自動画像説明
画像に対して正確な説明を生成します。
COCOベンチマークテストで109.8点を獲得しました。
マルチモーダルインタラクション
複雑なシーン理解
複数の画像とテキストを含む複雑なシーンを処理します。
交錯画像テキストタスクで優れた性能を発揮します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase