U

Unime Phi3.5 V 4.2B

DeepGlint-AIによって開発
UniMEはマルチモーダル大規模モデルに基づく汎用埋め込み学習モデルで、モーダルの壁を打破し、クロスモーダル検索と埋め込み学習を実現することに焦点を当てています。
ダウンロード数 54
リリース時間 : 4/25/2025

モデル概要

UniMEはテキスト識別知識蒸留とハードネガティブサンプル増強の命令チューニング手法を使用し、マルチモーダル大規模モデルの埋め込み能力を強化し、画像とテキストのクロスモーダル検索をサポートします。

モデル特徴

テキスト識別知識蒸留
KLダイバージェンスを使用して学生モデルと教師モデルのバッチ類似度分布の埋め込みをアラインメントし、言語モデルコンポーネントのみを微調整し、残りのパラメータは凍結したままにします。
ハードネガティブサンプル増強の命令チューニング
類似度閾値の偽ネガティブサンプルフィルタリングメカニズムと自動ハードネガティブサンプルサンプリング戦略を使用し、視覚的感度を向上させ、クロスモーダルアラインメントを強化し、命令追従能力を高めます。
高解像度画像処理
336×336の画像解像度でのトレーニングをサポートし、マルチモーダル埋め込みベンチマークテストで優れたパフォーマンスを発揮します。

モデル能力

画像埋め込み
テキスト埋め込み
クロスモーダル検索
マルチモーダルアラインメント

使用事例

クロスモーダル検索
画像からテキストへの検索
画像の内容に基づいて関連するテキスト記述を検索します。
MMEBランキングで1位を獲得しました。
テキストから画像への検索
テキスト記述に基づいて関連する画像を検索します。
多様な検索タスクで優れたパフォーマンスを発揮します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase