O

Openvision Vit So400m Patch14 384

UCSC-VLAAによって開発
OpenVisionは、完全にオープンでコスト効率の高い高度なビジョンエンコーダのファミリーで、マルチモーダル学習に使用されます。
ダウンロード数 238
リリース時間 : 5/6/2025

モデル概要

OpenVisionは、効率的なビジョンエンコーダのシリーズを提供し、マルチモーダル学習タスクをサポートし、特に画像特徴抽出と関連アプリケーションに適しています。

モデル特徴

完全オープン
モデルは完全にオープンソースで、自由な使用と改変が可能です。
コスト効率
計算効率を重視した設計で、リソースが限られた環境に適しています。
マルチモーダルサポート
視覚と言語のマルチモーダル学習タスクをサポートします。

モデル能力

画像特徴抽出
マルチモーダル学習
視覚言語アラインメント

使用事例

コンピュータビジョン
画像分類
抽出された画像特徴を使用して分類タスクを行います。
画像検索
視覚的特徴に基づく類似性検索。
マルチモーダルアプリケーション
画像とテキストのマッチング
画像とテキストの意味空間をアラインメントします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase