O

Openvision Vit So400m Patch14 224

Developed by UCSC-VLAA
OpenVision是一個完全開源、高性價比的先進視覺編碼器家族,專為多模態學習設計,性能匹配甚至超越OpenAI CLIP。
Downloads 41
Release Time : 5/6/2025

Model Overview

OpenVision是一系列視覺編碼器,旨在為多模態學習提供高效、靈活的解決方案。它支持從輕量級到大規模的模型部署,適用於多種多模態任務。

Model Features

完全開源
OpenVision的訓練數據和訓練方法完全開源,填補了現有方案中數據或方法未公開的空白。
高性價比
OpenVision在性能上匹配甚至超越OpenAI CLIP,同時提供了更優的成本效益。
靈活部署
提供從590萬到6.321億不等的參數量選擇,支持從輕量級到大規模的靈活部署。
多模態集成
在LLaVA等多模態框架中集成時,表現出優異的性能。

Model Capabilities

圖像特徵提取
多模態學習
視覺編碼

Use Cases

多模態學習
多模態模型集成
將OpenVision集成到LLaVA等多模態框架中,提升模型性能。
性能匹配甚至超越OpenAI CLIP。
邊緣設備部署
輕量級視覺編碼
使用小參數量模型在邊緣設備上進行高效的視覺編碼。
支持輕量級、邊緣設備友好的多模態部署。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase