M

Moonvit SO 400M

由moonshotai開發
MoonViT是一款原生分辨率的視覺編碼器,基於SigLIP-SO-400M進行初始化和持續預訓練,適用於圖像特徵提取任務。
下載量 275
發布時間 : 4/10/2025

模型概述

MoonViT是一款專為圖像特徵提取設計的視覺編碼器,其訓練基於SigLIP-SO-400M模型,能夠處理高分辨率圖像並提取有效特徵。

模型特點

原生分辨率支持
MoonViT能夠處理原生分辨率的圖像,無需降採樣即可提取特徵。
基於SigLIP-SO-400M
模型的初始化和持續預訓練均基於SigLIP-SO-400M,繼承了其強大的視覺特徵提取能力。
高效特徵提取
專為圖像特徵提取優化,能夠生成高質量的圖像特徵表示。

模型能力

圖像特徵提取
高分辨率圖像處理

使用案例

計算機視覺
圖像理解
提取圖像特徵用於後續的圖像分類、目標檢測等任務。
高質量的圖像特徵表示
多模態學習
作為視覺編碼器與語言模型結合,構建多模態系統。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase