C

C RADIOv2 G

由nvidia開發
C-RADIOv2是NVIDIA開發的視覺特徵提取模型,提供多種規格版本,適用於圖像理解和密集處理任務。
下載量 648
發布時間 : 1/17/2025

模型概述

該模型用於執行視覺特徵提取任務,生成的圖像嵌入可被下游模型用於圖像分類、語義分割等應用。

模型特點

多規格版本
提供基礎版、大型版、巨型版和超巨型版四種規格,滿足不同計算需求
高效特徵提取
生成全局和局部圖像嵌入,適用於圖像級理解和密集處理任務
高分辨率支持
支持16像素為增量的分辨率,最高可達2048x2028
數據平衡技術
採用逆頻率採樣和PHI標準化技術優化訓練數據分佈

模型能力

圖像特徵提取
圖像分類
語義分割
深度估計
視覺語言模型集成

使用案例

計算機視覺
圖像分類
使用模型提取的圖像嵌入進行圖像分類任務
語義分割
利用模型的空間特徵進行像素級語義分割
多模態應用
視覺語言模型
將圖像特徵集成到大型語言模型中
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase