R

RADIO B

由nvidia開發
RADIO是由NVIDIA研究院開發的視覺基礎模型,能夠將不同領域的視覺信息統一表徵,適用於多種視覺任務。
下載量 999
發布時間 : 7/23/2024

模型概述

RADIO是一個視覺基礎模型,能夠生成圖像的整體概念表徵和局部內容表徵,適用於語義分割等密集任務或與大型語言模型集成。

模型特點

統一表徵
能夠將不同領域的視覺信息統一表徵,實現萬域歸一。
雙輸出
同時輸出圖像整體概念表徵和局部內容表徵,適用於多種下游任務。
高效下采樣
通過14x14的補丁尺寸實現高效的空間特徵提取。

模型能力

圖像整體概念表徵
局部內容表徵
語義分割
視覺-語言模型集成

使用案例

計算機視覺
語義分割
利用模型輸出的空間特徵進行像素級分類
視覺-語言集成
將圖像表徵與大型語言模型結合,實現多模態理解
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase