R

RADIO

nvidiaによって開発
NVIDIAが開発した視覚特徴抽出モデルで、画像を埋め込みベクトルに変換し下流タスクに利用可能
ダウンロード数 5,166
リリース時間 : 12/11/2023

モデル概要

視覚Transformerアーキテクチャに基づく画像特徴抽出モデルで、柔軟な入力解像度をサポートし、生成された埋め込みベクトルは画像分類、セマンティックセグメンテーションなどのコンピュータビジョンタスクに適応

モデル特徴

柔軟な入力解像度
最大2048x2028解像度入力をサポート(16ピクセル単位)、様々なアプリケーションシナリオのニーズに対応
二重出力特徴
グローバル特徴(summary)と局所空間特徴(spatial_features)を同時出力し、異なるタスク要件を満たす
大規模事前学習
128億枚のインターネット画像からなるDataCompデータセットで事前学習され、強力な特徴抽出能力を有する

モデル能力

画像特徴抽出
画像分類
セマンティックセグメンテーション
視覚埋め込み生成

使用事例

コンピュータビジョン
画像分類
RADIOで抽出した画像埋め込みベクトルを下流分類器の入力として使用
セマンティックセグメンテーション
RADIOの空間特徴を利用して密な予測タスクを実行
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase