C

C RADIOv2 G

nvidiaによって開発
C-RADIOv2はNVIDIAが開発した視覚特徴抽出モデルで、複数のサイズバージョンを提供し、画像理解と高密度処理タスクに適しています。
ダウンロード数 648
リリース時間 : 1/17/2025

モデル概要

このモデルは視覚特徴抽出タスクを実行するために使用され、生成された画像埋め込みは下流モデルによる画像分類、セマンティックセグメンテーションなどのアプリケーションに利用できます。

モデル特徴

マルチサイズバージョン
基本版、大型版、巨大版、超巨大版の4つのサイズを提供し、異なる計算ニーズに対応
効率的な特徴抽出
グローバルおよびローカルな画像埋め込みを生成し、画像レベルの理解と高密度処理タスクに適しています
高解像度サポート
16ピクセル単位の解像度をサポートし、最大2048x2028まで対応可能
データバランス技術
逆頻度サンプリングとPHI正規化技術を採用してトレーニングデータ分布を最適化

モデル能力

画像特徴抽出
画像分類
セマンティックセグメンテーション
深度推定
視覚言語モデル統合

使用事例

コンピュータビジョン
画像分類
モデルが抽出した画像埋め込みを使用して画像分類タスクを実行
セマンティックセグメンテーション
モデルの空間的特徴を利用してピクセルレベルのセマンティックセグメンテーションを実施
マルチモーダルアプリケーション
視覚言語モデル
画像特徴を大規模言語モデルに統合
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase