G

Git RSCLIP

lcybuaaによって開発
Git-RSCLIPはGit-10Mデータセットで事前学習された視覚-言語モデルで、リモートセンシング画像のマルチモーダル理解に特化しています。
ダウンロード数 59.37k
リリース時間 : 3/3/2025

モデル概要

このモデルはリモートセンシング画像とテキストの関連付けタスクに特化した視覚-言語モデルで、ゼロショット画像分類や画像テキスト検索などの機能をサポートします。

モデル特徴

グローバル規模リモートセンシングデータセット
1000万枚のリモートセンシング画像-テキストペアを含むGit-10Mデータセットで事前学習されており、全世界をカバーしています。
高解像度処理
256x256解像度の画像処理をサポートし、リモートセンシング画像の高精度な要求に適しています。
ゼロショット学習能力
微調整なしで直接ゼロショット画像分類や画像テキスト検索タスクに適用可能です。

モデル能力

ゼロショット画像分類
画像テキスト検索
リモートセンシング画像理解

使用事例

リモートセンシング画像分析
リモートセンシング河川画像分類
リモートセンシング画像中の河川とその他の地理的特徴を識別します。
高精度なゼロショット分類能力
住宅と道路検出
リモートセンシング画像から住宅や道路などの人工構造物を検出します。
マルチラベル分類をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase