R

RS M CLIP

joaodanielによって開発
リモートセンシング分野向けの多言語視覚-言語事前学習モデル、10言語の画像-テキストクロスモーダルタスクをサポート
ダウンロード数 248
リリース時間 : 11/5/2024

モデル概要

RS-M-CLIPはCLIPアーキテクチャを改良したモデルで、リモートセンシング画像処理に最適化されており、多言語翻訳データと自己蒸留手法を統合して性能を向上。クロスモーダル検索、ゼロショット画像分類などのタスクをサポート。

モデル特徴

多言語サポート
主要な欧州・アジア言語を含む10言語のテキスト入力をサポート
リモートセンシング最適化
衛星/航空画像の特性に特化して訓練され、リモートセンシングタスクで優れた性能を発揮
自己蒸留訓練
局所的および大域的な表現を整合させる自己教師あり手法でモデル性能を向上

モデル能力

多言語画像分類
クロスモーダル画像検索
多言語テキスト検索
ゼロショット学習

使用事例

地理空間分析
衛星画像分類
衛星画像をゼロショット分類(例:航空機、建物などの識別)
サンプルで航空機画像を正確に識別
多言語画像検索
異なる言語クエリで関連リモートセンシング画像を検索
10言語のクエリ入力をサポート
都市計画
土地利用分析
都市区域、緑地などの土地利用タイプを識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase