R

RS M CLIP

由joaodaniel開發
面向遙感領域的多語言視覺-語言預訓練模型,支持10種語言的圖像-文本跨模態任務
下載量 248
發布時間 : 11/5/2024

模型概述

RS-M-CLIP是基於CLIP架構的改進模型,專門針對遙感圖像處理優化,通過整合多語言翻譯數據和自蒸餾方法提升性能。支持跨模態檢索、零樣本圖像分類等任務。

模型特點

多語言支持
支持10種語言的文本輸入,包括主要歐洲和亞洲語言
遙感領域優化
專門針對衛星/航拍圖像特性進行訓練,在遙感任務中表現優異
自蒸餾訓練
採用對齊局部和全局表示的自監督方法提升模型性能

模型能力

多語言圖像分類
跨模態圖像檢索
多語言文本檢索
零樣本學習

使用案例

地理空間分析
衛星圖像分類
對衛星圖像進行零樣本分類,如識別飛機、建築物等目標
在示例中準確識別出飛機圖像
多語言圖像檢索
使用不同語言查詢檢索相關遙感圖像
支持10種語言的查詢輸入
城市規劃
土地利用分析
識別城市區域、綠地等土地利用類型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase