🚀 OceanSAR - 1模型
OceanSAR - 1是OceanSAR系列中的首個基礎模型,專為合成孔徑雷達(SAR)圖像分析而設計,尤其專注于海洋觀測。該模型採用了新穎的動態數據集剪枝策略,提高了訓練效率和特徵質量。
🚀 快速開始
模型使用示例
import torch
from transformers import AutoModel
model = AutoModel.from_pretrained("galeio-research/OceanSAR-1")
dummy_image = torch.randn(1, 1, 256, 256)
with torch.no_grad():
outputs = model(dummy_image)
features = outputs.pooler_output
✨ 主要特性
模型用途
- 直接使用:該模型旨在作為SAR圖像分析的特徵提取器,尤其適用於海洋觀測任務。可用於從SAR圖像中提取特徵,以及為下游任務進行遷移學習。
- 下游使用:該模型已在三個下游任務上得到驗證,包括對SAR圖像中10種地球物理現象的分類、海洋波高預測的迴歸任務以及表面風速估計的迴歸任務。
模型優勢
採用新穎的動態數據集剪枝策略,可最大化數據集的多樣性和平衡性,降低計算成本,提高模型在下游任務中的性能,且無需預先存在的特徵提取器。
📦 安裝指南
使用該模型需要安裝以下依賴:
- PyTorch >= 1.8.0
- Transformers >= 4.30.0
- torchvision >= 0.9.0
💻 使用示例
基礎用法
import torch
from transformers import AutoModel
model = AutoModel.from_pretrained("galeio-research/OceanSAR-1")
dummy_image = torch.randn(1, 1, 256, 256)
with torch.no_grad():
outputs = model(dummy_image)
features = outputs.pooler_output
📚 詳細文檔
模型詳情
屬性 |
詳情 |
模型類型 |
視覺基礎模型(ResNet50/ViT變體) |
訓練數據 |
Sentinel - 1波模式(WV)SAR圖像(2015 - 2024年) |
訓練制度 |
採用動態數據集剪枝的DINO自監督學習 |
下游任務驗證
- TenGeoP分類:對SAR圖像中的10種地球物理現象進行分類。
- 有效波高估計:海洋波高預測的迴歸任務。
- 風速預測:表面風速估計的迴歸任務。
評估結果
該模型在三個下游任務(線性探測)上達到了最先進的性能:
- TenGeoP分類:
- ResNet50:準確率75.5%
- ViT - S/16:準確率78.6%
- ViT - S/8:準確率82.1%
- ViT - B/8:準確率83.6%
- 有效波高估計:
- 均方根誤差(RMSE):0.63 - 0.72米(取決於架構)
- 風速預測:
- 均方根誤差(RMSE):1.37 - 1.43米/秒(取決於架構)
🔧 技術細節
訓練數據
- 數據集:Sentinel - 1波模式(WV)SAR圖像
- 時間範圍:2015 - 2024年
- 規模:約1200萬張圖像
- 預處理:
- 空間下采樣至50米分辨率
- 動態數據集剪枝以保證多樣性和平衡性
- 從訓練集中排除驗證圖像
動態數據集剪枝
該模型使用的新穎動態數據集剪枝策略具有以下特點:
- 最大化數據集的多樣性和平衡性
- 降低計算成本
- 提高模型在下游任務中的性能
- 無需預先存在的特徵提取器
硬件要求
建議使用至少具有8GB顯存的GPU。
📄 許可證
本模型採用Apache License 2.0許可。
📚 引用
@article{kerdreux2025efficientselfsupervisedlearningearth,
title={Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation},
author={Kerdreux, Thomas and Tuel, Alexandre and Febvre, Quentin and Mouche, Alexis and Chapron, Bertrand},
journal={arXiv preprint arXiv:2504.06962},
year={2025},
eprint={2504.06962},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2504.06962},
}
🙏 致謝
本工作獲得了GENCI分配的2025 - [A0171015666],得以使用IDRIS和TGCC的高性能計算資源。