🚀 OceanSAR-1のモデルカード
OceanSAR-1は、海洋観測を目的とした合成開口レーダー(SAR)画像解析用の基礎モデルです。新しい動的データセット削減戦略を用いて訓練され、訓練効率と特徴品質が向上しています。
🚀 クイックスタート
OceanSAR-1モデルを使用してSAR画像から特徴を抽出するには、以下のコードを参考にしてください。
import torch
from transformers import AutoModel
model = AutoModel.from_pretrained("galeio-research/OceanSAR-1")
dummy_image = torch.randn(1, 1, 256, 256)
with torch.no_grad():
outputs = model(dummy_image)
features = outputs.pooler_output
✨ 主な機能
- SAR画像解析用の特徴抽出器:SAR画像から特徴を抽出し、下流タスクの転移学習に使用できます。
- 下流タスクでの検証:10種類の地球物理学的現象の分類、有義波高推定、風速予測などの下流タスクで検証されています。
📦 インストール
このモデルを使用するには、transformers
ライブラリが必要です。以下のコマンドでインストールできます。
pip install transformers
💻 使用例
基本的な使用法
import torch
from transformers import AutoModel
model = AutoModel.from_pretrained("galeio-research/OceanSAR-1")
dummy_image = torch.randn(1, 1, 256, 256)
with torch.no_grad():
outputs = model(dummy_image)
features = outputs.pooler_output
📚 ドキュメント
モデルの詳細
モデルの説明
OceanSAR-1は、OceanSARファミリーの最初の基礎モデルで、合成開口レーダー(SAR)画像解析に特化し、海洋観測に焦点を当てて設計されています。モデルは、新しい動的データセット削減戦略を使用して訓練され、訓練効率と特徴品質を向上させています。
- 開発者: Thomas Kerdreux, Alexandre Tuel @ Galeio
- デプロイ者: Antoine Audras @ Galeio
- モデルの種類: ビジョン基礎モデル(ResNet50/ViTバリアント)
- ライセンス: Apache License 2.0
- 訓練データ: Sentinel-1 Wave Mode (WV) SAR画像 (2015-2024)
- 訓練方式: 動的データセット削減を伴うDINO自己教師付き学習
用途
直接的な使用
このモデルは、SAR画像解析の特徴抽出器として、特に海洋観測タスクに使用することを目的としています。以下の用途に使用できます。
下流タスクでの使用
このモデルは、3つの下流タスクで検証されています。
- TenGeoP分類:SAR画像における10種類の地球物理学的現象の分類
- 有義波高推定:海洋の波高予測の回帰タスク
- 風速予測:表面風速推定の回帰タスク
訓練の詳細
訓練データ
- データセット: Sentinel-1 Wave Mode (WV) SAR画像
- 期間: 2015-2024
- サイズ: 約1200万枚の画像
- 前処理:
- 空間的に50m解像度にダウンサンプリング
- 多様性とバランスを考慮した動的データセット削減
- 検証画像を訓練セットから除外
動的データセット削減
このモデルは、新しい動的データセット削減戦略を使用しています。
- データセットの多様性とバランスを最大化する
- 計算コストを削減する
- 下流タスクでのモデル性能を向上させる
- 既存の特徴抽出器を必要としない
評価
結果
このモデルは、3つの下流タスク(線形プロービング)で最先端の性能を達成しています。
- TenGeoP分類:
- ResNet50: 75.5%の精度
- ViT-S/16: 78.6%の精度
- ViT-S/8: 82.1%の精度
- ViT-B/8: 83.6%の精度
- 有義波高推定:
- RMSE: 0.63-0.72m(アーキテクチャによる)
- 風速予測:
- RMSE: 1.37-1.43 m/s(アーキテクチャによる)
商業的なデプロイや特定の運用ニーズに合った最適化モデルバリアントにアクセスする場合は、ライセンスとサポートオプションについて相談してください。
技術仕様
ハードウェア要件
- 少なくとも8GBのVRAMを持つGPUが推奨されます。
依存関係
- PyTorch >= 1.8.0
- Transformers >= 4.30.0
- torchvision >= 0.9.0
入力仕様
- 入力サイズ: 256x256ピクセル
- 単チャンネル(VV偏波)
- 正規化されたピクセル値
- Sentinel-1 Wave ModeのSAR画像
🔧 技術詳細
引用
BibTeX:
@article{kerdreux2025efficientselfsupervisedlearningearth,
title={Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation},
author={Kerdreux, Thomas and Tuel, Alexandre and Febvre, Quentin and Mouche, Alexis and Chapron, Bertrand},
journal={arXiv preprint arXiv:2504.06962},
year={2025},
eprint={2504.06962},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2504.06962},
}
謝辞
この研究は、GENCIによる割り当て2025-[A0171015666]の下で、IDRISとTGCCのHPCリソースを利用して行われました。
📄 ライセンス
このモデルは、Apache License 2.0の下で提供されています。