vit-base-patch16-224-in21k-euroSatオープンソースモデル - 高精度なリモートセンシング画像分類の実用ツール

Vit Base Patch16 224 In21k Eurosat

philschmidによって開発

Google Vision Transformerアーキテクチャに基づき、EuroSatデータセットで微調整された高精度リモートセンシング画像分類モデル

ダウンロード数 28

リリース時間 : 3/2/2022

モデル概要

このモデルはVision Transformer (ViT)アーキテクチャに基づく画像分類モデルで、EuroSatリモートセンシング画像データセットに特化して微調整されており、99.06%という高い分類精度を実現します。

高精度分類

EuroSatテストセットで99.06%の精度と100%のトップ3精度を達成

ViTアーキテクチャ採用

Vision Transformerアーキテクチャを採用し、強力な画像特徴抽出能力を有する

効率的なトレーニング

わずか5エポックのトレーニングでほぼ完璧な分類性能を達成

リモートセンシング画像分類

多クラス画像認識

高精度シーン分類

リモートセンシング分析

土地利用分類

衛星画像中の異なる土地タイプを分類・識別

10種類の異なる土地タイプを正確に識別可能

環境モニタリング

森林、農地、水域などの環境要素の変化を監視

地理情報システム

地図注記自動化

衛星画像中の地理的特徴を自動識別・注記

このモデルは、google/vit-base-patch16-224-in21k を未知のデータセットでファインチューニングしたバージョンです。評価セットでは以下の結果を達成しています。

プロパティ	詳細
モデル名	philschmid/vit-base-patch16-224-in21k-euroSat
元のモデル	google/vit-base-patch16-224-in21k
タスク	画像分類
データセット	eurosat
精度	0.9906
トップ3精度	1.0000

このモデルは、google/vit-base-patch16-224-in21k を未知のデータセットでファインチューニングしたものです。評価セットでは、以下の結果が得られています。

詳細情報は必要です。

訓練中に使用されたハイパーパラメータは以下の通りです。

オプティマイザ: {'inner_optimizer': {'class_name': 'AdamWeightDecay', 'config': {'name': 'AdamWeightDecay', 'learning_rate': {'class_name': 'PolynomialDecay', 'config': {'initial_learning_rate': 3e-05, 'decay_steps': 3585, 'end_learning_rate': 0.0, 'power': 1.0, 'cycle': False, 'name': None}}, 'decay': 0.0, 'beta_1': 0.9, 'beta_2': 0.999, 'epsilon': 1e-08, 'amsgrad': False, 'weight_decay_rate': 0.01}}, 'dynamic': True, 'initial_scale': 32768.0, 'dynamic_growth_steps': 2000}
訓練精度: mixed_float16

訓練損失	訓練精度	訓練Top-3精度	検証損失	検証精度	検証Top-3精度	エポック数
0.4692	0.9471	0.9878	0.1455	0.9861	0.9998	1
0.0998	0.9888	0.9996	0.0821	0.9864	0.9995	2
0.0517	0.9939	0.9999	0.0617	0.9871	1.0	3
0.0309	0.9971	0.9999	0.0524	0.9878	0.9998	4
0.0218	0.9990	1.0000	0.0440	0.9906	1.0	5