🚀 segformer-b0-finetuned-segments-stamp-verification
このモデルは、nvidia/mit-b0 を bilal01/stamp-verification データセットでファインチューニングしたバージョンです。評価セットでは以下の結果を達成しています。
- 損失: 0.0372
- 平均IoU: 0.1908
- 平均精度: 0.3817
- 全体精度: 0.3817
- 未ラベル精度: nan
- 切手精度: 0.3817
- 未ラベルIoU: 0.0
- 切手IoU: 0.3817
✨ 主な機能
モデルの説明
StampSegNetは、切手のセグメンテーション用に特別に設計されたカスタムデータセットでファインチューニングされたセマンティックセグメンテーションモデルです。強力なHugging Faceフレームワークをベースに、ディープラーニング技術を利用して、画像から切手を正確かつ効率的にセグメント化します。
このモデルは、画像の異なる領域を切手に属するものとそうでないものに識別・分類するように訓練されています。複雑なデザイン、境界、独特な色などの切手固有の特徴を理解することで、StampSegNetは画像内の切手の正確な境界を強調するピクセルレベルのセグメンテーションマップを生成することができます。
想定される用途と制限
- 切手コレクション管理:StampSegNetモデルは、切手コレクターや愛好家が画像から切手を自動的にセグメント化するために使用できます。切手を正確に識別して分離することで、切手コレクションの整理やカタログ化のプロセスを簡素化し、時間と労力を節約します。
- 電子商取引プラットフォーム:切手の売り手と買い手を対象としたオンラインマーケットプレイスやオークションプラットフォームは、StampSegNetモデルを統合してユーザー体験を向上させることができます。売り手は切手の画像を簡単にアップロードでき、モデルは自動的にセグメント化された切手を抽出して表示し、潜在的な買い手のための検索、分類、評価を容易にします。
ただし、StampSegNetは切手のセグメンテーションで高い性能を発揮しますが、大きく損傷したり隠された切手、異常な形状の切手、照明条件の悪い画像などのシナリオでは課題に直面する可能性があります。さらに、すべてのAIベースのモデルと同様に、訓練データに含まれるバイアスがセグメンテーション結果に影響を与える可能性があるため、倫理的な影響を慎重に評価して軽減する必要があります。
📦 インストール
訓練と評価データ
使用したデータセットはkaggleから取得しました。以下にリンクを示します。
{dataset}(https://www.kaggle.com/datasets/rtatman/stamp-verification-staver-dataset)
60個のサンプルを使用し、Segments.aiでアノテーションを付けました。
訓練手順
データ収集と準備
- 切手の画像とそれに対応するピクセルレベルのアノテーション(画像内の切手の領域を示す)を含む多様なデータセットを収集します。
- データセットには、さまざまな切手のデザイン、サイズ、色、背景、照明条件が含まれていることを確認します。
- データセットを訓練セットと検証セットに分割します。
モデルの選択と構成
- 切手のセグメンテーションタスクに適したセマンティックセグメンテーションモデルアーキテクチャを選択します。
- nvidia/mit-b0 を事前学習モデルとして使用し、それをファインチューニングします。
- モデルのアーキテクチャと必要なハイパーパラメータ(学習率、バッチサイズ、オプティマイザなど)を構成します。
訓練
- 初期化された重みを使用して、ラベル付きの切手データセットでモデルを訓練します。
- セマンティックセグメンテーションタスクに適した損失関数(交差エントロピー損失やDice損失など)を使用します。
- ミニバッチ確率的勾配降下法(SGD)またはAdamなどのオプティマイザを使用して、モデルのパラメータを更新します。
- ピクセル精度、平均IoU、F1スコアなどの指標を計算して、訓練の進捗状況を監視します。
訓練ハイパーパラメータ
訓練中に使用されたハイパーパラメータは以下の通りです。
- 学習率: 6e-05
- 訓練バッチサイズ: 2
- 評価バッチサイズ: 2
- シード: 42
- オプティマイザ: Adam(ベータ=(0.9,0.999)、イプシロン=1e-08)
- 学習率スケジューラタイプ: 線形
- エポック数: 20
訓練結果
訓練損失 |
エポック |
ステップ |
検証損失 |
平均IoU |
平均精度 |
全体精度 |
未ラベル精度 |
切手精度 |
未ラベルIoU |
切手IoU |
0.3384 |
0.83 |
20 |
0.2769 |
0.0335 |
0.0670 |
0.0670 |
nan |
0.0670 |
0.0 |
0.0670 |
0.2626 |
1.67 |
40 |
0.2201 |
0.1256 |
0.2512 |
0.2512 |
nan |
0.2512 |
0.0 |
0.2512 |
0.1944 |
2.5 |
60 |
0.1918 |
0.2030 |
0.4060 |
0.4060 |
nan |
0.4060 |
0.0 |
0.4060 |
0.2665 |
3.33 |
80 |
0.1564 |
0.1574 |
0.3148 |
0.3148 |
nan |
0.3148 |
0.0 |
0.3148 |
0.1351 |
4.17 |
100 |
0.1194 |
0.1817 |
0.3634 |
0.3634 |
nan |
0.3634 |
0.0 |
0.3634 |
0.1156 |
5.0 |
120 |
0.1035 |
0.1334 |
0.2668 |
0.2668 |
nan |
0.2668 |
0.0 |
0.2668 |
0.1103 |
5.83 |
140 |
0.0895 |
0.1819 |
0.3638 |
0.3638 |
nan |
0.3638 |
0.0 |
0.3638 |
0.0882 |
6.67 |
160 |
0.0746 |
0.0833 |
0.1665 |
0.1665 |
nan |
0.1665 |
0.0 |
0.1665 |
0.0778 |
7.5 |
180 |
0.0655 |
0.1927 |
0.3854 |
0.3854 |
nan |
0.3854 |
0.0 |
0.3854 |
0.0672 |
8.33 |
200 |
0.0585 |
0.1327 |
0.2654 |
0.2654 |
nan |
0.2654 |
0.0 |
0.2654 |
0.0612 |
9.17 |
220 |
0.0615 |
0.1640 |
0.3279 |
0.3279 |
nan |
0.3279 |
0.0 |
0.3279 |
0.0611 |
10.0 |
240 |
0.0546 |
0.2466 |
0.4933 |
0.4933 |
nan |
0.4933 |
0.0 |
0.4933 |
0.0537 |
10.83 |
260 |
0.0499 |
0.1129 |
0.2258 |
0.2258 |
nan |
0.2258 |
0.0 |
0.2258 |
0.0504 |
11.67 |
280 |
0.0502 |
0.1857 |
0.3713 |
0.3713 |
nan |
0.3713 |
0.0 |
0.3713 |
0.0707 |
12.5 |
300 |
0.0442 |
0.1710 |
0.3419 |
0.3419 |
nan |
0.3419 |
0.0 |
0.3419 |
0.0508 |
13.33 |
320 |
0.0434 |
0.2003 |
0.4006 |
0.4006 |
nan |
0.4006 |
0.0 |
0.4006 |
0.0396 |
14.17 |
340 |
0.0420 |
0.1409 |
0.2818 |
0.2818 |
nan |
0.2818 |
0.0 |
0.2818 |
0.0395 |
15.0 |
360 |
0.0417 |
0.1640 |
0.3280 |
0.3280 |
nan |
0.3280 |
0.0 |
0.3280 |
0.0387 |
15.83 |
380 |
0.0397 |
0.1827 |
0.3655 |
0.3655 |
nan |
0.3655 |
0.0 |
0.3655 |
0.0458 |
16.67 |
400 |
0.0387 |
0.1582 |
0.3165 |
0.3165 |
nan |
0.3165 |
0.0 |
0.3165 |
0.0363 |
17.5 |
420 |
0.0390 |
0.1724 |
0.3449 |
0.3449 |
nan |
0.3449 |
0.0 |
0.3449 |
0.0401 |
18.33 |
440 |
0.0382 |
0.2018 |
0.4036 |
0.4036 |
nan |
0.4036 |
0.0 |
0.4036 |
0.0355 |
19.17 |
460 |
0.0382 |
0.2032 |
0.4064 |
0.4064 |
nan |
0.4064 |
0.0 |
0.4064 |
0.0447 |
20.0 |
480 |
0.0372 |
0.1908 |
0.3817 |
0.3817 |
nan |
0.3817 |
0.0 |
0.3817 |
フレームワークバージョン
- Transformers 4.28.0
- Pytorch 2.0.0+cu118
- Datasets 2.12.0
- Tokenizers 0.13.3
📄 ライセンス
Other