🚀 Dogs-Breed-Image-Classification-V2
このモデルは、犬の品種を高精度に識別する画像分類モデルです。microsoft/resnet-152 をベースに、Standford dogs dataset でファインチューニングされています。
🚀 クイックスタート
このモデルは、犬の品種を高精度に識別することができます。評価セットでは、以下の結果を達成しています。
✨ 主な機能
📚 ドキュメント
モデルの説明
このモデルは、Kaggle - Standford dogs dataset のデータセットを使用して訓練されています。
ウェブサイトからの引用:
The Stanford Dogs dataset contains images of 120 breeds of dogs from around the world. This dataset has been built using images and annotation from ImageNet for the task of fine-grained image categorization. It was originally collected for fine-grain image categorization, a challenging problem as certain dog breeds have near identical features or differ in colour and age.
引用:
Aditya Khosla, Nityananda Jayadevaprakash, Bangpeng Yao and Li Fei-Fei. Novel dataset for Fine-Grained Image Categorization. First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2011. [pdf] [poster] [BibTex]
二次引用:
J. Deng, W. Dong, R. Socher, L.-J. Li, K. Li and L. Fei-Fei, ImageNet: A Large-Scale Hierarchical Image Database. IEEE Computer Vision and Pattern Recognition (CVPR), 2009. [pdf] [BibTex]
想定される用途と制限
このモデルは、犬の120品種を分類するためにのみファインチューニングされています。
訓練と評価データ
75%の訓練データと25%のテストデータを使用しています。
訓練手順
訓練ハイパーパラメータ
訓練中に使用されたハイパーパラメータは以下の通りです。
- 学習率: 5e-06
- 訓練バッチサイズ: 32
- 評価バッチサイズ: 32
- シード: 42
- オプティマイザ: Adam (betas=(0.9,0.999), epsilon=1e-08)
- 学習率スケジューラの種類: 線形
- エポック数: 20
訓練結果
訓練損失 |
エポック |
ステップ |
検証損失 |
正確度 |
ログなし |
1.0 |
483 |
4.6525 |
0.7382 |
4.7329 |
2.0 |
966 |
4.3558 |
0.7298 |
4.5033 |
3.0 |
1449 |
3.9568 |
0.7471 |
4.1405 |
4.0 |
1932 |
3.5160 |
0.7782 |
3.7176 |
5.0 |
2415 |
3.0805 |
0.7946 |
3.293 |
6.0 |
2898 |
2.6907 |
0.8021 |
2.8898 |
7.0 |
3381 |
2.3044 |
0.8126 |
2.5343 |
8.0 |
3864 |
2.0091 |
0.8177 |
2.2188 |
9.0 |
4347 |
1.7910 |
0.8126 |
1.9698 |
10.0 |
4830 |
1.6015 |
0.8194 |
1.7532 |
11.0 |
5313 |
1.4383 |
0.8220 |
1.586 |
12.0 |
5796 |
1.3355 |
0.8264 |
1.4533 |
13.0 |
6279 |
1.2467 |
0.8260 |
1.336 |
14.0 |
6762 |
1.1575 |
0.8313 |
1.2641 |
15.0 |
7245 |
1.1038 |
0.8321 |
1.185 |
16.0 |
7728 |
1.0606 |
0.8395 |
1.1329 |
17.0 |
8211 |
1.0178 |
0.8398 |
1.0977 |
18.0 |
8694 |
1.0115 |
0.8408 |
1.0732 |
19.0 |
9177 |
0.9945 |
0.8381 |
1.0508 |
20.0 |
9660 |
0.9930 |
0.8393 |
フレームワークのバージョン
- Transformers 4.37.2
- Pytorch 2.3.0
- Datasets 2.15.0
- Tokenizers 0.15.1
📄 ライセンス
このモデルは、Apache-2.0ライセンスの下で提供されています。