google-vit-base-patch16-224-faceオープンソース画像分類モデル

ホーム

Google Vit Base Patch16 224 Face

jayantaによって開発

google/vit-base-patch16-224を画像フォルダデータセットでファインチューニングしたVision Transformerモデルで、画像分類タスクに使用されます。

画像分類

Transformers

オープンソースライセンス:Apache-2.0 #ViT画像分類 #顔特徴抽出 #高精度分類

ダウンロード数 18

リリース時間 : 1/12/2023

モデル概要

このモデルはVision Transformer (ViT)アーキテクチャに基づく画像分類モデルで、特定分野の画像認識タスクに適応するようファインチューニングされています。

モデル特徴

ViTアーキテクチャベース

Vision Transformerアーキテクチャを採用し、自己注意機構で画像データを処理

ファインチューニング版

ベースモデルをファインチューニングし、特定の画像分類タスクに適応

中規模モデル

baseサイズのViTモデルを使用し、性能と計算リソースのバランスを考慮

モデル能力

画像分類

特徴抽出

視覚パターン認識

使用事例

コンピュータビジョン

顔画像分類

顔を含む画像を分類・識別

評価データセットで72.49%の精度を達成

汎用画像分類

様々な種類の画像を分類・識別

🚀 google-vit-base-patch16-224-face

このモデルは、google/vit-base-patch16-224 を imagefolder データセットでファインチューニングしたバージョンです。評価セットでは以下の結果を達成しています。

損失: 1.4531
正解率: 0.7249
適合率: 0.7172
再現率: 0.7249
F1スコア: 0.7196

📚 ドキュメント

モデルの詳細

詳細情報は後日追加予定です。

想定される用途と制限

詳細情報は後日追加予定です。

学習と評価データ

詳細情報は後日追加予定です。

学習手順

学習ハイパーパラメータ

学習時には以下のハイパーパラメータが使用されました。

学習率: 0.00012
学習バッチサイズ: 64
評価バッチサイズ: 64
乱数シード: 42
勾配蓄積ステップ: 4
総学習バッチサイズ: 256
オプティマイザ: Adam (betas=(0.9,0.999), epsilon=1e-08)
学習率スケジューラの種類: 線形
学習率スケジューラのウォームアップ比率: 0.1
エポック数: 8

学習結果

学習損失	エポック	ステップ	検証損失	正解率	適合率	再現率	F1スコア
0.8514	1.0	290	0.8464	0.7048	0.7035	0.7048	0.6909
0.7202	2.0	580	0.7791	0.7283	0.7297	0.7283	0.7111
0.5455	3.0	870	0.7950	0.7285	0.7174	0.7285	0.7171
0.334	4.0	1160	0.8948	0.7155	0.7152	0.7155	0.7145
0.1644	5.0	1450	1.0820	0.7239	0.7189	0.7239	0.7194
0.0482	6.0	1740	1.2792	0.7204	0.7144	0.7204	0.7160
0.0236	7.0	2030	1.4162	0.7279	0.7195	0.7279	0.7209
0.0049	8.0	2320	1.4531	0.7249	0.7172	0.7249	0.7196

フレームワークのバージョン

Transformers 4.24.0.dev0
Pytorch 1.11.0+cu102
Datasets 2.6.1
Tokenizers 0.13.1

📄 ライセンス

このモデルは Apache-2.0 ライセンスの下で提供されています。

メトリクス

正解率
適合率
再現率
F1スコア

データセット

imagefolder

モデル指標

プロパティ	詳細
モデル名	google-vit-base-patch16-224-face
タスク名	画像分類
タスクタイプ	image-classification
データセット名	imagefolder
データセットタイプ	imagefolder
データセット設定	default
分割	train
引数	default
正解率	0.7248574809078198
適合率	0.717172031675939
再現率	0.7248574809078198
F1スコア	0.7195690317790054