# 画像分類

Medai Resnet50 Brain
MIT
ResNet-50は深層残差ネットワークで、マイクロソフトリサーチによって開発され、画像分類タスクに広く使用されています。
画像分類
M
aryan-anand
31
1
Cat Dog Root Me
PyTorchとHuggingPicsで構築された画像分類モデルで、猫と犬の写真を正確に区別できます。
画像分類 TensorBoard
C
danihdms
21
1
Light Gender Classifier
HuggingPicsで生成された軽量画像分類モデルで、性別分類タスクに使用されます。
画像分類 TensorBoard
L
musaoc
21
1
Plant Identification Vit
Apache-2.0
Google Vision Transformer (ViT)アーキテクチャを基に微調整した植物識別モデルで、評価セットで80.96%の精度を達成
画像分類 Transformers
P
marwaALzaabi
37
1
Utkface Race Classifications
Apache-2.0
このモデルはmicrosoft/resnet-50を未知のデータセットでファインチューニングしたバージョンで、主に画像分類タスクに使用され、評価セットで84.86%の精度を達成しました。
画像分類 Transformers
U
raffaelsiregar
202
1
Kat Tiny Patch16 224.vitft
Apache-2.0
KATは、従来のTransformerのチャネルミキサーをグループ化有理コルモゴロフ-アーノルドネットワーク(GR-KAN)で置き換えた新しい視覚モデルで、ImageNet-1kデータセットでトレーニングされています。
画像分類
K
adamdad
293
1
Negclip
MIT
オープンクリップは、微調整なしで画像を分類できるゼロショット画像分類モデルです。
画像分類
N
Nano1337
92
0
UL Exterior Classification
Apache-2.0
GoogleのViT-base-patch16-224モデルをファインチューニングした画像分類モデルで、評価セットでの精度は68.97%
画像分類 Transformers
U
sharmajai901
319
1
Plant Disease Detection Project
その他
MobileNet V2はモバイルデバイス向けに設計された軽量な畳み込みニューラルネットワークで、遅延、モデルサイズ、精度のバランスを実現しています。
画像分類 Transformers
P
Diginsa
242.43k
4
Font Identifier
Apache-2.0
ResNet-18をファインチューニングしたフォント認識モデルで、テストセットでの精度は78.1%
画像分類 Transformers
F
ariadnak
44
2
Font Identifier
MIT
ResNet18をファインチューニングしたフォント認識モデルで、48種類の標準フォントを認識可能、テスト精度は96.33%
画像分類 Transformers 英語
F
gaborcselle
1,292
17
Vit Base Patch16 224 In21k Face Recognition
Apache-2.0
このモデルはGoogleのViTアーキテクチャを基に、画像フォルダデータセットで微調整された顔認識モデルで、評価セットでほぼ完璧な精度を達成しました。
人の顔に関係がある Transformers
V
jayanta
216
12
Birds Classifier EfficientNetB2
Apache-2.0
EfficientNet-B2を微調整した鳥類画像分類器で、525種類の鳥を識別可能、精度は99%に達します
画像分類 Transformers
B
dennisjooo
4,320
20
Resnet18 Catdog Classifier
Apache-2.0
ResNet-18をファインチューニングした猫と犬の画像分類モデルで、Kaggleの猫犬データセットでトレーニングされ、精度は99.29%
画像分類 Transformers 英語
R
hilmansw
216
1
Dinov2 Small Imagenet1k 1 Layer
Apache-2.0
DINOv2手法で訓練された小型視覚Transformerモデルで、画像特徴抽出と分類タスクに適しています
画像分類 Transformers
D
facebook
50.86k
2
Organoids Prova Organoid
Apache-2.0
このモデルはGoogleのViT-base-patch16-224を画像フォルダデータセットでファインチューニングした画像分類モデルで、評価セットで85.76%の精度を達成しました。
画像分類 Transformers
O
gcicceri
25
1
Cola001
HuggingPicsで生成された画像分類モデルで、さまざまな犬種を識別できます
画像分類 Transformers
C
GiaKhanh
29
0
Pvt Tiny 224
Apache-2.0
ピラミッド視覚トランスフォーマー(PVT)は、トランスフォーマーアーキテクチャに基づく視覚モデルで、画像分類タスク向けに設計されています。
画像分類 Transformers
P
Xrenya
25
0
Fun
Apache-2.0
google/vit-base-patch16-224をベースにファインチューニングされた視覚モデルで、画像分類タスクに適しています
画像分類 Transformers
F
tcvrishank
16
0
Vit Bach Demo
Apache-2.0
google/vit-base-patch16-224を基にファインチューニングしたVision Transformerモデル、画像分類タスクに適しています
画像分類 Transformers
V
tcvrishank
16
0
Vit Base Letter
Apache-2.0
GoogleのViTベースモデルを文字認識データセットでファインチューニングした画像分類モデルで、精度は98.81%
画像分類 Transformers 英語
V
pittawat
93
2
Vit Diatome
Apache-2.0
GoogleのViTモデルをDiatomeデータセットでファインチューニングした視覚分類モデルで、精度は94.29%
画像分類 Transformers
V
sgonzalezsilot
38
1
Vit Base Aiornot
Apache-2.0
google/vit-base-patch16-224をファインチューニングしたビジュアルモデル、具体的な用途は明記されていません
画像分類 Transformers
V
ThankGod
39
0
Face Discriminator
Apache-2.0
マイクロソフトResNet-50をファインチューニングした顔分類モデルで、検証セットで99.84%の精度を達成
画像分類 Transformers
F
petrznel
23
0
Microsoft Swin Tiny Patch4 Window7 224 Ov
これはmicrosoft/swin-tiny-patch4-window7-224モデルから変換されたOpenVINOバージョンで、画像分類推論を高速化するために使用されます。
画像分類 Transformers 英語
M
helenai
508
1
Doge
DogeはHuggingPicsで生成された画像分類モデルで、Doge関連の画像を識別するために特別に設計されています。
画像分類 Transformers
D
Johnnyboiiii
16
0
Swin Tiny Patch4 Window7 224 Isl Finetuned
Apache-2.0
microsoft/swin-tiny-patch4-window7-224を基に微調整した視覚モデルで、評価データセットで100%の精度を達成
画像分類 Transformers
S
hazardous
17
0
Fl Image Category Multi Label
Apache-2.0
これはGoogleのViTモデルをファインチューニングした画像分類モデルで、fl_image_category_dsデータセットで訓練され、66.22%の精度を達成しています。
画像分類 Transformers
F
StephenSKelley
17
1
Vit Artworkclassifier
Apache-2.0
ViTアーキテクチャに基づく芸術スタイル分類モデルで、入力画像の芸術スタイルカテゴリを識別可能
画像分類 Transformers
V
oschamp
41
2
Fl Image Category
Apache-2.0
microsoft/resnet-18をファインチューニングした画像分類モデルで、fl_image_category_dsデータセットでトレーニング済み
画像分類 Transformers
F
StephenSKelley
29
0
Vit Model
前処理1024構成データセットでファインチューニングされたViTモデル、画像分類タスク用
画像分類 Transformers
V
mm-ai
19
0
Hq Fer2013
Apache-2.0
GoogleのViTモデルをファインチューニングした表情認識モデルで、FER2013データセットで訓練され、70.22%の精度を達成。
画像分類 Transformers
H
Piro17
38
0
Vit Base Patch16 224 Finetuned Algae Wirs
Apache-2.0
このモデルはGoogleのViTモデルを藻類データセットで微調整した視覚分類モデルで、主に藻類画像分類タスクに使用されます。
画像分類 Transformers
V
samitizerxu
20
0
Resnet 50 4 32
Apache-2.0
microsoft/resnet-50をファインチューニングした画像分類モデルで、評価データセットでの精度は64.1%
画像分類 Transformers
R
Celal11
26
0
Poke Model
Gpl-3.0
google/vit-base-patch16-224をベースにファインチューニングした視覚分類モデルで、第一世代ポケモンの識別に使用
画像分類 Transformers
P
torresflo
23
1
Bald Or Not
PyTorchとHuggingPicsを使用したシンプルな画像分類モデルで、画像内の人物がハゲかどうかを判断します。
画像分類 Transformers
B
mvaloatto
28
3
Yolo V8 Fog Or Smog Classification
YOLOv8ベースの画像分類モデルで、霧や煙のシーンを識別するために使用されます。
画像分類 TensorBoard
Y
uisikdag
23
0
Genderage2
Apache-2.0
ViTアーキテクチャに基づくVision Transformerモデルで、性別と年齢の分類タスクに使用
画像分類 Transformers
G
ivensamdh
263
3
Beit Base Patch16 224 Pt22k Ft22k Finetuned FER2013 7e 05 Finetuned SFEW 7e 05
Apache-2.0
BEiTアーキテクチャに基づく画像分類モデルで、FER2013データセットで微調整され、表情認識に使用されます
画像分類 Transformers
B
lixiqi
18
0
Beit Base Patch16 224 Pt22k Ft22k Finetuned FER2013CKPlus 7e 05
Apache-2.0
これはBEiTアーキテクチャに基づく画像分類モデルで、FER2013とCK+データセットで微調整され、顔表情認識タスクに使用されます。
画像分類 Transformers
B
Celal11
19
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase