# 軽量視覚モデル

Devstral Small Vision 2505 GGUF
Apache-2.0
Mistral Smallモデルを基にした視覚エンコーダーで、画像テキスト生成タスクをサポートし、llama.cppフレームワークに適応
画像生成テキスト
D
ngxson
777
20
Swin Tiny Finetuned Dogfood
Apache-2.0
Swin Transformer Tinyアーキテクチャをファインチューニングしたドッグフード画像分類モデル、テストセットで98.8%の精度を達成
画像分類 Transformers
S
sasha
15
1
Lsnet B
MIT
LSNetは人間の視覚システムの動的異尺度能力にヒントを得た軽量視覚モデルファミリーで、様々な視覚タスクにおいて性能と効率のバランスを実現しています。
画像分類
L
jameslahm
186
1
Ibm Granite.granite Vision 3.2 2b GGUF
Granite Vision 3.2 2B は IBM が開発した視覚言語モデルで、画像テキストからテキストへの変換タスクに特化しています。
画像生成テキスト
I
DevQuasar
211
1
Aimv2 Large Patch14 336.apple Pt Dist
AIM-v2は効率的な画像エンコーダーで、timmライブラリをベースに実装されており、様々なコンピュータビジョンタスクに適しています。
画像分類 Transformers
A
timm
14
0
Sam2 Hiera Small.fb R896 2pt1
Apache-2.0
timmライブラリに基づくSAM2(HieraDet画像エンコーダーのみ)の重みで、FacebookのHiera小型モデルに由来します。
画像セグメンテーション Transformers
S
timm
67
0
Minh
Apache-2.0
YOLOSは視覚Transformer(ViT)ベースの物体検出モデルで、DETR損失で訓練され、COCOデータセットで優れた性能を発揮します。
物体検出
M
minh14122003
14
0
Cat Emotion Classifier
Apache-2.0
GoogleのViTモデルを基にファインチューニングした、猫の感情分類用画像分類モデル
画像分類 Transformers
C
semihdervis
54
2
Swin Tiny Patch4 Window7 224 Cifar10
Apache-2.0
Swin Transformerアーキテクチャに基づく微小モデル、CIFAR-10画像分類タスク向けにファインチューニング
画像分類 Transformers
S
Skafu
94
1
Deit Tiny Patch16 224 Finetuned Main Gpu 20e Final
Apache-2.0
DeiT-tinyアーキテクチャに基づく軽量画像分類モデルで、カスタム画像データセットで微調整後98.56%の検証精度を達成
画像分類 Transformers
D
Gokulapriyan
15
0
Autotrain Test 41086106044
AutoTrainでトレーニングされた多クラス画像分類モデルで、一般的な物体の分類認識をサポート
画像分類 Transformers
A
Younesao
16
0
Swin Tiny Patch4 Window7 224 Finetuned Eurosat
Apache-2.0
Swin Transformer Tinyアーキテクチャに基づく画像分類モデルで、CIFAR10データセットでファインチューニングされ、精度97.24%を達成
画像分類 Transformers
S
eric1993
16
0
Autotrain Pick A Card 3726099222
これはAutoTrainでトレーニングされた多クラス画像分類モデルで、検証セットで優れた性能を発揮し、精度は90.9%に達しました。
画像分類 Transformers
A
rwcuffney
16
0
Autotrain Weather Classification 3723199089
これはAutoTrainでトレーニングされた多クラス画像分類モデルで、天気分類タスク専用です。
画像分類 Transformers
A
8kkillian
16
0
Swin Tiny Patch4 Window7 224 Finetuned Ai Not
Apache-2.0
Swin Transformerアーキテクチャに基づく微調整モデル、AI生成コンテンツ検出タスク用
画像分類 Transformers
S
LukeSajkowski
17
0
3 Labels
AutoTrainでトレーニングされた3クラス画像分類モデルで、検証セットで95%の精度を達成
画像分類 Transformers
3
Ailyth
18
0
Swin Tiny Patch4 Window7 224 Finetuned Aiornot Baseline
Apache-2.0
Swin Transformer Tinyアーキテクチャに基づく視覚モデルで、未知のデータセットで微調整され、画像分類タスクに使用されます
画像分類 Transformers
S
Thabet
17
0
Autotrain Ex And Pt 3122688390
AutoTrainでトレーニングされたマルチクラス画像分類モデルで、さまざまな一般的な物体の分類認識をサポートします
画像分類 Transformers
A
Lloviant
17
0
Swin Tiny Patch4 Window7 224 Finetuned Fluro Cls
Apache-2.0
Swin Transformer Tinyアーキテクチャに基づく微調整モデルで、画像分類タスクに使用されます
画像分類 Transformers
S
zlgao
19
0
Vit Base Patch16 224 Finetuned
Apache-2.0
Google Vision Transformer (ViT)モデルを基に微調整した画像分類モデルで、カスタム画像データセットでトレーニング済み
画像分類 Transformers
V
clp
30
0
Swin Tiny Patch4 Window7 224 Finetuned Woody LeftGR Clean 130epochs
Apache-2.0
Swin Transformer Tinyアーキテクチャに基づく画像分類モデルで、カスタム画像データセットで130エポックのファインチューニングを行い、精度90.23%を達成
画像分類 Transformers
S
Alex-VisTas
11
0
Swin Tiny Patch4 Window7 224 Finetuned Woody LeftGR 130epochs
Apache-2.0
Swin Transformer Tinyアーキテクチャに基づく画像分類モデル、特定の画像データセットで130エポックのファインチューニングを実施
画像分類 Transformers
S
Alex-VisTas
12
0
Autotrain Cat Vs Dogs 1858163503
これはAutoTrainを使用してトレーニングされた二項分類モデルで、猫と犬の画像を区別するために特別に設計されています。
画像分類 Transformers
A
kem000123
10
2
Levit 192 Finetuned On Unlabelled IA With Snorkel Labels
Apache-2.0
このモデルはfacebook/levit-192を基に、未ラベルデータセットでファインチューニングしたバージョンで、精度、再現率、F1値、正解率において優れた性能を示しています。
画像分類 Transformers
L
ImageIN
19
0
Snacks Classifier
マイクロソフトのSwin Transformer Tinyアーキテクチャを基にした軽量画像分類モデルで、スナック分類データセットでファインチューニング後、92.86%のテスト精度を達成
画像分類 Transformers
S
Matthijs
15
0
Visual Transformer Chihuahua Cookies
視覚Transformerアーキテクチャに基づく画像分類モデルで、チワワ犬とクッキーの2種類の画像を区別するために特別に設計されています
画像分類 Transformers
V
peterbonnesoeur
15
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase