# ImageNet最適化

Hiera Base 224 In1k Hf
Hieraは階層型ビジョントランスフォーマーモデルで、高速かつ強力でシンプルな特徴を持ち、幅広い画像・動画タスクで既存技術を凌駕する性能を発揮しながら、処理速度も大幅に向上させています。
画像分類 Transformers 英語
H
facebook
188
2
Tecoa2 Clip
MIT
OpenAI CLIPで初期化された視覚言語モデルで、ImageNetで教師あり敵対的ファインチューニングを行い、ロバスト性強化特性を備えています
テキスト生成画像
T
chs20
53
1
Fare2 Clip
MIT
OpenAI CLIPを初期化した視覚言語モデルで、教師なし敵対的微調整によりロバスト性を向上
テキスト生成画像
F
chs20
543
2
Fare4 Clip
MIT
OpenAI CLIPで初期化された視覚言語モデルで、教師なし敵対的微調整によりロバスト性を向上
テキスト生成画像
F
chs20
45
1
Vit Hybrid Base Bit 384
Apache-2.0
ハイブリッドビジョントランスフォーマー(ViT)モデルは、畳み込みネットワークとTransformerアーキテクチャを組み合わせたもので、画像分類タスクにおいてImageNetで優れた性能を発揮します。
画像分類 Transformers
V
google
992.28k
6
Convnext Small 224
Apache-2.0
ConvNeXTは純粋な畳み込みモデルで、視覚トランスフォーマーからインスピレーションを得て設計され、ImageNet-1kデータセットでトレーニングされ、従来の視覚トランスフォーマーよりも優れた性能を発揮します。
画像分類 Transformers
C
facebook
586
5
Convnext Base 224
Apache-2.0
ConvNeXTは純粋な畳み込みモデルで、ビジュアルTransformerからインスピレーションを得て設計され、ImageNet - 1kデータセットで訓練され、画像分類タスクに使用されます。
画像分類 Transformers
C
facebook
2,756
9
Convnext Large 224
Apache-2.0
ConvNeXTは純粋な畳み込みモデルで、視覚Transformerからインスピレーションを得た設計で、ImageNet-1kデータセットで224x224解像度でトレーニングされました。
画像分類 Transformers
C
facebook
740
27
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase