Hiera Base 224 In1k Hf
Hieraは階層型ビジョントランスフォーマーモデルで、高速かつ強力でシンプルな特徴を持ち、幅広い画像・動画タスクで既存技術を凌駕する性能を発揮しながら、処理速度も大幅に向上させています。
画像分類
Transformers 英語

H
facebook
188
2
Tecoa2 Clip
MIT
OpenAI CLIPで初期化された視覚言語モデルで、ImageNetで教師あり敵対的ファインチューニングを行い、ロバスト性強化特性を備えています
テキスト生成画像
T
chs20
53
1
Fare2 Clip
MIT
OpenAI CLIPを初期化した視覚言語モデルで、教師なし敵対的微調整によりロバスト性を向上
テキスト生成画像
F
chs20
543
2
Fare4 Clip
MIT
OpenAI CLIPで初期化された視覚言語モデルで、教師なし敵対的微調整によりロバスト性を向上
テキスト生成画像
F
chs20
45
1
Vit Hybrid Base Bit 384
Apache-2.0
ハイブリッドビジョントランスフォーマー(ViT)モデルは、畳み込みネットワークとTransformerアーキテクチャを組み合わせたもので、画像分類タスクにおいてImageNetで優れた性能を発揮します。
画像分類
Transformers

V
google
992.28k
6
Convnext Small 224
Apache-2.0
ConvNeXTは純粋な畳み込みモデルで、視覚トランスフォーマーからインスピレーションを得て設計され、ImageNet-1kデータセットでトレーニングされ、従来の視覚トランスフォーマーよりも優れた性能を発揮します。
画像分類
Transformers

C
facebook
586
5
Convnext Base 224
Apache-2.0
ConvNeXTは純粋な畳み込みモデルで、ビジュアルTransformerからインスピレーションを得て設計され、ImageNet - 1kデータセットで訓練され、画像分類タスクに使用されます。
画像分類
Transformers

C
facebook
2,756
9
Convnext Large 224
Apache-2.0
ConvNeXTは純粋な畳み込みモデルで、視覚Transformerからインスピレーションを得た設計で、ImageNet-1kデータセットで224x224解像度でトレーニングされました。
画像分類
Transformers

C
facebook
740
27
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98