Hiera Base 224 In1k Hf
Hiera是一種分層式視覺Transformer模型,兼具快速、強大且簡潔的特點,在廣泛圖像與視頻任務中超越現有技術水平的同時顯著提升了運行速度。
圖像分類
Transformers 英語

H
facebook
188
2
Tecoa2 Clip
MIT
基於OpenAI CLIP初始化的視覺語言模型,在ImageNet上進行監督式對抗微調,具有魯棒性增強特性
文本生成圖像
T
chs20
53
1
Fare2 Clip
MIT
基於OpenAI CLIP初始化的視覺語言模型,通過無監督對抗微調提升魯棒性
文本生成圖像
F
chs20
543
2
Fare4 Clip
MIT
基於OpenAI CLIP初始化的視覺語言模型,通過無監督對抗微調提升魯棒性
文本生成圖像
F
chs20
45
1
Vit Hybrid Base Bit 384
Apache-2.0
混合視覺變換器(ViT)模型結合了卷積網絡和Transformer架構,用於圖像分類任務,在ImageNet上表現出色。
圖像分類
Transformers

V
google
992.28k
6
Convnext Base 224
Apache-2.0
ConvNeXT是一個純卷積模型,設計靈感源自視覺Transformer,在ImageNet-1k數據集上訓練,用於圖像分類任務。
圖像分類
Transformers

C
facebook
2,756
9
Convnext Small 224
Apache-2.0
ConvNeXT是一個純卷積模型,設計靈感來自視覺變換器,在ImageNet-1k數據集上訓練,性能優於傳統視覺變換器。
圖像分類
Transformers

C
facebook
586
5
Convnext Large 224
Apache-2.0
ConvNeXT是一個純卷積模型,設計靈感來自視覺Transformer,在ImageNet-1k數據集上以224x224分辨率訓練而成。
圖像分類
Transformers

C
facebook
740
27
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98