ImageNet優化

# ImageNet優化

Hiera Base 224 In1k Hf

Hiera是一種分層式視覺Transformer模型，兼具快速、強大且簡潔的特點，在廣泛圖像與視頻任務中超越現有技術水平的同時顯著提升了運行速度。

Transformers 英語

基於OpenAI CLIP初始化的視覺語言模型，在ImageNet上進行監督式對抗微調，具有魯棒性增強特性

文本生成圖像

基於OpenAI CLIP初始化的視覺語言模型，通過無監督對抗微調提升魯棒性

文本生成圖像

基於OpenAI CLIP初始化的視覺語言模型，通過無監督對抗微調提升魯棒性

文本生成圖像

Vit Hybrid Base Bit 384

混合視覺變換器（ViT）模型結合了卷積網絡和Transformer架構，用於圖像分類任務，在ImageNet上表現出色。

Convnext Base 224

ConvNeXT是一個純卷積模型，設計靈感源自視覺Transformer，在ImageNet-1k數據集上訓練，用於圖像分類任務。

Convnext Small 224

ConvNeXT是一個純卷積模型，設計靈感來自視覺變換器，在ImageNet-1k數據集上訓練，性能優於傳統視覺變換器。

Convnext Large 224

ConvNeXT是一個純卷積模型，設計靈感來自視覺Transformer，在ImageNet-1k數據集上以224x224分辨率訓練而成。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase