L

Levit 128S

由facebook開發
LeViT-128S是基於ImageNet-1k數據集預訓練的視覺Transformer模型,結合了卷積網絡的優勢以實現更快推理。
下載量 3,198
發布時間 : 6/1/2022

模型概述

LeViT是一種結合了卷積網絡和Transformer架構的視覺模型,專為圖像分類任務設計,在保持高準確率的同時優化了推理速度。

模型特點

混合架構設計
結合卷積網絡和Transformer的優勢,在保持視覺任務性能的同時優化計算效率。
高效推理
專為快速推理設計,相比純Transformer架構具有更低的計算開銷。
ImageNet預訓練
在ImageNet-1k數據集上預訓練,可直接用於千類圖像分類任務。

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
通用物體識別
識別圖像中的常見物體(如動物、日常用品等)
可準確分類ImageNet的1,000個類別
場景理解
分析圖像場景內容(如室內外環境、建築類型等)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase