Mobilevitv2 1.0 Voc Deeplabv3
基於MobileViTv2架構和DeepLabV3頭部的語義分割模型,在PASCAL VOC數據集上以512x512分辨率預訓練
Downloads 29
Release Time : 6/6/2023
Model Overview
該模型結合了MobileViTv2的高效視覺Transformer架構和DeepLabV3的語義分割能力,適用於圖像分割任務
Model Features
高效視覺Transformer
採用可分離自注意力機制替代傳統多頭自注意力,提升移動設備上的計算效率
DeepLabV3頭部
結合DeepLabV3分割頭部,增強模型對多尺度特徵的捕捉能力
輕量化設計
專為移動和邊緣設備優化,平衡性能和計算資源需求
Model Capabilities
圖像分割
語義分割
像素級分類
Use Cases
計算機視覺
場景理解
識別和分割圖像中的不同物體和區域
在PASCAL VOC數據集上表現良好
自動駕駛
道路場景分割,識別車輛、行人、道路等元素
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98