H

Hiera Base 224

由namangarg110開發
Hiera是一種高效的分層式Transformer架構,通過MAE訓練優化空間偏置特性,顯著提升參數利用效率
下載量 48
發布時間 : 2/28/2024

模型概述

Hiera是針對視覺任務設計的層級Transformer模型,通過多尺度特徵處理和MAE預訓練策略,在保持高效運行的同時實現高精度圖像處理

模型特點

分層架構設計
採用淺層高分辨率/深層低分辨率的多尺度處理方式,模仿傳統CNN的特徵提取模式
MAE預訓練優化
通過掩碼自編碼器(MAE)訓練策略賦予模型空間偏置特性,提高參數利用效率
高效運行
相比傳統層級Transformer模型(如ConvNeXT/Swin),在保持精度的同時顯著提升運行速度

模型能力

圖像特徵提取
多尺度視覺表示學習
高效圖像處理

使用案例

計算機視覺
圖像分類
適用於ImageNet等標準圖像分類任務
視覺特徵提取
可作為下游視覺任務(如目標檢測、分割)的特徵提取器
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase