H

Hiera Base 224 Hf

由facebook開發
Hiera是一種層次化視覺Transformer模型,具有快速、強大且簡潔的特點,在圖像和視頻任務中表現優異。
下載量 163
發布時間 : 5/12/2024

模型概述

Hiera是一種高效的層次化視覺Transformer模型,專為圖像分類、特徵提取和掩碼圖像建模設計,通過簡化傳統Transformer結構實現更高效率。

模型特點

高效層次化設計
通過初始減少特徵數量、後期降低空間分辨率的層次化設計,顯著提升運行效率。
簡化結構
移除傳統Transformer冗餘模塊,通過MAE訓練方法讓模型自主學習空間偏置特性,保持結構簡潔。
優異性能
在多項圖像和視頻識別任務中超越現有技術,同時顯著提升運行速度。

模型能力

圖像分類
特徵提取
掩碼圖像建模

使用案例

計算機視覺
圖像分類
對圖像進行高效準確的分類識別
特徵提取
提取圖像不同階段的特徵圖,用於下游任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase