H

Hiera Large 224 Hf

由facebook開發
Hiera是一種層次化視覺Transformer模型,兼具快速、強大且簡潔的特性,在圖像視頻任務中超越現有技術且速度更快。
下載量 532
發布時間 : 5/12/2024

模型概述

Hiera是一種層次化視覺Transformer模型,專為圖像分類、特徵提取或掩碼圖像建模設計。本特定檢查點專為特徵提取設計。

模型特點

層次化設計
通過層次化結構在不同網絡階段使用不同空間分辨率和特徵維度,提高效率。
簡潔架構
移除了傳統視覺Transformer中的冗餘模塊,保持架構簡潔高效。
高效訓練
通過MAE訓練教導模型學習空間偏置,而非通過複雜架構手動添加。
高性能
在多項圖像視頻識別任務中達到業界最優水平,同時運行速度更快。

模型能力

圖像分類
特徵提取
掩碼圖像建模

使用案例

計算機視覺
圖像分類
用於標準圖像分類任務
在ImageNet-1K等基準測試中表現優異
特徵提取
提取圖像的多層次特徵表示
可用於下游視覺任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase