H

Hiera Base 224 In1k Hf

由facebook開發
Hiera是一種分層式視覺Transformer模型,兼具快速、強大且簡潔的特點,在廣泛圖像與視頻任務中超越現有技術水平的同時顯著提升了運行速度。
下載量 188
發布時間 : 5/12/2024

模型概述

Hiera是一種無需繁複設計的層次化視覺Transformer,專為圖像分類任務優化,通過簡化架構和MAE訓練方法實現高效性能。

模型特點

高效分層設計
採用層次化結構,早期層減少特徵數量,後期層降低空間分辨率,顯著提升運行效率。
簡化架構
移除了傳統視覺Transformer中的冗餘模塊,通過MAE訓練教導模型學習空間偏置,保持架構簡潔。
高性能
在多項圖像視頻識別任務中實現技術突破,準確率超越現有技術水平。

模型能力

圖像分類
特徵提取
掩碼圖像建模

使用案例

計算機視覺
圖像分類
對輸入圖像進行分類識別
示例輸出:'虎斑貓'
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase