H

Hiera Huge 224 Hf

由facebook開發
Hiera是一種高效的分層視覺Transformer模型,在圖像和視頻任務中表現優異且運行速度快
下載量 41
發布時間 : 5/12/2024

模型概述

Hiera是一種分層的視覺Transformer模型,設計簡潔高效,通過MAE訓練方法簡化了傳統視覺Transformer的冗餘模塊,在多項圖像視頻識別任務中超越現有技術

模型特點

分層設計
採用分層架構,早期層減少特徵數量,深層網絡降低空間分辨率,提高效率
簡潔架構
通過MAE訓練方法簡化或移除了傳統Transformer中的冗餘模塊,保持高效
高性能
在多項圖像和視頻識別任務中超越現有技術,同時運行速度顯著提升

模型能力

圖像分類
特徵提取
掩碼圖像建模

使用案例

計算機視覺
圖像分類
對圖像內容進行分類識別
在ImageNet-1K等基準測試中表現優異
特徵提取
從圖像中提取多層次的特徵表示
可用於下游視覺任務的遷移學習
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase