H

Hiera Abswin Base Mim

Developed by birder-project
採用絕對窗口位置嵌入策略的Hiera圖像編碼器,通過掩碼圖像建模(MIM)預訓練,可作為通用特徵提取器或下游任務的骨幹網絡。
Downloads 72
Release Time : 3/20/2025

Model Overview

該模型是一個基於Hiera架構的圖像編碼器,採用絕對窗口位置嵌入策略,通過掩碼圖像建模(MIM)進行預訓練。它未針對特定分類任務進行微調,旨在作為通用特徵提取器或下游任務(如目標檢測、分割或自定義分類)的骨幹網絡使用。

Model Features

絕對窗口位置嵌入
採用創新的絕對窗口位置嵌入策略,解決了傳統窗口注意力機制中位置嵌入插值的問題
層次化視覺Transformer
基於Hiera架構,通過去蕪存菁的方式實現高效的層次化視覺特徵提取
多源訓練數據
使用包含1200萬張多樣化圖像的混合數據集進行訓練,涵蓋多個公開數據集和私有鳥類數據集
多任務適用性
可作為通用特徵提取器或下游任務(如檢測、分割)的骨幹網絡使用

Model Capabilities

圖像特徵提取
目標檢測特徵提取
圖像分割特徵提取
鳥類識別特徵提取

Use Cases

計算機視覺
鳥類識別
利用模型提取的特徵進行鳥類分類和識別
目標檢測
作為骨幹網絡用於目標檢測任務
圖像分割
作為骨幹網絡用於圖像分割任務
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase