H

Hiera Base 224 Hf

facebookによって開発
Hieraは階層型視覚Transformerモデルで、高速・強力・簡潔な特徴を持ち、画像・動画タスクで優れた性能を発揮します。
ダウンロード数 163
リリース時間 : 5/12/2024

モデル概要

Hieraは効率的な階層型視覚Transformerモデルで、画像分類・特徴抽出・マスク画像モデリング向けに設計されており、従来のTransformer構造を簡素化することで高い効率性を実現しています。

モデル特徴

効率的な階層設計
初期段階で特徴量を削減し、後期段階で空間解像度を下げる階層設計により、実行効率を大幅に向上させています。
簡素化された構造
従来のTransformerの冗長なモジュールを削除し、MAE訓練手法によりモデルが空間バイアス特性を自主的に学習できるようにし、構造の簡潔さを保っています。
優れた性能
複数の画像・動画認識タスクにおいて既存技術を凌駕しつつ、実行速度も大幅に向上しています。

モデル能力

画像分類
特徴抽出
マスク画像モデリング

使用事例

コンピュータビジョン
画像分類
画像を効率的かつ正確に分類・識別
特徴抽出
画像の各段階の特徴マップを抽出し、下流タスクに活用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase