H

Hiera Tiny 224 Hf

facebookによって開発
Hieraは階層型視覚Transformerモデルで、高速・強力かつ非常に簡潔な特徴を持ち、幅広い画像・動画タスクにおいて現行の最先端技術を凌駕するとともに、大幅な速度向上を実現しています。
ダウンロード数 8,208
リリース時間 : 4/1/2024

モデル概要

Hieraは画像分類、特徴抽出、マスク画像モデリング向けに設計された階層型視覚Transformerモデルで、効率的で簡潔なアーキテクチャにより、多くの画像・動画認識タスクで性能ブレークスルーを達成しています。

モデル特徴

階層型設計
初期段階で特徴量を削減し、後期段階で解像度を下げる階層型設計により、モデルの効率性を大幅に向上させています。
効率的で簡潔
既存のTransformerにおける冗長なモジュールを簡素化または削除し、高速な動作速度を維持しながら精度を向上させています。
マルチタスク対応
画像分類、特徴抽出、マスク画像モデリングなど、様々な視覚タスクに対応しています。

モデル能力

画像分類
特徴抽出
マスク画像モデリング

使用事例

コンピュータビジョン
画像分類
画像内容の分類・識別に使用
ImageNet-1Kなどのデータセットで優れた性能を発揮
特徴抽出
画像の多層的な特徴表現を抽出
下流の視覚タスクに利用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase