H

Hiera Huge 224 Hf

facebookによって開発
Hieraは効率的な階層型ビジョントランスフォーマーモデルで、画像・動画タスクにおいて優れた性能と高速処理を実現
ダウンロード数 41
リリース時間 : 5/12/2024

モデル概要

Hieraは階層型ビジョントランスフォーマーモデルで、シンプルかつ効率的に設計されており、MAEトレーニング手法により従来のビジョントランスフォーマーの冗長モジュールを簡素化、多くの画像・動画認識タスクで既存技術を凌駕

モデル特徴

階層設計
階層アーキテクチャを採用、初期層で特徴量を削減、深層ネットワークで空間解像度を低下させ効率化
簡潔なアーキテクチャ
MAEトレーニング手法により従来のTransformerの冗長モジュールを簡素化・削除し効率を維持
高性能
多くの画像・動画認識タスクで既存技術を上回り、処理速度も大幅に向上

モデル能力

画像分類
特徴抽出
マスク画像モデリング

使用事例

コンピュータビジョン
画像分類
画像内容を分類・識別
ImageNet-1Kなどのベンチマークで優れた性能
特徴抽出
画像から多層的な特徴表現を抽出
下流の視覚タスクへの転移学習に利用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase