H

Hiera Base Plus 224 Hf

facebookによって開発
Hieraは階層型ビジョントランスフォーマーモデルで、高速・強力・シンプルな特性を兼ね備え、幅広い画像・動画タスクにおいて既存技術を凌駕するとともに、実行速度を大幅に向上させます。
ダウンロード数 15
リリース時間 : 5/12/2024

モデル概要

Hieraは効率的な階層型ビジョントランスフォーマーモデルで、画像分類、特徴抽出、マスク画像モデリング向けに設計されています。冗長なモジュールを簡素化し、MAEトレーニングを採用することで、多数の画像・動画認識タスクにおいて高性能を実現しています。

モデル特徴

効率的な階層設計
階層構造により、異なる段階で空間解像度と特徴量を調整することで、実行効率を大幅に向上させます。
簡素化されたアーキテクチャ
既存のトランスフォーマーから冗長なモジュールを削除し、シンプルなアーキテクチャを維持しながら精度を向上させます。
MAEトレーニング
マスク自己符号化(MAE)トレーニング手法を採用し、アーキテクチャによる手動追加ではなく、モデルに空間バイアスを学習させます。
高性能
多数の画像・動画認識タスクにおいて既存技術を凌駕するとともに、高速な推論速度を維持します。

モデル能力

画像分類
特徴抽出
マスク画像モデリング

使用事例

コンピュータビジョン
画像分類
入力画像を分類し、画像内の主要なオブジェクトやシーンを識別します。
ImageNet-1Kなどのベンチマークテストで優れた性能を発揮
特徴抽出
画像の多階層特徴表現を抽出し、下流の視覚タスクに利用可能です。
異なる段階の特徴マップを抽出可能で、多様な視覚アプリケーションをサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase