H

Hiera Base 224 In1k Hf

facebookによって開発
Hieraは階層型ビジョントランスフォーマーモデルで、高速かつ強力でシンプルな特徴を持ち、幅広い画像・動画タスクで既存技術を凌駕する性能を発揮しながら、処理速度も大幅に向上させています。
ダウンロード数 188
リリース時間 : 5/12/2024

モデル概要

Hieraは複雑な設計を必要としない階層型ビジョントランスフォーマーで、画像分類タスク向けに最適化されており、シンプルなアーキテクチャとMAE学習手法により高い効率性を実現しています。

モデル特徴

効率的な階層設計
階層構造を採用し、初期層では特徴量を削減、後期層では空間解像度を低下させることで、処理効率を大幅に向上させています。
シンプルなアーキテクチャ
従来のビジョントランスフォーマーから冗長なモジュールを排除し、MAE学習を通じて空間バイアスを学習させることで、アーキテクチャの簡潔さを保っています。
高性能
多数の画像・動画認識タスクにおいて技術的ブレークスルーを達成し、既存技術を上回る精度を実現しています。

モデル能力

画像分類
特徴抽出
マスク画像モデリング

使用事例

コンピュータビジョン
画像分類
入力画像を分類・識別する
出力例:'トラネコ'
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase