M

Mit B5

nvidiaによって開発
SegFormerはTransformerベースのセマンティックセグメンテーションモデルで、このバージョンはImagenet-1kでプリトレーニングされたエンコーダ部分のみを含みます。
ダウンロード数 15.94k
リリース時間 : 3/2/2022

モデル概要

SegFormerは階層型Transformerエンコーダと軽量な全MLPデコーダで構成されており、このモデルはプリトレーニング済みの階層型Transformerエンコーダのみを含み、セマンティックセグメンテーションタスクのファインチューニングに使用できます。

モデル特徴

階層型Transformerアーキテクチャ
階層型Transformer設計を採用し、異なるスケールの画像特徴を効率的に処理できます
軽量設計
モデル設計は簡潔で効率的であり、性能を維持しながら計算リソース要件を削減します
プリトレーニング済みエンコーダ
ImageNet-1kでプリトレーニングされたエンコーダを提供し、下流タスクのファインチューニングを容易にします

モデル能力

画像分類
セマンティックセグメンテーション(ファインチューニング必要)
特徴抽出

使用事例

コンピュータビジョン
セマンティックセグメンテーション
シーン理解、自動運転などピクセルレベルの分類が必要なタスクに使用可能
ADE20KやCityscapesなどのベンチマークテストで優れた性能を発揮
画像分類
1000クラスのImageNet画像分類タスクに直接使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase