M

Mit B0

nvidiaによって開発
SegFormerはTransformerベースのセマンティックセグメンテーションモデルで、階層型エンコーダと軽量MLPデコーダヘッドを採用しており、ADE20KやCityscapesなどのベンチマークテストで優れた性能を発揮します。
ダウンロード数 83.99k
リリース時間 : 3/2/2022

モデル概要

このモデルはSegFormerの階層型Transformerエンコーダ部分で、ImageNet-1kで事前学習されており、下流のセマンティックセグメンテーションタスクの微調整に使用できます。

モデル特徴

階層型Transformerアーキテクチャ
階層型設計のTransformerエンコーダを採用し、多尺度の特徴を効果的に捉えることができます。
軽量MLPデコーダヘッド
軽量な全MLPデコーダヘッドと組み合わせて、効率的なセマンティックセグメンテーションを実現します。
ImageNet事前学習
エンコーダはImageNet-1kデータセットで事前学習されており、強力な特徴抽出能力を持っています。

モデル能力

画像特徴抽出
セマンティックセグメンテーションタスクの微調整

使用事例

コンピュータビジョン
シーン理解
ADE20Kなどのシーン解析データセットのセマンティックセグメンテーションに使用されます。
都市シーン分析
Cityscapesデータセットで道路、建物などの都市シーン要素のセグメンテーションを行います。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase