M

Mit B1

Developed by nvidia
SegFormerはTransformerアーキテクチャに基づくセマンティックセグメンテーションモデルで、階層型エンコーダと軽量MLPデコーダを採用しています。
Downloads 7,305
Release Time : 3/2/2022

Model Overview

このモデルはSegFormerのプリトレーニング済みエンコーダ部分で、ImageNet-1kでファインチューニングされており、セマンティックセグメンテーションタスクの転移学習に適しています。

Model Features

階層型Transformerアーキテクチャ
マルチスケール特徴抽出の階層設計を採用し、異なるレベルの視覚的特徴を効果的に捉えることが可能
軽量MLPデコーダ
従来の畳み込みデコーダと比較して計算効率が高く、パラメータ数も少ない
ImageNetプリトレーニング
エンコーダはImageNet-1kでプリトレーニングされており、強力な特徴抽出能力を有する

Model Capabilities

画像セマンティックセグメンテーション
視覚的特徴抽出
転移学習

Use Cases

コンピュータビジョン
シーン理解
屋内・屋外シーンのピクセル単位のセマンティックセグメンテーション
ADE20KやCityscapesなどのベンチマークテストで優れた性能
自動運転
道路シーンの解析と物体認識
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase