S

Segformer B3 Finetuned Cityscapes 1024 1024

nvidiaによって開発
SegFormerはTransformerベースのセマンティックセグメンテーションモデルで、Cityscapesデータセットでファインチューニングされ、1024x1024解像度の画像セグメンテーションタスクに適しています。
ダウンロード数 2,678
リリース時間 : 3/2/2022

モデル概要

このモデルは階層型Transformerエンコーダと軽量全MLPデコーダヘッドアーキテクチャを採用し、セマンティックセグメンテーションタスクに特化しており、都市景観などのシーンで優れた性能を発揮します。

モデル特徴

階層型Transformerエンコーダ
階層型Transformerアーキテクチャを採用し、多尺度特徴を効果的に捉えることができます。
軽量MLPデコーダヘッド
全MLPデコーダヘッド設計を使用し、効率性を維持しながら正確なセグメンテーション結果を提供します。
高解像度対応
1024x1024の高解像度画像入力に対応し、細かいセグメンテーションタスクに適しています。

モデル能力

画像セマンティックセグメンテーション
都市景観分析
道路認識

使用事例

スマート交通
道路セグメンテーション
都市道路領域を識別してセグメント化します。
サンプル画像はモデルによる道路の正確なセグメンテーション結果を示しています。
都市管理
都市景観分析
都市環境の様々な要素を識別してセグメント化します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase