S

Segformer B2 Finetuned Cityscapes 1024 1024

nvidiaによって開発
SegFormerはTransformerアーキテクチャに基づくセマンティックセグメンテーションモデルで、CityScapesデータセットでファインチューニングされており、1024x1024解像度の画像セグメンテーションタスクに適しています。
ダウンロード数 2,179
リリース時間 : 3/2/2022

モデル概要

このモデルは階層型Transformerエンコーダーと軽量な全MLPデコーダーヘッドアーキテクチャを採用しており、都市景観などのシーンで優れた性能を発揮するセマンティックセグメンテーションタスク専用です。

モデル特徴

効率的なTransformerアーキテクチャ
階層型Transformerエンコーダーを採用し、効率性を維持しながら優れたセマンティックセグメンテーション性能を実現
軽量MLPデコーダーヘッド
全MLP構造のデコーダーヘッドを使用し、従来のデコーダーに比べてより軽量で効率的
高解像度サポート
1024x1024解像度画像に最適化されており、高精度セグメンテーションタスクに適している

モデル能力

画像セマンティックセグメンテーション
都市景観認識
道路シーン解析

使用事例

インテリジェント交通
道路シーンセグメンテーション
都市道路シーンをピクセルレベルでセマンティックセグメンテーションし、道路、車両、歩行者などの要素を識別
Cityscapesデータセットで優れた性能を発揮
都市計画
都市景観分析
都市景観構成を分析し、建物、緑地、道路などの領域を識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase