S

Segformer B5 Finetuned Cityscapes 1024 1024

nvidiaによって開発
1024x1024解像度でCityScapesデータセットにファインチューニングされたSegFormerセマンティックセグメンテーションモデルで、階層型Transformerエンコーダと軽量な全MLPデコーダヘッドアーキテクチャを採用しています。
ダウンロード数 31.18k
リリース時間 : 3/2/2022

モデル概要

このモデルはセマンティックセグメンテーションタスク向けに設計されており、特に都市景観シーンの画像分割に適しています。Transformerアーキテクチャに基づき、ADE20Kや都市景観などのベンチマークで優れた性能を発揮します。

モデル特徴

階層型Transformerアーキテクチャ
階層型Transformerエンコーダを採用し、マルチスケール特徴を効果的に抽出可能
軽量デコーダヘッド
全MLP設計の軽量デコーダヘッドを使用し、高速な推論速度を維持
高解像度対応
1024x1024の高解像度入力をサポートし、精密なセグメンテーションタスクに適応

モデル能力

画像セマンティックセグメンテーション
都市景観解析
多クラス物体認識

使用事例

インテリジェント交通
道路シーン理解
都市道路シーンにおける車両、歩行者、道路などのピクセルレベル分割
サンプル画像では道路領域を正確に分割できることが示されています
都市計画
都市景観分析
都市建築物、緑地などの要素分布を自動識別・統計
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase