S

Segformer B4 Finetuned Cityscapes 1024 1024

nvidiaによって開発
SegFormerはTransformerアーキテクチャに基づくセマンティックセグメンテーションモデルで、Cityscapesデータセットでファインチューニングされており、1024x1024解像度の画像セグメンテーションタスクに適しています。
ダウンロード数 10.06k
リリース時間 : 3/2/2022

モデル概要

このモデルは階層型Transformerエンコーダーと軽量な全MLPデコーダーヘッドアーキテクチャを採用し、セマンティックセグメンテーションタスク向けに設計されており、Cityscapesなどのベンチマークテストで優れた性能を発揮します。

モデル特徴

階層型Transformerエンコーダー
階層型Transformerアーキテクチャを採用し、マルチスケール特徴を効果的に抽出可能
軽量MLPデコーダーヘッド
全MLP構造のデコーダーヘッドを使用し、高速な推論速度を維持
高解像度対応
1024x1024解像度画像に最適化

モデル能力

画像セマンティックセグメンテーション
道路シーン理解
マルチカテゴリ物体認識

使用事例

自動運転
道路シーンセグメンテーション
都市道路シーンをピクセルレベルでセマンティックセグメンテーション
道路、車両、歩行者などの要素を正確に識別可能
都市測量
都市景観分析
航空写真やストリートビュー画像から建築物、植生などの情報を抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase