U

Upernet Swin Small

smp-hubによって開発
Swin Transformer小型アーキテクチャをベースにしたUPerNetセマンティックセグメンテーションモデル、ADE20Kなどのシーン解析タスクに適しています
ダウンロード数 100
リリース時間 : 4/12/2025

モデル概要

このモデルはUPerNetアーキテクチャとSwin-Smallをエンコーダーとして組み合わせ、高精度なセマンティックセグメンテーションタスクに特化しており、特にシーン解析や画像セグメンテーションアプリケーションに適しています

モデル特徴

Swin Transformerバックボーンネットワーク
先進的なSwin-Smallをエンコーダーとして採用し、階層型ウィンドウアテンションメカニズムを組み合わせることで、マルチスケール特徴を効果的に捕捉します
UPerNetデコードアーキテクチャ
統一知覚解析ネットワーク(UPerNet)をデコーダーとして使用し、効率的なマルチスケール特徴融合を実現します
事前学習サポート
すぐに使える事前学習済み重みを提供し、HuggingFace Hubを通じて迅速にロード可能です
ADE20K最適化
ADE20Kシーン解析データセットに特化して最適化されており、150クラスのセマンティックセグメンテーションをサポートします

モデル能力

画像セマンティックセグメンテーション
シーン解析
ピクセルレベル分類
マルチスケール特徴抽出

使用事例

コンピュータビジョン
シーン理解
複雑なシーン内の様々な物体をピクセルレベルで識別・分割します
150クラスの物体を含む正確なセグメンテーションマスクを出力可能
自動運転知覚
道路シーン内の様々な要素(車両、歩行者、道路など)を解析します
リモートセンシング画像分析
衛星/航空画像内の地物を分類・分割します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase