U

Upernet Swin Large

smp-hubによって開発
Swin Transformerアーキテクチャに基づくUPerNetセマンティックセグメンテーションモデル、高精度な画像分割タスクに適しています
ダウンロード数 110
リリース時間 : 4/12/2025

モデル概要

このモデルはUPerNetアーキテクチャとSwin-Largeをエンコーダーとして組み合わせ、セマンティックセグメンテーションタスク専用に設計されており、画像内の各ピクセルを分類識別できます。

モデル特徴

Swin Transformerバックボーンネットワーク
先進的なSwin-Largeをエンコーダーとして採用し、強力な特徴抽出能力を備えています
UPerNetデコーダーアーキテクチャ
UPerNetをデコーダーとして使用し、マルチスケールの特徴情報を効果的に統合します
事前学習サポート
事前学習済みの重みを提供し、推論やファインチューニングに直接使用できます
高解像度処理
512x512ピクセルの入力解像度をサポートします

モデル能力

画像セマンティックセグメンテーション
ピクセルレベル分類
シーン理解

使用事例

コンピュータビジョン
シーン解析
複雑なシーン画像に対してピクセルレベルのセマンティックセグメンテーションを実施
150の異なるカテゴリを識別可能
自動運転
道路シーン理解に使用され、道路、車両、歩行者などの要素を識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase