D

Dpt Large Ade20k

smp-hubによって開発
Transformerアーキテクチャに基づくセマンティックセグメンテーションモデルで、ADE20Kデータセットに最適化されています
ダウンロード数 279
リリース時間 : 4/6/2025

モデル概要

DPTはTransformerベースのセマンティックセグメンテーションモデルで、Vision Transformerをエンコーダーとして使用し、高解像度画像のセグメンテーションタスクを効率的に処理できます。このモデルはADE20Kデータセットで事前学習されており、シーン理解タスクに適しています。

モデル特徴

Transformerベースのアーキテクチャ
Vision Transformerをエンコーダーとして採用し、長距離依存関係を捉えることができます
動的画像サイズサポート
異なるサイズの入力画像を処理できます
事前学習済み重み
ADE20Kデータセットで事前学習されており、下流タスクに直接使用できます

モデル能力

画像セマンティックセグメンテーション
シーン理解
ピクセルレベル分類

使用事例

コンピュータビジョン
シーン解析
複雑なシーン内の各要素をピクセルレベルで分類します
150の異なるカテゴリの物体や領域を識別できます
自動運転環境認識
道路シーンの様々な要素を解析します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase