D

DPT

vedantdalimkarによって開発
PyTorchベースの画像セグメンテーションモデル、Transformerアーキテクチャを使用した高密度予測タスク
ダウンロード数 92
リリース時間 : 3/22/2025

モデル概要

DPTはVision Transformerアーキテクチャに基づく画像セマンティックセグメンテーションモデルで、様々な高密度予測タスクに適しています。このモデルはsegmentation_models.pytorchライブラリを通じて提供され、複数の事前学習済みエンコーダとカスタム設定をサポートします。

モデル特徴

Transformerアーキテクチャ
Vision Transformerをエンコーダとして採用し、画像セグメンテーションタスクに適しています
柔軟な設定
エンコーダの深さ、特徴次元、出力ストライドなど、様々なパラメータ設定をサポート
事前学習サポート
事前学習済み重みと組み合わせて使用可能で、モデル性能を向上させます

モデル能力

画像セマンティックセグメンテーション
高密度予測
複数の入力解像度をサポート

使用事例

コンピュータビジョン
シーン理解
複雑なシーンをピクセルレベルでセマンティックセグメンテーション
医用画像分析
医用画像内の臓器や病変領域のセグメンテーション
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase