D

Dpt Swinv2 Tiny 256

Developed by Intel
SwinV2バックボーンネットワークに基づくDPTモデルで、単眼深度推定用に140万枚の画像でトレーニングされました。
Downloads 2,285
Release Time : 12/10/2023

Model Overview

このモデルはMiDaS 3.1バージョンの一部で、SwinV2トランスフォーマーをバックボーンネットワークとして採用し、単一画像からの深度情報推定に焦点を当てています。生成AI、3D再構築、自動運転などの分野に適しています。

Model Features

SwinV2バックボーンネットワークに基づく
SwinV2トランスフォーマーをバックボーンネットワークとして採用し、階層型トランスフォーマーの利点を組み合わせることで、深度推定の効率と精度を向上させました。
大規模トレーニングデータ
140万枚の画像でトレーニングされ、多様なシーンをカバーすることで、モデルの汎化能力を強化しました。
ゼロショット転移能力
ゼロショット転移をサポートし、新しいシーンで微調整なしに適用できます。

Model Capabilities

単眼深度推定
ゼロショット転移
画像深度分析

Use Cases

コンピュータビジョン
3D再構築
単一画像から深度情報を推定し、3Dシーン再構築に使用します。
自動運転
自動運転システムにおける環境認識と障害物検出に使用します。
生成AI
生成AIに深度情報を提供し、画像生成のリアリズムを向上させます。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase