S

Sapiens Depth 0.3b Torchscript

Developed by facebook
Sapiensは3億枚の1024x1024解像度の人間画像で事前学習された視覚変換器ファミリーで、深度推定タスクに使用されます。
Downloads 69
Release Time : 9/9/2024

Model Overview

Sapiens-0.3Bは人間画像の相対深度を推定するために特別に設計された視覚変換器モデルです。1K高解像度で優れた性能を発揮し、実世界のシーンにも汎化できます。

Model Features

高解像度サポート
1K高解像度推論をネイティブサポートし、高精度深度推定タスクに適しています。
強力な汎化能力
アノテーションデータが不足している場合や完全に合成されたデータであっても、実データに対して優れた汎化能力を示します。
大規模事前学習
3億枚の1024x1024解像度人間画像で事前学習されており、強力な特徴抽出能力を備えています。

Model Capabilities

人間画像深度推定
高解像度画像処理
実シーン汎化

Use Cases

コンピュータビジョン
仮想現実
仮想現実アプリケーションにおける人間深度推定に使用され、シーンのリアリズムを向上させます。
拡張現実
拡張現実アプリケーションで、より自然なインタラクションを実現するために人間深度を正確に推定します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase