Marigold Depth V1 0
安定拡散モデルをファインチューニングした単眼画像深度推定モデルで、アフィン不変性を持ち、自然シーンの深度予測に適している
Downloads 92.50k
Release Time : 12/5/2023
Model Overview
このモデルは単一画像から推定深度マップを生成するために使用され、Stable Diffusion 2モデルをファインチューニングしており、ゼロショット学習をサポートします
Model Features
アフィン不変深度推定
モデルが予測する深度値は0から1の範囲で、アフィン不変性を持ち、異なるスケールのシーンに適用可能
ゼロショット学習能力
特定シーンの訓練データがなくても深度推定が可能
効率的な推論
1ステップの推論で良好な予測結果が得られ、10-50ステップ使用すればより正確な結果が得られる
不確実性推定
複数の予測を統合すると、不確実性マップを生成可能
Model Capabilities
単眼画像深度推定
自然シーン分析
深度マップ生成
不確実性定量化
Use Cases
コンピュータビジョン
3Dシーン再構築
単一画像からシーンの深度情報を推定
3Dモデリングやシーン理解に利用可能
拡張現実
ARアプリケーションに深度情報を提供
よりリアルな現実と仮想の融合効果を実現
ロボットビジョン
自律ナビゲーション
ロボットに環境の深度知覚を提供
経路計画や障害物回避を支援
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98