2025年最高の 177 個の3Dビジョンツール

Hunyuan3d 2
その他
テンセントが提供する先進的な3D合成システムで、画像やテキストから高解像度のテクスチャ付き3Dアセットを生成可能
3Dビジョン 複数言語対応
H
tencent
490.00k
1,314
TRELLIS Image Large
MIT
TRELLIS Image Largeは大型3D生成モデルTRELLISの画像条件版で、入力画像に基づいて3Dコンテンツを生成できます。
3Dビジョン 英語
T
microsoft
463.44k
520
Depth Anything V2 Small Hf
Apache-2.0
Depth Anything V2は現在最も強力な単眼深度推定モデルで、59.5万枚の合成注釈画像と6200万枚以上の実写無注釈画像でトレーニングされ、微細なディテールとロバスト性を備えています。
3Dビジョン Transformers
D
depth-anything
438.72k
15
Dpt Large
Apache-2.0
ビジュアルトランスフォーマー(ViT)に基づく単眼深度推定モデルで、140万枚の画像で訓練され、ゼロショット深度予測タスクに適しています。
3Dビジョン Transformers
D
Intel
364.62k
187
Dpt Hybrid Midas
Apache-2.0
ビジョントランスフォーマー(ViT)に基づく単眼深度推定モデル、140万枚の画像でトレーニング
3Dビジョン Transformers
D
Intel
224.05k
94
VGGT 1B
VGGTはフィードフォワードニューラルネットワークで、シーンの1つ、いくつか、または数百のビューから、数秒ですべての重要な3D属性を推論できます。
3Dビジョン 英語
V
facebook
196.31k
40
Depth Anything Large Hf
Apache-2.0
Depth AnythingはDPTアーキテクチャとDINOv2バックボーンネットワークに基づく深度推定モデルで、約6200万枚の画像でトレーニングされ、相対的および絶対的深度推定タスクで最先端の結果を達成しました。
3Dビジョン Transformers
D
LiheYoung
147.17k
51
Depth Anything V2 Large
Depth Anything V2は現在最も強力な単眼深度推定モデルで、大量の合成画像と実画像で訓練され、精密な深度詳細と高い頑健性を提供します。
3Dビジョン 英語
D
depth-anything
130.54k
94
Mast3r ViTLarge BaseDecoder 512 Catmlpdpt Metric
MASt3RはViTアーキテクチャに基づく画像から3Dへの変換モデルで、画像と3D空間のマッチングを実現
3Dビジョン
M
naver
116.60k
15
Depth Anything Small Hf
Apache-2.0
Depth AnythingはDPTアーキテクチャに基づく深度推定モデルで、DINOv2バックボーンネットワークを採用し、約6200万枚の画像でトレーニングされ、相対的および絶対的深度推定タスクで優れた性能を発揮します。
3Dビジョン Transformers
D
LiheYoung
97.89k
29
Marigold Depth V1 0
Apache-2.0
安定拡散モデルをファインチューニングした単眼画像深度推定モデルで、アフィン不変性を持ち、自然シーンの深度予測に適している
3Dビジョン 英語
M
prs-eth
92.50k
127
Depth Anything V2 Large Hf
Depth Anything V2は現在最も強力な単眼深度推定(MDE)モデルで、59.5万枚の合成注釈画像と6200万枚以上の実写無注釈画像でトレーニングされており、より細かいディテールと強力なロバスト性を備えています。
3Dビジョン Transformers
D
depth-anything
83.99k
19
Depth Anything V2 Base
Depth Anything V2は現在最も強力な単眼深度推定(MDE)モデルで、59.5万枚の合成注釈画像と6200万枚以上の実写無注釈画像でトレーニングされています
3Dビジョン 英語
D
depth-anything
66.95k
17
Depth Anything V2 Small
Apache-2.0
Depth Anything V2 は現在最も性能の高い単眼深度推定モデルで、大規模な合成画像と実画像でトレーニングされており、V1バージョンと比較してより細かい詳細を捕捉でき、よりロバストです。
3Dビジョン 英語
D
depth-anything
55.22k
64
Depthcrafter
その他
DepthCrafterは、カメラ姿勢やオプティカルフローなどの追加情報なしで、細かいディテールを持つ時間的に一貫した長い深度シーケンスをオープンワールドビデオに生成できるモデルです。
3Dビジョン
D
tencent
55.08k
91
Depth Anything V2 Metric Indoor Large Hf
Depth Anything V2をHypersim合成データセットで屋内メトリック深度推定用にファインチューニングしたバージョン、transformersライブラリ互換。
3Dビジョン Transformers
D
depth-anything
47.99k
9
Depth Anything V2 Base Hf
Depth Anything V2は現在最も強力な単眼深度推定モデルで、59.5万枚の合成注釈画像と6200万枚以上の実写無注釈画像でトレーニングされており、より細かいディテールとより強力なロバスト性を備えています。
3Dビジョン Transformers
D
depth-anything
47.73k
1
Dust3r ViTLarge BaseDecoder 512 Dpt
DUSt3Rは、画像から簡単に幾何学的3Dビジョンを実現するモデルで、単一または複数の画像から3Dシーンを再構築できます。
3Dビジョン
D
naver
46.93k
14
Lotus Depth G V1 0
Apache-2.0
Lotusは拡散モデルに基づく視覚基盤モデルで、高品質な密集予測タスクに特化しています。
3Dビジョン
L
jingheya
33.45k
21
Dpt Beit Base 384
MIT
DPTはBEiTバックボーンネットワークに基づく密集予測トランスフォーマーモデルで、単眼深度推定に使用され、140万枚の画像でトレーニングされています。
3Dビジョン Transformers
D
Intel
25.98k
1
Hunyuan3d 2mini
その他
Tencent Hunyuan3D 2miniは、軽量で効率的な画像から3Dモデルを生成するモデルで、パラメータ規模は6億、中国語と英語の入力をサポートしています。
3Dビジョン 複数言語対応
H
tencent
23.22k
69
Marigold Depth Lcm V1 0
Apache-2.0
潜在整合性蒸留法を用いてファインチューニングされた単眼深度推定モデルで、単一画像から深度マップを生成
3Dビジョン 英語
M
prs-eth
22.45k
55
Zoedepth Nyu Kitti
MIT
ZoeDepthはNYUとKITTIデータセットでファインチューニングされた深度推定モデルで、実際の測定単位で深度値を推定できます。
3Dビジョン Transformers
Z
Intel
20.32k
5
Yoso Normal V0 3
Apache-2.0
分散分散を低減することで安定したシャープな法線マップを生成するモデル
3Dビジョン
Y
Stable-X
20.30k
1
Trellis Normal V0 1
MIT
TRELLISの改良版で、2D画像を3Dモデルに変換することをサポートし、特に法線条件付け処理に対応しています。
3Dビジョン 英語
T
Stable-X
19.31k
10
Triposr
MIT
TripoSRはStability AIとTripo AIが共同開発した高速フィードフォワード型3D生成モデルで、単一画像からの迅速な3Dモデル再構築に特化しています。
3Dビジョン
T
stabilityai
19.25k
545
Depth Anything Vitl14
Depth Anything は大規模なラベルなしデータを活用して深度推定の可能性を解き放つ強力な深度推定モデルです。
3Dビジョン Transformers
D
LiheYoung
16.70k
42
Fast3r ViT Large 512
その他
fast3rは、Facebook Researchが開発した、画像から3Dへの変換に特化したモデルです。
3Dビジョン
F
jedyang97
16.34k
20
Depthpro Hf
DepthProは、高解像度で高精度な深度マップを生成できるゼロショットメトリック単眼深度推定のための基礎モデルです。
3Dビジョン Transformers
D
apple
13.96k
52
Openlrm Mix Base 1.1
OpenLRMは論文LRMのオープンソース実装で、単一画像から3Dモデルを生成可能。複数のサイズバージョンを含む。
3Dビジョン Transformers
O
zxhezexin
10.25k
6
Hunyuan3d 2mv
その他
混元3D - 2多視点版は、混元3D - 2を微調整したバージョンで、多視点で形状生成を制御できる高解像度テクスチャの3Dアセット生成モデルです。
3Dビジョン 複数言語対応
H
tencent
9,170
371
Depth Anything V2 Metric Indoor Base Hf
Depth Anything V2モデルを基に、屋内計量深度推定タスク向けにHypersim合成データセットでファインチューニングしたバージョン
3Dビジョン Transformers
D
depth-anything
9,056
1
Marigold Normals V0 1
Apache-2.0
安定拡散モデルをファインチューニングした単眼画像法線推定モデルで、単一のRGB画像から表面法線マップを予測可能
3Dビジョン 英語
M
prs-eth
8,845
4
Depth Anything Vits14
Depth Anythingは大規模なラベルなしデータを活用して性能を向上させた深度推定モデルで、単眼深度推定タスクに適しています。
3Dビジョン Transformers
D
LiheYoung
8,130
6
Glpn Nyu
Apache-2.0
GLPNモデルはNYUv2データセットで訓練され、単眼深度推定に使用され、グローバルとローカルのパスネットワークを組み合わせて高精度な深度予測を実現します。
3Dビジョン Transformers
G
vinvino02
7,699
22
Monst3r PO TA S W ViTLarge BaseDecoder 512 Dpt
MonST3Rは、動きが存在する状況で幾何形状を推定するシンプルな方法で、画像から3Dシーンを再構築できます。
3Dビジョン
M
Junyi42
7,641
17
Depth Anything Vitb14
Depth Anythingは大規模なラベルなしデータで訓練された深度推定モデルで、単一画像から深度情報を予測できます。
3Dビジョン Transformers
D
LiheYoung
7,152
3
Yoso Normal V1 8 1
Apache-2.0
拡散分散を低減することで安定したシャープな法線マップを生成するモデル
3Dビジョン
Y
Stable-X
7,080
3
Zoedepth Kitti
MIT
ZoeDepthは単眼深度推定のための視覚モデルで、KITTIデータセットでファインチューニングされており、ゼロショット転移可能なメトリック深度推定を実現します。
3Dビジョン Transformers
Z
Intel
7,037
2
Shap E
MIT
Shap-Eは拡散プロセスに基づくテキストから3D画像を生成するモデルで、テキストプロンプトに応じてテクスチャメッシュやニューラルラディアンスフィールドとしてレンダリング可能な3Dアセットを生成できます。
3Dビジョン
S
openai
6,109
234
Theia Base Patch16 224 Cddsv
その他
テイアはロボット学習向けの視覚基盤モデルで、複数の視覚基盤モデルを蒸留することで豊富な視覚表現能力を獲得しています
3Dビジョン Transformers
T
theaiinstitute
5,404
2
Triposg
MIT
TripoSGは大規模修正フローモデルに基づく高忠実度3D形状合成の基盤モデルで、単一画像から高品質な3Dメッシュを生成できます。
3Dビジョン
T
VAST-AI
5,402
101
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase