すべてのカテゴリ

3Dビジョン

2025年最高の 177 個の3Dビジョンツール

テンセントが提供する先進的な3D合成システムで、画像やテキストから高解像度のテクスチャ付き3Dアセットを生成可能

3Dビジョン複数言語対応

TRELLIS Image Large

TRELLIS Image Largeは大型3D生成モデルTRELLISの画像条件版で、入力画像に基づいて3Dコンテンツを生成できます。

3Dビジョン英語

Depth Anything V2 Small Hf

Depth Anything V2は現在最も強力な単眼深度推定モデルで、59.5万枚の合成注釈画像と6200万枚以上の実写無注釈画像でトレーニングされ、微細なディテールとロバスト性を備えています。

ビジュアルトランスフォーマー(ViT)に基づく単眼深度推定モデルで、140万枚の画像で訓練され、ゼロショット深度予測タスクに適しています。

Dpt Hybrid Midas

ビジョントランスフォーマー(ViT)に基づく単眼深度推定モデル、140万枚の画像でトレーニング

VGGTはフィードフォワードニューラルネットワークで、シーンの1つ、いくつか、または数百のビューから、数秒ですべての重要な3D属性を推論できます。

3Dビジョン英語

Depth Anything Large Hf

Depth AnythingはDPTアーキテクチャとDINOv2バックボーンネットワークに基づく深度推定モデルで、約6200万枚の画像でトレーニングされ、相対的および絶対的深度推定タスクで最先端の結果を達成しました。

Depth Anything V2 Large

Depth Anything V2は現在最も強力な単眼深度推定モデルで、大量の合成画像と実画像で訓練され、精密な深度詳細と高い頑健性を提供します。

3Dビジョン英語

Mast3r ViTLarge BaseDecoder 512 Catmlpdpt Metric

MASt3RはViTアーキテクチャに基づく画像から3Dへの変換モデルで、画像と3D空間のマッチングを実現

Depth Anything Small Hf

Depth AnythingはDPTアーキテクチャに基づく深度推定モデルで、DINOv2バックボーンネットワークを採用し、約6200万枚の画像でトレーニングされ、相対的および絶対的深度推定タスクで優れた性能を発揮します。

Marigold Depth V1 0

安定拡散モデルをファインチューニングした単眼画像深度推定モデルで、アフィン不変性を持ち、自然シーンの深度予測に適している

3Dビジョン英語

Depth Anything V2 Large Hf

Depth Anything V2は現在最も強力な単眼深度推定(MDE)モデルで、59.5万枚の合成注釈画像と6200万枚以上の実写無注釈画像でトレーニングされており、より細かいディテールと強力なロバスト性を備えています。

Depth Anything V2 Base

Depth Anything V2は現在最も強力な単眼深度推定(MDE)モデルで、59.5万枚の合成注釈画像と6200万枚以上の実写無注釈画像でトレーニングされています

3Dビジョン英語

Depth Anything V2 Small

Depth Anything V2 は現在最も性能の高い単眼深度推定モデルで、大規模な合成画像と実画像でトレーニングされており、V1バージョンと比較してより細かい詳細を捕捉でき、よりロバストです。

3Dビジョン英語

DepthCrafterは、カメラ姿勢やオプティカルフローなどの追加情報なしで、細かいディテールを持つ時間的に一貫した長い深度シーケンスをオープンワールドビデオに生成できるモデルです。

Depth Anything V2 Metric Indoor Large Hf

Depth Anything V2をHypersim合成データセットで屋内メトリック深度推定用にファインチューニングしたバージョン、transformersライブラリ互換。

Depth Anything V2 Base Hf

Depth Anything V2は現在最も強力な単眼深度推定モデルで、59.5万枚の合成注釈画像と6200万枚以上の実写無注釈画像でトレーニングされており、より細かいディテールとより強力なロバスト性を備えています。

Dust3r ViTLarge BaseDecoder 512 Dpt

DUSt3Rは、画像から簡単に幾何学的3Dビジョンを実現するモデルで、単一または複数の画像から3Dシーンを再構築できます。

Lotus Depth G V1 0

Lotusは拡散モデルに基づく視覚基盤モデルで、高品質な密集予測タスクに特化しています。

Dpt Beit Base 384

DPTはBEiTバックボーンネットワークに基づく密集予測トランスフォーマーモデルで、単眼深度推定に使用され、140万枚の画像でトレーニングされています。

Hunyuan3d 2mini

Tencent Hunyuan3D 2miniは、軽量で効率的な画像から3Dモデルを生成するモデルで、パラメータ規模は6億、中国語と英語の入力をサポートしています。

3Dビジョン複数言語対応

Marigold Depth Lcm V1 0

潜在整合性蒸留法を用いてファインチューニングされた単眼深度推定モデルで、単一画像から深度マップを生成

3Dビジョン英語

Zoedepth Nyu Kitti

ZoeDepthはNYUとKITTIデータセットでファインチューニングされた深度推定モデルで、実際の測定単位で深度値を推定できます。

Yoso Normal V0 3

分散分散を低減することで安定したシャープな法線マップを生成するモデル

Trellis Normal V0 1

TRELLISの改良版で、2D画像を3Dモデルに変換することをサポートし、特に法線条件付け処理に対応しています。

3Dビジョン英語

TripoSRはStability AIとTripo AIが共同開発した高速フィードフォワード型3D生成モデルで、単一画像からの迅速な3Dモデル再構築に特化しています。

Depth Anything Vitl14

Depth Anything は大規模なラベルなしデータを活用して深度推定の可能性を解き放つ強力な深度推定モデルです。

Fast3r ViT Large 512

fast3rは、Facebook Researchが開発した、画像から3Dへの変換に特化したモデルです。

DepthProは、高解像度で高精度な深度マップを生成できるゼロショットメトリック単眼深度推定のための基礎モデルです。

Openlrm Mix Base 1.1

OpenLRMは論文LRMのオープンソース実装で、単一画像から3Dモデルを生成可能。複数のサイズバージョンを含む。

混元3D - 2多視点版は、混元3D - 2を微調整したバージョンで、多視点で形状生成を制御できる高解像度テクスチャの3Dアセット生成モデルです。

3Dビジョン複数言語対応

Depth Anything V2 Metric Indoor Base Hf

Depth Anything V2モデルを基に、屋内計量深度推定タスク向けにHypersim合成データセットでファインチューニングしたバージョン

Marigold Normals V0 1

安定拡散モデルをファインチューニングした単眼画像法線推定モデルで、単一のRGB画像から表面法線マップを予測可能

3Dビジョン英語

Depth Anything Vits14

Depth Anythingは大規模なラベルなしデータを活用して性能を向上させた深度推定モデルで、単眼深度推定タスクに適しています。

GLPNモデルはNYUv2データセットで訓練され、単眼深度推定に使用され、グローバルとローカルのパスネットワークを組み合わせて高精度な深度予測を実現します。

Monst3r PO TA S W ViTLarge BaseDecoder 512 Dpt

MonST3Rは、動きが存在する状況で幾何形状を推定するシンプルな方法で、画像から3Dシーンを再構築できます。

Depth Anything Vitb14

Depth Anythingは大規模なラベルなしデータで訓練された深度推定モデルで、単一画像から深度情報を予測できます。

Yoso Normal V1 8 1

拡散分散を低減することで安定したシャープな法線マップを生成するモデル

ZoeDepthは単眼深度推定のための視覚モデルで、KITTIデータセットでファインチューニングされており、ゼロショット転移可能なメトリック深度推定を実現します。

Shap-Eは拡散プロセスに基づくテキストから3D画像を生成するモデルで、テキストプロンプトに応じてテクスチャメッシュやニューラルラディアンスフィールドとしてレンダリング可能な3Dアセットを生成できます。

Theia Base Patch16 224 Cddsv

テイアはロボット学習向けの視覚基盤モデルで、複数の視覚基盤モデルを蒸留することで豊富な視覚表現能力を獲得しています

TripoSGは大規模修正フローモデルに基づく高忠実度3D形状合成の基盤モデルで、単一画像から高品質な3Dメッシュを生成できます。

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase