MASt3Rオープンソース画像から3Dモデルへ - 無料でデプロイして画像と3D空間の正確なマッチングを実現

ホーム

Mast3r ViTLarge BaseDecoder 512 Catmlpdpt Metric

naverによって開発

MASt3RはViTアーキテクチャに基づく画像から3Dへの変換モデルで、画像と3D空間のマッチングを実現

3Dビジョン

Safetensors

#画像3Dマッチング #非計量空間再構築 #マルチ解像度処理

ダウンロード数 116.60k

リリース時間 : 7/9/2024

モデル概要

このモデルは主に2D画像を3D空間表現に変換し、画像と3D空間の正確なマッチングを実現、DUSt3R技術を改良

モデル特徴

マルチ解像度サポート

512x384から512x160までの様々な入力解像度をサポート

非計量出力

3D空間情報を非計量方式で処理

ハイブリッドアーキテクチャ

ViT-LargeエンコーダーとViT-Baseデコーダーの利点を組み合わせ

モデル能力

2D画像から3D空間への変換

マルチビュー画像マッチング

3Dシーン再構築

使用事例

コンピュータビジョン

拡張現実

現実世界の画像と仮想3D空間を整合

より正確なAR体験を実現

3Dモデリング

単一または複数の画像から3Dモデルを再構築

3Dモデリングプロセスを簡素化

🚀 MASt3Rによる3D空間での画像マッチング

MASt3Rは、3D空間における画像マッチングを行うためのモデルです。このモデルは、高度な画像解析技術を用いて、3D空間での画像の対応付けを行います。

🚀 クイックスタート

まずは、mast3rをインストールします。モデルをロードするには、以下のコードを実行します。

💻 使用例

基本的な使用法

from mast3r.model import AsymmetricMASt3R
import torch

model = AsymmetricMASt3R.from_pretrained("naver/MASt3R_ViTLarge_BaseDecoder_512_catmlpdpt_nonmetric")

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

📚 ドキュメント

引用情報

@misc{mast3r_arxiv24,
      title={Grounding Image Matching in 3D with MASt3R}, 
      author={Vincent Leroy and Yohann Cabon and Jerome Revaud},
      year={2024},
      eprint={2406.09756},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

@inproceedings{dust3r_cvpr24,
      title={DUSt3R: Geometric 3D Vision Made Easy}, 
      author={Shuzhe Wang and Vincent Leroy and Yohann Cabon and Boris Chidlovskii and Jerome Revaud},
      booktitle = {CVPR},
      year = {2024}
}

モデル情報

Gihubページ: https://github.com/naver/mast3r/

プロパティ	詳細
モデル名	MASt3R_ViTLarge_BaseDecoder_512_catmlpdpt_nonmetric
訓練解像度	512x384, 512x336, 512x288, 512x256, 512x160
ヘッド	CatMLP+DPT
エンコーダ	ViT-L
デコーダ	ViT-B

📄 ライセンス

コードはCC BY - NC - SA 4.0ライセンスの下で配布されています。詳細については、LICENSEを参照してください。
チェックポイントについては、CC - BY - NC - SA 4.0に加えて、使用したすべての公開訓練データセットとベースチェックポイントのライセンスに同意する必要があります。
特に、mapfreeデータセットのライセンスは非常に制限的です。詳細については、CHECKPOINTS_NOTICEを確認してください。