AerialMegaDepthオープンソースモデル - 航空撮影画像から3Dシーンを再構築し、無料で新しい視点を生成する

ホーム

Checkpoint Aerial Mast3r

kvuong2711によって開発

AerialMegaDepthは航空写真からの3Dシーン再構築と新規視点生成に特化した深層学習モデルです。

3Dビジョン

Safetensors

#空中・地上3次元再構築 #クロスビュー合成 #大規模シーン建模

ダウンロード数 15

リリース時間 : 4/20/2025

モデル概要

このモデルは航空写真と地上視点の画像データを組み合わせ、マルチビュー幾何学と深度推定を学習することで、高品質な3Dシーン再構築と視点合成を実現します。主にコンピュータビジョン分野、特に3D再構築や拡張現実などのシナリオに応用されます。

モデル特徴

空中・地上統合再構築

航空写真と地上視点の画像データを同時処理可能で、より包括的な3Dシーン再構築を実現

高品質視点合成

仮想ツアーなどのアプリケーションに適したリアルな新規視点画像を生成可能

ハイブリッドモデルアーキテクチャ

ViT大型ベースデコーダーと特別設計したメトリック学習モジュールを統合

モデル能力

3Dシーン再構築

新規視点合成

深度推定

マルチビュー画像処理

使用事例

都市モデリング

都市3Dモデリング

航空写真を利用した都市3Dモデルの再構築

高精度な都市3Dモデルを生成

バーチャルツーリズム

仮想シーンツアー

限られた視点画像から連続視点を生成

没入型の仮想観光体験を実現

拡張現実

ARシーン構築

実環境の3D表現を迅速に構築

ARアプリケーションに環境基盤を提供

属性	详情
ライブラリ名	aerial-megadepth
タグ	image-to-3d、model_hub_mixin、pytorch_model_hub_mixin
ベースモデル	naver/MASt3R_ViTLarge_BaseDecoder_512_catmlpdpt_metric

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Checkpoint Aerial Mast3r

モデル概要

モデル特徴

モデル能力

使用事例

🚀 AerialMegaDepth: 航空と地上の再構築とビュー合成の学習

🚀 クイックスタート

モデル情報

関連リンク

引用情報

著者

発表会