dpt - hybrid - midasオープンソース深度推定モデル、CNNとTransformerの長所を組み合わせて高精度に測定

ホーム

Dpt Hybrid Midas

Xenovaによって開発

Intelが開発したハイブリッド深度推定モデルで、畳み込みニューラルネットワークとTransformerアーキテクチャの利点を組み合わせている

3Dビジョン

Transformers

#深度推定 #ONNX形式 #ウェブ対応

ダウンロード数 23

リリース時間 : 11/11/2023

モデル概要

DPT-Hybrid-MiDaSは単眼深度推定のための深層学習モデルで、単一のRGB画像から深度マップを予測できます。このモデルはCNNの局所的特徴抽出能力とTransformerのグローバルな文脈理解能力を組み合わせています。

モデル特徴

ハイブリッドアーキテクチャ

CNNとTransformerの利点を組み合わせ、局所的な詳細を捉えつつグローバルな文脈を理解できる

高精度深度推定

単一のRGB画像から正確な深度マップを生成可能

Web互換

ONNX形式の重みを提供し、ウェブブラウザでの展開が容易

モデル能力

単眼深度推定

3Dシーン理解

画像深度分析

使用事例

コンピュータビジョン

拡張現実

ARアプリケーションにシーン深度情報を提供

よりリアルな仮想オブジェクト配置と遮蔽効果を実現

ロボットナビゲーション

ロボットが環境の3D構造を理解するのを支援

経路計画と障害物回避能力の向上

写真

被写界深度シミュレーション

深度マップに基づいて撮影後の被写界深度効果を調整

プロ級のボケ効果を作成可能

属性	详情
ベースモデル	Intel/dpt-hybrid-midas
ライブラリ名	transformers.js

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Dpt Hybrid Midas

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Intel/dpt-hybrid-midasのONNXモデル

🚀 クイックスタート