Coreml Depth Anything Small
Depth AnythingはDPTアーキテクチャとDINOv2バックボーンネットワークに基づく深度推定モデルで、約6200万枚の画像で訓練され、相対的および絶対的深度推定タスクで最先端の結果を達成しています。
ダウンロード数 51
リリース時間 : 5/3/2024
モデル概要
このモデルはDPTアーキテクチャを採用し、DINOv2バックボーンネットワークに基づいており、画像深度推定タスクに特化し、単一画像から深度情報を予測できます。
モデル特徴
大規模訓練データ
約6200万枚の画像で訓練されており、モデルに強力な汎化能力を保証します
効率的なアーキテクチャ
DPTアーキテクチャとDINOv2バックボーンネットワークに基づき、精度を維持しながら効率的な推論を実現します
マルチプラットフォームサポート
Core MLフォーマットモデルを提供し、Appleデバイスで効率的に動作します
精度最適化
Float32とFloat16の2つの精度バージョンを提供し、精度とパフォーマンスのニーズをバランスさせます
モデル能力
単眼深度推定
相対深度予測
絶対深度予測
画像深度分析
使用事例
コンピュータビジョン
拡張現実
ARアプリケーションにシーン深度情報を提供します
ARオブジェクト配置とインタラクションのリアリズムを向上させます
3D再構築
単一画像から深度マップを生成します
3Dシーン再構築を支援します
自動運転
車両周辺環境の知覚を支援します
シーン深度情報を提供します
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98