Chronodepth V1
ChronoDepthは動画拡散事前分布に基づく時間的一貫性のある動画深度学習手法で、動画から深度情報を学習し予測できます。
ダウンロード数 28
リリース時間 : 12/2/2024
モデル概要
このモデルは動画拡散事前分布技術を活用し、動画深度推定の時間的一貫性を実現し、動画深度予測タスクに適しています。
モデル特徴
時間的一貫性
動画拡散事前分布技術により、動画深度予測の時間的一貫性を保証
動画深度推定
単一画像ではなく動画データに特化した深度推定
拡散モデルベース
安定した動画拡散モデルを基本アーキテクチャとして利用
モデル能力
動画深度推定
時間的一貫性予測
動画解析
使用事例
コンピュータビジョン
動画深度予測
入力動画に対してフレームごとの深度予測を実施
時間的一貫性のある深度マップシーケンスを生成
拡張現実/仮想現実
3Dシーン再構築
動画入力に基づく3Dシーンの再構築
AR/VRアプリケーションにおけるシーン理解に利用可能
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98