モデル選定

3Dシーン再構築

# 3Dシーン再構築

MIDIは単一画像から組み合わせ式3Dシーンを生成する生成モデルです。

Lightglue Superpoint

LightGlueは、コンピュータビジョンにおける特徴マッチングと姿勢推定の問題に使用される、効率的なキーポイント検出とマッチングモデルです。

Align3r DepthPro ViTLarge BaseDecoder 512 Dpt

Align3R は単眼ビデオから時間的一貫性のあるビデオ深度、動的点群、およびカメラ姿勢を推定するモデルです。

Dpt Beit Large 384

BEiTバックボーンネットワークに基づく単眼深度推定モデルで、単一画像から詳細な深度情報を推測可能

Control V11f1p Sd15 Depth

ControlNet v1.1 は ControlNet v1.0 の後継モデルで、深度画像条件を用いて Stable Diffusion の画像生成を制御します。

画像生成その他

T2iadapter Depth Sd15v2

T2Iアダプターは安定拡散モデルに追加の条件制御を提供するネットワークで、このチェックポイントは安定拡散1.5バージョン向けの深度条件制御専用です。

画像生成その他

Control V11f1p Sd15 Depth

ControlNet v1.1 は ControlNet v1.0 の後継モデルで、深度画像条件を追加することで Stable Diffusion モデルの生成を制御します。

画像生成その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase