MIDI 3D
Apache-2.0
MIDIは単一画像から組み合わせ式3Dシーンを生成する生成モデルです。
3Dビジョン
M
VAST-AI
448
39
Lightglue Superpoint
その他
LightGlueは、コンピュータビジョンにおける特徴マッチングと姿勢推定の問題に使用される、効率的なキーポイント検出とマッチングモデルです。
姿勢推定
Transformers

L
ETH-CVG
316
20
Align3r DepthPro ViTLarge BaseDecoder 512 Dpt
Align3R は単眼ビデオから時間的一貫性のあるビデオ深度、動的点群、およびカメラ姿勢を推定するモデルです。
3Dビジョン
A
cyun9286
227
3
Dpt Beit Large 384
MIT
BEiTバックボーンネットワークに基づく単眼深度推定モデルで、単一画像から詳細な深度情報を推測可能
3Dビジョン
Transformers

D
Intel
135
0
Control V11f1p Sd15 Depth
Openrail
ControlNet v1.1 は ControlNet v1.0 の後継モデルで、深度画像条件を用いて Stable Diffusion の画像生成を制御します。
画像生成 その他
C
frankjoshua
28
1
T2iadapter Depth Sd15v2
Apache-2.0
T2Iアダプターは安定拡散モデルに追加の条件制御を提供するネットワークで、このチェックポイントは安定拡散1.5バージョン向けの深度条件制御専用です。
画像生成 その他
T
TencentARC
2,217
3
Control V11f1p Sd15 Depth
Openrail
ControlNet v1.1 は ControlNet v1.0 の後継モデルで、深度画像条件を追加することで Stable Diffusion モデルの生成を制御します。
画像生成 その他
C
lllyasviel
12.52k
54
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98