# 高解像度ビジョン

Oryx 1.5 7B
Apache-2.0
Oryx-1.5-7BはQwen2.5言語モデルを基に開発された7Bパラメータモデルで、32Kトークンのコンテキストウィンドウをサポートし、任意の空間サイズと時間長の視覚入力を効率的に処理することに特化しています。
テキスト生成ビデオ Safetensors 複数言語対応
O
THUdyh
133
7
Sapiens Depth 1b Bfloat16
Sapiensは3億枚の1024x1024解像度のポートレート画像で事前学習されたビジョントランスフォーマーモデルで、人間中心の視覚タスクに特化しています。
3Dビジョン 英語
S
facebook
37
0
Sapiens Depth 2b Bfloat16
Sapiens-2Bは3億枚の高解像度人体画像で事前学習されたビジョントランスフォーマーモデルで、人体深度推定タスクに最適化されており、1K解像度の推論をサポートし、実シーンでの優れた汎化能力を有します。
3Dビジョン 英語
S
facebook
17
0
Sapiens Pretrain 0.3b
Sapiensは3億枚の高解像度人間画像で事前学習されたビジョントランスフォーマーモデルで、人間中心の視覚タスク向けに設計されています。
画像分類 英語
S
facebook
34
1
Sapiens Pretrain 1b
Sapiensは3億枚の高解像度人間画像で事前学習されたビジョントランスフォーマーモデルで、人間中心の視覚タスクに特化しています。
人の顔に関係がある 英語
S
facebook
48
1
Sapiens Depth 2b Torchscript
Sapiensは3億枚の1024×1024解像度人体画像で事前学習されたビジョンTransformerモデルで、人体中心の視覚タスク向けに設計されており、優れた汎化能力を備えています。
3Dビジョン 英語
S
facebook
58
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase