S

Sapiens Pretrain 0.6b

facebookによって開発
Sapiensは3億枚の1024×1024解像度人体画像で事前学習された視覚Transformerモデルで、人間中心の視覚タスクに優れています。
ダウンロード数 13
リリース時間 : 9/10/2024

モデル概要

6億パラメータの視覚Transformerモデルで、1K高解像度推論をネイティブサポートし、注釈データが不足している場合や完全に合成データの場合でも実データに対して優れた汎化能力を示します。

モデル特徴

高解像度サポート
1024×1024解像度画像処理をネイティブサポート
データ効率
注釈データが不足している場合や完全に合成データの場合でも良好に汎化
大規模事前学習
3億枚の人体画像に基づいて事前学習

モデル能力

人体画像特徴抽出
高解像度画像処理
視覚表現学習

使用事例

コンピュータビジョン
人体姿勢推定
高解像度画像から人体姿勢特徴を抽出
バーチャルアバター生成
リアルなデジタルヒューマン生成に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase