S

Sapiens Pretrain 0.6b

Developed by facebook
Sapiensは3億枚の1024×1024解像度人体画像で事前学習された視覚Transformerモデルで、人間中心の視覚タスクに優れています。
Downloads 13
Release Time : 9/10/2024

Model Overview

6億パラメータの視覚Transformerモデルで、1K高解像度推論をネイティブサポートし、注釈データが不足している場合や完全に合成データの場合でも実データに対して優れた汎化能力を示します。

Model Features

高解像度サポート
1024×1024解像度画像処理をネイティブサポート
データ効率
注釈データが不足している場合や完全に合成データの場合でも良好に汎化
大規模事前学習
3億枚の人体画像に基づいて事前学習

Model Capabilities

人体画像特徴抽出
高解像度画像処理
視覚表現学習

Use Cases

コンピュータビジョン
人体姿勢推定
高解像度画像から人体姿勢特徴を抽出
バーチャルアバター生成
リアルなデジタルヒューマン生成に使用
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase