S

Sapiens Seg 0.3b Torchscript

facebookによって開発
Sapiensは3億枚の1024x1024解像度の人間画像で事前学習されたビジョントランスフォーマーモデルファミリーで、1K高解像度推論をサポートし、アノテーションデータが不足しているか完全に合成された場合でも実データに対する優れた汎化能力を発揮します。
ダウンロード数 56
リリース時間 : 9/9/2024

モデル概要

Seg 0.3Bモデルは人間画像の28種類の身体部位セグメンテーションに使用できます。

モデル特徴

高解像度対応
1K高解像度推論をネイティブサポート、画像サイズは1024x768です。
強力な汎化能力
アノテーションデータが不足しているか完全に合成された場合でも、実データに対する優れた汎化能力を発揮します。
効率的な計算
計算量は1.242 TFLOPs、ブロックサイズ16x16、埋め込み次元1024です。

モデル能力

人間画像セグメンテーション
高解像度画像処理
28種類の身体部位認識

使用事例

医療画像
身体部位セグメンテーション
医療画像において人体の各部位を正確に分割するために使用されます。
28種類の身体部位セグメンテーションをサポートします。
仮想現実
バーチャルアバター作成
仮想現実アプリケーションで高精度な人体モデルを作成するために使用されます。
高解像度対応により、バーチャルアバターのディテール表現が向上します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase