S

Sapiens Seg 0.6b Bfloat16

facebookによって開発
Sapiensは3億枚の1024x1024解像度の人間画像で事前学習された視覚Transformerモデルファミリーで、人間中心の視覚タスクに特化しています。
ダウンロード数 24
リリース時間 : 9/10/2024

モデル概要

このモデルは人間画像の28種類の身体部位セグメンテーションに使用され、1K高解像度推論をサポートし、実シーンで優れた汎化能力を示します。

モデル特徴

高解像度サポート
ネイティブで1K高解像度推論をサポートし、画像サイズは1024x768まで可能です。
強力な汎化能力
アノテーションデータが不足している場合や完全に合成された場合でも、実データに対する優れた汎化能力を発揮します。
大規模事前学習
3億枚の1024x1024解像度人間画像に基づいて事前学習されています。

モデル能力

人体画像セグメンテーション
高解像度画像処理
多クラス身体部位認識

使用事例

医療画像
身体部位セグメンテーション
医療画像において人体の各部位を正確にセグメンテーションするために使用されます。
28種類の身体部位のセグメンテーションをサポート
仮想現実
バーチャルアバター作成
高精度の仮想人体アバターを作成するために使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase