S

Sam Hq Vit Huge

syscv-communityによって開発
SAM-HQはSegment Anything Model(SAM)の強化版で、より高品質な物体マスクを生成でき、特に複雑な構造の物体処理に適しています。
ダウンロード数 516
リリース時間 : 5/5/2025

モデル概要

SAM-HQは高品質出力トークンとグローバル-ローカル特徴融合技術を導入することで、セグメンテーションマスクの品質を大幅に向上させつつ、オリジナルSAMのプロンプト設計、効率性、ゼロショット汎化能力を維持しています。

モデル特徴

高品質出力トークン
特別に設計された学習可能なトークンで、マスクデコーダーに注入され、より正確なセグメンテーションマスクを予測します。
グローバル-ローカル特徴融合
マスクデコーダー特徴を初期および最終ViT特徴と融合し、高レベルな意味情報と低レベルな境界情報を組み合わせてマスクの詳細を改善します。
効率的な改良
パラメータを0.5%未満しか増加させず、8GPUで4時間のトレーニング時間で、セグメンテーション品質を大幅に向上させます。
ゼロショット汎化
オリジナルSAMのゼロショット汎化能力を維持し、未見のデータに直接適用できます。

モデル能力

高品質画像セグメンテーション
プロンプトベースのセグメンテーション(点、ボックスなど)
自動マスク生成
ゼロショット転移学習

使用事例

画像編集
精密な物体抽出
複雑な背景から物体を精密にセグメンテーションし、詳細や薄い構造を保持します
オリジナルSAMと比較して、物体の境界詳細をより良く保持できます
自動化アノテーション
高品質データアノテーション
トレーニングデータアノテーションのための正確な物体マスクを自動生成します
手動アノテーション作業を削減し、アノテーション品質を向上させます
医療画像分析
医療構造セグメンテーション
医療画像中の微細な構造をセグメンテーションします
高精度セグメンテーションが必要な医療アプリケーションに適しています
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase