S

Sam Vit Large

facebookによって開発
SAMは入力プロンプト点やバウンディングボックスから高品質な物体マスクを生成できる視覚モデルで、ゼロショット転移能力を備えています。
ダウンロード数 455.43k
リリース時間 : 4/19/2023

モデル概要

Segment Anything Model (SAM)は入力プロンプト点やバウンディングボックスから高品質な物体マスクを生成でき、画像内の全ての物体に対してマスクを作成できます。このモデルは1100万枚の画像と11億のマスクを含むデータセットで訓練されており、様々なセグメンテーションタスクで強力なゼロショット性能を発揮します。

モデル特徴

ゼロショット転移能力
モデルは新しい画像分布やタスクに対して優れたゼロショット性能を示し、完全教師あり結果に匹敵あるいはそれを上回ります。
大規模訓練データ
1100万枚の画像と11億のマスクを含むデータセットで訓練されており、現在最大規模のセグメンテーションデータセットです。
マルチモーダルプロンプト入力
点やバウンディングボックスなど様々な形式のプロンプト入力をサポートしています。
効率的なアーキテクチャ設計
視覚エンコーダー、プロンプトエンコーダー、マスクデコーダーの3モジュール設計を採用し、効率的なセグメンテーションを実現しています。

モデル能力

画像セグメンテーション
物体マスク生成
ゼロショット転移
プロンプトベースセグメンテーション

使用事例

コンピュータビジョン
物体セグメンテーション
点やバウンディングボックスのプロンプト入力により、画像中の特定物体を正確にセグメント化します。
高品質な物体マスクを生成
自動画像セグメンテーション
人手によるプロンプトなしで、画像内の全ての物体に対してセグメンテーションマスクを自動生成します。
ゼロショットスタイルの自動セグメンテーションを実現
産業応用
製品品質検査
製品表面の欠陥検出や部品セグメンテーションに使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase