Sam2 Hiera Large
FAIRが開発した画像とビデオ向けのプロンプト可能な視覚セグメンテーションの基礎モデル
Downloads 155.85k
Release Time : 8/2/2024
Model Overview
SAM 2は汎用的な視覚セグメンテーションモデルで、画像とビデオにおいてプロンプト可能なセグメンテーションタスクを実行できます。点やボックスなどのプロンプト方式によるインタラクティブなセグメンテーションをサポートしています。
Model Features
マルチモーダルプロンプトサポート
点やボックスなど複数のプロンプト方式によるインタラクティブなセグメンテーションをサポート
ビデオセグメンテーション能力
ビデオシーケンスを処理可能で、フレーム間のマスク伝播をサポート
効率的な推論
混合精度推論(bfloat16)をサポートし、計算効率を最適化
Model Capabilities
画像セグメンテーション
ビデオセグメンテーション
インタラクティブセグメンテーション
マスク生成
Use Cases
コンピュータビジョン
画像編集
編集用に画像から特定のオブジェクトを正確にセグメント
高品質なオブジェクトセグメンテーションマスク
ビデオ分析
ビデオ内のオブジェクト運動軌跡を追跡
フレーム間で一貫したオブジェクトセグメンテーション結果
ヒューマンコンピュータインタラクション
インタラクティブセグメンテーションツール
簡単なクリックやボックス選択で迅速にオブジェクトセグメンテーション結果を取得
リアルタイム応答のセグメンテーション結果
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98