coreml - sam2 - largeオープンソース画像・動画セグメンテーションモデル - プロンプトベースの可視化セグメンテーションを無料で実現

ホーム

Coreml Sam2 Large

appleによって開発

SAM 2はFAIRが開発した画像と動画の汎用セグメンテーションモデルで、プロンプトベースの視覚的セグメンテーションタスクをサポートします。

画像セグメンテーションオープンソースライセンス:Apache-2.0 #プロンプト駆動セグメンテーション #クロスメディア汎用性 #CoreML最適化

ダウンロード数 25

リリース時間 : 9/13/2024

モデル概要

このモデルはSAM 2 LargeのCore MLバージョンで、画像と動画におけるプロンプトベースのセグメンテーションタスク向けに設計されており、SAM2 Studioデモアプリケーションに適しています。

モデル特徴

汎用セグメンテーション能力

画像と動画における様々なセグメンテーションタスクをサポートし、幅広い適用性を持ちます。

プロンプトベースのセグメンテーション

ユーザーが提供するプロンプトに基づいて正確なセグメンテーションが可能で、インタラクティブ性と柔軟性が向上します。

Core ML最適化

float16精度のCore ML形式に変換されており、Appleデバイスでの効率的な実行に適しています。

モデル能力

画像セグメンテーション

動画セグメンテーション

プロンプトベースのセグメンテーション

マスク生成

使用事例

コンピュータビジョン

画像編集

画像内のオブジェクトを迅速に分離し、後編集や処理を行います。

精密なオブジェクトマスクを生成

動画分析

動画フレーム内のオブジェクトを追跡・セグメンテーションします。

動画オブジェクトの連続的なセグメンテーションを実現

AR/VRアプリケーション

仮想オブジェクトインタラクション

拡張現実シーンで実世界のオブジェクトを認識・セグメンテーションします。

現実と仮想のインタラクション基盤を実現

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Coreml Sam2 Large

モデル概要

モデル特徴

モデル能力

使用事例

🚀 SAM2 Large Core ML

🚀 クイックスタート

📦 インストール

📄 ライセンス

📚 ドキュメント

引用