Clipseg Rd16
CLIPベースのゼロショットおよびワンショット画像セグメンテーションモデル、テキストと画像プロンプトをサポート
ダウンロード数 5,256
リリース時間 : 11/4/2022
モデル概要
このモデルはCLIPSegの次元削減バージョン(16次元に削減)で、ゼロショットおよびワンショット画像セグメンテーションタスク向けに設計されており、テキストまたは画像プロンプトに基づいて画像セグメンテーションが可能です。
モデル特徴
ゼロショットセグメンテーション
トレーニング不要で新規カテゴリの画像セグメンテーションが可能
マルチモーダルプロンプト
テキストと画像の両方をセグメンテーションプロンプトとしてサポート
次元削減処理
オリジナルCLIPSegモデルの次元削減バージョン(16次元に削減)
モデル能力
画像セグメンテーション
ゼロショット学習
ワンショット学習
マルチモーダル処理
使用事例
コンピュータビジョン
テキストベースの画像セグメンテーション
テキスト記述に基づいて画像内の対応領域を自動分割
テキスト記述のオブジェクトを識別・分割可能
サンプル画像ベースのセグメンテーション
サンプル画像に基づいて対象画像内の類似領域を自動分割
サンプル画像と類似するオブジェクトを識別・分割可能
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98