C

Chinese Clip Vit Large Patch14

OFA-Sysによって開発
中国語CLIPモデル、VITアーキテクチャベース、中国語視覚言語タスクをサポート
ダウンロード数 2,333
リリース時間 : 11/9/2022

モデル概要

これはVision Transformerアーキテクチャに基づく中国語CLIPモデルで、画像とテキストの共同表現学習を処理でき、クロスモーダル検索と分類タスクに適しています。

モデル特徴

中国語クロスモーダル理解
中国語シーンに特化して最適化された視覚言語共同表現モデル
効率的な視覚エンコーディング
ViTアーキテクチャに基づき、画像入力を効率的に処理可能
ゼロショット分類能力
テキスト記述に基づくゼロショット画像分類をサポート

モデル能力

画像テキストマッチング
クロスモーダル検索
ゼロショット画像分類
中国語視覚言語理解

使用事例

コンテンツ審査
違反コンテンツ検出
テキスト記述を通じて違反画像コンテンツを検出
特定タイプの違反コンテンツを識別可能
電子商取引
商品検索
テキスト記述を通じて関連商品画像を検索
商品検索精度向上
ソーシャルメディア
コンテンツ推薦
ユーザー興味に基づき関連画像テキストコンテンツを推薦
ユーザーエンゲージメント向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase