FLIP-base-32オープンソースビジュアル言語モデル - 8000万枚の顔画像で訓練され、顔画像アプリケーションに適しています

ホーム

FLIP Base 32

FLIP-datasetによって開発

これはCLIPアーキテクチャに基づく視覚言語モデルで、特に顔画像に対して8000万枚の画像で追加学習されています。

マルチモーダル融合

Transformers

オープンソースライセンス:Apache-2.0 #顔CLIPモデル #大規模顔事前学習 #マルチモーダル対照学習

ダウンロード数 16

リリース時間 : 6/28/2023

モデル概要

このモデルはCLIPアーキテクチャに基づき、8000万枚の顔画像による追加学習を通じて、顔関連タスクでの性能を強化しています。顔認識、画像検索などのタスクに適しています。

モデル特徴

大規模顔データ学習

8000万枚の顔画像を使用した追加学習により、顔関連タスクでのモデル性能を強化

CLIPアーキテクチャベース

CLIPモデルの強力な視覚言語アライメント能力を継承

効率的な学習

8枚のA100 GPUを使用した学習、TencentPretrainフレームワークによる学習効率の最適化

モデル能力

顔画像特徴抽出

画像-テキストマッチング

顔画像検索

クロスモーダル理解

使用事例

顔認識

顔認証

2枚の顔画像が同一人物に属するかどうかを検証

顔検索

大規模データベース内での類似顔検索

コンテンツモデレーション

顔コンテンツフィルタリング

不適切な顔コンテンツの識別とフィルタリング

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

FLIP Base 32

モデル概要

モデル特徴

モデル能力

使用事例

🚀 FaceCLIP-base-32

🚀 クイックスタート

💻 使用例

基本的な使用法

📄 ライセンス