FLIP Base 32
F
FLIP Base 32
FLIP-datasetによって開発
これはCLIPアーキテクチャに基づく視覚言語モデルで、特に顔画像に対して8000万枚の画像で追加学習されています。
ダウンロード数 16
リリース時間 : 6/28/2023
モデル概要
このモデルはCLIPアーキテクチャに基づき、8000万枚の顔画像による追加学習を通じて、顔関連タスクでの性能を強化しています。顔認識、画像検索などのタスクに適しています。
モデル特徴
大規模顔データ学習
8000万枚の顔画像を使用した追加学習により、顔関連タスクでのモデル性能を強化
CLIPアーキテクチャベース
CLIPモデルの強力な視覚言語アライメント能力を継承
効率的な学習
8枚のA100 GPUを使用した学習、TencentPretrainフレームワークによる学習効率の最適化
モデル能力
顔画像特徴抽出
画像-テキストマッチング
顔画像検索
クロスモーダル理解
使用事例
顔認識
顔認証
2枚の顔画像が同一人物に属するかどうかを検証
顔検索
大規模データベース内での類似顔検索
コンテンツモデレーション
顔コンテンツフィルタリング
不適切な顔コンテンツの識別とフィルタリング
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98