F

FLIP Base 32

FLIP-datasetによって開発
これはCLIPアーキテクチャに基づく視覚言語モデルで、特に顔画像に対して8000万枚の画像で追加学習されています。
ダウンロード数 16
リリース時間 : 6/28/2023

モデル概要

このモデルはCLIPアーキテクチャに基づき、8000万枚の顔画像による追加学習を通じて、顔関連タスクでの性能を強化しています。顔認識、画像検索などのタスクに適しています。

モデル特徴

大規模顔データ学習
8000万枚の顔画像を使用した追加学習により、顔関連タスクでのモデル性能を強化
CLIPアーキテクチャベース
CLIPモデルの強力な視覚言語アライメント能力を継承
効率的な学習
8枚のA100 GPUを使用した学習、TencentPretrainフレームワークによる学習効率の最適化

モデル能力

顔画像特徴抽出
画像-テキストマッチング
顔画像検索
クロスモーダル理解

使用事例

顔認識
顔認証
2枚の顔画像が同一人物に属するかどうかを検証
顔検索
大規模データベース内での類似顔検索
コンテンツモデレーション
顔コンテンツフィルタリング
不適切な顔コンテンツの識別とフィルタリング
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase