B

Brahmai Clip V0.1

brahmairesearchによって開発
ViT-L/14とマスクドセルフアテンションTransformerを基にしたCLIPモデルで、ゼロショット画像分類研究用
ダウンロード数 12.53k
リリース時間 : 6/13/2024

モデル概要

このモデルは画像とテキストのエンコーダをコントラスティブラーニングで訓練し、ゼロショット画像分類タスクをサポート、主に学術研究分野で使用

モデル特徴

ゼロショット学習能力
特定タスクのファインチューニングなしで画像分類タスクを実行可能
マルチモーダル理解
視覚情報とテキスト情報を同時処理し、クロスモーダル関連性を構築
研究指向設計
モデルの頑健性、汎化能力、バイアス問題の研究に特化して最適化

モデル能力

画像分類
クロスモーダル検索
ゼロショット学習

使用事例

学術研究
モデル頑健性研究
コンピュータビジョンモデルが異なる分類体系下で示す性能安定性を研究
バイアス分析
異なる人口統計グループ間でのモデル性能差を評価
性別分類精度>96%、人種分類約93%、年齢分類約63%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase