C

Clip Fa Vision

由SajjadAyoubi開發
CLIPfa是OpenAI CLIP模型的波斯語版本,通過對比學習連接波斯語文本與圖像表示
下載量 43
發布時間 : 3/2/2022

模型概述

基於對比學習的多模態模型,可將波斯語文本與圖像映射到共享的向量空間,實現跨模態檢索與匹配

模型特點

波斯語適配
使用Farahani的RoBERTa-fa作為文本編碼器,專門優化波斯語文本理解
輕量級訓練
僅用40萬組數據(原版1/10)完成有效訓練
雙模態對齊
視覺與文本編碼器輸出768維共享向量空間

模型能力

波斯語圖文匹配
跨模態向量檢索
圖像語義搜索
文本引導圖像分類

使用案例

多媒體檢索
波斯語圖像搜索
用波斯語描述搜索相關圖像
在2.5萬圖庫中展示檢索效果
內容審核
多語言違規內容識別
通過波斯語文本描述檢測違規圖像
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase