C

Clip Vit Base Patch32 Lego Brick

由armaggheddon97開發
基於CLIP模型微調的樂高積木圖像-文本匹配模型,專為識別樂高積木及其描述設計。
下載量 44
發布時間 : 1/24/2025

模型概述

此模型是在樂高積木描述數據集上微調的CLIP模型,用於準確匹配樂高積木圖像與其對應的文本描述,幫助用戶通過描述或圖片找到特定積木。

模型特點

高精度匹配
模型經過微調,能夠以高置信度準確匹配樂高積木圖像與文本描述。
零樣本分類
支持零樣本圖像分類,無需額外訓練即可對新類別進行分類。
多模態處理
同時處理圖像和文本輸入,生成對應的嵌入向量。

模型能力

圖像分類
文本-圖像匹配
生成圖像嵌入
生成文本嵌入

使用案例

樂高積木識別
積木搜索
通過文本描述或上傳圖片查找特定樂高積木。
模型能夠以高置信度返回最匹配的積木結果。
零樣本分類
對新的樂高積木類別進行分類,無需額外訓練。
在測試數據集上準確率達到99.23%。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase