O

Otpensource Vision

由hateslopacademy開發
基於Bllossom/llama-3.2-Korean-Bllossom-AICA-5B訓練的視覺語言模型,支持韓語和英語,專注於時尚領域的圖像轉文本和文本分類任務。
下載量 14
發布時間 : 1/25/2025

模型概述

otpensource-vision是一個結合視覺和語言能力的多模態模型,能夠分析圖像中的時尚元素並生成結構化文本描述,同時支持純文本的自然語言處理任務。

模型特點

多語言視覺理解
支持韓語和英語的視覺語言處理,能夠從圖像中提取時尚相關信息
時尚領域優化
使用專業時尚數據集訓練,擅長分析服裝類別、顏色、季節等時尚元素
結構化輸出
能夠生成JSON格式的結構化輸出,便於系統集成和進一步處理
商業友好許可
採用CC-BY-4.0許可證,允許商業用途

模型能力

圖像轉文本
時尚元素分析
多語言文本生成
情感分析
文本分類

使用案例

電子商務
商品自動標註
自動分析商品圖片並生成包含類別、顏色等信息的結構化描述
可生成JSON格式的商品信息
時尚推薦系統
基於視覺分析為用戶推薦風格匹配的時尚單品
內容生成
社交媒體內容創作
根據時尚圖片自動生成描述性文字內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase