J

Japanese Stable Vlm

由stabilityai開發
一款視覺語言指令跟隨模型,能夠為輸入圖像生成日語描述,並可選地處理輸入文本(如問題)。
下載量 122
發布時間 : 11/1/2023

模型概述

日語穩定視覺語言模型是一款結合視覺與語言處理能力的模型,主要用於圖像描述生成和視覺問答任務,特別針對日語場景優化。

模型特點

日語視覺語言理解
專門針對日語優化的視覺語言處理能力,能夠準確理解日語指令和生成日語描述
多任務支持
支持圖像描述生成、標籤輔助描述和視覺問答等多種視覺語言任務
兩階段訓練
採用兩階段訓練策略,先訓練MLP投影層,再微調語言模型和投影層,提高模型性能

模型能力

圖像描述生成
視覺問答
日語文本處理
多模態理解

使用案例

內容生成
圖像自動標註
為圖像生成詳細的日語描述
生成符合圖像內容的自然語言描述
智能問答
視覺問答系統
回答關於圖像內容的日語問題
提供準確的圖像相關問答
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase