J

Japanese Stable Vlm

Developed by stabilityai
一款視覺語言指令跟隨模型,能夠為輸入圖像生成日語描述,並可選地處理輸入文本(如問題)。
Downloads 122
Release Time : 11/1/2023

Model Overview

日語穩定視覺語言模型是一款結合視覺與語言處理能力的模型,主要用於圖像描述生成和視覺問答任務,特別針對日語場景優化。

Model Features

日語視覺語言理解
專門針對日語優化的視覺語言處理能力,能夠準確理解日語指令和生成日語描述
多任務支持
支持圖像描述生成、標籤輔助描述和視覺問答等多種視覺語言任務
兩階段訓練
採用兩階段訓練策略,先訓練MLP投影層,再微調語言模型和投影層,提高模型性能

Model Capabilities

圖像描述生成
視覺問答
日語文本處理
多模態理解

Use Cases

內容生成
圖像自動標註
為圖像生成詳細的日語描述
生成符合圖像內容的自然語言描述
智能問答
視覺問答系統
回答關於圖像內容的日語問題
提供準確的圖像相關問答
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase