L

Llava Jp 1.3b V1.0

由toshi456開發
LLaVA-JP是一個能夠就輸入圖像進行對話的日語視覺語言模型,基於LLaVA方法對llm-jp-1.3b-v1.0進行微調訓練而成。
下載量 30
發布時間 : 12/4/2023

模型概述

該模型能夠理解圖像內容並生成日語描述或回答相關問題,是一個多模態視覺語言模型。

模型特點

日語視覺理解
專門針對日語優化的視覺語言理解能力
多階段訓練
採用兩階段訓練方法,先預訓練視覺投影器,再進行微調
多模態交互
能夠同時處理圖像和文本輸入,進行自然對話

模型能力

圖像理解
日語文本生成
視覺問答
圖像描述生成

使用案例

圖像理解與描述
圖像內容描述
分析圖像內容並生成日語描述
能夠準確識別圖像中的物體和場景
視覺問答
基於圖像的問答
回答關於圖像內容的日語問題
能夠理解問題並給出相關回答
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase