H

Heron Chat Git ELYZA Fast 7b V0

由turing-motors開發
一個能夠對輸入圖像進行對話的視覺語言模型,支持日語交互
下載量 17
發布時間 : 9/6/2023

模型概述

該模型基於GIT架構,結合ELYZA日語Llama-2 7B快速指令版語言模型,能夠處理圖像並生成相關文本描述或回答關於圖像的問題

模型特點

視覺語言理解
能夠理解圖像內容並進行相關對話
日語優化
專門針對日語進行訓練和優化
多階段訓練
先使用STAIR日文圖說數據集訓練,再使用LLaVA日語指令數據集和日語視覺基因組微調

模型能力

圖像描述生成
視覺問答
日語對話

使用案例

聊天應用
圖像內容問答
用戶上傳圖片並詢問相關問題,模型生成回答
能夠準確識別常見圖像內容並回答問題
輔助工具
圖像內容描述
為視障人士提供圖像內容描述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase