H

Heron Chat Blip Ja Stablelm Base 7b V1 Llava 620k

由turing-motors開發
一個能夠就輸入圖像進行對話的視覺語言模型,支持日語交互
下載量 25
發布時間 : 2/27/2024

模型概述

該模型基於BLIP2架構,結合日語StableLM基礎Alpha版語言模型,能夠處理圖像輸入並進行自然語言對話

模型特點

日語視覺對話
專門針對日語優化的視覺問答能力
高效架構
結合BLIP2視覺編碼器和StableLM語言模型
全面微調
使用LLaVA-Instruct-620K-JA數據集進行訓練

模型能力

圖像理解
日語對話
視覺問答
圖像描述生成

使用案例

聊天應用
圖像對話機器人
用戶上傳圖片後與AI進行關於圖片內容的對話
能夠理解圖片內容並生成相關回答
研究用途
多模態研究
用於視覺語言模型相關研究
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase