H

Heron NVILA Lite 15B

由turing-motors開發
Heron-NVILA-Lite-15B 是一款基於 NVILA-Lite 架構、專為日語訓練的視覺語言模型,支持日語和英語,具備圖文理解和生成能力。
下載量 936
發布時間 : 3/23/2025

模型概述

該模型是一款多模態視覺語言模型,能夠處理圖像和文本輸入,生成文本輸出。主要用於日語和英語的圖文對話、圖像描述等任務。

模型特點

多模態能力
能夠同時處理圖像和文本輸入,實現圖文交互
日語優化
專門針對日語進行了訓練和優化
高效架構
採用NVILA-Lite架構,平衡性能和效率
多階段訓練
經過三階段訓練過程,提升模型性能

模型能力

圖像理解
文本生成
圖文對話
多語言支持
多圖交替理解

使用案例

圖像理解
圖像描述
根據輸入圖像生成描述性文本
能夠準確描述圖像內容
視覺問答
圖像問答
回答關於圖像內容的問題
在評測中獲得3.82/5分的表現
多模態對話
圖文交替對話
處理包含多張圖片和文本的複雜對話
能夠理解上下文並生成連貫回覆
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase