L

Llava V1.5 13B GPTQ

由TheBloke開發
Llava v1.5 13B是由Haotian Liu開發的多模態模型,結合了視覺和語言能力,能夠理解和生成基於圖像和文本的內容。
下載量 131
發布時間 : 10/15/2023

模型概述

Llava v1.5 13B是一個基於Llama架構的多模態模型,支持圖像和文本的聯合處理,適用於視覺問答、圖像描述生成等任務。

模型特點

多模態能力
結合視覺和語言處理能力,能夠理解和生成基於圖像和文本的內容。
高效量化
提供多種GPTQ量化版本,適應不同硬件需求,降低推理成本。
高性能
基於Llama架構,具有強大的推理和生成能力。

模型能力

圖像理解
文本生成
視覺問答
圖像描述生成

使用案例

教育
視覺問答
根據圖像內容回答用戶提出的問題。
提供準確且詳細的答案。
內容生成
圖像描述生成
為圖像生成詳細的文字描述。
生成自然且準確的描述文本。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase