_

Spydaz Web AI Llava

由LeroyDyer開發
LLaVa是一個開源多模態聊天機器人,通過對LLaMA/Vicuna在GPT生成的多模態指令跟隨數據上進行微調訓練而成,專門為聊天/指令優化的多模態版本LLM。
下載量 30
發布時間 : 9/17/2024

模型概述

基於Transformer架構的自迴歸語言模型,支持視覺和語言的多模態交互,適用於複雜的指令跟隨和聊天場景。

模型特點

多模態能力
同時處理視覺和語言輸入,實現跨模態理解與生成
高效訓練
僅使用120萬公開數據,在單節點8-A100上1天完成訓練
非洲語言支持
特別優化對多種非洲語言的處理能力
學術任務優化
針對學術VQA任務進行專項優化

模型能力

視覺問答
多模態對話
跨語言翻譯
指令跟隨
知識推理
圖像描述生成

使用案例

教育
多語言學習助手
通過視覺和語言交互輔助語言學習
支持14種語言的學習交流
醫療
醫療視覺問答
解析醫學圖像並回答相關問題
企業
多模態客服系統
處理包含圖像和文本的客戶諮詢
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase