E

Erax VL 2B V1.5 Q4 K M GGUF

由Ngoac開發
這是一個多模態視覺問答模型,支持越南語、英語和中文,基於erax-ai/EraX-VL-2B-V1.5轉換的GGUF格式版本。
下載量 55
發布時間 : 1/2/2025

模型概述

該模型是一個視覺問答(VQA)模型,能夠處理圖像和文本輸入,生成相關答案。特別適用於保險、光學字符識別(OCR)等場景。

模型特點

多語言支持
支持越南語、英語和中文三種語言的視覺問答任務
GGUF格式優化
轉換為GGUF格式,便於在llama.cpp等工具上高效運行
多模態能力
能夠同時處理圖像和文本輸入,進行跨模態理解
行業應用優化
特別針對保險和OCR等應用場景進行了優化

模型能力

視覺問答
圖像理解
多語言處理
文本生成

使用案例

保險
保險單據處理
自動識別和分析保險單據中的信息
醫療
處方識別
識別醫療處方中的文字和內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase