E

Erax VL 7B V1.5

由mxw1998開發
EraX-VL-7B-V1.5是一款強大的多模態模型,專精於光學字符識別(OCR)和視覺問答(VQA),在多語言環境下表現卓越,尤其擅長越南語。
下載量 26
發布時間 : 4/23/2025

模型概述

基於Qwen/Qwen2-VL-7B-Instruct微調的多模態模型,擅長文檔識別、視覺問答和多輪推理,特別優化了越南語處理能力。

模型特點

卓越的越南語OCR能力
針對越南語文檔(如醫療表格、發票、身份證等)進行了優化,識別精度高
多輪視覺問答
支持基於圖像的複雜多輪問答和推理
多語言支持
除越南語外,還支持英語和中文處理
開源模型
基於Apache 2.0許可證開源,可自由使用和修改

模型能力

文檔信息提取
圖像內容描述
多輪視覺問答
多語言文本識別
醫療表格處理
商業單據分析

使用案例

醫療健康
醫療處方識別
從醫療處方中提取患者信息、藥品清單和劑量
準確識別越南語醫療文檔中的關鍵信息
體檢報告分析
解析體檢報告中的各項指標和診斷結果
結構化輸出體檢數據
金融服務
發票處理
自動識別發票中的金額、稅號和商品信息
提高財務處理效率
身份驗證
從身份證件中提取個人信息
簡化KYC流程
政府服務
證件處理
處理各類政府證件如駕駛證、車輛登記證等
自動化證件信息錄入
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase