V

Vintern 3B R Beta

由5CD-AI開發
Vintern-3B-R-beta是一個多模態大語言模型,專注於基於圖像的複雜推理任務,能分解推理步驟並有效控制幻覺現象。
下載量 1,841
發布時間 : 3/19/2025

模型概述

該模型結合了視覺和語言處理能力,擅長處理結構化文檔圖像和複雜問題推理,支持越南語、英語和中文。

模型特點

複雜推理能力
能夠基於圖像進行長鏈條複雜推理,將推理步驟分解為多個子步驟
多語言支持
支持越南語、英語和中文三種語言處理
幻覺控制
在推理過程中有效控制幻覺現象的產生
多模態處理
結合視覺和語言處理能力,處理結構化文檔圖像

模型能力

圖像理解
複雜推理
多語言文本生成
結構化文檔處理
OCR文本提取

使用案例

餐飲行業
菜單價格分析
從餐廳菜單圖像中提取菜品信息並比較價格
準確識別最高價菜品
政府文檔處理
公文文本提取
從政府公文圖像中提取完整文本內容
準確提取越南語政府公文內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase