F

Florence 2 FT DocVQA

由sahilnishad開發
基於Florence-2-base微調的文檔視覺問答模型,專門用於處理文檔圖像中的問答任務。
下載量 4,928
發布時間 : 11/2/2024

模型概述

該模型在DocumentVQA數據集上進行了微調,能夠理解文檔圖像內容並回答相關問題,適用於各種文檔分析場景。

模型特點

文檔圖像理解
能夠解析和理解文檔圖像中的內容和結構
問答能力
針對文檔內容提供準確的問答功能
多模態處理
同時處理視覺和文本信息,實現跨模態理解

模型能力

文檔圖像分析
視覺問答
文本提取
跨模態理解

使用案例

文檔處理
合同分析
從合同文檔中提取關鍵條款和條件
發票處理
識別發票中的金額、日期和供應商信息
教育
試卷批改
自動批改學生答卷並提取答案
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase