F

Florence 2 DocVQA

由impactframes開發
基於微軟Florence-2模型使用Docmatix數據集(5%數據量)微調1天的版本,適用於圖像文本理解任務
下載量 30
發布時間 : 10/4/2024

模型概述

該模型是Florence-2-large-ft的微調版本,專注於圖像與文本的聯合理解任務,通過特定領域數據增強性能

模型特點

領域適應微調
使用Docmatix數據集進行針對性微調,提升特定領域表現
多模態理解
能夠同時處理圖像和文本輸入,實現跨模態理解

模型能力

圖像文本理解
跨模態推理
視覺問答

使用案例

文檔理解
文檔圖像解析
從掃描文檔圖像中提取結構化信息
教育技術
教材內容分析
分析教材中的圖文內容並生成摘要
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase