D

Docfusion

由 sc22mc 开发
DocFusion 是一个用于文档解析任务的统一框架,旨在解决现有文档解析方法中存在的系统复杂和性能受限等问题,为文档解析提供了更高效、统一的解决方案。
下载量 107
发布时间 : 1/28/2025

模型简介

DocFusion 是一个统一的文档解析框架,能够同时处理文档解析中的布局元素检测和识别任务,具有轻量级和高性能的特点。

模型特点

统一处理能力
提出 Gaussian-Kernel CrossEntropy Loss (GK-CEL),使生成式框架能够同时处理文档解析中的布局元素检测和识别任务。
轻量级模型
DocFusion 作为统一的文档解析模型,仅具有 0.28B 参数。
优质数据集
构建了 DocLatex-1.6M 数据集,为模型训练提供高质量的数据支持。
出色性能
在四个核心文档解析任务中表现出色,验证了统一方法的有效性。

模型能力

文档布局元素检测
文档元素识别
统一文档解析

使用案例

文档处理
文档布局分析
自动检测文档中的布局元素,如标题、段落、表格等。
在四个核心文档解析任务中表现出色
文档元素识别
识别文档中的具体元素内容,如文本、图像、公式等。
高质量的数据支持提升了识别准确率
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase