D

Donut Base Finetuned Cord V2

Developed by Xenova
Donut是一個基於Swin Transformer的視覺文檔理解模型,專門針對CORD數據集進行了微調,能夠從圖像中提取結構化文本信息。
Downloads 32
Release Time : 9/5/2023

Model Overview

該模型是基於Donut架構的視覺文檔理解模型,經過CORD數據集的微調,能夠處理文檔圖像並提取其中的結構化文本信息。

Model Features

視覺文檔理解
能夠從文檔圖像中提取結構化文本信息,適用於各種文檔處理場景。
基於Swin Transformer
採用先進的Swin Transformer架構,具有強大的視覺特徵提取能力。
網頁端兼容
已轉換為ONNX格式,可通過Transformers.js在網頁端使用。

Model Capabilities

文檔圖像處理
結構化文本提取
視覺特徵識別

Use Cases

文檔處理
收據信息提取
從收據圖像中自動提取商家、金額、日期等結構化信息
提高數據錄入效率,減少人工處理
表單識別
識別各種表單中的字段和內容
實現表單數據的自動化處理
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase