LayoutLMv3-finetuned-DocLayNet Open-source Document Layout Analysis Model - Precise Handling of Document Element Classification

Layoutlmv3 Finetuned DocLayNet

Developed by Mit1208

A document layout analysis model fine-tuned based on the LayoutLMv3 architecture, specifically designed for document element classification tasks in the DocLayNet dataset.

Text Recognition

Transformers

English#Document Layout Analysis #Multimodal Token Classification #High-precision OCR

Downloads 226

Release Time : 3/24/2023

Model Overview

This model is a fine-tuned version based on microsoft/layoutlmv3-base, primarily used for token classification tasks in document images, capable of identifying and classifying different layout elements in documents.

Model Features

Document Layout Understanding

Capable of understanding the visual layout and textual content of documents, identifying different element regions within documents.

Multimodal Processing

Simultaneously processes textual content and visual layout information for more accurate document analysis.

Efficient Fine-tuning

Fine-tuned based on the pre-trained LayoutLMv3 model, delivering excellent performance on specific tasks.

Model Capabilities

Document Layout Analysis

Visual Text Classification

Document Element Recognition

Use Cases

Document Processing

Contract Analysis

Automatically identifies elements such as headings, paragraphs, and signature areas in contract documents.

F1 score reaches 0.6667

Academic Paper Parsing

Extracts sections such as abstracts, main text, figures, and references from academic papers.

Digital Office

Table Recognition

Identifies table regions and content from scanned documents.

Training Loss	Epoch	Step	Validation Loss	Precision	Recall	F1	Accuracy
1.3383	0.58	200	0.8358	0.3007	0.4381	0.3566	0.7724
0.8308	1.16	400	0.6735	0.4634	0.5429	0.5	0.8084
0.518	1.74	600	0.5706	0.5373	0.6857	0.6025	0.8399
0.3856	2.33	800	0.6303	0.6032	0.7238	0.6580	0.8648
0.2558	2.91	1000	0.5644	0.6179	0.7238	0.6667	0.8720

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Layoutlmv3 Finetuned DocLayNet

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 layoutlmv3-finetuned-DocLayNet

🚀 Quick Start

📚 Documentation

Model description

Intended uses & limitations

Training and evaluation data

🔧 Technical Details

Training procedure

Training hyperparameters

Training results

Framework versions

How to Train & Inference

📄 License