金融文檔處理

# 金融文檔處理

專為泰英雙語現實場景文檔解析打造的視覺語言模型，基於Qwen2.5-VL-Instruction框架

圖像生成文本

Transformers 支持多種語言

Qwen Vl 2.5 3B Finetuned Cheque

一款視覺語言模型，專門用於從支票圖像中提取結構化的金融信息，生成包含支票號碼、收款人、金額和簽發日期等關鍵信息的JSON格式輸出。

圖像生成文本

Transformers 英語

Qwen2 VL 2B OCR

Qwen2-VL-2B-OCR是基於unsloth/Qwen2-VL-2B-Instruct微調的OCR模型，專注於從文檔、表格和工資單圖像中提取完整文本。

圖像生成文本

Transformers 英語

Sk Invoice Receipts

基於Donut架構微調的實驗性模型，專用於將發票或收據圖像轉換為XML或JSON數據結構，無需傳統OCR引擎。

圖像生成文本

Invoice And Receipts Donut V1

基於Donut架構的大型語言模型，專為發票和收據圖像轉換為結構化數據而設計

圖像生成文本

Tatr Tab Struct V2

基於PubTables1M和FinTabNet數據集訓練的DETR架構模型，專用於表格結構識別任務

Layout Xlm Base Finetuned With DocLayNet Base At Linelevel Ml384

基於LayoutXLM基礎模型在DocLayNet數據集上微調的行級別文檔理解模型，支持多語言文檔佈局分析和標記分類。

Transformers 支持多種語言

Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Paragraphlevel Ml512

這是一個文檔理解模型，專門用於分析文檔佈局和內容，在段落級別進行標記分類任務。

Transformers 支持多種語言

Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Linelevel Ml384

基於LiLT和DocLayNet數據集微調的行級別文檔理解模型，支持多語言文檔佈局分析

圖像生成文本

Transformers 支持多種語言

Donut Base Payslips

基於Donut架構的文檔理解模型，專門針對工資單圖像處理進行微調

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase