Typhoon Ocr 7b
專為泰英雙語現實場景文檔解析打造的視覺語言模型,基於Qwen2.5-VL-Instruction框架
圖像生成文本
Transformers 支持多種語言

T
scb10x
126
9
Qwen Vl 2.5 3B Finetuned Cheque
一款視覺語言模型,專門用於從支票圖像中提取結構化的金融信息,生成包含支票號碼、收款人、金額和簽發日期等關鍵信息的JSON格式輸出。
圖像生成文本
Transformers 英語

Q
AJNG
170
1
Qwen2 VL 2B OCR
Apache-2.0
Qwen2-VL-2B-OCR是基於unsloth/Qwen2-VL-2B-Instruct微調的OCR模型,專注於從文檔、表格和工資單圖像中提取完整文本。
圖像生成文本
Transformers 英語

Q
JackChew
842
4
Sk Invoice Receipts
Apache-2.0
基於Donut架構微調的實驗性模型,專用於將發票或收據圖像轉換為XML或JSON數據結構,無需傳統OCR引擎。
圖像生成文本
Transformers

S
selvakumarcts
201
39
Invoice And Receipts Donut V1
Apache-2.0
基於Donut架構的大型語言模型,專為發票和收據圖像轉換為結構化數據而設計
圖像生成文本
Transformers

I
mychen76
2,945
54
Tatr Tab Struct V2
基於PubTables1M和FinTabNet數據集訓練的DETR架構模型,專用於表格結構識別任務
文字識別
Transformers

T
deepdoctection
99
2
Layout Xlm Base Finetuned With DocLayNet Base At Linelevel Ml384
MIT
基於LayoutXLM基礎模型在DocLayNet數據集上微調的行級別文檔理解模型,支持多語言文檔佈局分析和標記分類。
文字識別
Transformers 支持多種語言

L
pierreguillou
103
3
Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Paragraphlevel Ml512
MIT
這是一個文檔理解模型,專門用於分析文檔佈局和內容,在段落級別進行標記分類任務。
文字識別
Transformers 支持多種語言

L
pierreguillou
126
3
Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Linelevel Ml384
MIT
基於LiLT和DocLayNet數據集微調的行級別文檔理解模型,支持多語言文檔佈局分析
圖像生成文本
Transformers 支持多種語言

L
pierreguillou
700
12
Donut Base Payslips
MIT
基於Donut架構的文檔理解模型,專門針對工資單圖像處理進行微調
文字識別
Transformers

D
Assadullah
20
0
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98