O

Olmocr 7B Thai V2

由Adun開發
優化後的olmOCR模型,專注於提升泰語文本識別的準確性,支持多語言和表格格式。
下載量 917
發布時間 : 4/21/2025

模型概述

olmOCR是一個基於視覺語言模型的OCR工具,經過微調以增強對泰語字符和數字的識別能力,適用於從PDF等文檔中提取文本。

模型特點

多語言與表格支持
支持多種語言字符及表格格式的識別。
開源特性
提供模型權重、微調數據集和推理代碼,便於開發者進行定製開發。
高準確性
基於250K文檔進行微調,確保識別的準確性。
API與CLI支持
可通過命令行或API(vLLM、SGlang)調用,便於集成到現有系統中。

模型能力

泰語文本識別
多語言字符識別
表格格式識別
PDF文本提取

使用案例

文檔處理
泰語文檔數字化
將泰語PDF文檔轉換為可編輯的純文本。
提升泰語字符識別的準確率。
多語言表格識別
從包含多種語言和表格的文檔中提取結構化數據。
支持複雜的文檔格式。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase