O

Olmocr 7B 0225 Preview

由FriendliAI開發
基於Qwen2-VL-7B-Instruct微調的文檔OCR模型,支持多語言文檔識別與元數據提取
下載量 322
發布時間 : 2/28/2025

模型概述

該模型是針對文檔OCR任務優化的多模態模型,能夠處理單頁文檔圖像並提取文本內容及文檔結構信息。

模型特點

多模態文檔理解
結合視覺與語言模型能力,同時處理圖像和文本信息
元數據提取
可識別文檔語言、旋轉校正、表格/圖表檢測等結構化信息
高效推理支持
通過sglang框架支持海量文檔批量處理

模型能力

文檔圖像識別
多語言文本提取
文檔結構分析
元數據生成
表格檢測
圖表檢測

使用案例

學術研究
論文數字化
將學術論文PDF轉換為結構化數字內容
提取文本內容及論文元數據
企業文檔處理
合同解析
自動識別合同文檔中的關鍵條款和結構
生成結構化合同數據
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase