Olmocr 7B 0725 FP8
O

Olmocr 7B 0725 FP8

由allenai開發
olmOCR-7B-0725-FP8是基於Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225數據集微調後量化為FP8版本的文檔OCR模型。
下載量 881
發布時間 : 7/22/2025

模型概述

該模型專注於文檔圖像的文字識別,能夠處理包含文本的文檔圖像,並提取其中的文字內容。

模型特點

FP8量化
使用llmcompressor工具將原始模型量化為FP8版本,提高推理效率
文檔OCR優化
專門針對文檔圖像進行優化,能夠準確識別文檔中的文字內容
大規模處理能力
通過sglang支持高效推理,適合處理數百萬文檔的大規模應用場景

模型能力

文檔圖像文字識別
多語言文本提取
大規模文檔處理

使用案例

文檔數字化
歷史文檔數字化
將紙質歷史文檔轉換為可搜索的數字文本
企業文檔處理
自動化處理企業大量合同、報告等文檔
教育研究
學術論文分析
從掃描的學術論文中提取文本內容進行分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase