Olmocr 7B 0725 FP8

O

Olmocr 7B 0725 FP8

由allenai開發

olmOCR-7B-0725-FP8是基於Qwen2.5-VL-7B-Instruct模型，使用olmOCR-mix-0225數據集微調後量化為FP8版本的文檔OCR模型。

圖像生成文本

英語開源協議:Apache-2.0 #文檔圖像OCR #FP8量化 #大規模文檔處理

下載量 881

發布時間 : 7/22/2025

模型概述

該模型專注於文檔圖像的文字識別，能夠處理包含文本的文檔圖像，並提取其中的文字內容。

模型特點

FP8量化

使用llmcompressor工具將原始模型量化為FP8版本，提高推理效率

文檔OCR優化

專門針對文檔圖像進行優化，能夠準確識別文檔中的文字內容

大規模處理能力

通過sglang支持高效推理，適合處理數百萬文檔的大規模應用場景

模型能力

文檔圖像文字識別

多語言文本提取

大規模文檔處理

使用案例

文檔數字化

歷史文檔數字化

將紙質歷史文檔轉換為可搜索的數字文本

企業文檔處理

自動化處理企業大量合同、報告等文檔

教育研究

學術論文分析

從掃描的學術論文中提取文本內容進行分析

精選推薦AI模型

Qwen2.5 VL 7B Abliterated Caption It I1 GGUF

Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本，支持多語言圖像描述任務。

圖像生成文本

Transformers 支持多種語言

Nunchaku Flux.1 Dev Colossus

Colossus Project Flux 的 Nunchaku 量化版本，旨在根據文本提示生成高質量圖像。該模型在優化推理效率的同時，將性能損失降至最低。

圖像生成英語

Qwen2.5 VL 7B Abliterated Caption It GGUF

這是一個基於Qwen2.5-VL-7B模型的靜態量化版本，專注於圖像描述生成任務，支持多種語言。

圖像生成文本

Transformers 支持多種語言

Olmocr 7B 0725 FP8

olmOCR-7B-0725-FP8是基於Qwen2.5-VL-7B-Instruct模型，使用olmOCR-mix-0225數據集微調後量化為FP8版本的文檔OCR模型。

圖像生成文本

Transformers 英語

Lucy-128k是基於Qwen3-1.7B開發的專注於代理式網絡搜索和輕量級瀏覽的模型，在移動設備上也能高效運行。

大型語言模型

Transformers 英語

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase