Olmocr 7B 0725 FP8

O

Olmocr 7B 0725 FP8

由 allenai 开发

olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型，使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。

图像生成文本

英语开源协议:Apache-2.0 #文档图像OCR #FP8量化 #大规模文档处理

下载量 881

发布时间 : 7/22/2025

模型简介

该模型专注于文档图像的文字识别，能够处理包含文本的文档图像，并提取其中的文字内容。

模型特点

FP8量化

使用llmcompressor工具将原始模型量化为FP8版本，提高推理效率

文档OCR优化

专门针对文档图像进行优化，能够准确识别文档中的文字内容

大规模处理能力

通过sglang支持高效推理，适合处理数百万文档的大规模应用场景

模型能力

文档图像文字识别

多语言文本提取

大规模文档处理

使用案例

文档数字化

历史文档数字化

将纸质历史文档转换为可搜索的数字文本

企业文档处理

自动化处理企业大量合同、报告等文档

教育研究

学术论文分析

从扫描的学术论文中提取文本内容进行分析

精选推荐AI模型

Qwen2.5 VL 7B Abliterated Caption It I1 GGUF

Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本，支持多语言图像描述任务。

图像生成文本

Transformers 支持多种语言

Nunchaku Flux.1 Dev Colossus

Colossus Project Flux 的 Nunchaku 量化版本，旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时，将性能损失降至最低。

图像生成英语

Qwen2.5 VL 7B Abliterated Caption It GGUF

这是一个基于Qwen2.5-VL-7B模型的静态量化版本，专注于图像描述生成任务，支持多种语言。

图像生成文本

Transformers 支持多种语言

Olmocr 7B 0725 FP8

olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型，使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。

图像生成文本

Transformers 英语

Lucy-128k是基于Qwen3-1.7B开发的专注于代理式网络搜索和轻量级浏览的模型，在移动设备上也能高效运行。

大型语言模型

Transformers 英语

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase