Olmocr 7B 0725 FP8
olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。
下载量 881
发布时间 : 7/22/2025
模型简介
该模型专注于文档图像的文字识别,能够处理包含文本的文档图像,并提取其中的文字内容。
模型特点
FP8量化
使用llmcompressor工具将原始模型量化为FP8版本,提高推理效率
文档OCR优化
专门针对文档图像进行优化,能够准确识别文档中的文字内容
大规模处理能力
通过sglang支持高效推理,适合处理数百万文档的大规模应用场景
模型能力
文档图像文字识别
多语言文本提取
大规模文档处理
使用案例
文档数字化
历史文档数字化
将纸质历史文档转换为可搜索的数字文本
企业文档处理
自动化处理企业大量合同、报告等文档
教育研究
学术论文分析
从扫描的学术论文中提取文本内容进行分析
精选推荐AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多语言图像描述任务。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时,将性能损失降至最低。
图像生成 英语
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
这是一个基于Qwen2.5-VL-7B模型的静态量化版本,专注于图像描述生成任务,支持多种语言。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。
图像生成文本
Transformers 英语

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基于Qwen3-1.7B开发的专注于代理式网络搜索和轻量级浏览的模型,在移动设备上也能高效运行。
大型语言模型
Transformers 英语

L
Mungert
263
2