Olmocr 7B 0725 FP8
olmOCR-7B-0725-FP8是基於Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225數據集微調後量化為FP8版本的文檔OCR模型。
下載量 881
發布時間 : 7/22/2025
模型概述
該模型專注於文檔圖像的文字識別,能夠處理包含文本的文檔圖像,並提取其中的文字內容。
模型特點
FP8量化
使用llmcompressor工具將原始模型量化為FP8版本,提高推理效率
文檔OCR優化
專門針對文檔圖像進行優化,能夠準確識別文檔中的文字內容
大規模處理能力
通過sglang支持高效推理,適合處理數百萬文檔的大規模應用場景
模型能力
文檔圖像文字識別
多語言文本提取
大規模文檔處理
使用案例
文檔數字化
歷史文檔數字化
將紙質歷史文檔轉換為可搜索的數字文本
企業文檔處理
自動化處理企業大量合同、報告等文檔
教育研究
學術論文分析
從掃描的學術論文中提取文本內容進行分析
精選推薦AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多語言圖像描述任務。
圖像生成文本
Transformers 支持多種語言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根據文本提示生成高質量圖像。該模型在優化推理效率的同時,將性能損失降至最低。
圖像生成 英語
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
這是一個基於Qwen2.5-VL-7B模型的靜態量化版本,專注於圖像描述生成任務,支持多種語言。
圖像生成文本
Transformers 支持多種語言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基於Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225數據集微調後量化為FP8版本的文檔OCR模型。
圖像生成文本
Transformers 英語

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基於Qwen3-1.7B開發的專注於代理式網絡搜索和輕量級瀏覽的模型,在移動設備上也能高效運行。
大型語言模型
Transformers 英語

L
Mungert
263
2