Perseus-Doc-vl-071225-i1-GGUF开源视觉语言模型 - 支持中英双语多任务文本图像生成

首页

Perseus Doc Vl 071225 I1 GGUF

由 mradermacher 开发

Perseus-Doc-vl-0712 是一个支持英文和中文的视觉语言模型，适用于文本生成推理、图像字幕生成和光学字符识别等多种任务。

图像生成文本

Transformers

支持多种语言开源协议:Apache-2.0 #文档视觉理解 #多语言OCR #PDF内容解析

下载量 322

发布时间 : 7/13/2025

模型简介

该模型是一个多功能的视觉语言模型，能够处理文档分析、图像理解和文本生成等任务，特别适用于文档处理和视觉内容理解场景。

模型特点

多语言支持

同时支持英文和中文处理，适用于双语环境。

多任务能力

能够执行文本生成、图像字幕生成和OCR等多种任务。

量化选项丰富

提供多种量化版本，适应不同硬件资源需求。

模型能力

文本生成

图像字幕生成

光学字符识别

智能字符识别

文档视觉理解

图像到文本转换

使用案例

文档处理

PDF文档分析

从PDF文档中提取和分析文本内容

文档OCR

识别扫描文档中的文字内容

图像理解

图像字幕生成

为图像生成描述性文字

🚀 Perseus-Doc-vl-0712 模型介绍

Perseus-Doc-vl-0712 是一个视觉语言模型，支持英文和中文，可用于文本生成推理、图像字幕生成、光学字符识别等多种任务。

📚 详细文档

基本信息

属性	详情
基础模型	prithivMLmods/Perseus-Doc-vl-0712
数据集	prithivMLmods/OpenDoc-Pdf-Preview、prithivMLmods/Corvus-OCR-Caption-Mix、prithivMLmods/Openpdf-Analysis-Recognition、prithivMLmods/Opendoc2-Analysis-Recognition
支持语言	英文、中文
库名称	transformers
许可证	apache-2.0
量化者	mradermacher
标签	text-generation-inference、image-captioning、optical-character-recognition、intelligent-character-recognition、caption、ocr、visual-understanding、art、icr、image-to-text、vlm、Doc-v

关于模型

加权/矩阵量化的 https://huggingface.co/prithivMLmods/Perseus-Doc-vl-0712

如需便捷的概述和下载列表，请访问我们的该模型页面。

静态量化文件可在 https://huggingface.co/mradermacher/Perseus-Doc-vl-071225-GGUF 获取。

⚠️ 重要提示 这是一个视觉模型，mmproj 文件（如果有）将存放在静态仓库中。

💻 使用示例

如果您不确定如何使用 GGUF 文件，请参考 TheBloke 的 README 以获取更多详细信息，包括如何拼接多部分文件。

🔧 技术细节

提供的量化文件

（按大小排序，不一定代表质量。IQ 量化通常优于类似大小的非 IQ 量化）

链接	类型	大小/GB	说明
GGUF	i1-IQ1_S	2.0	适用于资源紧张情况
GGUF	i1-IQ1_M	2.1	多数情况下资源紧张
GGUF	i1-IQ2_XXS	2.4
GGUF	i1-IQ2_XS	2.6
GGUF	i1-IQ2_S	2.7
GGUF	i1-IQ2_M	2.9
GGUF	i1-Q2_K_S	2.9	质量非常低
GGUF	i1-Q2_K	3.1	IQ3_XXS 可能更好
GGUF	i1-IQ3_XXS	3.2	质量较低
GGUF	i1-IQ3_XS	3.4
GGUF	i1-Q3_K_S	3.6	IQ3_XS 可能更好
GGUF	i1-IQ3_S	3.6	优于 Q3_K*
GGUF	i1-IQ3_M	3.7
GGUF	i1-Q3_K_M	3.9	IQ3_S 可能更好
GGUF	i1-Q3_K_L	4.2	IQ3_M 可能更好
GGUF	i1-IQ4_XS	4.3
GGUF	i1-IQ4_NL	4.5	优先选择 IQ4_XS
GGUF	i1-Q4_0	4.5	速度快，质量低
GGUF	i1-Q4_K_S	4.6	大小/速度/质量最优
GGUF	i1-Q4_K_M	4.8	速度快，推荐使用
GGUF	i1-Q4_1	5.0
GGUF	i1-Q5_K_S	5.4
GGUF	i1-Q5_K_M	5.5
GGUF	i1-Q6_K	6.4	实际上类似于静态 Q6_K