Perseus-Doc-vl-071225-i1-GGUF開源視覺語言模型 - 支持中英雙語多任務文本圖像生成

首頁

Perseus Doc Vl 071225 I1 GGUF

由mradermacher開發

Perseus-Doc-vl-0712 是一個支持英文和中文的視覺語言模型，適用於文本生成推理、圖像字幕生成和光學字符識別等多種任務。

圖像生成文本

Transformers

支持多種語言開源協議:Apache-2.0 #文檔視覺理解 #多語言OCR #PDF內容解析

下載量 322

發布時間 : 7/13/2025

模型概述

該模型是一個多功能的視覺語言模型，能夠處理文檔分析、圖像理解和文本生成等任務，特別適用於文檔處理和視覺內容理解場景。

模型特點

多語言支持

同時支持英文和中文處理，適用於雙語環境。

多任務能力

能夠執行文本生成、圖像字幕生成和OCR等多種任務。

量化選項豐富

提供多種量化版本，適應不同硬件資源需求。

模型能力

文本生成

圖像字幕生成

光學字符識別

智能字符識別

文檔視覺理解

圖像到文本轉換

使用案例

文檔處理

PDF文檔分析

從PDF文檔中提取和分析文本內容

文檔OCR

識別掃描文檔中的文字內容

圖像理解

圖像字幕生成

為圖像生成描述性文字

🚀 Perseus-Doc-vl-0712 模型介紹

Perseus-Doc-vl-0712 是一個視覺語言模型，支持英文和中文，可用於文本生成推理、圖像字幕生成、光學字符識別等多種任務。

📚 詳細文檔

基本信息

屬性	詳情
基礎模型	prithivMLmods/Perseus-Doc-vl-0712
數據集	prithivMLmods/OpenDoc-Pdf-Preview、prithivMLmods/Corvus-OCR-Caption-Mix、prithivMLmods/Openpdf-Analysis-Recognition、prithivMLmods/Opendoc2-Analysis-Recognition
支持語言	英文、中文
庫名稱	transformers
許可證	apache-2.0
量化者	mradermacher
標籤	text-generation-inference、image-captioning、optical-character-recognition、intelligent-character-recognition、caption、ocr、visual-understanding、art、icr、image-to-text、vlm、Doc-v

關於模型

加權/矩陣量化的 https://huggingface.co/prithivMLmods/Perseus-Doc-vl-0712

如需便捷的概述和下載列表，請訪問我們的該模型頁面。

靜態量化文件可在 https://huggingface.co/mradermacher/Perseus-Doc-vl-071225-GGUF 獲取。

⚠️ 重要提示 這是一個視覺模型，mmproj 文件（如果有）將存放在靜態倉庫中。

💻 使用示例

如果您不確定如何使用 GGUF 文件，請參考 TheBloke 的 README 以獲取更多詳細信息，包括如何拼接多部分文件。

🔧 技術細節

提供的量化文件

（按大小排序，不一定代表質量。IQ 量化通常優於類似大小的非 IQ 量化）

鏈接	類型	大小/GB	說明
GGUF	i1-IQ1_S	2.0	適用於資源緊張情況
GGUF	i1-IQ1_M	2.1	多數情況下資源緊張
GGUF	i1-IQ2_XXS	2.4
GGUF	i1-IQ2_XS	2.6
GGUF	i1-IQ2_S	2.7
GGUF	i1-IQ2_M	2.9
GGUF	i1-Q2_K_S	2.9	質量非常低
GGUF	i1-Q2_K	3.1	IQ3_XXS 可能更好
GGUF	i1-IQ3_XXS	3.2	質量較低
GGUF	i1-IQ3_XS	3.4
GGUF	i1-Q3_K_S	3.6	IQ3_XS 可能更好
GGUF	i1-IQ3_S	3.6	優於 Q3_K*
GGUF	i1-IQ3_M	3.7
GGUF	i1-Q3_K_M	3.9	IQ3_S 可能更好
GGUF	i1-Q3_K_L	4.2	IQ3_M 可能更好
GGUF	i1-IQ4_XS	4.3
GGUF	i1-IQ4_NL	4.5	優先選擇 IQ4_XS
GGUF	i1-Q4_0	4.5	速度快，質量低
GGUF	i1-Q4_K_S	4.6	大小/速度/質量最優
GGUF	i1-Q4_K_M	4.8	速度快，推薦使用
GGUF	i1-Q4_1	5.0
GGUF	i1-Q5_K_S	5.4
GGUF	i1-Q5_K_M	5.5
GGUF	i1-Q6_K	6.4	實際上類似於靜態 Q6_K