🚀 Perseus-Doc-vl-0712 模型介紹
Perseus-Doc-vl-0712 是一個視覺語言模型,支持英文和中文,可用於文本生成推理、圖像字幕生成、光學字符識別等多種任務。
📚 詳細文檔
基本信息
屬性 |
詳情 |
基礎模型 |
prithivMLmods/Perseus-Doc-vl-0712 |
數據集 |
prithivMLmods/OpenDoc-Pdf-Preview、prithivMLmods/Corvus-OCR-Caption-Mix、prithivMLmods/Openpdf-Analysis-Recognition、prithivMLmods/Opendoc2-Analysis-Recognition |
支持語言 |
英文、中文 |
庫名稱 |
transformers |
許可證 |
apache-2.0 |
量化者 |
mradermacher |
標籤 |
text-generation-inference、image-captioning、optical-character-recognition、intelligent-character-recognition、caption、ocr、visual-understanding、art、icr、image-to-text、vlm、Doc-v |
關於模型
加權/矩陣量化的 https://huggingface.co/prithivMLmods/Perseus-Doc-vl-0712
如需便捷的概述和下載列表,請訪問我們的 該模型頁面。
靜態量化文件可在 https://huggingface.co/mradermacher/Perseus-Doc-vl-071225-GGUF 獲取。
⚠️ 重要提示
這是一個視覺模型,mmproj 文件(如果有)將存放在 靜態倉庫 中。
💻 使用示例
如果您不確定如何使用 GGUF 文件,請參考 TheBloke 的 README 以獲取更多詳細信息,包括如何拼接多部分文件。
🔧 技術細節
提供的量化文件
(按大小排序,不一定代表質量。IQ 量化通常優於類似大小的非 IQ 量化)
鏈接 |
類型 |
大小/GB |
說明 |
GGUF |
i1-IQ1_S |
2.0 |
適用於資源緊張情況 |
GGUF |
i1-IQ1_M |
2.1 |
多數情況下資源緊張 |
GGUF |
i1-IQ2_XXS |
2.4 |
|
GGUF |
i1-IQ2_XS |
2.6 |
|
GGUF |
i1-IQ2_S |
2.7 |
|
GGUF |
i1-IQ2_M |
2.9 |
|
GGUF |
i1-Q2_K_S |
2.9 |
質量非常低 |
GGUF |
i1-Q2_K |
3.1 |
IQ3_XXS 可能更好 |
GGUF |
i1-IQ3_XXS |
3.2 |
質量較低 |
GGUF |
i1-IQ3_XS |
3.4 |
|
GGUF |
i1-Q3_K_S |
3.6 |
IQ3_XS 可能更好 |
GGUF |
i1-IQ3_S |
3.6 |
優於 Q3_K* |
GGUF |
i1-IQ3_M |
3.7 |
|
GGUF |
i1-Q3_K_M |
3.9 |
IQ3_S 可能更好 |
GGUF |
i1-Q3_K_L |
4.2 |
IQ3_M 可能更好 |
GGUF |
i1-IQ4_XS |
4.3 |
|
GGUF |
i1-IQ4_NL |
4.5 |
優先選擇 IQ4_XS |
GGUF |
i1-Q4_0 |
4.5 |
速度快,質量低 |
GGUF |
i1-Q4_K_S |
4.6 |
大小/速度/質量最優 |
GGUF |
i1-Q4_K_M |
4.8 |
速度快,推薦使用 |
GGUF |
i1-Q4_1 |
5.0 |
|
GGUF |
i1-Q5_K_S |
5.4 |
|
GGUF |
i1-Q5_K_M |
5.5 |
|
GGUF |
i1-Q6_K |
6.4 |
實際上類似於靜態 Q6_K |
以下是 ikawrakow 製作的一個方便的圖表,比較了一些低質量量化類型(數值越低越好):

此外,這裡有 Artefact2 對此事的看法:https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9
常見問題與模型請求
如需獲取您可能遇到問題的答案,和/或希望對其他模型進行量化,請訪問 https://huggingface.co/mradermacher/model_requests。
🙏 致謝
感謝我的公司 nethype GmbH 允許我使用其服務器,並對我的工作站進行升級,使我能夠在業餘時間完成這項工作。此外,感謝 @nicoboss 讓我使用他的私人超級計算機,使我能夠提供比原本更多、質量更高的矩陣量化文件。