bge-large-zh-v1.5-i1-GGUF開源模型 - 多量化選項適配不同需求場景

Bge Large Zh V1.5 I1 GGUF

由mradermacher開發

這是BAAI/bge-large-zh-v1.5模型的加權/矩陣量化版本，提供多種量化選項，適用於不同需求場景。

下載量 337

發布時間 : 4/6/2025

模型概述

該項目提供了BAAI/bge-large-zh-v1.5模型的量化版本，通過GGUF格式提供多種量化選項，方便用戶根據需求選擇適合的版本。

多種量化選項

提供從IQ1到IQ6等多種量化版本，滿足不同場景需求

輕量化

量化後模型大小最小僅0.2GB，便於部署和使用

中文優化

專門針對中文文本進行優化的嵌入模型

中文文本嵌入

語義相似度計算

信息檢索

信息檢索

文檔搜索

使用嵌入向量進行相似文檔檢索

語義分析

語義相似度計算

計算文本之間的語義相似度

本項目提供了https://huggingface.co/BAAI/bge-large-zh-v1.5 的加權/矩陣量化版本，方便用戶使用和下載。

如果你不確定如何使用GGUF文件，可以參考TheBloke的README，其中包含了如何使用以及如何拼接多部分文件的詳細信息。

本項目是對https://huggingface.co/BAAI/bge-large-zh-v1.5 進行加權/矩陣量化的版本。靜態量化文件可在https://huggingface.co/mradermacher/bge-large-zh-v1.5-GGUF 獲取。

為了方便查看和下載，請訪問我們的該模型頁面。

（按大小排序，不一定代表質量。IQ量化通常比類似大小的非IQ量化更優）

鏈接	類型	大小/GB	備註
GGUF	i1-IQ1_S	0.2	適用於急需的情況
GGUF	i1-IQ1_M	0.2	大多用於急需情況
GGUF	i1-IQ2_XXS	0.2
GGUF	i1-IQ2_XS	0.2
GGUF	i1-IQ2_S	0.2
GGUF	i1-IQ2_M	0.2
GGUF	i1-Q2_K_S	0.2	質量非常低
GGUF	i1-IQ3_XXS	0.2	質量較低
GGUF	i1-Q2_K	0.2	IQ3_XXS可能更好
GGUF	i1-IQ3_XS	0.2
GGUF	i1-IQ3_S	0.3	優於Q3_K*
GGUF	i1-Q3_K_S	0.3	IQ3_XS可能更好
GGUF	i1-IQ3_M	0.3
GGUF	i1-Q3_K_M	0.3	IQ3_S可能更好
GGUF	i1-IQ4_XS	0.3
GGUF	i1-Q3_K_L	0.3	IQ3_M可能更好
GGUF	i1-IQ4_NL	0.3	優先選擇IQ4_XS
GGUF	i1-Q4_0	0.3	速度快，質量低
GGUF	i1-Q4_K_S	0.3	大小/速度/質量最優
GGUF	i1-Q4_K_M	0.3	速度快，推薦使用
GGUF	i1-Q4_1	0.3
GGUF	i1-Q5_K_S	0.3
GGUF	i1-Q5_K_M	0.3
GGUF	i1-Q6_K	0.4	實際上類似於靜態Q6_K