bge-large-zh-v1.5-i1-GGUF开源模型 - 多量化选项适配不同需求场景

Bge Large Zh V1.5 I1 GGUF

由 mradermacher 开发

这是BAAI/bge-large-zh-v1.5模型的加权/矩阵量化版本，提供多种量化选项，适用于不同需求场景。

下载量 337

发布时间 : 4/6/2025

模型简介

该项目提供了BAAI/bge-large-zh-v1.5模型的量化版本，通过GGUF格式提供多种量化选项，方便用户根据需求选择适合的版本。

多种量化选项

提供从IQ1到IQ6等多种量化版本，满足不同场景需求

轻量化

量化后模型大小最小仅0.2GB，便于部署和使用

中文优化

专门针对中文文本进行优化的嵌入模型

中文文本嵌入

语义相似度计算

信息检索

信息检索

文档搜索

使用嵌入向量进行相似文档检索

语义分析

语义相似度计算

计算文本之间的语义相似度

本项目提供了https://huggingface.co/BAAI/bge-large-zh-v1.5 的加权/矩阵量化版本，方便用户使用和下载。

如果你不确定如何使用GGUF文件，可以参考TheBloke的README，其中包含了如何使用以及如何拼接多部分文件的详细信息。

本项目是对https://huggingface.co/BAAI/bge-large-zh-v1.5 进行加权/矩阵量化的版本。静态量化文件可在https://huggingface.co/mradermacher/bge-large-zh-v1.5-GGUF 获取。

为了方便查看和下载，请访问我们的该模型页面。

（按大小排序，不一定代表质量。IQ量化通常比类似大小的非IQ量化更优）

链接	类型	大小/GB	备注
GGUF	i1-IQ1_S	0.2	适用于急需的情况
GGUF	i1-IQ1_M	0.2	大多用于急需情况
GGUF	i1-IQ2_XXS	0.2
GGUF	i1-IQ2_XS	0.2
GGUF	i1-IQ2_S	0.2
GGUF	i1-IQ2_M	0.2
GGUF	i1-Q2_K_S	0.2	质量非常低
GGUF	i1-IQ3_XXS	0.2	质量较低
GGUF	i1-Q2_K	0.2	IQ3_XXS可能更好
GGUF	i1-IQ3_XS	0.2
GGUF	i1-IQ3_S	0.3	优于Q3_K*
GGUF	i1-Q3_K_S	0.3	IQ3_XS可能更好
GGUF	i1-IQ3_M	0.3
GGUF	i1-Q3_K_M	0.3	IQ3_S可能更好
GGUF	i1-IQ4_XS	0.3
GGUF	i1-Q3_K_L	0.3	IQ3_M可能更好
GGUF	i1-IQ4_NL	0.3	优先选择IQ4_XS
GGUF	i1-Q4_0	0.3	速度快，质量低
GGUF	i1-Q4_K_S	0.3	大小/速度/质量最优
GGUF	i1-Q4_K_M	0.3	速度快，推荐使用
GGUF	i1-Q4_1	0.3
GGUF	i1-Q5_K_S	0.3
GGUF	i1-Q5_K_M	0.3
GGUF	i1-Q6_K	0.4	实际上类似于静态Q6_K