mxbai-embed-large-v1开源句子嵌入模型 - 免费支持英语文本嵌入及多样量化需求

首页

Mxbai Embed Large V1 Gguf

由 ChristianAzinn 开发

mxbai-embed-large-v1是基于BERT-large架构的句子嵌入模型，使用AnglE损失函数训练，支持英语文本嵌入，提供多种量化版本以适应不同需求。

文本嵌入英语开源协议:Apache-2.0 #英语文本嵌入 #BERT大模型 #高精度向量化

下载量 646

发布时间 : 4/7/2024

模型简介

这是一个高质量的句子嵌入模型，基于BERT-large架构，使用AnglE损失函数在大规模数据上训练而成。模型提供了从2位到32位的多种量化版本，适用于不同的计算资源场景。

模型特点

高质量句子嵌入

使用AnglE损失函数在大规模高质量数据上训练，在BERT-large规模上达到SOTA性能

多种量化版本

提供从2位(Q2_K)到32位(FP32)的多种量化版本，适应不同计算资源需求

512token上下文长度

支持最多512个token的上下文长度，适合处理较长文本

广泛兼容性

兼容llama.cpp和LM Studio等主流推理框架

模型能力

文本嵌入

语义搜索

信息检索

文本相似度计算

使用案例

搜索与检索

语义搜索

将查询和文档转换为嵌入向量进行语义相似度匹配

提高搜索结果的相关性

文档聚类

基于嵌入向量对文档进行聚类分析

发现文档间的语义关系

推荐系统

内容推荐

基于内容嵌入相似度推荐相关内容

提高推荐准确性和多样性

🚀 mxbai-embed-large-v1-gguf

本项目提供了 mxbai-embed-large-v1 模型的 GGUF 格式文件，可用于特征提取，在 BERT 大规模模型上实现了 SOTA 性能。

🚀 快速开始

与 llama.cpp 结合使用示例

若要计算单个嵌入向量，需先构建 llama.cpp 并运行以下命令：

./embedding -ngl 99 -m [filepath-to-gguf].gguf -p 'search_query: What is TSNE?'

你也可以提交一批文本进行嵌入处理，只要总令牌数不超过上下文长度即可。embedding 示例仅展示前三个嵌入向量。

texts.txt 文件内容如下：

search_query: What is TSNE?
search_query: Who is Laurens Van der Maaten?

计算多个嵌入向量的命令如下：

./embedding -ngl 99 -m [filepath-to-gguf].gguf -f texts.txt

与 LM Studio 结合使用示例

从以下链接下载 0.2.19 测试版：Windows MacOS Linux

安装完成后，打开应用程序。主界面应如下所示：

image/png

在主搜索栏中搜索 “ChristianAzinn”，或者点击左侧菜单中的 “搜索” 标签进行搜索。

image/png

从搜索结果中选择你的模型（本示例使用 bge-small-en-v1.5-gguf），并选择要下载的量化版本。由于该模型较小，建议选择 Q8_0，若条件允许也可选择 f16/32。通常，列表越靠下（或数字越大），文件越大，性能越好。

image/png

模型下载成功后，你将看到绿色对勾和 “已下载” 字样，下载时间取决于你的网络速度。

image/png

模型下载完成后，点击左侧菜单中的 “本地服务器” 标签，打开文本嵌入模型加载器。该加载器在 0.2.19 版本之前不可用，请确保下载的是正确版本。

image/png

从下拉列表中选择刚刚下载的模型进行加载。若模型无法完全加载到显存中，你可能需要在右侧菜单中调整配置，如 GPU 卸载。

image/png

最后，点击 “启动服务器” 按钮：

image/png

若在控制台看到如下文本，则表示一切就绪！你可以在任何需要的应用程序中直接替换 OpenAI 嵌入 API 使用该模型，也可以直接查询端点进行测试。

image/png

以下是一个向 API 端点发送的示例 curl 请求：

curl http://localhost:1234/v1/embeddings \
  -H "Content-Type: application/json" \
  -d '{
    "input": "Your text string goes here",
    "model": "model-identifier-here"
  }'

更多信息请参考 LM Studio 文本嵌入文档。

✨ 主要特性

高性能：基于 AnglE 损失函数在高质量大规模数据上训练，在 BERT 大规模模型上实现了 SOTA 性能。
多兼容性：支持 llama.cpp 和 LM Studio。

📚 详细文档

原始模型描述

这是我们的基础句子嵌入模型，它使用 AnglE 损失函数在高质量大规模数据上进行训练，在 BERT 大规模模型上取得了 SOTA 性能。更多信息请查看我们的博客文章。

本仓库描述

本仓库包含 mxbai-embed-large-v1 嵌入模型的 GGUF 格式文件。

这些文件是使用 llama.cpp PR 5500，提交记录为 34aa045de，在消费级 RTX 4090 上进行转换和量化的。

该模型支持最多 512 个令牌的上下文。

兼容性

这些文件与截至提交记录 4524290e8 的 llama.cpp 兼容，也与版本 0.2.19 的 LM Studio 兼容。

量化方法说明

点击查看详情

可用的量化方法如下： * GGML_TYPE_Q2_K - “类型 1” 2 位量化，超级块包含 16 个块，每个块有 16 个权重。块的缩放因子和最小值使用 4 位量化，最终每个权重有效使用 2.5625 位（bpw）。 * GGML_TYPE_Q3_K - “类型 0” 3 位量化，超级块包含 16 个块，每个块有 16 个权重。缩放因子使用 6 位量化，最终每个权重使用 3.4375 位。 * GGML_TYPE_Q4_K - “类型 1” 4 位量化，超级块包含 8 个块，每个块有 32 个权重。缩放因子和最小值使用 6 位量化，最终每个权重使用 4.5 位。 * GGML_TYPE_Q5_K - “类型 1” 5 位量化，与 GGML_TYPE_Q4_K 具有相同的超级块结构，最终每个权重使用 5.5 位。 * GGML_TYPE_Q6_K - “类型 0” 6 位量化，超级块有 16 个块，每个块有 16 个权重。缩放因子使用 8 位量化，最终每个权重使用 6.5625 位。

请参考下面的 “提供的文件” 表格，了解哪些文件使用了哪些方法以及如何使用。

提供的文件

名称	量化方法	位数	大小	使用场景
mxbai-embed-large-v1.Q2_K.gguf	Q2_K	2	144 MB	最小，但质量损失显著 - 不建议大多数场景使用
mxbai-embed-large-v1.Q3_K_S.gguf	Q3_K_S	3	160 MB	非常小，但质量损失高
mxbai-embed-large-v1.Q3_K_M.gguf	Q3_K_M	3	181 MB	非常小，但质量损失高
mxbai-embed-large-v1.Q3_K_L.gguf	Q3_K_L	3	198 MB	小，但质量损失较大
mxbai-embed-large-v1.Q4_0.gguf	Q4_0	4	200 MB	旧版本；小，但质量损失非常高 - 建议使用 Q3_K_M
mxbai-embed-large-v1.Q4_K_S.gguf	Q4_K_S	4	203 MB	小，但质量损失更大
mxbai-embed-large-v1.Q4_K_M.gguf	Q4_K_M	4	216 MB	中等，质量平衡 - 推荐使用
mxbai-embed-large-v1.Q5_0.gguf	Q5_0	5	237 MB	旧版本；中等，质量平衡 - 建议使用 Q4_K_M
mxbai-embed-large-v1.Q5_K_S.gguf	Q5_K_S	5	237 MB	大，质量损失低 - 推荐使用
mxbai-embed-large-v1.Q5_K_M.gguf	Q5_K_M	5	246 MB	大，质量损失非常低 - 推荐使用
mxbai-embed-large-v1.Q6_K.gguf	Q6_K	6	278 MB	非常大，质量损失极低
mxbai-embed-large-v1.Q8_0.gguf	Q8_0	8	358 MB	非常大，质量损失极低 - 推荐使用
mxbai-embed-large-v1.Q8_0.gguf	FP16	16	670 MB	极大，几乎是原始模型 - 不建议使用
mxbai-embed-large-v1.Q8_0.gguf	FP32	32	1.34 GB	极大，几乎是原始模型 - 不建议使用

📄 许可证

本模型采用 Apache-2.0 许可证。

致谢

感谢 LM Studio 团队以及所有从事开源 AI 工作的人员。

本 README 受 nomic-ai-embed-text-v1.5-GGUF（另一个优秀的嵌入模型）和传奇的 TheBloke 的 README 启发。

模型元信息

属性	详情
模型类型	BERT
模型创建者	MixedBread AI
量化者	ChristianAzinn
库名称	sentence-transformers
任务标签	特征提取
标签	mteb、transformers、transformers.js、gguf
基础模型	mixedbread-ai/mxbai-embed-large-v1
推理	否
语言	英语
许可证	Apache-2.0
模型名称	mxbai-embed-large-v1