🚀 magicunicorn/mxbai-embed-large-v1-Q8_0-GGUF
本模型是使用llama.cpp,通过ggml.ai的 GGUF-my-repo 空间,从 mixedbread-ai/mxbai-embed-large-v1
转换为GGUF格式的。有关该模型的更多详细信息,请参考 原始模型卡片。
🚀 快速开始
📦 安装指南
通过brew(适用于Mac和Linux)安装llama.cpp:
brew install llama.cpp
💻 使用示例
基础用法
调用llama.cpp的服务器或命令行界面(CLI)。
CLI方式:
llama-cli --hf-repo magicunicorn/mxbai-embed-large-v1-Q8_0-GGUF --hf-file mxbai-embed-large-v1-q8_0.gguf -p "The meaning to life and the universe is"
服务器方式:
llama-server --hf-repo magicunicorn/mxbai-embed-large-v1-Q8_0-GGUF --hf-file mxbai-embed-large-v1-q8_0.gguf -c 2048
高级用法
你也可以直接通过Llama.cpp仓库中列出的 使用步骤 来使用此检查点。
步骤1:从GitHub克隆llama.cpp:
git clone https://github.com/ggerganov/llama.cpp
步骤2:进入llama.cpp文件夹,并使用 LLAMA_CURL=1
标志以及其他特定于硬件的标志(例如,在Linux上使用Nvidia GPU时使用 LLAMA_CUDA=1
)进行编译:
cd llama.cpp && LLAMA_CURL=1 make
步骤3:通过主二进制文件运行推理:
./llama-cli --hf-repo magicunicorn/mxbai-embed-large-v1-Q8_0-GGUF --hf-file mxbai-embed-large-v1-q8_0.gguf -p "The meaning to life and the universe is"
或者
./llama-server --hf-repo magicunicorn/mxbai-embed-large-v1-Q8_0-GGUF --hf-file mxbai-embed-large-v1-q8_0.gguf -c 2048
📚 详细文档
模型信息
属性 |
详情 |
模型类型 |
特征提取 |
基础模型 |
mixedbread-ai/mxbai-embed-large-v1 |
库名称 |
sentence-transformers |
许可证 |
Apache-2.0 |
语言 |
英语 |
模型评估结果
模型 mxbai-angle-large-v1
在多个数据集上进行了评估,涵盖了分类、检索、聚类、重排序、语义文本相似度(STS)、成对分类、摘要等多种任务。以下是部分评估结果的展示:
分类任务
数据集名称 |
准确率 |
F1值 |
MTEB AmazonCounterfactualClassification (en) |
75.044776119403 |
68.92736573359774 |
MTEB AmazonPolarityClassification |
93.84025000000001 |
93.8297833897293 |
MTEB AmazonReviewsClassification (en) |
49.184 |
48.74163227751588 |
... |
... |
... |
检索任务
数据集名称 |
MAP@1 |
MAP@10 |
MRR@1 |
MRR@10 |
MTEB ArguAna |
41.252 |
57.778 |
41.679 |
57.92699999999999 |
MTEB CQADupstackAndroidRetrieval |
32.745999999999995 |
43.632 |
39.485 |
49.537 |
MTEB FEVER |
75.424 |
83.435 |
81.113 |
87.77199999999999 |
... |
... |
... |
... |
... |
聚类任务
数据集名称 |
V-measure |
MTEB ArxivClusteringP2P |
48.97294504317859 |
MTEB ArxivClusteringS2S |
42.98071077674629 |
MTEB BiorxivClusteringP2P |
39.91773608582761 |
... |
... |
重排序任务
数据集名称 |
MAP |
MRR |
MTEB AskUbuntuDupQuestions |
65.16477858490782 |
78.23583080508287 |
MTEB StackOverflowDupQuestions |
55.217701909036286 |
56.17658995416349 |
... |
... |
... |
语义文本相似度(STS)任务
数据集名称 |
余弦相似度皮尔逊相关系数 |
余弦相似度斯皮尔曼相关系数 |
MTEB BIOSSES |
89.6277629421789 |
88.4056288400568 |
MTEB SICK-R |
87.71506247604255 |
82.91813463738802 |
MTEB STS12 |
87.43772054228462 |
78.75750601716682 |
... |
... |
... |
成对分类任务
数据集名称 |
余弦相似度准确率 |
余弦相似度F1值 |
MTEB SprintDuplicateQuestions |
99.87326732673267 |
93.6318407960199 |
MTEB TwitterSemEval2015 |
87.58419264469214 |
71.49673530889001 |
MTEB TwitterURLCorpus |
89.09069740365584 |
78.36863452005407 |
... |
... |
... |
摘要任务
数据集名称 |
余弦相似度皮尔逊相关系数 |
余弦相似度斯皮尔曼相关系数 |
MTEB SummEval |
30.954206018888453 |
32.71062599450096 |
以上仅展示了部分评估结果,完整的评估结果可参考原始文档中的详细记录。这些结果反映了模型在不同任务和数据集上的性能表现,为模型的应用和改进提供了重要的参考依据。