🚀 多语言-e5-large-instruct-Q3_K_S-GGUF模型
本模型是通过llama.cpp,借助ggml.ai的GGUF-my-repo空间,从intfloat/multilingual-e5-large-instruct
转换为GGUF格式的。有关该模型的更多详细信息,请参考原始模型卡片。
🚀 快速开始
✨ 主要特性
- 支持多语言,涵盖了众多语言类型,如英语、中文、日语等。
- 基于
intfloat/multilingual-e5-large-instruct
模型转换而来,保留了原模型的核心能力。
- 以GGUF格式呈现,便于与llama.cpp进行集成使用。
📦 安装指南
通过Homebrew(适用于Mac和Linux)安装llama.cpp:
brew install llama.cpp
💻 使用示例
基础用法
使用llama.cpp的命令行界面(CLI)进行推理:
llama-cli --hf-repo yoeven/multilingual-e5-large-instruct-Q3_K_S-GGUF --hf-file multilingual-e5-large-instruct-q3_k_s.gguf -p "The meaning to life and the universe is"
高级用法
启动llama.cpp服务器进行推理:
llama-server --hf-repo yoeven/multilingual-e5-large-instruct-Q3_K_S-GGUF --hf-file multilingual-e5-large-instruct-q3_k_s.gguf -c 2048
另外,你也可以按照Llama.cpp仓库中列出的使用步骤直接使用该检查点:
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp && LLAMA_CURL=1 make
./llama-cli --hf-repo yoeven/multilingual-e5-large-instruct-Q3_K_S-GGUF --hf-file multilingual-e5-large-instruct-q3_k_s.gguf -p "The meaning to life and the universe is"
或者
./llama-server --hf-repo yoeven/multilingual-e5-large-instruct-Q3_K_S-GGUF --hf-file multilingual-e5-large-instruct-q3_k_s.gguf -c 2048
🔧 技术细节
本模型基于intfloat/multilingual-e5-large-instruct
基础模型,通过llama.cpp和ggml.ai的GGUF-my-repo空间转换为GGUF格式。GGUF格式是一种高效的模型存储和使用格式,能够与llama.cpp很好地集成,提供了命令行界面和服务器两种使用方式,方便用户根据不同的场景进行推理操作。
📄 许可证
本模型遵循MIT许可证。
模型信息表格
属性 |
详情 |
模型类型 |
基于intfloat/multilingual-e5-large-instruct 转换的GGUF格式模型 |
训练数据 |
参考原始模型的训练数据 |
模型评估结果
本模型在多个数据集上进行了评估,涵盖了分类、检索、聚类、重排序等多种任务,以下是部分评估结果展示:
分类任务
数据集名称 |
准确率 |
AP |
F1 |
MTEB AmazonCounterfactualClassification (en) |
76.23880597014924 |
39.07351965022687 |
70.04836733862683 |
MTEB AmazonPolarityClassification |
96.28742500000001 |
94.8449918887462 |
96.28680923610432 |
MTEB AmazonReviewsClassification (en) |
56.716 |
- |
55.76510398266401 |
... |
... |
... |
... |
检索任务
数据集名称 |
MAP@1 |
MAP@10 |
MAP@100 |
... |
MTEB ArguAna |
31.721 |
49.221 |
49.884 |
... |
MTEB CQADupstackRetrieval |
27.764166666666668 |
37.298166666666674 |
38.530166666666666 |
... |
... |
... |
... |
... |
... |
聚类任务
数据集名称 |
V-measure |
MTEB ArxivClusteringP2P |
46.40419580759799 |
MTEB ArxivClusteringS2S |
40.48593255007969 |
... |
... |
重排序任务
数据集名称 |
MAP |
MRR |
MTEB AskUbuntuDupQuestions |
63.889179122289995 |
77.61146286769556 |
MTEB MindSmallReranking |
33.08507884504006 |
34.32436977159129 |
... |
... |
... |
语义文本相似度任务(STS)
数据集名称 |
Cosine相似度 - Pearson |
Cosine相似度 - Spearman |
... |
MTEB BIOSSES |
88.15075203727929 |
86.9622224570873 |
... |
MTEB SICK-R |
85.84209174935282 |
81.73248048438833 |
... |
... |
... |
... |
... |
双语挖掘任务
数据集名称 |
准确率 |
F1 |
精确率 |
召回率 |
MTEB BUCC (de-en) |
99.65553235908142 |
99.60681976339595 |
99.58246346555325 |
99.65553235908142 |
MTEB BUCC (fr-en) |
99.26260180497468 |
99.14520507740848 |
99.08650671362535 |
99.26260180497468 |
... |
... |
... |
... |
... |
以上仅展示了部分评估结果,完整结果可参考文档开头的详细数据部分。这些结果展示了模型在不同任务和数据集上的性能表现,为用户了解模型能力提供了参考。