🚀 DrRos/bge-reranker-large-Q4_K_M-GGUF
本模型是通过 llama.cpp 并借助 ggml.ai 的 GGUF-my-repo 空间,将 BAAI/bge-reranker-large
模型转换为 GGUF 格式。有关该模型的更多详细信息,请参考 原始模型卡片。
🚀 快速开始
本模型可与 llama.cpp 结合使用,以下是具体的使用步骤。
📦 安装指南
通过 brew 安装 llama.cpp(适用于 Mac 和 Linux):
brew install llama.cpp
💻 使用示例
基础用法
CLI 方式
llama-cli --hf-repo DrRos/bge-reranker-large-Q4_K_M-GGUF --hf-file bge-reranker-large-q4_k_m.gguf -p "The meaning to life and the universe is"
Server 方式
llama-server --hf-repo DrRos/bge-reranker-large-Q4_K_M-GGUF --hf-file bge-reranker-large-q4_k_m.gguf -c 2048
高级用法
你也可以直接按照 Llama.cpp 仓库中列出的 使用步骤 来使用此检查点。
步骤 1:从 GitHub 克隆 llama.cpp
git clone https://github.com/ggerganov/llama.cpp
步骤 2:进入 llama.cpp 文件夹并使用 LLAMA_CURL=1
标志以及其他特定硬件标志进行编译(例如,在 Linux 上使用英伟达 GPU 时可使用 LLAMA_CUDA=1
)
cd llama.cpp && LLAMA_CURL=1 make
步骤 3:通过主二进制文件运行推理
./llama-cli --hf-repo DrRos/bge-reranker-large-Q4_K_M-GGUF --hf-file bge-reranker-large-q4_k_m.gguf -p "The meaning to life and the universe is"
或者
./llama-server --hf-repo DrRos/bge-reranker-large-Q4_K_M-GGUF --hf-file bge-reranker-large-q4_k_m.gguf -c 2048
📚 详细文档
模型信息
属性 |
详情 |
模型类型 |
特征提取 |
基础模型 |
BAAI/bge-reranker-large |
许可证 |
MIT |
模型评估结果
任务类型 |
数据集名称 |
数据集类型 |
数据集分割 |
MAP 值 |
MRR 值 |
重排序 |
MTEB CMedQAv1 |
C-MTEB/CMedQAv1-reranking |
测试集 |
81.27206722525007 |
84.14238095238095 |
重排序 |
MTEB CMedQAv2 |
C-MTEB/CMedQAv2-reranking |
测试集 |
84.10369934291236 |
86.79376984126984 |
重排序 |
MTEB MMarcoReranking |
C-MTEB/Mmarco-reranking |
开发集 |
35.4600511272538 |
34.60238095238095 |
重排序 |
MTEB T2Reranking |
C-MTEB/T2Reranking |
开发集 |
67.27728847727172 |
77.1315192743764 |
📄 许可证
本项目采用 MIT 许可证。