bge-reranker-base-Q8_0-GGUF开源模型 - 用于免费部署的文本重排序任务

Bge Reranker Base Q8 0 GGUF

由 xinming0111 开发

该模型是从BAAI/bge-reranker-base转换而来的GGUF格式模型，主要用于文本重排序任务。

下载量 106

发布时间 : 12/16/2024

模型简介

基于BAAI/bge-reranker-base转换的GGUF格式模型，适用于文本重排序任务，支持中英文。

GGUF格式

模型已转换为GGUF格式，便于通过llama.cpp使用。

多语言支持

支持英文和中文的文本重排序任务。

高性能

在多个重排序任务上表现出色，如在CMedQAv1和CMedQAv2数据集上的高MAP和MRR值。

文本重排序

中英文文本处理

信息检索

医疗问答重排序

在医疗问答系统中对检索结果进行重排序，提高相关答案的排名。

在CMedQAv1和CMedQAv2数据集上分别达到81.27和84.10的MAP值。

通用信息检索

在通用信息检索系统中优化搜索结果的相关性排序。

在MMarcoReranking和T2Reranking数据集上表现良好。

本模型是使用llama.cpp通过ggml.ai的GGUF-my-repo空间，从BAAI/bge-reranker-base转换为GGUF格式的。有关该模型的更多详细信息，请参考原始模型卡片。

通过brew安装llama.cpp（适用于Mac和Linux）

brew install llama.cpp

可以通过命令行界面（CLI）或服务器模式使用该模型。

llama-cli --hf-repo xinming0111/bge-reranker-base-Q8_0-GGUF --hf-file bge-reranker-base-q8_0.gguf -p "The meaning to life and the universe is"

llama-server --hf-repo xinming0111/bge-reranker-base-Q8_0-GGUF --hf-file bge-reranker-base-q8_0.gguf -c 2048

你也可以直接按照Llama.cpp仓库中列出的使用步骤使用此检查点。

步骤1：从GitHub克隆llama.cpp仓库。

git clone https://github.com/ggerganov/llama.cpp

步骤2：进入llama.cpp文件夹，并使用LLAMA_CURL=1标志以及其他特定硬件标志（例如，在Linux上使用Nvidia GPU时使用LLAMA_CUDA=1）进行编译。

cd llama.cpp && LLAMA_CURL=1 make

步骤3：通过主二进制文件运行推理。

./llama-cli --hf-repo xinming0111/bge-reranker-base-Q8_0-GGUF --hf-file bge-reranker-base-q8_0.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo xinming0111/bge-reranker-base-Q8_0-GGUF --hf-file bge-reranker-base-q8_0.gguf -c 2048

任务类型	数据集名称	数据集类型	数据集分割	MAP值	MRR值
重排序	MTEB CMedQAv1	C-MTEB/CMedQAv1-reranking	测试集	81.27206722525007	84.14238095238095
重排序	MTEB CMedQAv2	C-MTEB/CMedQAv2-reranking	测试集	84.10369934291236	86.79376984126984
重排序	MTEB MMarcoReranking	C-MTEB/Mmarco-reranking	开发集	35.4600511272538	34.60238095238095
重排序	MTEB T2Reranking	C-MTEB/T2Reranking	开发集	67.27728847727172	77.1315192743764