bge-reranker-base-Q8_0-GGUF開源模型 - 用於免費部署的文本重排序任務

Bge Reranker Base Q8 0 GGUF

由xinming0111開發

該模型是從BAAI/bge-reranker-base轉換而來的GGUF格式模型，主要用於文本重排序任務。

下載量 106

發布時間 : 12/16/2024

模型概述

基於BAAI/bge-reranker-base轉換的GGUF格式模型，適用於文本重排序任務，支持中英文。

GGUF格式

模型已轉換為GGUF格式，便於通過llama.cpp使用。

多語言支持

支持英文和中文的文本重排序任務。

高性能

在多個重排序任務上表現出色，如在CMedQAv1和CMedQAv2數據集上的高MAP和MRR值。

文本重排序

中英文文本處理

信息檢索

醫療問答重排序

在醫療問答系統中對檢索結果進行重排序，提高相關答案的排名。

在CMedQAv1和CMedQAv2數據集上分別達到81.27和84.10的MAP值。

通用信息檢索

在通用信息檢索系統中優化搜索結果的相關性排序。

在MMarcoReranking和T2Reranking數據集上表現良好。

本模型是使用llama.cpp通過ggml.ai的GGUF-my-repo空間，從BAAI/bge-reranker-base轉換為GGUF格式的。有關該模型的更多詳細信息，請參考原始模型卡片。

通過brew安裝llama.cpp（適用於Mac和Linux）

brew install llama.cpp

可以通過命令行界面（CLI）或服務器模式使用該模型。

llama-cli --hf-repo xinming0111/bge-reranker-base-Q8_0-GGUF --hf-file bge-reranker-base-q8_0.gguf -p "The meaning to life and the universe is"

llama-server --hf-repo xinming0111/bge-reranker-base-Q8_0-GGUF --hf-file bge-reranker-base-q8_0.gguf -c 2048

你也可以直接按照Llama.cpp倉庫中列出的使用步驟使用此檢查點。

步驟1：從GitHub克隆llama.cpp倉庫。

git clone https://github.com/ggerganov/llama.cpp

步驟2：進入llama.cpp文件夾，並使用LLAMA_CURL=1標誌以及其他特定硬件標誌（例如，在Linux上使用Nvidia GPU時使用LLAMA_CUDA=1）進行編譯。

cd llama.cpp && LLAMA_CURL=1 make

步驟3：通過主二進制文件運行推理。

./llama-cli --hf-repo xinming0111/bge-reranker-base-Q8_0-GGUF --hf-file bge-reranker-base-q8_0.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo xinming0111/bge-reranker-base-Q8_0-GGUF --hf-file bge-reranker-base-q8_0.gguf -c 2048

任務類型	數據集名稱	數據集類型	數據集分割	MAP值	MRR值
重排序	MTEB CMedQAv1	C-MTEB/CMedQAv1-reranking	測試集	81.27206722525007	84.14238095238095
重排序	MTEB CMedQAv2	C-MTEB/CMedQAv2-reranking	測試集	84.10369934291236	86.79376984126984
重排序	MTEB MMarcoReranking	C-MTEB/Mmarco-reranking	開發集	35.4600511272538	34.60238095238095
重排序	MTEB T2Reranking	C-MTEB/T2Reranking	開發集	67.27728847727172	77.1315192743764