Mxbai Rerank Base V2 Seq
M
Mxbai Rerank Base V2 Seq
由 michaelfeil 开发
一个基于Transformer的多语言文本排序模型,支持15种语言的文本相关性排序任务
下载量 528
发布时间 : 3/14/2025
模型简介
该模型专门用于文本相关性排序任务,能够处理多种语言的文本对并计算它们的语义相似度得分。适用于信息检索、推荐系统等场景。
模型特点
多语言支持
支持15种语言的文本排序任务,包括英语、中文、日语等主要语言
高效语义匹配
能够准确计算文本对之间的语义相似度,适用于大规模文本排序
基于Transformer架构
利用先进的Transformer架构捕捉文本深层次语义特征
模型能力
多语言文本相似度计算
文本相关性排序
跨语言文本匹配
使用案例
信息检索
搜索引擎结果排序
对搜索引擎返回的结果进行相关性排序
提高搜索结果的相关性和用户体验
推荐系统
内容推荐
基于用户历史行为推荐相关内容
提高推荐准确性和用户满意度
🚀 Rewritten Mixedbread Reranker as classifier
本项目将Mixedbread重排器改写为分类器,截至2025年3月,它是最强大的重排器,例如可用于检索增强生成(RAG)任务。
🚀 快速开始
FP8部署
在H100上进行FP8部署,配置如下:
build_commands: []
environment_variables: {}
external_package_dirs: []
model_metadata:
example_model_input:
input: 'ERROR: This redirects to the embedding endpoint. Use the /sync API to
reach /sync/predict'
model_name: BEI-mixedbread-ai-mxbai-rerank-base-v2-reranker-fp8-truss-example
python_version: py39
requirements: []
resources:
accelerator: L4
cpu: '1'
memory: 10Gi
use_gpu: true
secrets: {}
system_packages: []
trt_llm:
build:
base_model: encoder
checkpoint_repository:
repo: michaelfeil/mxbai-rerank-base-v2-seq
revision: main
source: HF
max_num_tokens: 32768
max_seq_len: 1000001
num_builder_gpus: 4
quantization_type: fp8
要将部署推送到Baseten.co,可使用以下命令:
truss push --publish
更多信息请参考: https://github.com/basetenlabs/truss-examples/tree/main/11-embeddings-reranker-classification-tensorrt/BEI-mixedbread-ai-mxbai-rerank-base-v2-reranker-fp8
作为分类器使用
若要在Baseten.co或github.com/michaelfeil/infinity上使用,应使用分类API。你需要手动创建以下特定于该模型的提示模板,该模板遵循https://github.com/mixedbread-ai/mxbai-rerank/tree/main 上的参考实现。
def create_mxbai_v2_reranker_prompt_template(query: str, document: str, instruction: str = "") -> str:
"""
Create a carefully formatted chat template string (without tokenizer) for ranking relevance.
Parameters:
query (str): The search query.
document (str): The document text to evaluate.
instruction (str): Special instructions (e.g., "You are an expert for Mockingbirds.")
Returns:
str: The formatted chat template.
"""
instruction = f"instruction: {instruction}\n" if instruction else ""
# fixed system prompt, keep as is.
system_prompt = "You are Qwen, created by Alibaba Cloud. You are a helpful assistant."
assert not "\n" in system_prompt
assert not "\n" in instruction[:-1]
assert isinstance(query, str)
assert isinstance(document, str)
templated = (
# keep spacing, newlines as is.
# template for mixedbread reranker v2
# https://huggingface.co/michaelfeil/mxbai-rerank-base-v2-seq/
f"<|endoftext|><|im_start|>system\n{system_prompt}\n"
"<|im_end|>\n"
"<|im_start|>user\n"
f"{instruction}"
f"query: {query} \n"
f"document: {document} \n"
"You are a search relevance expert who evaluates how well documents match search queries. "
"For each query-document pair, carefully analyze the semantic relationship between them, then provide your binary relevance judgment (0 for not relevant, 1 for relevant).\n"
"Relevance:<|im_end|>\n"
"<|im_start|>assistant\n"
)
return templated
✨ 主要特性
- 先进性能与高效性:具备最先进的性能和强大的效率。
- 多语言支持:支持100多种语言,在英语和中文上表现出色。
- 代码支持:支持代码相关任务。
- 长上下文支持:能够处理长上下文内容。
📦 安装指南
安装mxbai-rerank:
pip install mxbai-rerank
💻 使用示例
基础用法
from mxbai_rerank import MxbaiRerankV2
model = MxbaiRerankV2("mixedbread-ai/mxbai-rerank-base-v2")
query = "Who wrote 'To Kill a Mockingbird'?"
documents = [
"'To Kill a Mockingbird' is a novel by Harper Lee published in 1960. It was immediately successful, winning the Pulitzer Prize, and has become a classic of modern American literature.",
"The novel 'Moby-Dick' was written by Herman Melville and first published in 1851. It is considered a masterpiece of American literature and deals with complex themes of obsession, revenge, and the conflict between good and evil.",
"Harper Lee, an American novelist widely known for her novel 'To Kill a Mockingbird', was born in 1926 in Monroeville, Alabama. She received the Pulitzer Prize for Fiction in 1961.",
"Jane Austen was an English novelist known primarily for her six major novels, which interpret, critique and comment upon the British landed gentry at the end of the 18th century.",
"The 'Harry Potter' series, which consists of seven fantasy novels written by British author J.K. Rowling, is among the most popular and critically acclaimed books of the modern era.",
"'The Great Gatsby', a novel written by American author F. Scott Fitzgerald, was published in 1925. The story is set in the Jazz Age and follows the life of millionaire Jay Gatsby and his pursuit of Daisy Buchanan."
]
# Lets get the scores
results = model.rank(query, documents, return_documents=True, top_k=3)
print(results)
📚 详细文档
性能
基准测试结果
模型 | BEIR平均得分 | 多语言得分 | 中文得分 | 代码搜索得分 | 延迟 (s) |
---|---|---|---|---|---|
mxbai-rerank-large-v2 | 57.49 | 29.79 | 84.16 | 32.05 | 0.89 |
mxbai-rerank-base-v2 | 55.57 | 28.56 | 83.70 | 31.73 | 0.67 |
mxbai-rerank-large-v1 | 49.32 | 21.88 | 72.53 | 30.72 | 2.24 |
*延迟在A100 GPU上测量
训练细节
模型采用三步训练过程:
- GRPO(引导式强化提示优化)
- 对比学习
- 偏好学习
更多详细信息,请查看我们的技术博客文章。相关论文即将发布。
📄 许可证
本项目遵循Apache 2.0许可证。
🎓 引用
@online{rerank2025mxbai,
title={Every Byte Matters: Introducing mxbai-embed-xsmall-v1},
author={Sean Lee and Aamir Shakir and Julius Lipp and Rui Huang},
year={2025},
url={https://www.mixedbread.com/blog/mxbai-rerank-v2},
}
Jina Embeddings V3
Jina Embeddings V3 是一个多语言句子嵌入模型,支持超过100种语言,专注于句子相似度和特征提取任务。
文本嵌入
Transformers 支持多种语言

J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
基于MS Marco段落排序任务训练的交叉编码器模型,用于信息检索中的查询-段落相关性评分
文本嵌入 英语
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
基于蒸馏技术的稀疏检索模型,专为OpenSearch优化,支持免推理文档编码,在搜索相关性和效率上优于V1版本
文本嵌入
Transformers 英语

O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
基于PubMedBERT的生物医学实体表征模型,通过自对齐预训练优化语义关系捕捉
文本嵌入 英语
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Large 是一个强大的句子转换器模型,专注于句子相似度和文本嵌入任务,在多个基准测试中表现出色。
文本嵌入 英语
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一个英文句子转换器模型,专注于句子相似度任务,在多个文本嵌入基准测试中表现优异。
文本嵌入
Transformers 支持多种语言

G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base 是一个多语言的句子嵌入模型,支持超过50种语言,适用于句子相似度计算等任务。
文本嵌入
Transformers 支持多种语言

G
Alibaba-NLP
1.2M
246
Polybert
polyBERT是一个化学语言模型,旨在实现完全由机器驱动的超快聚合物信息学。它将PSMILES字符串映射为600维密集指纹,以数值形式表示聚合物化学结构。
文本嵌入
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
基于土耳其语BERT的句子嵌入模型,专为语义相似度任务优化
文本嵌入
Transformers 其他

B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
基于BAAI/bge-small-en-v1.5模型微调的文本嵌入模型,通过MEDI数据集与MTEB分类任务数据集训练,优化了检索任务的查询编码能力。
文本嵌入
Safetensors 英语
G
avsolatorio
945.68k
29
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98