B

Bloomz 560m Retriever V2

由 cmarkea 开发
基于Bloomz-560m-dpo-chat模型的双编码器,用于将文章和查询映射到同一向量空间,支持法语和英语的跨语言检索。
下载量 17
发布时间 : 5/26/2024

模型简介

该模型是一个双编码器,专门设计用于开放域问答(ODQA)任务,能够将查询和相关文章映射到同一向量空间,确保查询与相关文章的邻近性。支持法语和英语的跨语言检索。

模型特点

跨语言检索
支持法语和英语的跨语言检索,无论文章是法语还是英语,任一语言的查询都能找到相关文章。
高效检索
采用余弦距离作为度量标准,显著提升检索效率。
对比学习训练
使用改进版mMARCO数据集进行对比学习训练,过滤假阴性样本并采用困难负样本策略。

模型能力

特征提取
跨语言检索
开放域问答

使用案例

信息检索
开放域问答
用于开放域问答系统,快速检索相关文章以回答问题。
在SQuAD测试集上表现优异,Top-1准确率达68%(法/法)和66.6%(英/法)。
跨语言文档检索
支持法语和英语之间的跨语言文档检索。
在跨语言检索任务中表现优于传统BM25和CamemBERT等模型。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase