ms-marco-TinyBERT-L2開源輕量級模型 - 免費部署實現信息檢索相關性評分

首頁

Ms Marco TinyBERT L2

由cross-encoder開發

基於MS Marco段落排序任務訓練的輕量級交叉編碼器，用於信息檢索中的查詢-段落相關性評分

文本嵌入英語開源協議:Apache-2.0 #信息檢索重排序 #高效推理 #英文段落排序

下載量 71.76k

發布時間 : 3/2/2022

模型概述

該模型專門用於信息檢索任務，能夠對查詢與段落的相關性進行評分，適用於搜索引擎結果的重排序場景。基於BERT-Tiny架構優化，在保持較高性能的同時具有極快的處理速度。

模型特點

高效輕量

基於TinyBERT架構優化，處理速度高達9000篇/秒（V100 GPU）

精準排序

在MS Marco和TREC DL基準測試中表現優異，NDCG@10達69.84

即插即用

兼容HuggingFace Transformers和SentenceTransformers生態

模型能力

查詢-段落相關性評分

搜索結果重排序

信息檢索

使用案例

搜索引擎優化

搜索結果重排序

對ElasticSearch等檢索引擎返回的初步結果進行相關性重排序

提升搜索結果的相關性排序質量

問答系統

答案段落篩選

從候選答案段落中篩選出與問題最相關的答案

提高問答系統的準確率

🚀 用於MS Marco的交叉編碼器

本模型專為信息檢索任務而設計，在MS Marco段落排序任務上進行訓練，能夠對給定查詢與候選段落進行相關性排序，有效提升信息檢索的準確性和效率。

🚀 快速開始

本模型可用於信息檢索：給定一個查詢，將該查詢與所有可能的段落（例如通過ElasticSearch檢索得到的段落）進行編碼，然後按降序對段落進行排序。更多詳細信息請參閱 SBERT.net 檢索與重排序。訓練代碼可在此處獲取：SBERT.net 訓練MS Marco

✨ 主要特性

訓練數據：基於 MS Marco段落排序任務數據進行訓練。
應用場景：適用於信息檢索場景，可對查詢和段落進行相關性排序。

📦 安裝指南

若要使用本模型，你需要安裝 SentenceTransformers 庫。你可以使用以下命令進行安裝：

pip install sentence-transformers

💻 使用示例

基礎用法

當你安裝了 SentenceTransformers 庫後，使用起來非常簡單。你可以像這樣使用預訓練模型：

from sentence_transformers import CrossEncoder

model = CrossEncoder('cross-encoder/ms-marco-TinyBERT-L2')
scores = model.predict([
    ("How many people live in Berlin?", "Berlin had a population of 3,520,031 registered inhabitants in an area of 891.82 square kilometers."),
    ("How many people live in Berlin?", "Berlin is well known for its museums."),
])
print(scores)
# [0.82869005 0.00169255]

高級用法

你也可以使用 transformers 庫來使用本模型：

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model = AutoModelForSequenceClassification.from_pretrained('cross-encoder/ms-marco-TinyBERT-L2')
tokenizer = AutoTokenizer.from_pretrained('cross-encoder/ms-marco-TinyBERT-L2')

features = tokenizer(['How many people live in Berlin?', 'How many people live in Berlin?'], ['Berlin has a population of 3,520,031 registered inhabitants in an area of 891.82 square kilometers.', 'New York City is famous for the Metropolitan Museum of Art.'],  padding=True, truncation=True, return_tensors="pt")

model.eval()
with torch.no_grad():
    scores = model(**features).logits
    print(scores)

📚 詳細文檔

性能表現

在下表中，我們提供了各種預訓練的交叉編碼器及其在 TREC深度學習2019 和 MS Marco段落重排序數據集上的性能表現。

模型名稱	NDCG@10 (TREC DL 19)	MRR@10 (MS Marco Dev)	每秒處理文檔數
版本2模型
cross-encoder/ms-marco-TinyBERT-L2-v2	69.84	32.56	9000
cross-encoder/ms-marco-MiniLM-L2-v2	71.01	34.85	4100
cross-encoder/ms-marco-MiniLM-L4-v2	73.04	37.70	2500
cross-encoder/ms-marco-MiniLM-L6-v2	74.30	39.01	1800
cross-encoder/ms-marco-MiniLM-L12-v2	74.31	39.02	960
版本1模型
cross-encoder/ms-marco-TinyBERT-L2	67.43	30.15	9000
cross-encoder/ms-marco-TinyBERT-L4	68.09	34.50	2900
cross-encoder/ms-marco-TinyBERT-L6	69.57	36.13	680
cross-encoder/ms-marco-electra-base	71.99	36.41	340
其他模型
nboost/pt-tinybert-msmarco	63.63	28.80	2900
nboost/pt-bert-base-uncased-msmarco	70.94	34.75	340
nboost/pt-bert-large-msmarco	73.36	36.48	100
Capreolus/electra-base-msmarco	71.23	36.89	340
amberoad/bert-multilingual-passage-reranking-msmarco	68.40	35.54	330
sebastian-hofstaetter/distilbert-cat-margin_mse-T2-msmarco	72.82	37.88	720