Bloomz-3b-reranking開源重排序模型 - 跨英法雙語衡量查詢與上下文語義相關性

首頁

Bloomz 3b Reranking

由cmarkea開發

基於Bloomz-3b構建的跨語言重排序模型，用於衡量查詢與上下文之間的語義相關性，支持法語和英語。

大型語言模型

Transformers

支持多種語言開源協議:Openrail #跨語言重排序 #語義相關性評分 #開放域問答

下載量 115

發布時間 : 3/15/2024

模型概述

該模型旨在通過標準化評分篩選開放域問答場景中的查詢/上下文匹配結果，並以比檢索器更高效的建模方式重新排序結果。適用於跨語言場景，能有效處理法語和英語的文本排序任務。

模型特點

跨語言支持

支持法語和英語，在跨語言場景中表現優異，且不受單語言場景行為影響。

高效重排序

通過標準化評分高效篩選查詢/上下文匹配結果，比傳統檢索器更精確。

高精度

在同語言和跨語言評估中均表現出色，Top-1準確率高達89%以上。

模型能力

語義相關性評分

跨語言文本排序

開放域問答結果重排序

使用案例

信息檢索

開放域問答系統

用於重排序檢索器輸出的查詢/上下文匹配結果，提升問答系統的準確性。

Top-1準確率89.37%（法語/法語），89.20%（法語/英語）

多語言應用

跨語言文檔檢索

支持法語和英語的跨語言文檔檢索和排序。

MRR指標93.79（法語/法語），93.63（法語/英語）

🚀 Bloomz-3b 重排序模型

本重排序模型基於 cmarkea/bloomz-3b-dpo-chat 模型構建，旨在衡量問題（查詢）與上下文之間的語義對應關係。通過歸一化評分，它有助於在開放域問答（ODQA）場景中過濾檢索器輸出的查詢/上下文匹配結果。此外，它能夠使用比檢索器更高效的建模方法對結果進行重新排序。不過，由於計算成本較高，這種建模類型並不適合直接進行數據庫搜索。

該模型支持法語和英語，具有語言無關性。因此，它可以在跨語言環境中有效評分，而不受單語言環境（英語或法語）下的行為影響。

📦 數據集

訓練數據集由 mMARCO 數據集組成，包含查詢/正樣本/難負樣本三元組。此外，我們還納入了 SQuAD 數據集中“訓練”分割的數據，形成查詢/正樣本/難負樣本三元組。為了為 SQuAD 生成難負樣本數據，我們考慮了與查詢主題相同但來自不同查詢集的上下文。因此，負樣本觀察結果與查詢屬於相同主題，但可能不包含問題的答案。

最後，將三元組展開，得到查詢/上下文句子對，若為查詢/正樣本則標籤為 1，若為查詢/負樣本則標籤為 0。在每對元素（查詢和上下文）中，隨機且均勻地選擇法語或英語。

📊 評估

為了評估重排序器的性能，我們將使用 SQuAD 數據集的“驗證”分割。我們將從每個段落中選擇第一個問題，以及構成應在 Oracle 建模中排名第一的上下文的段落。有趣的是，主題數量有限，每個與查詢不匹配的對應主題的上下文都被視為難負樣本（主題外的其他上下文為簡單負樣本）。因此，我們可以構建以下表格，每個主題顯示上下文數量和相關查詢：

主題名稱	上下文數量	主題名稱	上下文數量
Normans	39	Civil_disobedience	26
Computational_complexity_theory	48	Construction	22
Southern_California	39	Private_school	26
Sky_(United_Kingdom)	22	Harvard_University	30
Victoria_(Australia)	25	Jacksonville,_Florida	21
Huguenot	44	Economic_inequality	44
Steam_engine	46	University_of_Chicago	37
Oxygen	43	Yuan_dynasty	47
1973_oil_crisis	24	Immune_system	49
European_Union_law	40	Intergovernmental_Panel_on_Climate_Change	24
Amazon_rainforest	21	Prime_number	31
Ctenophora	31	Rhine	44
Fresno,_California	28	Scottish_Parliament	39
Packet_switching	23	Islamism	39
Black_Death	23	Imperialism	39
Geology	25	Warsaw	49
Pharmacy	26	French_and_Indian_War	46
Force	44

評估語料庫由 1204 對需要排名的查詢/上下文組成。

首先，我們計算了查詢和上下文語言相同（法語/法語）情況下的評估分數。

模型（法語/法語）	平均排名	排名標準差	排名第一的比例（%）	排名前十的比例（%）	排名前一百的比例（%）	平均倒數排名（x100）	排名第一的平均分數	排名第一的分數標準差
BM25	14.47	92.19	69.77	92.03	98.09	77.74	NA	NA
CamemBERT	5.72	36.88	69.35	95.51	98.92	79.51	0.83	0.37
DistilCamemBERT	5.54	25.90	66.11	92.77	99.17	76.00	0.80	0.39
mMiniLMv2-L12	4.43	30.27	71.51	95.68	99.42	80.17	0.78	0.38
RoBERTa (multilingual)	15.13	60.39	57.23	83.87	96.18	66.21	0.53	0.11
cmarkea/bloomz-560m-reranking	1.49	2.58	83.55	99.17	100	89.98	0.93	0.15
cmarkea/bloomz-3b-reranking	1.22	1.06	89.37	99.75	100	93.79	0.94	0.10

然後，我們在跨語言環境中評估了模型，查詢為法語，上下文為英語。

模型（法語/英語）	平均排名	排名標準差	排名第一的比例（%）	排名前十的比例（%）	排名前一百的比例（%）	平均倒數排名（x100）	排名第一的平均分數	排名第一的分數標準差
BM25	288.04	371.46	21.93	41.93	55.15	28.41	NA	NA
CamemBERT	12.20	61.39	59.55	89.71	97.42	70.38	0.65	0.47
DistilCamemBERT	40.97	104.78	25.66	64.78	88.62	38.83	0.53	0.49
mMiniLMv2-L12	6.91	32.16	59.88	89.95	99.09	70.39	0.61	0.46
RoBERTa (multilingual)	79.32	153.62	27.91	49.50	78.16	35.41	0.40	0.12
cmarkea/bloomz-560m-reranking	1.51	1.92	81.89	99.09	100	88.64	0.92	0.15
cmarkea/bloomz-3b-reranking	1.22	0.98	89.20	99.84	100	93.63	0.94	0.10

可以觀察到，跨語言環境對我們模型的性能影響不大。如果在重排序和過濾搜索的前 K 個結果的場景中使用該模型，可以應用 0.8 的閾值來過濾檢索器輸出的上下文，從而減少 RAG 類型應用中上下文中存在的噪聲問題。

💻 使用示例

基礎用法

以下示例基於 Transformers 庫的 API 管道。

from transformers import pipeline

reranker = pipeline(
    task='text-classification',
    model='cmarkea/bloomz-3b-reranking',
    top_k=None
)

query: str
contexts: List[str]

similarities = reranker(
    [
        dict(
            text=context, # the model was trained with context in `text`
            text_pair=query # and query in `text_pair` argument.
        )
        for context in contexts
    ]
)

score_label_1 = [
    next(item['score'] for item in entry if item['label'] == 'LABEL_1') 
    for entry in similarities
]
contexts_reranked = sorted(
    zip(score_label_1, contexts),
    key=lambda x: x[0],
    reverse=True
)

score, contexts_cleaned = zip(
    *filter(
        lambda x: x[0] >= 0.8,
        contexts_reranked
    )
)

📄 許可證

本項目使用的許可證為 bigscience-bloom-rail-1.0。

📖 引用

@online{DeBloomzReranking,
  AUTHOR = {Cyrile Delestre},
  ORGANIZATION = {Cr{\'e}dit Mutuel Ark{\'e}a},
  URL = {https://huggingface.co/cmarkea/bloomz-3b-reranking},
  YEAR = {2024},
  KEYWORDS = {NLP ; Transformers ; LLM ; Bloomz},
}