🚀 AlignScoreCS
AlignScoreCS是一個多任務多語言模型,旨在評估各種自然語言理解(NLU)任務中上下文-聲明對的事實一致性。這些任務包括摘要生成、問答(QA)、語義文本相似度(STS)、釋義、事實驗證(FV)和自然語言推理(NLI)。
該模型在包含700萬份文檔的大規模多任務數據集上進行了微調,涵蓋了捷克語和英語的上述NLU任務。其多語言預訓練使其有潛力應用於其他多種語言。模型架構能夠通過迴歸、二元分類或三元分類來處理任務,但為了評估目的,我們建議使用AlignScore函數。
這項工作受到了其英文版本AlignScore: Evaluating Factual Consistency with a Unified Alignment Function的啟發。不過,我們在訓練時使用了同質批次而非異質批次,並採用了三種不同的架構共享一個編碼器。這種設置允許每個架構及其分類頭獨立使用。
🚀 快速開始
模型信息
屬性 |
詳情 |
模型類型 |
多任務多語言模型,用於評估捷克語和英語各種NLU任務中的事實一致性 |
訓練數據 |
使用了包含700萬份文檔的大規模多任務數據集,涵蓋多種NLU任務,英文數據集通過seamLessM4t翻譯成捷克語 |
評估指標 |
BLEURT、BLEU、BERTScore |
許可證 |
CC BY 4.0 |
模型使用
from AlignScoreCS import AlignScoreCS
alignScoreCS = AlignScoreCS.from_pretrained("krotima1/AlignScoreCS")
print(alignScoreCS.score(context="This is context", claim="This is claim"))
✨ 主要特性
- 多任務處理:能夠處理多種自然語言理解任務,包括摘要生成、問答、語義文本相似度等。
- 多語言支持:在捷克語和英語數據集上進行微調,且多語言預訓練使其有潛力用於其他語言。
- 靈活架構:架構可通過迴歸、二元分類或三元分類處理任務,每個架構及其分類頭可獨立使用。
📚 詳細文檔
評估方法
與論文AlignScore類似,我們使用其AlignScore函數,將上下文大致分塊為350個標記,並將聲明拆分為句子。每個上下文塊與每個聲明句子進行評估,並彙總為一個一致性分數。
AlignScoreCS模型基於三個共享一個編碼器的XLM - RoBERTa架構構建。
訓練架構
我們使用了檢查點xlm - roberta - large [xlm - roberta](https://huggingface.co/FacebookAI/xlm - roberta - large)的共享架構,並帶有三個用於迴歸、二元分類和三元分類的線性層來訓練模型。
📦 訓練數據集
以下表格展示了用於訓練模型的數據集,我們使用seamLessM4t將這些英文數據集翻譯成了捷克語。
NLP任務 |
數據集 |
訓練任務 |
上下文(單詞數) |
聲明(單詞數) |
樣本數量 |
自然語言推理(NLI) |
SNLI |
三元分類 |
10 |
13 |
捷克語: 500k 英語: 550k |
|
MultiNLI |
三元分類 |
16 |
20 |
捷克語: 393k 英語: 393k |
|
對抗性NLI |
三元分類 |
48 |
54 |
捷克語: 163k 英語: 163k |
|
DocNLI |
二元分類 |
97 |
285 |
捷克語: 200k 英語: 942k |
事實驗證 |
NLI風格的FEVER |
三元分類 |
48 |
50 |
捷克語: 208k 英語: 208k |
|
維生素C |
三元分類 |
23 |
25 |
捷克語: 371k 英語: 371k |
釋義 |
QQP |
二元分類 |
9 |
11 |
捷克語: 162k 英語: 364k |
|
PAWS |
二元分類 |
- |
18 |
捷克語: - 英語: 707k |
|
PAWS標註 |
二元分類 |
18 |
- |
捷克語: 49k 英語: - |
|
PAWS未標註 |
二元分類 |
18 |
- |
捷克語: 487k 英語: - |
語義文本相似度(STS) |
SICK |
迴歸 |
- |
10 |
捷克語: - 英語: 4k |
|
STS基準 |
迴歸 |
- |
10 |
捷克語: - 英語: 6k |
|
Free - N1 |
迴歸 |
18 |
- |
捷克語: 20k 英語: - |
問答(QA) |
SQuAD v2 |
二元分類 |
105 |
119 |
捷克語: 130k 英語: 130k |
|
RACE |
二元分類 |
266 |
273 |
捷克語: 200k 英語: 351k |
信息檢索 |
MS MARCO |
二元分類 |
49 |
56 |
捷克語: 200k 英語: 5M |
摘要生成 |
WikiHow |
二元分類 |
434 |
508 |
捷克語: 157k 英語: 157k |
|
SumAug |
二元分類 |
- |
- |
捷克語: - 英語: - |
📄 許可證
本項目採用CC BY 4.0許可證。