qnli-distilroberta-base開源模型 - 快速判斷段落能否回答特定問題！

首頁

Qnli Distilroberta Base

由cross-encoder開發

該模型是基於distilroberta-base訓練的交叉編碼器，用於判斷給定段落是否能回答特定問題，在GLUE QNLI數據集上訓練。

問答系統英語開源協議:Apache-2.0 #問答匹配 #文本推理 #SQuAD優化

下載量 1,526

發布時間 : 3/2/2022

模型概述

該模型是一個基於DistilRoBERTa-base的交叉編碼器，專門用於問答對匹配任務，判斷給定段落是否能回答特定問題。

模型特點

高效問答匹配

能夠準確判斷給定段落是否能回答特定問題

基於DistilRoBERTa

使用輕量級但高效的DistilRoBERTa-base模型架構

交叉編碼架構

採用交叉編碼器設計，能夠同時處理問題和段落的關係

模型能力

問答對匹配

文本相關性判斷

自然語言推理

使用案例

問答系統

自動問答驗證

驗證候選答案段落是否能正確回答問題

可提供0-1之間的相關性評分

信息檢索

搜索結果排序

對搜索引擎返回的結果進行相關性排序

提高搜索結果的相關性

🚀 用於SQuAD（QNLI）的交叉編碼器

該模型使用 SentenceTransformers 的 Cross-Encoder 類進行訓練，可有效解決文本排序相關問題。

🚀 快速開始

本模型基於 distilbert/distilroberta-base 基礎模型，使用 sentence-transformers 庫進行開發，適用於文本排序任務。

✨ 主要特性

基於 SentenceTransformers 庫的 Cross-Encoder 類訓練，在文本排序任務上表現出色。
模型在 GLUE QNLI 數據集上進行訓練，該數據集將 SQuAD 數據集轉換為自然語言推理（NLI）任務。

📦 安裝指南

文檔未提及具體安裝步驟，若需使用 sentence-transformers 庫，可使用以下命令安裝：

pip install sentence-transformers

💻 使用示例

基礎用法

from sentence_transformers import CrossEncoder

model = CrossEncoder('cross-encoder/qnli-distilroberta-base')
scores = model.predict([('Query1', 'Paragraph1'), ('Query2', 'Paragraph2')])

#e.g.
scores = model.predict([('How many people live in Berlin?', 'Berlin had a population of 3,520,031 registered inhabitants in an area of 891.82 square kilometers.'), ('What is the size of New York?', 'New York City is famous for the Metropolitan Museum of Art.')])

高級用法

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model = AutoModelForSequenceClassification.from_pretrained('cross-encoder/qnli-distilroberta-base')
tokenizer = AutoTokenizer.from_pretrained('cross-encoder/qnli-distilroberta-base')

features = tokenizer(['How many people live in Berlin?', 'What is the size of New York?'], ['Berlin had a population of 3,520,031 registered inhabitants in an area of 891.82 square kilometers.', 'New York City is famous for the Metropolitan Museum of Art.'],  padding=True, truncation=True, return_tensors="pt")

model.eval()
with torch.no_grad():
    scores = torch.nn.functional.sigmoid(model(**features).logits)
    print(scores)

📚 詳細文檔

訓練數據：給定一個問題和一個段落，判斷該問題是否可以由該段落回答。模型在 GLUE QNLI 數據集上進行訓練，該數據集將 SQuAD 數據集轉換為自然語言推理（NLI）任務。
性能表現：關於該模型的性能結果，請參考 SBERT.net 預訓練交叉編碼器。

📄 許可證

本項目採用 Apache-2.0 許可證。

屬性	詳情
基礎模型	distilbert/distilroberta-base
模型類型	用於SQuAD（QNLI）的交叉編碼器
訓練數據	GLUE QNLI 數據集，將 SQuAD 數據集轉換為 NLI 任務
庫名稱	sentence-transformers
標籤	transformers