T

T5 3b Ssm Nq

由google開發
T5-3b-ssm-nq是基於T5架構的閉卷問答模型,通過預訓練和微調實現知識檢索和問答功能。
下載量 15
發布時間 : 3/2/2022

模型概述

該模型採用T5架構,經過C4和維基百科數據集的預訓練,並在自然問題(NQ)數據集上微調,專門用於閉卷問答任務。

模型特點

閉卷問答
模型在不訪問外部知識源的情況下,直接從參數中檢索知識回答問題。
多階段訓練
先在C4數據集上預訓練,再在維基百科上使用顯著跨度掩碼目標訓練,最後在自然問題數據集上微調。
規模擴展性
模型性能隨參數規模擴大而提升,與開放域檢索系統表現相當。

模型能力

閉卷問答
知識檢索
文本生成

使用案例

問答系統
事實性問答
回答關於歷史人物、事件等事實性問題。
在自然問題測試集上達到33.2的精確匹配分數。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase