B

Bigbird Base Trivia Itc

由google開發
基於bigbird-roberta-base的微調模型,專為trivia問答任務優化,支持長序列處理。
下載量 1,049
發布時間 : 3/2/2022

模型概述

該模型是基於BigBird架構的問答模型,通過在trivia_qa數據集上微調而成,特別適合處理需要長上下文理解的問答任務。

模型特點

長序列處理能力
支持最大4096的序列長度,適合處理長文本問答任務。
靈活的注意力機制
支持block_sparse和original_full兩種注意力模式,可根據需求調整。
高效計算
通過隨機token和窗口化注意力機制實現高效計算。

模型能力

文本問答
長文本理解
事實檢索

使用案例

知識問答
百科知識問答
回答基於百科知識的各類問題
在trivia_qa數據集上表現良好
事實核查
從長文本中提取事實信息進行驗證
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase