L

Longformer Base 4096 Finetuned Squadv2

由mrm8488開發
該模型是基於Longformer架構,在SQuAD v2問答數據集上微調的問答系統,支持處理長文本序列(最長4096個token)。
下載量 190
發布時間 : 3/2/2022

模型概述

Longformer-base-4096是一個專為長文檔設計的Transformer模型,基於RoBERTa初始化,並在SQuAD v2數據集上進行了問答任務微調。它結合了滑動窗口局部注意力和全局注意力機制,適合處理長文檔問答任務。

模型特點

長文本處理能力
支持最長4096個token的序列,適合處理長文檔問答任務
混合注意力機制
結合滑動窗口局部注意力和全局注意力,在保持效率的同時捕捉長距離依賴關係
高精度問答
在SQuAD v2驗證集上達到79.92%的精確匹配率和83.35%的F1分數

模型能力

長文本問答
開放域問答
無答案檢測

使用案例

文檔問答系統
法律文檔分析
從長法律文檔中提取特定問題的答案
研究報告問答
回答關於學術論文或技術報告的問題
客戶支持
FAQ自動回答
從長產品文檔中回答客戶問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase