X

Xlm Roberta Longformer Base 4096

由markussagen開發
基於XLM-R擴展的長序列處理模型,支持最長4096標記的序列處理,適用於多語言任務
下載量 9,499
發布時間 : 3/2/2022

模型概述

該模型通過Longformer預訓練方案擴展XLM-RoBERTa的序列處理能力,旨在為低資源語言提供高效的長文本處理解決方案

模型特點

超長序列處理
支持4096標記的序列長度(原XLM-R僅支持512),適合處理長文檔
低資源語言優化
無需為每種語言單獨預訓練,特別優化瑞典語等低資源語言支持
高效訓練方案
採用梯度累積(64步)和16位精度訓練,降低顯存需求

模型能力

長文本理解
多語言問答
跨語言遷移學習

使用案例

問答系統
多語言文檔問答
處理長文檔中的跨語言問答任務
文本分析
低資源語言處理
對瑞典語等低資源語言的長文本進行分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase