X

Xlm Roberta Longformer Base 4096

由Peltarion開發
基於XLM-RoBERTa擴展的長序列模型,支持最長4096標記的序列處理,適用於多語言任務
下載量 64
發布時間 : 3/2/2022

模型概述

XLM-R長序列模型是XLM-RoBERTa的擴展版本,通過特殊預訓練方案支持更長的序列處理(原版僅支持512標記)。該模型在多語言問答等任務上表現優異,特別適合低資源語言場景。

模型特點

超長上下文支持
支持最長4096個標記的序列處理(原版XLM-R僅支持512標記)
低資源語言優化
無需為每種語言單獨預訓練,特別適合瑞典語等低資源語言場景
高效訓練方案
採用梯度累積技術(64步)和16位精度訓練,降低顯存需求

模型能力

長文本理解
多語言問答
跨語言遷移學習

使用案例

問答系統
多語言長文檔問答
處理包含長上下文的跨語言問答任務
文本理解
低資源語言文檔分析
對瑞典語等低資源語言的長文檔進行語義分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase