L

Longformer Base 4096 Bne Es

由PlanTL-GOB-ES開發
基於Longformer架構的西班牙語掩碼語言模型,能夠處理長文本輸入,適用於問答、文本分類等任務
下載量 52.76k
發布時間 : 11/2/2022

模型概述

該模型基於RoBERTa架構改進,專門針對西班牙語長文本處理優化,支持4096詞元的上下文長度,適用於多種自然語言處理任務

模型特點

長文本處理能力
支持4096詞元的上下文長度,無需額外聚合策略即可處理長文檔
改進的注意力機制
採用滑動窗口注意力與全局注意力相結合的方式,平衡計算效率與上下文理解
西班牙語優化
基於西班牙國家圖書館大規模語料訓練,專門針對西班牙語特性優化

模型能力

掩碼語言建模
文本分類
命名實體識別
問答系統
語義相似度計算

使用案例

文本分析
法律文檔分析
分析西班牙語法律文檔中的關鍵信息
新聞分類
對西班牙語新聞文章進行分類
在MLDoc數據集上F1得分0.9608
信息提取
命名實體識別
從西班牙語文檔中提取人名、地名等實體
在CoNLL-NERC數據集上F1得分0.8757
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase