L

Longformer Base 4096 Bne Es

Developed by PlanTL-GOB-ES
基於Longformer架構的西班牙語掩碼語言模型,能夠處理長文本輸入,適用於問答、文本分類等任務
Downloads 52.76k
Release Time : 11/2/2022

Model Overview

該模型基於RoBERTa架構改進,專門針對西班牙語長文本處理優化,支持4096詞元的上下文長度,適用於多種自然語言處理任務

Model Features

長文本處理能力
支持4096詞元的上下文長度,無需額外聚合策略即可處理長文檔
改進的注意力機制
採用滑動窗口注意力與全局注意力相結合的方式,平衡計算效率與上下文理解
西班牙語優化
基於西班牙國家圖書館大規模語料訓練,專門針對西班牙語特性優化

Model Capabilities

掩碼語言建模
文本分類
命名實體識別
問答系統
語義相似度計算

Use Cases

文本分析
法律文檔分析
分析西班牙語法律文檔中的關鍵信息
新聞分類
對西班牙語新聞文章進行分類
在MLDoc數據集上F1得分0.9608
信息提取
命名實體識別
從西班牙語文檔中提取人名、地名等實體
在CoNLL-NERC數據集上F1得分0.8757
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase