L

Lsg Camembert Base 4096

由ccdv開發
基於CamemBERT-base調整的長序列處理模型,採用局部+稀疏+全局注意力機制(LSG),高效處理長文本
下載量 108
發布時間 : 3/2/2022

模型概述

該模型針對法語長文本優化,在保持CamemBERT原有架構基礎上引入LSG注意力機制,支持4096長度的上下文處理

模型特點

長上下文處理
支持長達4096個標記的序列處理,優於傳統Transformer模型
高效注意力機制
採用局部+稀疏+全局(LSG)混合注意力模式,計算效率高於Longformer/BigBird
自適應序列長度
支持自動填充序列長度至塊大小的整數倍,簡化預處理流程
多種稀疏模式
提供6種稀疏注意力選擇策略,可根據任務需求靈活配置

模型能力

法語文本理解
長文檔處理
掩碼語言建模
序列分類
文本特徵提取

使用案例

文本理解
法語長文檔分類
對法語長篇文章或文檔進行主題分類
示例顯示可有效處理300+單詞的序列
語言建模
法語完形填空
預測被掩碼的法語詞彙
示例成功預測'Paris est la capitale de la France'
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase