L

Lsg Legal Small Uncased 4096

由ccdv開發
基於LEGAL-BERT的小型版本,採用局部+稀疏+全局注意力機制(LSG)高效處理長序列
下載量 1,088
發布時間 : 3/2/2022

模型概述

該模型是LEGAL-BERT的小型版本,專門優化用於處理長序列法律文本,採用創新的局部+稀疏+全局注意力機制(LSG),在速度和性能上優於傳統長序列處理模型如Longformer或BigBird。

模型特點

高效長序列處理
採用LSG注意力機制,可高效處理長達4096個令牌的序列,性能優於傳統長序列模型
靈活配置
支持調整全局令牌數、塊大小、稀疏因子等多種參數以適應不同任務需求
多種稀疏模式
提供6種稀疏選擇類型(bos_pooling/norm/pooling/lsh/stride/block_stride)適應不同場景
自適應填充
自動填充不足塊大小的序列,建議配合分詞器截斷和填充功能使用

模型能力

長文本處理
法律文本分析
填充掩碼預測
序列分類

使用案例

法律文本處理
法律文檔分類
對長篇幅法律文檔進行自動分類
可處理長達4096個令牌的文檔序列
法律術語預測
預測法律文本中的缺失術語
示例顯示能準確預測'capital'和'happiness'等術語
通用NLP任務
長文本分類
處理需要長上下文理解的分類任務
模型輸出包含分類logits
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase