# 稀疏注意力

Lsg Legal Small Uncased 4096
基於LEGAL-BERT的小型版本,採用局部+稀疏+全局注意力機制(LSG)高效處理長序列
大型語言模型 Transformers 英語
L
ccdv
1,088
0
Bigbird Roberta Large
Apache-2.0
BigBird是一種基於稀疏注意力的Transformer模型,能夠處理長達4096的序列,適用於長文檔任務。
大型語言模型 英語
B
google
1,152
27
Bigbird Roberta Base Finetuned App
MIT
基於稀疏注意力的Transformer模型,專為移動應用描述分類任務微調
文本分類 Transformers 英語
B
nsi319
15
0
Bigbird Base Trivia Itc
Apache-2.0
基於bigbird-roberta-base的微調模型,專為trivia問答任務優化,支持長序列處理。
問答系統 英語
B
google
1,049
8
Bigbird Pegasus Large Pubmed
Apache-2.0
BigBirdPegasus 是一種基於稀疏注意力的 Transformer 模型,能夠處理更長的序列,特別適用於長文檔摘要任務。
文本生成 Transformers 英語
B
google
2,031
47
Pino Bigbird Roberta Base
Pino是基於BigBird架構的荷蘭語預訓練模型,採用稀疏注意力機制處理長序列文本,支持最長4096的序列長度。
大型語言模型 其他
P
flax-community
17
2
Bigbird Pegasus Large Arxiv
Apache-2.0
BigBird是一種基於稀疏注意力的Transformer模型,能夠處理更長的序列,適用於長文檔摘要等任務。
文本生成 Transformers 英語
B
google
8,528
61
Bigbird Pegasus Large Bigpatent
Apache-2.0
BigBird是一種基於稀疏注意力的Transformer模型,能夠處理長達4096的序列,適用於長文檔摘要等任務。
文本生成 Transformers 英語
B
google
945
40
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase