P

Pino Bigbird Roberta Base

由flax-community開發
Pino是基於BigBird架構的荷蘭語預訓練模型,採用稀疏注意力機制處理長序列文本,支持最長4096的序列長度。
下載量 17
發布時間 : 3/2/2022

模型概述

BigBird是一種基於稀疏注意力的Transformer模型,能夠高效處理長序列文本。該模型針對荷蘭語進行了預訓練,適用於需要處理長文本的任務。

模型特點

長序列處理能力
採用塊稀疏注意力機制,可高效處理長達4096的序列,計算成本顯著低於傳統Transformer
荷蘭語優化
專門針對荷蘭語進行預訓練,使用mC4和荷蘭新聞數據集
靈活注意力配置
支持完全注意力模式和塊稀疏模式,可調整block_size和num_random_blocks參數

模型能力

長文本理解
荷蘭語文本處理
掩碼語言建模

使用案例

自然語言處理
長文檔摘要
處理和分析長文檔並生成摘要
長上下文問答
基於長文檔內容回答複雜問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase