B

Bigbird Base Japanese

由nlp-waseda開發
基於日語維基百科、CC-100和OSCAR數據集預訓練的日語BigBird模型,適用於長序列處理任務。
下載量 38
發布時間 : 6/3/2023

模型概述

這是一個基於日語維基百科、CC-100日語部分和OSCAR日語部分預訓練的日語BigBird基礎模型,主要用於掩碼語言建模和下游任務微調。

模型特點

長序列處理
支持最大4096長度的序列處理,適合處理長文本任務。
高效預訓練
使用16塊NVIDIA A100 GPU和DeepSpeed優化,訓練效率高。
專業分詞
輸入文本需使用Juman++進行專業分詞,確保語言處理準確性。

模型能力

日語文本理解
掩碼語言建模
長序列處理
下游任務微調

使用案例

文本分類
情感分析
對日語文本進行情感傾向分類
在MARC-ja任務上準確率達到0.959
語義相似度
句子相似度計算
計算兩個日語句子的語義相似度
在JSTS任務上皮爾遜係數達到0.888
問答系統
日語閱讀理解
基於給定文本回答日語問題
在JSQuAD任務上F1值達到0.933
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase