B

Bertin Roberta Base Spanish

由bertin-project開發
BERTIN是一系列基於BERT的西班牙語模型,當前模型是在西班牙語mC4部分上使用Flax從頭訓練的RoBERTa-base模型。
下載量 1,845
發布時間 : 3/2/2022

模型概述

BERTIN是一個高效的西班牙語預訓練語言模型,使用困惑度採樣技術優化訓練過程,適用於填充掩碼等自然語言處理任務。

模型特點

困惑度採樣技術
使用創新的困惑度採樣方法,顯著減少訓練數據量和訓練時間,同時保持模型性能。
高效預訓練
在Flax/JAX社區活動期間完成訓練,展示了小型團隊高效訓練大型語言模型的可能性。
西班牙語優化
專門針對西班牙語設計和優化,填補了西班牙語單語模型的空白。

模型能力

文本理解
填充掩碼
西班牙語自然語言處理

使用案例

文本處理
文本補全
自動補全句子中缺失的部分,如'我去書店買了一本<mask>'。
語言研究
西班牙語語言模型研究
為西班牙語NLP研究提供基礎模型。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase