B

Bert Base Spanish Wwm Uncased

由dccuchile開發
BETO是基於大型西班牙語語料庫訓練的BERT模型,支持區分大小寫和未區分大小寫兩種版本,適用於多種西班牙語NLP任務。
下載量 231.26k
發布時間 : 3/2/2022

模型概述

BETO是一個專門針對西班牙語優化的BERT模型,採用全詞掩碼技術訓練,適用於詞性標註、命名實體識別、文檔分類等任務。

模型特點

全詞掩碼訓練
採用全詞掩碼技術訓練,提高了模型對西班牙語的理解能力
雙版本支持
提供區分大小寫和未區分大小寫兩種版本,適應不同應用場景
大規模訓練
基於31K BPE子詞單元,訓練步數達200萬次

模型能力

西班牙語文本理解
詞性標註
命名實體識別
文檔分類
複述識別
自然語言推理

使用案例

自然語言處理
西班牙語文檔分類
對西班牙語文檔進行自動分類
在MLDoc數據集上達到96.12%準確率
西班牙語命名實體識別
識別西班牙語文本中的人名、地名等實體
在CoNLL-2002數據集上達到88.43% F1分數
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase