B

Bert Base Spanish Wwm Cased

由dccuchile開發
BETO是基於大型西班牙語語料庫訓練的BERT模型,提供區分大小寫和未區分大小寫版本,適用於多種西班牙語NLP任務。
下載量 61.43k
發布時間 : 3/2/2022

模型概述

BETO是專門針對西班牙語優化的BERT模型,採用全詞掩碼技術訓練,在詞性標註、命名實體識別等任務上表現優異。

模型特點

全詞掩碼訓練
採用Whole Word Masking技術,提升模型對西班牙語的理解能力
雙版本支持
提供區分大小寫和未區分大小寫兩種版本,適應不同應用場景
大規模訓練
基於31K BPE子詞詞彙表,訓練200萬步
多框架支持
提供TensorFlow和PyTorch兩種框架的預訓練權重

模型能力

西班牙語文本理解
詞性標註
命名實體識別
文檔分類
文本複述檢測
跨語言推理

使用案例

自然語言處理
西班牙語文檔分類
對西班牙語新聞、文章等進行自動分類
在MLDoc數據集上達到96.12%準確率
西班牙語命名實體識別
識別西班牙語文本中的人名、地名等實體
在CoNLL-2002數據集上達到88.43% F1分數
跨語言應用
跨語言推理
處理西班牙語與其他語言間的推理任務
在XNLI數據集上達到82.01%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase