E

Elhberteu

由orai-nlp開發
ElhBERTeu是為巴斯克語推出的BERT模型,基於多領域語料訓練,在BasqueGLUE基準測試中表現優異。
下載量 529
發布時間 : 5/6/2022

模型概述

ElhBERTeu是一個基礎版、區分大小寫的巴斯克語單語BERT模型,專為自然語言理解任務設計,參數總量1.24億。

模型特點

多領域語料訓練
彙集新聞、維基百科、科學、文學等多領域巴斯克語文本,總規模達5.75億詞元。
優化訓練方案
全程採用512序列長度在TPU上完成100萬步預訓練,batch_size設置為256。
基準測試表現優異
在BasqueGLUE基準測試中平均得分73.71,超越同類模型BERTeus。

模型能力

巴斯克語文本理解
命名實體識別
意圖分類
槽位填充
文本分類
問答系統
詞義消歧
指代消解

使用案例

自然語言處理
巴斯克語文本分類
對巴斯克語新聞、科學文獻等進行自動分類
在BHTC任務上F1得分78.05
巴斯克語問答系統
構建巴斯克語智能問答應用
在QNLI任務上準確率73.84
語言學研究
巴斯克語語言分析
支持巴斯克語語法、語義等語言學研究
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase