B

Bert Medium Amharic

由rasyosef開發
基於bert-medium架構預訓練的阿姆哈拉語模型,參數量4050萬,在2.9億詞元上訓練,性能媲美更大規模的多語言模型。
下載量 2,661
發布時間 : 6/16/2024

模型概述

專為阿姆哈拉語設計的BERT模型,支持填充掩碼任務,可用於文本理解和生成任務。

模型特點

高效參數利用
僅4050萬參數即達到與2.79億參數模型相當的阿姆哈拉語處理能力
專用分詞器
基於28k詞彙量的阿姆哈拉語專用分詞器
多數據集訓練
整合oscar、mc4和阿姆哈拉語句子語料庫進行訓練

模型能力

阿姆哈拉語文本理解
填充掩碼預測
下游任務微調

使用案例

自然語言處理
情感分析
對阿姆哈拉語文本進行情感傾向分類
F1分數0.83
命名實體識別
識別阿姆哈拉語文本中的人名、地名等實體
F1分數0.68
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase