K

Kyrgyzbert

由metinovadilet開發
基於BERT架構的小規模語言模型,專為吉爾吉斯語自然語言處理應用設計。
下載量 79
發布時間 : 2/26/2025

模型概述

吉爾吉斯Bert是一個基於BERT架構的小規模語言模型,在大量吉爾吉斯語文本語料庫上進行了預訓練,適用於掩碼語言建模(MLM)、文本分類及吉爾吉斯語自然語言處理應用。

模型特點

定製吉爾吉斯語分詞器
使用專門為吉爾吉斯語定製的分詞器,優化了語言處理效果。
小規模BERT架構
採用小規模BERT架構,隱藏層維度512,層數6,注意力頭數8,適合資源有限的環境。
高性能預訓練
在包含150萬句以上的吉爾吉斯語文本語料庫上進行預訓練,優化了掩碼語言建模任務。

模型能力

文本補全與預測
特徵提取
情感分析
命名實體識別(NER)
機器翻譯

使用案例

文本處理
填充缺失詞彙
填充吉爾吉斯文本中的缺失詞彙,適用於文本補全與預測任務。
自然語言處理
情感分析
通過微調模型,可用於吉爾吉斯語的情感分析任務。
命名實體識別(NER)
通過微調模型,可用於識別吉爾吉斯語文本中的命名實體。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase