K

Kyrgyzbert

Developed by metinovadilet
基於BERT架構的小規模語言模型,專為吉爾吉斯語自然語言處理應用設計。
Downloads 79
Release Time : 2/26/2025

Model Overview

吉爾吉斯Bert是一個基於BERT架構的小規模語言模型,在大量吉爾吉斯語文本語料庫上進行了預訓練,適用於掩碼語言建模(MLM)、文本分類及吉爾吉斯語自然語言處理應用。

Model Features

定製吉爾吉斯語分詞器
使用專門為吉爾吉斯語定製的分詞器,優化了語言處理效果。
小規模BERT架構
採用小規模BERT架構,隱藏層維度512,層數6,注意力頭數8,適合資源有限的環境。
高性能預訓練
在包含150萬句以上的吉爾吉斯語文本語料庫上進行預訓練,優化了掩碼語言建模任務。

Model Capabilities

文本補全與預測
特徵提取
情感分析
命名實體識別(NER)
機器翻譯

Use Cases

文本處理
填充缺失詞彙
填充吉爾吉斯文本中的缺失詞彙,適用於文本補全與預測任務。
自然語言處理
情感分析
通過微調模型,可用於吉爾吉斯語的情感分析任務。
命名實體識別(NER)
通過微調模型,可用於識別吉爾吉斯語文本中的命名實體。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase