K

Khmer Xlm Roberta Base 10k

由metythorn開發
這是一個基於XLM-RoBERTa架構預訓練的高棉語和英語語言模型,專為掩碼語言建模任務優化,在高棉語語境下表現優於原版xlm-roberta-base模型。
下載量 1,095
發布時間 : 7/3/2025

模型概述

該模型主要用於高棉語的掩碼語言建模任務,可用於填充掩碼、特徵提取、下游任務微調及語言理解研究。

模型特點

高棉語優化
專門針對高棉語進行優化,在高棉語掩碼語言建模任務中表現優於原版XLM-RoBERTa-base模型
雙語支持
同時支持高棉語和英語處理
大規模訓練
基於約8400萬個示例(8.2GB)的高質量雙語數據集訓練

模型能力

填充掩碼預測
文本特徵提取
語言模型微調

使用案例

自然語言處理
高棉語文本補全
預測高棉語句子中被掩碼的詞語
在高棉語語境下表現優於原版XLM-RoBERTa
語言理解研究
用於高棉語語言模型的研究和分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase