K

Khmer Xlm Roberta Base 10k

由 metythorn 开发
这是一个基于XLM-RoBERTa架构预训练的高棉语和英语语言模型,专为掩码语言建模任务优化,在高棉语语境下表现优于原版xlm-roberta-base模型。
下载量 1,095
发布时间 : 7/3/2025

模型简介

该模型主要用于高棉语的掩码语言建模任务,可用于填充掩码、特征提取、下游任务微调及语言理解研究。

模型特点

高棉语优化
专门针对高棉语进行优化,在高棉语掩码语言建模任务中表现优于原版XLM-RoBERTa-base模型
双语支持
同时支持高棉语和英语处理
大规模训练
基于约8400万个示例(8.2GB)的高质量双语数据集训练

模型能力

填充掩码预测
文本特征提取
语言模型微调

使用案例

自然语言处理
高棉语文本补全
预测高棉语句子中被掩码的词语
在高棉语语境下表现优于原版XLM-RoBERTa
语言理解研究
用于高棉语语言模型的研究和分析
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase