U

Ukr Roberta Base

由 youscan 开发
基于乌克兰语大规模语料训练的RoBERTa基础模型,适用于乌克兰语自然语言处理任务
下载量 3,702
发布时间 : 3/2/2022

模型简介

这是一个基于乌克兰语维基百科、OSCAR去重数据集和社交媒体文本训练的RoBERTa基础模型,采用与roberta-base-cased相同的架构,专门针对乌克兰语优化

模型特点

大规模乌克兰语预训练
使用超过33亿字符的乌克兰语语料进行预训练,包含维基百科、OSCAR去重数据集和社交媒体文本
标准RoBERTa架构
采用与roberta-base-cased相同的12层Transformer架构,确保与其他RoBERTa模型的兼容性
高效训练
使用4块V100显卡在85小时内完成训练,训练效率高

模型能力

文本理解
文本分类
命名实体识别
问答系统
文本生成

使用案例

文本分析
乌克兰语情感分析
分析乌克兰语社交媒体文本的情感倾向
乌克兰语新闻分类
对乌克兰语新闻文章进行自动分类
语言理解
乌克兰语问答系统
构建基于乌克兰语的知识问答系统
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase